သင့်ဂျပန် furigana app က ဂျပန်စာအုပ်လို ဘာကြောင့် မမြင်ရသလဲ
ဂျပန်စာသင်သူအများစုသည် furigana ကို ပထမဆုံးတွေ့သောအခါ “kanji အပေါ်မှာ kana အသံဖတ်ရေးထားခြင်း” လို့ ထင်ကြသည်။ မမှားသော်လည်း မကြာခင် မေးခွန်းများ ပေါ်လာသည်။
တူညီသော 昨日、学校へ行った。 ကို အလိုအလျောက် tool တစ်ခုက 昨日、学校へ行った。 ဟု ထုတ်ပေးနိုင်သည်။ သို့သော် ကလေးစာအုပ်၊ သင်ရိုးစာအုပ် သို့မဟုတ် သေချာ typograph လုပ်ထားသော စာအုပ်က 昨日、学校へ行った。 ကို ပိုနှစ်သက်နိုင်သည်။
နှစ်မျိုးလုံးသည် ဖတ်ရန်ကူညီသည်။ သို့သော် ဖြေသောမေးခွန်း မတူပါ။ ပထမနည်းလမ်းက “ဒီဝါကျ အသံထွက်က ဘာလဲ” ဟု မေးသည်။ ဒုတိယနည်းလမ်းက “စာမျက်နှာပေါ်ရှိ kanji ကို စာဖတ်သူ ဘယ်လို မှတ်မိသင့်သလဲ” ဟု မေးသည်။
Ruby ကို ဆုံးဖြတ်ချက်နှစ်ခုအဖြစ် မြင်ပါ
Typography တွင် furigana ကို ruby ဟု ခေါ်လေ့ရှိသည်။ Horizontal writing တွင် မူရင်းစာလုံးအပေါ်၊ vertical writing တွင် ညာဘက်တွင် ထားလေ့ရှိသည်။ W3C သည် ruby ကို ဂျပန်စာ layout ၏ အရေးကြီးသောအစိတ်အပိုင်းအဖြစ် ဖော်ပြထားသည်။ [1]
သို့သော် “ဘယ်စာလုံးကို အသံဖတ်ပေးမလဲ” နှင့် “အသံဖတ်ကို ဘယ်ယူနစ်နှင့် ချိတ်မလဲ” သည် မတူပါ။ kanji အားလုံးလား၊ ခက်သော kanji များသာလား၊ တစ်လုံးချင်းလား၊ compound ထဲရှိ kanji တစ်လုံးချင်းလား၊ စကားလုံးတစ်ခုလုံးလား။
JLREQ သည် mono-ruby, jukugo-ruby, group-ruby ဟူ၍ ခွဲခြားသည်။ ဤသုံးခုသည် orthographic route ကို နားလည်ရန် အဓိကသော့ချက်ဖြစ်သည်။ [2]
လမ်းကြောင်း ၁: morphological
Morphological route သည် ဘာသာစကားခွဲခြမ်းစိတ်ဖြာမှုမှ စသည်။ ဝါကျကို word သို့မဟုတ် morpheme unit များအဖြစ် ခွဲပြီး reading, part of speech, base form, inflection စသည့်အချက်အလက်များ ပေးသည်။
MeCab သည် surface form, part of speech, base form, reading, pronunciation စသည်တို့ကို output လုပ်နိုင်သည်။ UniDic လည်း morphological analysis အတွက် ရည်ရွယ်ထားသော ဂျပန်အဘိဓာန်ဖြစ်သည်။ [3] [4]
学校へ行った အတွက် ဤ route သည် 学校へ行った ဟု သဘာဝကျစွာ ထုတ်ပေးသည်။ ၎င်းသည် 学校 စကားလုံးကို がっこう ဟု ဖတ်ပြီး 行った form ကို いった ဟု ဖတ်သည်ကို အဓိကထားသည်။
ဤနည်းလမ်းသည် automation အတွက် အလွန်သင့်တော်သည်။ learning app, browser extension, TTS, search index, e-dictionary နှင့် NLP များသည် context အလိုက် word reading လိုအပ်သည်။
ကန့်သတ်ချက်: word reading သည် printed ruby မဟုတ်နိုင်
行った ၏ reading သည် いった ဖြစ်သော်လည်း စာအုပ်များတွင် 行った ဟု ရေးလေ့ရှိသည်။ った သည် မူရင်းစာထဲတွင် ရှိပြီးသား ဖြစ်သောကြောင့် 行 အပေါ်သို့ ထပ်တင်စရာမလိုပါ။
学校 သည် အသံထွက်ဖတ်ရန် လုံလောက်သည်။ သို့သော် kanji သင်ကြားရန် 学校 က 学 နှင့် 校 တို့၏ အခန်းကဏ္ဍကို ပိုမြင်သာစေသည်။
今日, 大人, 小豆 တို့ကို တစ်လုံးချင်း ခွဲခြင်းသည် မှားယွင်းသောအာရုံကို ဖြစ်စေနိုင်သည်။ ထိုအခါ group reading အဖြစ်ထားခြင်းက သဘာဝကျသည်။
လမ်းကြောင်း ၂: orthographic / kanji-unit driven
Orthographic route သည် စာမျက်နှာပေါ်ရှိ ရေးသားပုံမှ စသည်။ kanji ဘယ်နေရာမှာရှိသလဲ၊ ဘယ် compound ကို ဖွဲ့ထားသလဲ၊ ရည်ရွယ်ထားသော စာဖတ်သူအတွက် ဘယ်စာလုံးတွင် ကူညီချက်လိုသလဲ၊ ruby ကို တစ်လုံးချင်းလား၊ compound အလိုက်လား၊ စကားလုံးတစ်ခုလုံးလား ဆုံးဖြတ်သည်။
JLREQ သည် full ruby နှင့် partial ruby ကိုလည်း ခွဲခြားသည်။ kanji အားလုံးကို ruby ပေးနိုင်သလို ခက်သောစာလုံးများသာ၊ သို့မဟုတ် ပထမဆုံးတွေ့သည့်အကြိမ်သာ ပေးနိုင်သည်။ [2]
Jukugo-ruby နှင့် group-ruby
Jukugo-ruby သည် မကြာခဏ လျစ်လျူရှုခံရသော အလယ်ပိုင်းပုံစံဖြစ်သည်။ 学校 သည် ruby နှစ်ခုကိုသာ စုပေါင်းထားခြင်းမဟုတ်ဘဲ 学校 ကို compound အဖြစ် ထိန်းသိမ်းပြီး kanji တစ်လုံးချင်းကို reading segment ပေးသည်။
Reading ကို kanji တစ်လုံးချင်းသို့ သဘာဝကျစွာ မခွဲနိုင်ပါက group-ruby ဖြစ်သည်။ 今日, 明日, 大人, 一昨日 တို့က ဥပမာများဖြစ်သည်။ [5]
ကွာခြားချက်
| ရှုထောင့် | Morphological | Orthographic / kanji-unit |
|---|---|---|
| အဓိကမေးခွန်း | စကားလုံး သို့မဟုတ် ဝါကျကို ဘယ်လိုဖတ်မလဲ | စာမျက်နှာပေါ်ရှိ kanji တွင် ဘယ် reading ကို ချိတ်မလဲ |
| အခြေခံယူနစ် | Morpheme, word, short unit, inflected form | Base text, kanji, compound, whole word |
| နမူနာ output | 学校, 行った | 学校, 行った |
| အားသာချက် | Automation, context, TTS, vocabulary | Printed clarity, kanji learning, textbooks |
| အားနည်းချက် | kanji တစ်လုံးချင်း၏ အသံအပိုင်းကို မပြနိုင်နိုင် | Automation ခက်ခဲပြီး rules/review လိုသည် |
သင်ရိုးစာအုပ်နှင့် ကလေးစာအုပ်များ ဘာကြောင့် orthographic သုံးသလဲ
၎င်းတို့သည် အသံထွက်ဖတ်စေရုံသာမက kanji ကိုလည်း သင်ကြားသည်။ ဂျပန်ကျောင်းပညာရေးတွင် kanji ကို grade အလိုက် သတ်မှတ်ထားပြီး official materials များတွင် ကလေးဖွံ့ဖြိုးမှု၊ သင်ယူမှုဝန်၊ နေ့စဉ်အသုံးနှင့် အဓိပ္ပာယ်နားလည်မှုကို ထည့်သွင်းစဉ်းစားသည်။ [6] [7]
学校 ဖြင့် ဖတ်နိုင်သည်။ သို့သော် 学校 သည် 学 နှင့် 校 ၏ ဆက်စပ်မှုကို ပြသည်။ 行った သည် အသံထွက်ကို ပေးသော်လည်း 行った သည် kanji နှင့် okurigana ဆက်နွယ်မှုကို ပြသည်။
ဥပမာ လေးခု
学校. Morphological: 学校. Orthographic: 学校.
行った. Morphological: 行った. Orthographic: 行った.
今日. များသောအားဖြင့် နှစ်မျိုးလုံး 今日 ဖြစ်သည်။ 今日 ဟု ခွဲခြင်းက မှားယွင်းစေသည်။
生物. Context အရ せいぶつ သို့မဟုတ် なまもの ဖြစ်သည်။ Orthographic route သည် ပထမအတွက် 生物, ဒုတိယအတွက် 生物 ကို ရွေးနိုင်သည်။
သင်ယူသူအတွက် ဘယ်ဟာကောင်းလဲ
ဝါကျကို ချောချောမွေ့မွေ့ ဖတ်ချင်ရုံဆို morphological route က တိုက်ရိုက်အသုံးဝင်သည်။ Kanji သင်ခြင်း၊ ကလေးစာအုပ်ဖတ်ခြင်း၊ close reading သို့မဟုတ် teaching material ပြုလုပ်ခြင်းအတွက် orthographic route က ပိုသင့်တော်သည်။
App နှင့်教材 အတွက် နှစ်ဆင့်ပေါင်းစပ်နည်း
အရည်အသွေးမြင့် furigana system သည် ပထမအဆင့်တွင် morphological analysis ဖြင့် word reading ရယူပြီး ဒုတိယအဆင့်တွင် publication-style rules ဖြင့် reading ကို printed characters သို့ ပြန်ချိတ်သင့်သည်။ ဒုတိယအဆင့်တွင် linguistics, kanji education, Japanese typography နှင့် reader design ပါဝင်သည်။
မျက်မှန်နှစ်စုံ
Morphological route သည် နားထောင်မှုမျက်မှန်ဖြစ်ပြီး “ဒီဝါကျကို ဘယ်လိုအသံထွက်မလဲ” ဟု မေးသည်။ Orthographic route သည် စာရေးပုံမျက်မှန်ဖြစ်ပြီး “ဒီစာမျက်နှာက စာဖတ်သူကို ဖတ်ရန်နှင့် စာလုံးများကို သင်ရန် ဘယ်လိုကူညီမလဲ” ဟု မေးသည်။
OCAT မှတ်ချက်: OCAT တွင် Settings - Experimental Options ကို ဖွင့်ပြီး orthographic / kanji-unit driven သို့မဟုတ် morphological driven furigana ကို လွတ်လပ်စွာ ရွေးနိုင်သည်။ မူလသည် orthographic mode ဖြစ်သည်။ ဤ mode ကို ထောက်ပံ့သော ဂျပန်စာသင်ယူရေး app သည် OCAT တစ်ခုတည်းနီးပါး ဖြစ်နိုင်သည်။
