သင့်ဂျပန် furigana app က ဂျပန်စာအုပ်လို ဘာကြောင့် မမြင်ရသလဲ

Morphological နှင့် orthographic / kanji-unit driven: ဂျပန် furigana ၏ လမ်းကြောင်းနှစ်ခု

ဂျပန်စာသင်သူအများစုသည် furigana ကို ပထမဆုံးတွေ့သောအခါ “kanji အပေါ်မှာ kana အသံဖတ်ရေးထားခြင်း” လို့ ထင်ကြသည်။ မမှားသော်လည်း မကြာခင် မေးခွန်းများ ပေါ်လာသည်။

တူညီသော 昨日、学校へ行った。 ကို အလိုအလျောက် tool တစ်ခုက 昨日きのう、学校がっこうへ行ったいった。 ဟု ထုတ်ပေးနိုင်သည်။ သို့သော် ကလေးစာအုပ်၊ သင်ရိုးစာအုပ် သို့မဟုတ် သေချာ typograph လုပ်ထားသော စာအုပ်က 昨日きのう、学がっ校こうへ行いった。 ကို ပိုနှစ်သက်နိုင်သည်။

နှစ်မျိုးလုံးသည် ဖတ်ရန်ကူညီသည်။ သို့သော် ဖြေသောမေးခွန်း မတူပါ။ ပထမနည်းလမ်းက “ဒီဝါကျ အသံထွက်က ဘာလဲ” ဟု မေးသည်။ ဒုတိယနည်းလမ်းက “စာမျက်နှာပေါ်ရှိ kanji ကို စာဖတ်သူ ဘယ်လို မှတ်မိသင့်သလဲ” ဟု မေးသည်။

Ruby ကို ဆုံးဖြတ်ချက်နှစ်ခုအဖြစ် မြင်ပါ

Typography တွင် furigana ကို ruby ဟု ခေါ်လေ့ရှိသည်။ Horizontal writing တွင် မူရင်းစာလုံးအပေါ်၊ vertical writing တွင် ညာဘက်တွင် ထားလေ့ရှိသည်။ W3C သည် ruby ကို ဂျပန်စာ layout ၏ အရေးကြီးသောအစိတ်အပိုင်းအဖြစ် ဖော်ပြထားသည်။ [1]

သို့သော် “ဘယ်စာလုံးကို အသံဖတ်ပေးမလဲ” နှင့် “အသံဖတ်ကို ဘယ်ယူနစ်နှင့် ချိတ်မလဲ” သည် မတူပါ။ kanji အားလုံးလား၊ ခက်သော kanji များသာလား၊ တစ်လုံးချင်းလား၊ compound ထဲရှိ kanji တစ်လုံးချင်းလား၊ စကားလုံးတစ်ခုလုံးလား။

JLREQ သည် mono-ruby, jukugo-ruby, group-ruby ဟူ၍ ခွဲခြားသည်။ ဤသုံးခုသည် orthographic route ကို နားလည်ရန် အဓိကသော့ချက်ဖြစ်သည်။ [2]

လမ်းကြောင်း ၁: morphological

Morphological route သည် ဘာသာစကားခွဲခြမ်းစိတ်ဖြာမှုမှ စသည်။ ဝါကျကို word သို့မဟုတ် morpheme unit များအဖြစ် ခွဲပြီး reading, part of speech, base form, inflection စသည့်အချက်အလက်များ ပေးသည်။

MeCab သည် surface form, part of speech, base form, reading, pronunciation စသည်တို့ကို output လုပ်နိုင်သည်။ UniDic လည်း morphological analysis အတွက် ရည်ရွယ်ထားသော ဂျပန်အဘိဓာန်ဖြစ်သည်။ [3] [4]

学校へ行った အတွက် ဤ route သည် 学校がっこうへ行ったいった ဟု သဘာဝကျစွာ ထုတ်ပေးသည်။ ၎င်းသည် 学校 စကားလုံးကို がっこう ဟု ဖတ်ပြီး 行った form ကို いった ဟု ဖတ်သည်ကို အဓိကထားသည်။

ဤနည်းလမ်းသည် automation အတွက် အလွန်သင့်တော်သည်။ learning app, browser extension, TTS, search index, e-dictionary နှင့် NLP များသည် context အလိုက် word reading လိုအပ်သည်။

ကန့်သတ်ချက်: word reading သည် printed ruby မဟုတ်နိုင်

行った ၏ reading သည် いった ဖြစ်သော်လည်း စာအုပ်များတွင် 行いった ဟု ရေးလေ့ရှိသည်။ った သည် မူရင်းစာထဲတွင် ရှိပြီးသား ဖြစ်သောကြောင့် 行 အပေါ်သို့ ထပ်တင်စရာမလိုပါ။

学校がっこう သည် အသံထွက်ဖတ်ရန် လုံလောက်သည်။ သို့သော် kanji သင်ကြားရန် 学がっ校こう က 学 နှင့် 校 တို့၏ အခန်းကဏ္ဍကို ပိုမြင်သာစေသည်။

今日きょう, 大人おとな, 小豆あずき တို့ကို တစ်လုံးချင်း ခွဲခြင်းသည် မှားယွင်းသောအာရုံကို ဖြစ်စေနိုင်သည်။ ထိုအခါ group reading အဖြစ်ထားခြင်းက သဘာဝကျသည်။

လမ်းကြောင်း ၂: orthographic / kanji-unit driven

Orthographic route သည် စာမျက်နှာပေါ်ရှိ ရေးသားပုံမှ စသည်။ kanji ဘယ်နေရာမှာရှိသလဲ၊ ဘယ် compound ကို ဖွဲ့ထားသလဲ၊ ရည်ရွယ်ထားသော စာဖတ်သူအတွက် ဘယ်စာလုံးတွင် ကူညီချက်လိုသလဲ၊ ruby ကို တစ်လုံးချင်းလား၊ compound အလိုက်လား၊ စကားလုံးတစ်ခုလုံးလား ဆုံးဖြတ်သည်။

JLREQ သည် full ruby နှင့် partial ruby ကိုလည်း ခွဲခြားသည်။ kanji အားလုံးကို ruby ပေးနိုင်သလို ခက်သောစာလုံးများသာ၊ သို့မဟုတ် ပထမဆုံးတွေ့သည့်အကြိမ်သာ ပေးနိုင်သည်။ [2]

Jukugo-ruby နှင့် group-ruby

Jukugo-ruby သည် မကြာခဏ လျစ်လျူရှုခံရသော အလယ်ပိုင်းပုံစံဖြစ်သည်။ 学がっ校こう သည် ruby နှစ်ခုကိုသာ စုပေါင်းထားခြင်းမဟုတ်ဘဲ 学校 ကို compound အဖြစ် ထိန်းသိမ်းပြီး kanji တစ်လုံးချင်းကို reading segment ပေးသည်။

Reading ကို kanji တစ်လုံးချင်းသို့ သဘာဝကျစွာ မခွဲနိုင်ပါက group-ruby ဖြစ်သည်။ 今日きょう, 明日あした, 大人おとな, 一昨日おととい တို့က ဥပမာများဖြစ်သည်။ [5]

ကွာခြားချက်

ရှုထောင့်	Morphological	Orthographic / kanji-unit
အဓိကမေးခွန်း	စကားလုံး သို့မဟုတ် ဝါကျကို ဘယ်လိုဖတ်မလဲ	စာမျက်နှာပေါ်ရှိ kanji တွင် ဘယ် reading ကို ချိတ်မလဲ
အခြေခံယူနစ်	Morpheme, word, short unit, inflected form	Base text, kanji, compound, whole word
နမူနာ output	`学校がっこう`, `行ったいった`	`学がっ校こう`, `行いった`
အားသာချက်	Automation, context, TTS, vocabulary	Printed clarity, kanji learning, textbooks
အားနည်းချက်	kanji တစ်လုံးချင်း၏ အသံအပိုင်းကို မပြနိုင်နိုင်	Automation ခက်ခဲပြီး rules/review လိုသည်

သင်ရိုးစာအုပ်နှင့် ကလေးစာအုပ်များ ဘာကြောင့် orthographic သုံးသလဲ

၎င်းတို့သည် အသံထွက်ဖတ်စေရုံသာမက kanji ကိုလည်း သင်ကြားသည်။ ဂျပန်ကျောင်းပညာရေးတွင် kanji ကို grade အလိုက် သတ်မှတ်ထားပြီး official materials များတွင် ကလေးဖွံ့ဖြိုးမှု၊ သင်ယူမှုဝန်၊ နေ့စဉ်အသုံးနှင့် အဓိပ္ပာယ်နားလည်မှုကို ထည့်သွင်းစဉ်းစားသည်။ [6] [7]

学校がっこう ဖြင့် ဖတ်နိုင်သည်။ သို့သော် 学がっ校こう သည် 学 နှင့် 校 ၏ ဆက်စပ်မှုကို ပြသည်။ 行ったいった သည် အသံထွက်ကို ပေးသော်လည်း 行いった သည် kanji နှင့် okurigana ဆက်နွယ်မှုကို ပြသည်။

ဥပမာ လေးခု

学校. Morphological: 学校がっこう. Orthographic: 学がっ校こう.

行った. Morphological: 行ったいった. Orthographic: 行いった.

今日. များသောအားဖြင့် နှစ်မျိုးလုံး 今日きょう ဖြစ်သည်။ 今きょ日う ဟု ခွဲခြင်းက မှားယွင်းစေသည်။

生物. Context အရ せいぶつ သို့မဟုတ် なまもの ဖြစ်သည်။ Orthographic route သည် ပထမအတွက် 生せい物ぶつ, ဒုတိယအတွက် 生物なまもの ကို ရွေးနိုင်သည်။

သင်ယူသူအတွက် ဘယ်ဟာကောင်းလဲ

ဝါကျကို ချောချောမွေ့မွေ့ ဖတ်ချင်ရုံဆို morphological route က တိုက်ရိုက်အသုံးဝင်သည်။ Kanji သင်ခြင်း၊ ကလေးစာအုပ်ဖတ်ခြင်း၊ close reading သို့မဟုတ် teaching material ပြုလုပ်ခြင်းအတွက် orthographic route က ပိုသင့်တော်သည်။

App နှင့်教材 အတွက် နှစ်ဆင့်ပေါင်းစပ်နည်း

အရည်အသွေးမြင့် furigana system သည် ပထမအဆင့်တွင် morphological analysis ဖြင့် word reading ရယူပြီး ဒုတိယအဆင့်တွင် publication-style rules ဖြင့် reading ကို printed characters သို့ ပြန်ချိတ်သင့်သည်။ ဒုတိယအဆင့်တွင် linguistics, kanji education, Japanese typography နှင့် reader design ပါဝင်သည်။

မျက်မှန်နှစ်စုံ

Morphological route သည် နားထောင်မှုမျက်မှန်ဖြစ်ပြီး “ဒီဝါကျကို ဘယ်လိုအသံထွက်မလဲ” ဟု မေးသည်။ Orthographic route သည် စာရေးပုံမျက်မှန်ဖြစ်ပြီး “ဒီစာမျက်နှာက စာဖတ်သူကို ဖတ်ရန်နှင့် စာလုံးများကို သင်ရန် ဘယ်လိုကူညီမလဲ” ဟု မေးသည်။

OCAT မှတ်ချက်: OCAT တွင် Settings - Experimental Options ကို ဖွင့်ပြီး orthographic / kanji-unit driven သို့မဟုတ် morphological driven furigana ကို လွတ်လပ်စွာ ရွေးနိုင်သည်။ မူလသည် orthographic mode ဖြစ်သည်။ ဤ mode ကို ထောက်ပံ့သော ဂျပန်စာသင်ယူရေး app သည် OCAT တစ်ခုတည်းနီးပါး ဖြစ်နိုင်သည်။