သင့်ဂျပန် furigana app က ဂျပန်စာအုပ်လို ဘာကြောင့် မမြင်ရသလဲ

Morphological နှင့် orthographic / kanji-unit driven: ဂျပန် furigana ၏ လမ်းကြောင်းနှစ်ခု

ဂျပန်စာသင်သူအများစုသည် furigana ကို ပထမဆုံးတွေ့သောအခါ “kanji အပေါ်မှာ kana အသံဖတ်ရေးထားခြင်း” လို့ ထင်ကြသည်။ မမှားသော်လည်း မကြာခင် မေးခွန်းများ ပေါ်လာသည်။

တူညီသော 昨日、学校へ行った。 ကို အလိုအလျောက် tool တစ်ခုက 昨日きのう学校がっこう行ったいった ဟု ထုတ်ပေးနိုင်သည်။ သို့သော် ကလေးစာအုပ်၊ သင်ရိုးစာအုပ် သို့မဟုတ် သေချာ typograph လုပ်ထားသော စာအုပ်က 昨日きのうがっこうった。 ကို ပိုနှစ်သက်နိုင်သည်။

နှစ်မျိုးလုံးသည် ဖတ်ရန်ကူညီသည်။ သို့သော် ဖြေသောမေးခွန်း မတူပါ။ ပထမနည်းလမ်းက “ဒီဝါကျ အသံထွက်က ဘာလဲ” ဟု မေးသည်။ ဒုတိယနည်းလမ်းက “စာမျက်နှာပေါ်ရှိ kanji ကို စာဖတ်သူ ဘယ်လို မှတ်မိသင့်သလဲ” ဟု မေးသည်။

Ruby ကို ဆုံးဖြတ်ချက်နှစ်ခုအဖြစ် မြင်ပါ

Typography တွင် furigana ကို ruby ဟု ခေါ်လေ့ရှိသည်။ Horizontal writing တွင် မူရင်းစာလုံးအပေါ်၊ vertical writing တွင် ညာဘက်တွင် ထားလေ့ရှိသည်။ W3C သည် ruby ကို ဂျပန်စာ layout ၏ အရေးကြီးသောအစိတ်အပိုင်းအဖြစ် ဖော်ပြထားသည်။ [1]

သို့သော် “ဘယ်စာလုံးကို အသံဖတ်ပေးမလဲ” နှင့် “အသံဖတ်ကို ဘယ်ယူနစ်နှင့် ချိတ်မလဲ” သည် မတူပါ။ kanji အားလုံးလား၊ ခက်သော kanji များသာလား၊ တစ်လုံးချင်းလား၊ compound ထဲရှိ kanji တစ်လုံးချင်းလား၊ စကားလုံးတစ်ခုလုံးလား။

JLREQ သည် mono-ruby, jukugo-ruby, group-ruby ဟူ၍ ခွဲခြားသည်။ ဤသုံးခုသည် orthographic route ကို နားလည်ရန် အဓိကသော့ချက်ဖြစ်သည်။ [2]

လမ်းကြောင်း ၁: morphological

Morphological route သည် ဘာသာစကားခွဲခြမ်းစိတ်ဖြာမှုမှ စသည်။ ဝါကျကို word သို့မဟုတ် morpheme unit များအဖြစ် ခွဲပြီး reading, part of speech, base form, inflection စသည့်အချက်အလက်များ ပေးသည်။

MeCab သည် surface form, part of speech, base form, reading, pronunciation စသည်တို့ကို output လုပ်နိုင်သည်။ UniDic လည်း morphological analysis အတွက် ရည်ရွယ်ထားသော ဂျပန်အဘိဓာန်ဖြစ်သည်။ [3] [4]

学校へ行った အတွက် ဤ route သည် 学校がっこう行ったいった ဟု သဘာဝကျစွာ ထုတ်ပေးသည်။ ၎င်းသည် 学校 စကားလုံးကို がっこう ဟု ဖတ်ပြီး 行った form ကို いった ဟု ဖတ်သည်ကို အဓိကထားသည်။

ဤနည်းလမ်းသည် automation အတွက် အလွန်သင့်တော်သည်။ learning app, browser extension, TTS, search index, e-dictionary နှင့် NLP များသည် context အလိုက် word reading လိုအပ်သည်။

ကန့်သတ်ချက်: word reading သည် printed ruby မဟုတ်နိုင်

行った ၏ reading သည် いった ဖြစ်သော်လည်း စာအုပ်များတွင် った ဟု ရေးလေ့ရှိသည်။ った သည် မူရင်းစာထဲတွင် ရှိပြီးသား ဖြစ်သောကြောင့် အပေါ်သို့ ထပ်တင်စရာမလိုပါ။

学校がっこう သည် အသံထွက်ဖတ်ရန် လုံလောက်သည်။ သို့သော် kanji သင်ကြားရန် がっこう က နှင့် တို့၏ အခန်းကဏ္ဍကို ပိုမြင်သာစေသည်။

今日きょう, 大人おとな, 小豆あずき တို့ကို တစ်လုံးချင်း ခွဲခြင်းသည် မှားယွင်းသောအာရုံကို ဖြစ်စေနိုင်သည်။ ထိုအခါ group reading အဖြစ်ထားခြင်းက သဘာဝကျသည်။

လမ်းကြောင်း ၂: orthographic / kanji-unit driven

Orthographic route သည် စာမျက်နှာပေါ်ရှိ ရေးသားပုံမှ စသည်။ kanji ဘယ်နေရာမှာရှိသလဲ၊ ဘယ် compound ကို ဖွဲ့ထားသလဲ၊ ရည်ရွယ်ထားသော စာဖတ်သူအတွက် ဘယ်စာလုံးတွင် ကူညီချက်လိုသလဲ၊ ruby ကို တစ်လုံးချင်းလား၊ compound အလိုက်လား၊ စကားလုံးတစ်ခုလုံးလား ဆုံးဖြတ်သည်။

JLREQ သည် full ruby နှင့် partial ruby ကိုလည်း ခွဲခြားသည်။ kanji အားလုံးကို ruby ပေးနိုင်သလို ခက်သောစာလုံးများသာ၊ သို့မဟုတ် ပထမဆုံးတွေ့သည့်အကြိမ်သာ ပေးနိုင်သည်။ [2]

Jukugo-ruby နှင့် group-ruby

Jukugo-ruby သည် မကြာခဏ လျစ်လျူရှုခံရသော အလယ်ပိုင်းပုံစံဖြစ်သည်။ がっこう သည် ruby နှစ်ခုကိုသာ စုပေါင်းထားခြင်းမဟုတ်ဘဲ 学校 ကို compound အဖြစ် ထိန်းသိမ်းပြီး kanji တစ်လုံးချင်းကို reading segment ပေးသည်။

Reading ကို kanji တစ်လုံးချင်းသို့ သဘာဝကျစွာ မခွဲနိုင်ပါက group-ruby ဖြစ်သည်။ 今日きょう, 明日あした, 大人おとな, 一昨日おととい တို့က ဥပမာများဖြစ်သည်။ [5]

ကွာခြားချက်

ရှုထောင့်MorphologicalOrthographic / kanji-unit
အဓိကမေးခွန်းစကားလုံး သို့မဟုတ် ဝါကျကို ဘယ်လိုဖတ်မလဲစာမျက်နှာပေါ်ရှိ kanji တွင် ဘယ် reading ကို ချိတ်မလဲ
အခြေခံယူနစ်Morpheme, word, short unit, inflected formBase text, kanji, compound, whole word
နမူနာ output学校がっこう, 行ったいったがっこう, った
အားသာချက်Automation, context, TTS, vocabularyPrinted clarity, kanji learning, textbooks
အားနည်းချက်kanji တစ်လုံးချင်း၏ အသံအပိုင်းကို မပြနိုင်နိုင်Automation ခက်ခဲပြီး rules/review လိုသည်

သင်ရိုးစာအုပ်နှင့် ကလေးစာအုပ်များ ဘာကြောင့် orthographic သုံးသလဲ

၎င်းတို့သည် အသံထွက်ဖတ်စေရုံသာမက kanji ကိုလည်း သင်ကြားသည်။ ဂျပန်ကျောင်းပညာရေးတွင် kanji ကို grade အလိုက် သတ်မှတ်ထားပြီး official materials များတွင် ကလေးဖွံ့ဖြိုးမှု၊ သင်ယူမှုဝန်၊ နေ့စဉ်အသုံးနှင့် အဓိပ္ပာယ်နားလည်မှုကို ထည့်သွင်းစဉ်းစားသည်။ [6] [7]

学校がっこう ဖြင့် ဖတ်နိုင်သည်။ သို့သော် がっこう သည် နှင့် ၏ ဆက်စပ်မှုကို ပြသည်။ 行ったいった သည် အသံထွက်ကို ပေးသော်လည်း った သည် kanji နှင့် okurigana ဆက်နွယ်မှုကို ပြသည်။

ဥပမာ လေးခု

学校. Morphological: 学校がっこう. Orthographic: がっこう.

行った. Morphological: 行ったいった. Orthographic: った.

今日. များသောအားဖြင့် နှစ်မျိုးလုံး 今日きょう ဖြစ်သည်။ きょ ဟု ခွဲခြင်းက မှားယွင်းစေသည်။

生物. Context အရ せいぶつ သို့မဟုတ် なまもの ဖြစ်သည်။ Orthographic route သည် ပထမအတွက် せいぶつ, ဒုတိယအတွက် 生物なまもの ကို ရွေးနိုင်သည်။

သင်ယူသူအတွက် ဘယ်ဟာကောင်းလဲ

ဝါကျကို ချောချောမွေ့မွေ့ ဖတ်ချင်ရုံဆို morphological route က တိုက်ရိုက်အသုံးဝင်သည်။ Kanji သင်ခြင်း၊ ကလေးစာအုပ်ဖတ်ခြင်း၊ close reading သို့မဟုတ် teaching material ပြုလုပ်ခြင်းအတွက် orthographic route က ပိုသင့်တော်သည်။

App နှင့်教材 အတွက် နှစ်ဆင့်ပေါင်းစပ်နည်း

အရည်အသွေးမြင့် furigana system သည် ပထမအဆင့်တွင် morphological analysis ဖြင့် word reading ရယူပြီး ဒုတိယအဆင့်တွင် publication-style rules ဖြင့် reading ကို printed characters သို့ ပြန်ချိတ်သင့်သည်။ ဒုတိယအဆင့်တွင် linguistics, kanji education, Japanese typography နှင့် reader design ပါဝင်သည်။

မျက်မှန်နှစ်စုံ

Morphological route သည် နားထောင်မှုမျက်မှန်ဖြစ်ပြီး “ဒီဝါကျကို ဘယ်လိုအသံထွက်မလဲ” ဟု မေးသည်။ Orthographic route သည် စာရေးပုံမျက်မှန်ဖြစ်ပြီး “ဒီစာမျက်နှာက စာဖတ်သူကို ဖတ်ရန်နှင့် စာလုံးများကို သင်ရန် ဘယ်လိုကူညီမလဲ” ဟု မေးသည်။

OCAT မှတ်ချက်: OCAT တွင် Settings - Experimental Options ကို ဖွင့်ပြီး orthographic / kanji-unit driven သို့မဟုတ် morphological driven furigana ကို လွတ်လပ်စွာ ရွေးနိုင်သည်။ မူလသည် orthographic mode ဖြစ်သည်။ ဤ mode ကို ထောက်ပံ့သော ဂျပန်စာသင်ယူရေး app သည် OCAT တစ်ခုတည်းနီးပါး ဖြစ်နိုင်သည်။

ကိုးကားချက်များ

  1. Rules for Simple Placement of Japanese Ruby
  2. Requirements for Japanese Text Layout 日本語組版処理の要件
  3. MeCab: Yet Another Part-of-Speech and Morphological Analyzer
  4. UniDic glossary
  5. 文化庁 常用漢字表
  6. 学年別漢字配当表
  7. 文部科学省 音訓の小・中・高等学校段階別割り振り表

OCAT

စာကြောင်းတစ်ကြောင်းလုံးလေ့လာခြင်းက စကားလုံးတစ်လုံးချင်းအလွတ်ကျက်ခြင်းထက် ပိုမိုထိရောက်ပါသည်!

OCAT သည် AI နှင့် စကားပြောခြင်းအားဖြင့် ဂျပန်စကားပြော၊ တရုတ်ဘာသာ၊ ကန်တိုနီးစ်နှင့် အင်္ဂလိပ်စကားပြောစသည့် နိုင်ငံခြားဘာသာစကားများကို လေ့လာရန် ကူညီပေးသော အက်ပလီကေးရှင်းတစ်ခုဖြစ်ပါသည်။

သင်သည် အသံထွက်မှတ်ချက်များ၊ အသံဖွင့်နိုင်စွမ်း၊ စုဆောင်းနိုင်စွမ်းတို့ ပါဝင်သော သဘာဝကျသည့် စာကြောင်းများကို အလွယ်တကူ ရယူနိုင်ပြီး၊ သင့်ကိုယ်ပိုင် နေ့စဉ်စကားပြောစာကြောင်းစာကြည့်တိုက်ကို မြန်မြန်ဆန်ဆန် တည်ဆောက်နိုင်သည်။ ထို့နောက် ထပ်ခါတလဲလဲ ဖွင့်နားထောင်ကာ သဘာဝကျကျ စကားပြောနိုင်အောင် ပြုလုပ်နိုင်သည်။

စကားလုံးအလွတ်ကျက်ခြင်းထက် စာကြောင်းအလွတ်ကျက်ခြင်းက ပိုကောင်းသည်!

OCAT အမည်သည် ဂျပန်စကား "おしえてoshiete" မှ ဆင်းသက်လာခြင်းဖြစ်ပြီး "ကျေးဇူးပြု၍ သင်ပေးပါ" ဟု အဓိပ္ပာယ်ရသည်။

အဓိက လုပ်ဆောင်ချက်များ