ทำไมแอปฟุริงานะภาษาญี่ปุ่นของคุณจึงดูไม่เหมือนหนังสือญี่ปุ่น?

ขับเคลื่อนด้วยหน่วยคำกับขับเคลื่อนด้วยตัวอักษร: สองแนวทางของ furigana ภาษาญี่ปุ่น

ผู้เรียนภาษาญี่ปุ่นจำนวนมากเมื่อเจอ furigana ครั้งแรกมักคิดว่ามันคือการใส่เสียงอ่าน kana ไว้เหนือ kanji ความเข้าใจนี้ไม่ผิด แต่จะทำให้เกิดคำถามตามมาอย่างรวดเร็ว

ประโยคเดียวกันคือ 昨日、学校へ行った。 เครื่องมืออัตโนมัติอาจให้ 昨日きのう学校がっこう行ったいった แต่หนังสือเด็ก หนังสือเรียน หรือสิ่งพิมพ์ที่จัดหน้าอย่างตั้งใจอาจเลือก 昨日きのうがっこうった。

ทั้งสองแบบช่วยให้อ่านภาษาญี่ปุ่นได้ แต่ตอบคนละคำถาม แบบแรกตอบว่า “ประโยคนี้ออกเสียงอย่างไร” แบบหลังตอบว่า “คันจิบนหน้ากระดาษควรถูกผู้อ่านจำแนกอย่างไร”

มอง ruby เป็นสองการตัดสินใจ

ในงานจัดพิมพ์ furigana มักถูกเรียกว่า ruby เมื่อเขียนแนวนอนจะอยู่เหนือข้อความหลัก และเมื่อเขียนแนวตั้งจะอยู่ด้านขวา W3C อธิบายว่า ruby เป็นส่วนสำคัญของการจัดพิมพ์ภาษาญี่ปุ่น [1]

แต่การเลือกว่าจะใส่เสียงอ่านให้ตัวไหน กับการตัดสินใจว่าเสียงอ่านนั้นผูกกับหน่วยใด เป็นคนละเรื่องกัน จะใส่ทุก kanji หรือเฉพาะตัวที่ยาก? ผูกกับ kanji ทีละตัว กับแต่ละตัวในคำประสม หรือกับทั้งคำ?

JLREQ แบ่งความสัมพันธ์ของ ruby เป็น mono-ruby, jukugo-ruby และ group-ruby ซึ่งเป็นกุญแจสำคัญของแนวทาง orthographic [2]

แนวทางแรก: morphological

แนวทาง morphological เริ่มจากการวิเคราะห์ภาษา แบ่งประโยคเป็นคำหรือหน่วยคำ แล้วกำหนดเสียงอ่าน ชนิดคำ รูปพื้นฐาน และข้อมูลการผัน

MeCab สามารถส่งออก surface form, part of speech, base form, reading และ pronunciation ได้ ส่วน UniDic ก็เป็นพจนานุกรมสำหรับ morphological analysis ของภาษาญี่ปุ่นโดยตรง [3] [4]

สำหรับ 学校へ行った แนวทางนี้จะได้ 学校がっこう行ったいった อย่างเป็นธรรมชาติ เพราะสนใจว่า 学校 อ่านว่า がっこう และรูปผัน 行った อ่านว่า いった

วิธีนี้เหมาะกับระบบอัตโนมัติ เช่น แอปเรียนภาษา ส่วนขยายเบราว์เซอร์ TTS ดัชนีค้นหา พจนานุกรมอิเล็กทรอนิกส์ และ NLP เพราะต้องรู้เสียงอ่านของคำตามบริบท

จุดบอด: เสียงอ่านของคำไม่ใช่ ruby บนหน้ากระดาษเสมอไป

行った อ่านว่า いった แต่สิ่งพิมพ์มักเขียน った เพราะ った ปรากฏอยู่ในข้อความหลักแล้ว จึงไม่ต้องยกไปไว้เหนือ อีก

学校がっこう เพียงพอสำหรับการอ่านออกเสียง แต่ถ้าต้องการให้เห็นบทบาทของ และ ในการเรียนคันจิ がっこう จะชัดกว่า

คำอย่าง 今日きょう, 大人おとな, 小豆あずき ไม่ควรถูกฝืนแบ่งเป็นตัว ๆ เพราะจะสร้างความเข้าใจผิด จึงควรมองเป็น group reading

แนวทางที่สอง: orthographic / kanji-unit driven

แนวทาง orthographic เริ่มจากรูปเขียนบนหน้า กระดาษมี kanji ตรงไหน? kanji เหล่านั้นเป็นคำประสมอะไร? ผู้อ่านเป้าหมายต้องการความช่วยเหลือตรงไหน? ถ้าใส่ ruby จะใส่รายตัว รายคำประสม หรือทั้งคำ?

JLREQ ยังแยก full ruby และ partial ruby: อาจใส่ให้ kanji ทั้งหมด ใส่เฉพาะตัวที่อ่านยาก หรือใส่เฉพาะครั้งแรกที่ปรากฏ [2]

Jukugo-ruby และ group-ruby

Jukugo-ruby คือรูปแบบกลางที่มักถูกมองข้าม がっこう ไม่ใช่แค่ ruby สองอันแยกกัน แต่ยังรักษา 学校 ให้เป็นคำประสมหนึ่งคำ พร้อมแสดงความสัมพันธ์ของแต่ละ kanji กับเสียงอ่าน

เมื่อไม่สามารถกระจายเสียงอ่านไปยังแต่ละ kanji ได้อย่างเป็นธรรมชาติ จะใช้ group-ruby เช่น 今日きょう, 明日あした, 大人おとな, 一昨日おととい [5]

ความแตกต่าง

มิติMorphologicalOrthographic / kanji-unit
คำถามหลักคำหรือประโยคนี้อ่านอย่างไรkanji บนหน้ากระดาษควรรับเสียงอ่านส่วนใด
หน่วยพื้นฐานหน่วยคำ คำ short unit รูปผันข้อความหลัก kanji คำประสม ทั้งคำ
ผลลัพธ์ทั่วไป学校がっこう, 行ったいったがっこう, った
จุดแข็งอัตโนมัติ บริบท TTS เรียนคำศัพท์ชัดบนหน้ากระดาษ เรียนคันจิ หนังสือเด็ก สิ่งพิมพ์
จุดอ่อนอาจไม่บอกว่า kanji ใดรับเสียงส่วนใดทำอัตโนมัติยาก ต้องมีกฎและตรวจทาน

ทำไมหนังสือเรียนและหนังสือเด็กจึงชอบแนวทางตัวอักษร?

เพราะไม่ได้ช่วยแค่อ่านออกเสียง แต่ยังสอน kanji ด้วย การศึกษาญี่ปุ่นมีการจัด kanji ตามระดับชั้น และเอกสารทางการยังพิจารณาพัฒนาการเด็ก ภาระการเรียน ความจำเป็นในชีวิตประจำวัน และความเข้าใจความหมาย [6] [7]

学校がっこう อ่านได้ แต่ がっこう ทำให้เห็นบทบาทของ และ ส่วน 行ったいった บอกเสียงอ่าน แต่ った แสดงความสัมพันธ์ของ kanji กับ okurigana

สี่ตัวอย่าง

学校. Morphological: 学校がっこう. Orthographic: がっこう.

行った. Morphological: 行ったいった. Orthographic: った.

今日. โดยมากทั้งสองแบบคือ 今日きょう เพราะการฝืนเป็น きょ จะทำให้เข้าใจผิด

生物. บริบทกำหนดว่าจะเป็น せいぶつ หรือ なまもの แนวทาง orthographic อาจใช้ せいぶつ สำหรับความหมายชีววิทยา และ 生物なまもの สำหรับอาหารสด

แบบไหนดีกว่าสำหรับผู้เรียน?

ถ้าต้องการอ่านประโยคให้ลื่น แนวทาง morphological ตรงและมีประโยชน์ ถ้ากำลังเรียนคันจิ อ่านหนังสือเด็ก อ่านละเอียด หรือทำสื่อการสอน แนวทาง orthographic จะซื่อสัตย์ต่อหน้ากระดาษมากกว่า

สำหรับแอปและสื่อการสอน: ทางที่ดีคือสองขั้นตอน

ระบบ furigana คุณภาพสูงควรใช้ morphological analysis เพื่อรู้ว่าคำอ่านอย่างไร แล้วใช้กฎแบบสิ่งพิมพ์เพื่อกำหนดว่าจะผูกเสียงอ่านกลับไปยังตัวอักษรใด ความยากอยู่ขั้นที่สอง เพราะมันรวมภาษาศาสตร์ การสอนคันจิ การจัดพิมพ์ญี่ปุ่น และการออกแบบเพื่อผู้อ่าน

แว่นสองคู่

แนวทาง morphological คือแว่นด้านเสียง มันถามว่าประโยคนี้ออกเสียงอย่างไร ส่วนแนวทาง orthographic คือแว่นด้านตัวเขียน มันถามว่าหน้านี้ช่วยให้ผู้อ่านอ่านเข้าใจและเรียนตัวอักษรอย่างไร

หมายเหตุจาก OCAT: ใน OCAT ผู้ใช้สามารถไปที่ Settings - Experimental Options เพื่อเลือก furigana แบบ orthographic / kanji-unit driven หรือแบบ morphological driven ได้อย่างอิสระ ค่าเริ่มต้นคือโหมด orthographic นี่อาจเป็นหนึ่งในแอปเรียนภาษาญี่ปุ่นที่แทบไม่มีใครเหมือนซึ่งรองรับโหมดนี้

แหล่งอ้างอิง

  1. Rules for Simple Placement of Japanese Ruby
  2. Requirements for Japanese Text Layout 日本語組版処理の要件
  3. MeCab: Yet Another Part-of-Speech and Morphological Analyzer
  4. UniDic glossary
  5. 文化庁 常用漢字表
  6. 学年別漢字配当表
  7. 文部科学省 音訓の小・中・高等学校段階別割り振り表

OCAT

การเรียนประโยคทั้งประโยคมีประสิทธิภาพมากกว่าการท่องจำคำศัพท์ทีละคำ!

OCAT เป็นแอปพลิเคชันที่ช่วยให้คุณพัฒนาทักษะการพูดภาษาญี่ปุ่น ภาษาจีน ภาษากวางตุ้ง และภาษาอังกฤษได้อย่างรวดเร็วผ่านการสนทนากับ AI

คุณสามารถรวบรวมประโยคที่เป็นธรรมชาติพร้อมคำแนะนำการออกเสียง เล่นเสียง และบุ๊กมาร์กได้อย่างง่ายดาย เพื่อสร้างคลังประโยคประจำวันของคุณเองอย่างรวดเร็ว เล่นซ้ำๆ ฝึกหู และพูดได้อย่างมั่นใจตามธรรมชาติ

การเรียนประโยคทั้งประโยคมีประสิทธิภาพมากกว่าการท่องจำคำศัพท์ทีละคำ!

ชื่อ "OCAT" มาจากวลีภาษาญี่ปุ่น "おしえてoshiete" ซึ่งแปลว่า "กรุณาสอนฉันด้วย"

คุณสมบัติหลัก