ทำไมแอปฟุริงานะภาษาญี่ปุ่นของคุณจึงดูไม่เหมือนหนังสือญี่ปุ่น?
ผู้เรียนภาษาญี่ปุ่นจำนวนมากเมื่อเจอ furigana ครั้งแรกมักคิดว่ามันคือการใส่เสียงอ่าน kana ไว้เหนือ kanji ความเข้าใจนี้ไม่ผิด แต่จะทำให้เกิดคำถามตามมาอย่างรวดเร็ว
ประโยคเดียวกันคือ 昨日、学校へ行った。 เครื่องมืออัตโนมัติอาจให้ 昨日、学校へ行った。 แต่หนังสือเด็ก หนังสือเรียน หรือสิ่งพิมพ์ที่จัดหน้าอย่างตั้งใจอาจเลือก 昨日、学校へ行った。
ทั้งสองแบบช่วยให้อ่านภาษาญี่ปุ่นได้ แต่ตอบคนละคำถาม แบบแรกตอบว่า “ประโยคนี้ออกเสียงอย่างไร” แบบหลังตอบว่า “คันจิบนหน้ากระดาษควรถูกผู้อ่านจำแนกอย่างไร”
มอง ruby เป็นสองการตัดสินใจ
ในงานจัดพิมพ์ furigana มักถูกเรียกว่า ruby เมื่อเขียนแนวนอนจะอยู่เหนือข้อความหลัก และเมื่อเขียนแนวตั้งจะอยู่ด้านขวา W3C อธิบายว่า ruby เป็นส่วนสำคัญของการจัดพิมพ์ภาษาญี่ปุ่น [1]
แต่การเลือกว่าจะใส่เสียงอ่านให้ตัวไหน กับการตัดสินใจว่าเสียงอ่านนั้นผูกกับหน่วยใด เป็นคนละเรื่องกัน จะใส่ทุก kanji หรือเฉพาะตัวที่ยาก? ผูกกับ kanji ทีละตัว กับแต่ละตัวในคำประสม หรือกับทั้งคำ?
JLREQ แบ่งความสัมพันธ์ของ ruby เป็น mono-ruby, jukugo-ruby และ group-ruby ซึ่งเป็นกุญแจสำคัญของแนวทาง orthographic [2]
แนวทางแรก: morphological
แนวทาง morphological เริ่มจากการวิเคราะห์ภาษา แบ่งประโยคเป็นคำหรือหน่วยคำ แล้วกำหนดเสียงอ่าน ชนิดคำ รูปพื้นฐาน และข้อมูลการผัน
MeCab สามารถส่งออก surface form, part of speech, base form, reading และ pronunciation ได้ ส่วน UniDic ก็เป็นพจนานุกรมสำหรับ morphological analysis ของภาษาญี่ปุ่นโดยตรง [3] [4]
สำหรับ 学校へ行った แนวทางนี้จะได้ 学校へ行った อย่างเป็นธรรมชาติ เพราะสนใจว่า 学校 อ่านว่า がっこう และรูปผัน 行った อ่านว่า いった
วิธีนี้เหมาะกับระบบอัตโนมัติ เช่น แอปเรียนภาษา ส่วนขยายเบราว์เซอร์ TTS ดัชนีค้นหา พจนานุกรมอิเล็กทรอนิกส์ และ NLP เพราะต้องรู้เสียงอ่านของคำตามบริบท
จุดบอด: เสียงอ่านของคำไม่ใช่ ruby บนหน้ากระดาษเสมอไป
行った อ่านว่า いった แต่สิ่งพิมพ์มักเขียน 行った เพราะ った ปรากฏอยู่ในข้อความหลักแล้ว จึงไม่ต้องยกไปไว้เหนือ 行 อีก
学校 เพียงพอสำหรับการอ่านออกเสียง แต่ถ้าต้องการให้เห็นบทบาทของ 学 และ 校 ในการเรียนคันจิ 学校 จะชัดกว่า
คำอย่าง 今日, 大人, 小豆 ไม่ควรถูกฝืนแบ่งเป็นตัว ๆ เพราะจะสร้างความเข้าใจผิด จึงควรมองเป็น group reading
แนวทางที่สอง: orthographic / kanji-unit driven
แนวทาง orthographic เริ่มจากรูปเขียนบนหน้า กระดาษมี kanji ตรงไหน? kanji เหล่านั้นเป็นคำประสมอะไร? ผู้อ่านเป้าหมายต้องการความช่วยเหลือตรงไหน? ถ้าใส่ ruby จะใส่รายตัว รายคำประสม หรือทั้งคำ?
JLREQ ยังแยก full ruby และ partial ruby: อาจใส่ให้ kanji ทั้งหมด ใส่เฉพาะตัวที่อ่านยาก หรือใส่เฉพาะครั้งแรกที่ปรากฏ [2]
Jukugo-ruby และ group-ruby
Jukugo-ruby คือรูปแบบกลางที่มักถูกมองข้าม 学校 ไม่ใช่แค่ ruby สองอันแยกกัน แต่ยังรักษา 学校 ให้เป็นคำประสมหนึ่งคำ พร้อมแสดงความสัมพันธ์ของแต่ละ kanji กับเสียงอ่าน
เมื่อไม่สามารถกระจายเสียงอ่านไปยังแต่ละ kanji ได้อย่างเป็นธรรมชาติ จะใช้ group-ruby เช่น 今日, 明日, 大人, 一昨日 [5]
ความแตกต่าง
| มิติ | Morphological | Orthographic / kanji-unit |
|---|---|---|
| คำถามหลัก | คำหรือประโยคนี้อ่านอย่างไร | kanji บนหน้ากระดาษควรรับเสียงอ่านส่วนใด |
| หน่วยพื้นฐาน | หน่วยคำ คำ short unit รูปผัน | ข้อความหลัก kanji คำประสม ทั้งคำ |
| ผลลัพธ์ทั่วไป | 学校, 行った | 学校, 行った |
| จุดแข็ง | อัตโนมัติ บริบท TTS เรียนคำศัพท์ | ชัดบนหน้ากระดาษ เรียนคันจิ หนังสือเด็ก สิ่งพิมพ์ |
| จุดอ่อน | อาจไม่บอกว่า kanji ใดรับเสียงส่วนใด | ทำอัตโนมัติยาก ต้องมีกฎและตรวจทาน |
ทำไมหนังสือเรียนและหนังสือเด็กจึงชอบแนวทางตัวอักษร?
เพราะไม่ได้ช่วยแค่อ่านออกเสียง แต่ยังสอน kanji ด้วย การศึกษาญี่ปุ่นมีการจัด kanji ตามระดับชั้น และเอกสารทางการยังพิจารณาพัฒนาการเด็ก ภาระการเรียน ความจำเป็นในชีวิตประจำวัน และความเข้าใจความหมาย [6] [7]
学校 อ่านได้ แต่ 学校 ทำให้เห็นบทบาทของ 学 และ 校 ส่วน 行った บอกเสียงอ่าน แต่ 行った แสดงความสัมพันธ์ของ kanji กับ okurigana
สี่ตัวอย่าง
学校. Morphological: 学校. Orthographic: 学校.
行った. Morphological: 行った. Orthographic: 行った.
今日. โดยมากทั้งสองแบบคือ 今日 เพราะการฝืนเป็น 今日 จะทำให้เข้าใจผิด
生物. บริบทกำหนดว่าจะเป็น せいぶつ หรือ なまもの แนวทาง orthographic อาจใช้ 生物 สำหรับความหมายชีววิทยา และ 生物 สำหรับอาหารสด
แบบไหนดีกว่าสำหรับผู้เรียน?
ถ้าต้องการอ่านประโยคให้ลื่น แนวทาง morphological ตรงและมีประโยชน์ ถ้ากำลังเรียนคันจิ อ่านหนังสือเด็ก อ่านละเอียด หรือทำสื่อการสอน แนวทาง orthographic จะซื่อสัตย์ต่อหน้ากระดาษมากกว่า
สำหรับแอปและสื่อการสอน: ทางที่ดีคือสองขั้นตอน
ระบบ furigana คุณภาพสูงควรใช้ morphological analysis เพื่อรู้ว่าคำอ่านอย่างไร แล้วใช้กฎแบบสิ่งพิมพ์เพื่อกำหนดว่าจะผูกเสียงอ่านกลับไปยังตัวอักษรใด ความยากอยู่ขั้นที่สอง เพราะมันรวมภาษาศาสตร์ การสอนคันจิ การจัดพิมพ์ญี่ปุ่น และการออกแบบเพื่อผู้อ่าน
แว่นสองคู่
แนวทาง morphological คือแว่นด้านเสียง มันถามว่าประโยคนี้ออกเสียงอย่างไร ส่วนแนวทาง orthographic คือแว่นด้านตัวเขียน มันถามว่าหน้านี้ช่วยให้ผู้อ่านอ่านเข้าใจและเรียนตัวอักษรอย่างไร
หมายเหตุจาก OCAT: ใน OCAT ผู้ใช้สามารถไปที่ Settings - Experimental Options เพื่อเลือก furigana แบบ orthographic / kanji-unit driven หรือแบบ morphological driven ได้อย่างอิสระ ค่าเริ่มต้นคือโหมด orthographic นี่อาจเป็นหนึ่งในแอปเรียนภาษาญี่ปุ่นที่แทบไม่มีใครเหมือนซึ่งรองรับโหมดนี้
