Vì sao app furigana tiếng Nhật của bạn trông không giống sách Nhật?
Nhiều người học tiếng Nhật lần đầu gặp furigana thường nghĩ rằng nó chỉ là viết cách đọc kana phía trên kanji. Cách hiểu đó không sai, nhưng rất nhanh sẽ xuất hiện thắc mắc.
Cùng một câu 昨日、学校へ行った。, công cụ tự động có thể cho 昨日、学校へ行った。. Sách thiếu nhi, giáo trình hoặc ấn phẩm được dàn trang kỹ có thể chọn 昨日、学校へ行った。.
Cả hai đều giúp đọc tiếng Nhật, nhưng chúng trả lời hai câu hỏi khác nhau: câu này phát âm thế nào, hay những kanji in trên trang nên được người đọc nhận ra ra sao.
Hãy xem ruby là hai quyết định
Trong dàn trang, furigana thường được gọi là ruby. Khi viết ngang, nó thường ở phía trên chữ chính; khi viết dọc, nó thường ở bên phải. W3C cũng mô tả ruby là một phần quan trọng của dàn trang tiếng Nhật. [1]
Nhưng chọn chữ nào cần chú âm và quyết định chú âm bám vào đơn vị nào là hai việc khác nhau. Có chú âm mọi kanji không? Chỉ chú âm chữ khó? Gắn vào từng kanji, từng kanji trong một từ ghép, hay cả từ?
JLREQ chia quan hệ ruby tiếng Nhật thành mono-ruby, jukugo-ruby và group-ruby. Ba khái niệm này là chìa khóa để hiểu hướng dựa trên chữ viết. [2]
Con đường thứ nhất: dựa trên hình thái tố
Cách này bắt đầu bằng phân tích ngôn ngữ. Nó tách câu thành từ hoặc đơn vị hình thái, rồi gán cách đọc, từ loại, dạng gốc và thông tin biến đổi.
MeCab có thể xuất dạng bề mặt, từ loại, dạng gốc, cách đọc và phát âm; UniDic cũng được thiết kế cho phân tích hình thái tiếng Nhật với các tầng như đơn vị ngắn, từ vựng, dạng chữ viết và dạng phát âm. [3] [4]
Với 学校へ行った, kết quả tự nhiên là 学校へ行った. Hệ thống quan tâm rằng từ 学校 đọc là がっこう, và dạng biến đổi 行った đọc là いった.
Cách này rất hợp cho tự động hóa: app học tập, tiện ích trình duyệt, đọc văn bản, chỉ mục tìm kiếm, từ điển điện tử và NLP đều cần cách đọc theo ngữ cảnh.
Điểm mù: cách đọc của từ không luôn là ruby trên trang
行った đọc là いった, nhưng trong xuất bản thường viết 行った. Phần った đã nằm trong văn bản chính, nên không cần đưa lên ruby của chữ 行.
学校 đủ để đọc thành tiếng. Nhưng nếu muốn học vai trò của 学 và 校, 学校 rõ hơn. がっ ở đây là phần âm tương ứng trong từ ghép sau biến đổi âm, không phải cách đọc cô lập がく.
Với 今日, 大人, 小豆, tách từng chữ sẽ gây trực giác sai. Khi đó nên xem cả từ là một nhóm.
Con đường thứ hai: dựa trên chữ viết / kanji-unit
Cách này bắt đầu từ trang viết. Kanji ở đâu? Chúng tạo thành từ ghép nào? Chữ nào cần trợ giúp cho người đọc mục tiêu? Nếu thêm ruby, nên thêm từng chữ, theo từ ghép, hay cả từ?
JLREQ cũng phân biệt tổng ruby và ruby một phần: có thể chú âm mọi kanji, chỉ chữ khó, hoặc chỉ lần xuất hiện đầu tiên. [2]
Jukugo-ruby và group-ruby
Jukugo-ruby là dạng trung gian dễ bị bỏ qua. 学校 không chỉ là hai chú âm rời rạc; nó giữ sự cân bằng của từ ghép 学校, đồng thời cho thấy mỗi kanji nhận một phần âm.
Khi âm đọc không thể phân bổ tự nhiên, dùng group-ruby: 今日, 明日, 大人, 一昨日. Khung Joyo Kanji của Nhật cũng xử lý nhiều ateji và jukujikun như cách đọc ở cấp độ từ. [5]
Khác biệt
| Góc nhìn | Dựa trên hình thái tố | Dựa trên chữ viết / kanji-unit |
|---|---|---|
| Câu hỏi chính | Câu hoặc từ này đọc thế nào? | Kanji trên trang nên nhận phần đọc nào? |
| Đơn vị cơ bản | Hình thái tố, từ, đơn vị ngắn, dạng biến đổi | Chữ chính, kanji, từ ghép, cả từ |
| Kết quả điển hình | 学校, 行った | 学校, 行った |
| Điểm mạnh | Tự động hóa, ngữ cảnh, TTS, học từ vựng | Rõ trên trang, học kanji, sách thiếu nhi, dàn trang chuẩn |
| Điểm yếu | Không luôn chỉ ra kanji nào mang âm nào | Khó tự động hóa, cần quy tắc và kiểm tra |
Vì sao giáo trình và sách thiếu nhi nghiêng về chữ viết?
Vì chúng không chỉ giúp phát âm, mà còn dạy kanji. Giáo dục Nhật có bảng kanji theo lớp, và tài liệu chính thức phân bổ âm on/kun theo giai đoạn phát triển, gánh nặng học tập, nhu cầu đời sống và hiểu nghĩa. [6] [7]
学校 đọc được, nhưng 学校 cho thấy vai trò của 学 và 校. 行った đủ cho phát âm, nhưng 行った cho thấy quan hệ giữa kanji và okurigana.
Bốn ví dụ
学校. Hình thái tố: 学校. Chữ viết: 学校. Một bên hợp học từ, một bên hợp học kanji.
行った. Hình thái tố: 行った. Chữ viết: 行った. Okurigana vẫn nằm trong văn bản chính.
今日. Thường cả hai đều là 今日, vì ép thành 今日 sẽ gây hiểu nhầm.
生物. Ngữ cảnh quyết định せいぶつ hay なまもの. Hướng chữ viết có thể dùng 生物 cho nghĩa sinh vật, nhưng giữ 生物 như một nhóm cho nghĩa đồ tươi sống.
Người học nên chọn cách nào?
Nếu chỉ muốn đọc câu trôi chảy, hướng hình thái tố rất trực tiếp. Nếu đang học kanji, đọc sách thiếu nhi, đọc kỹ hoặc làm giáo trình, hướng chữ viết trung thành hơn với trang in.
Với app và giáo trình: nên dùng hai giai đoạn
Hệ thống furigana chất lượng nên dùng phân tích hình thái để biết từ đọc thế nào, rồi dùng quy tắc dàn trang để quyết định âm đọc bám lại vào chữ in ra sao. Phần khó nằm ở giai đoạn hai: đó là ngôn ngữ học, giáo dục kanji, dàn trang Nhật và thiết kế cho người đọc.
Hai cặp kính
Hướng hình thái tố là cặp kính thính giác: nó hỏi câu này phát âm thế nào. Hướng chữ viết là cặp kính trang giấy: nó hỏi trang này giúp người đọc đọc hiểu và học chữ thế nào.
Ghi chú OCAT: Trong OCAT, vào Cài đặt - Tùy chọn thử nghiệm, người dùng có thể tự chọn furigana dựa trên chữ viết (orthographic / kanji-unit) hoặc dựa trên hình thái tố (morphological). Mặc định là chế độ chữ viết. OCAT có thể là một trong những app học tiếng Nhật hiếm hoi hỗ trợ cách này.
