Vì sao app furigana tiếng Nhật của bạn trông không giống sách Nhật?

Dựa trên hình thái tố và dựa trên chữ viết: hai con đường của furigana tiếng Nhật

Nhiều người học tiếng Nhật lần đầu gặp furigana thường nghĩ rằng nó chỉ là viết cách đọc kana phía trên kanji. Cách hiểu đó không sai, nhưng rất nhanh sẽ xuất hiện thắc mắc.

Cùng một câu 昨日、学校へ行った。, công cụ tự động có thể cho 昨日きのう学校がっこう行ったいった. Sách thiếu nhi, giáo trình hoặc ấn phẩm được dàn trang kỹ có thể chọn 昨日きのうがっこうった。.

Cả hai đều giúp đọc tiếng Nhật, nhưng chúng trả lời hai câu hỏi khác nhau: câu này phát âm thế nào, hay những kanji in trên trang nên được người đọc nhận ra ra sao.

Hãy xem ruby là hai quyết định

Trong dàn trang, furigana thường được gọi là ruby. Khi viết ngang, nó thường ở phía trên chữ chính; khi viết dọc, nó thường ở bên phải. W3C cũng mô tả ruby là một phần quan trọng của dàn trang tiếng Nhật. [1]

Nhưng chọn chữ nào cần chú âm và quyết định chú âm bám vào đơn vị nào là hai việc khác nhau. Có chú âm mọi kanji không? Chỉ chú âm chữ khó? Gắn vào từng kanji, từng kanji trong một từ ghép, hay cả từ?

JLREQ chia quan hệ ruby tiếng Nhật thành mono-ruby, jukugo-ruby và group-ruby. Ba khái niệm này là chìa khóa để hiểu hướng dựa trên chữ viết. [2]

Con đường thứ nhất: dựa trên hình thái tố

Cách này bắt đầu bằng phân tích ngôn ngữ. Nó tách câu thành từ hoặc đơn vị hình thái, rồi gán cách đọc, từ loại, dạng gốc và thông tin biến đổi.

MeCab có thể xuất dạng bề mặt, từ loại, dạng gốc, cách đọc và phát âm; UniDic cũng được thiết kế cho phân tích hình thái tiếng Nhật với các tầng như đơn vị ngắn, từ vựng, dạng chữ viết và dạng phát âm. [3] [4]

Với 学校へ行った, kết quả tự nhiên là 学校がっこう行ったいった. Hệ thống quan tâm rằng từ 学校 đọc là がっこう, và dạng biến đổi 行った đọc là いった.

Cách này rất hợp cho tự động hóa: app học tập, tiện ích trình duyệt, đọc văn bản, chỉ mục tìm kiếm, từ điển điện tử và NLP đều cần cách đọc theo ngữ cảnh.

Điểm mù: cách đọc của từ không luôn là ruby trên trang

行った đọc là いった, nhưng trong xuất bản thường viết った. Phần った đã nằm trong văn bản chính, nên không cần đưa lên ruby của chữ .

学校がっこう đủ để đọc thành tiếng. Nhưng nếu muốn học vai trò của , がっこう rõ hơn. がっ ở đây là phần âm tương ứng trong từ ghép sau biến đổi âm, không phải cách đọc cô lập がく.

Với 今日きょう, 大人おとな, 小豆あずき, tách từng chữ sẽ gây trực giác sai. Khi đó nên xem cả từ là một nhóm.

Con đường thứ hai: dựa trên chữ viết / kanji-unit

Cách này bắt đầu từ trang viết. Kanji ở đâu? Chúng tạo thành từ ghép nào? Chữ nào cần trợ giúp cho người đọc mục tiêu? Nếu thêm ruby, nên thêm từng chữ, theo từ ghép, hay cả từ?

JLREQ cũng phân biệt tổng ruby và ruby một phần: có thể chú âm mọi kanji, chỉ chữ khó, hoặc chỉ lần xuất hiện đầu tiên. [2]

Jukugo-ruby và group-ruby

Jukugo-ruby là dạng trung gian dễ bị bỏ qua. がっこう không chỉ là hai chú âm rời rạc; nó giữ sự cân bằng của từ ghép 学校, đồng thời cho thấy mỗi kanji nhận một phần âm.

Khi âm đọc không thể phân bổ tự nhiên, dùng group-ruby: 今日きょう, 明日あした, 大人おとな, 一昨日おととい. Khung Joyo Kanji của Nhật cũng xử lý nhiều ateji và jukujikun như cách đọc ở cấp độ từ. [5]

Khác biệt

Góc nhìnDựa trên hình thái tốDựa trên chữ viết / kanji-unit
Câu hỏi chínhCâu hoặc từ này đọc thế nào?Kanji trên trang nên nhận phần đọc nào?
Đơn vị cơ bảnHình thái tố, từ, đơn vị ngắn, dạng biến đổiChữ chính, kanji, từ ghép, cả từ
Kết quả điển hình学校がっこう, 行ったいったがっこう, った
Điểm mạnhTự động hóa, ngữ cảnh, TTS, học từ vựngRõ trên trang, học kanji, sách thiếu nhi, dàn trang chuẩn
Điểm yếuKhông luôn chỉ ra kanji nào mang âm nàoKhó tự động hóa, cần quy tắc và kiểm tra

Vì sao giáo trình và sách thiếu nhi nghiêng về chữ viết?

Vì chúng không chỉ giúp phát âm, mà còn dạy kanji. Giáo dục Nhật có bảng kanji theo lớp, và tài liệu chính thức phân bổ âm on/kun theo giai đoạn phát triển, gánh nặng học tập, nhu cầu đời sống và hiểu nghĩa. [6] [7]

学校がっこう đọc được, nhưng がっこう cho thấy vai trò của . 行ったいった đủ cho phát âm, nhưng った cho thấy quan hệ giữa kanji và okurigana.

Bốn ví dụ

学校. Hình thái tố: 学校がっこう. Chữ viết: がっこう. Một bên hợp học từ, một bên hợp học kanji.

行った. Hình thái tố: 行ったいった. Chữ viết: った. Okurigana vẫn nằm trong văn bản chính.

今日. Thường cả hai đều là 今日きょう, vì ép thành きょ sẽ gây hiểu nhầm.

生物. Ngữ cảnh quyết định せいぶつ hay なまもの. Hướng chữ viết có thể dùng せいぶつ cho nghĩa sinh vật, nhưng giữ 生物なまもの như một nhóm cho nghĩa đồ tươi sống.

Người học nên chọn cách nào?

Nếu chỉ muốn đọc câu trôi chảy, hướng hình thái tố rất trực tiếp. Nếu đang học kanji, đọc sách thiếu nhi, đọc kỹ hoặc làm giáo trình, hướng chữ viết trung thành hơn với trang in.

Với app và giáo trình: nên dùng hai giai đoạn

Hệ thống furigana chất lượng nên dùng phân tích hình thái để biết từ đọc thế nào, rồi dùng quy tắc dàn trang để quyết định âm đọc bám lại vào chữ in ra sao. Phần khó nằm ở giai đoạn hai: đó là ngôn ngữ học, giáo dục kanji, dàn trang Nhật và thiết kế cho người đọc.

Hai cặp kính

Hướng hình thái tố là cặp kính thính giác: nó hỏi câu này phát âm thế nào. Hướng chữ viết là cặp kính trang giấy: nó hỏi trang này giúp người đọc đọc hiểu và học chữ thế nào.

Ghi chú OCAT: Trong OCAT, vào Cài đặt - Tùy chọn thử nghiệm, người dùng có thể tự chọn furigana dựa trên chữ viết (orthographic / kanji-unit) hoặc dựa trên hình thái tố (morphological). Mặc định là chế độ chữ viết. OCAT có thể là một trong những app học tiếng Nhật hiếm hoi hỗ trợ cách này.

Tài liệu tham khảo

  1. Rules for Simple Placement of Japanese Ruby
  2. Requirements for Japanese Text Layout 日本語組版処理の要件
  3. MeCab: Yet Another Part-of-Speech and Morphological Analyzer
  4. UniDic glossary
  5. 文化庁 常用漢字表
  6. 学年別漢字配当表
  7. 文部科学省 音訓の小・中・高等学校段階別割り振り表

OCAT

Học nguyên câu hiệu quả hơn ghi nhớ từng từ riêng lẻ!

OCAT là ứng dụng giúp bạn nhanh chóng cải thiện kỹ năng nói tiếng Nhật, tiếng Trung, tiếng Quảng Đông và tiếng Anh thông qua hội thoại cùng AI.

Bạn dễ dàng thu thập những câu nói thực tế kèm hướng dẫn phát âm, nghe lại âm thanh và đánh dấu, nhanh chóng xây dựng bộ sưu tập câu giao tiếp hàng ngày của riêng bạn. Phát lặp lại, luyện tai nghe, và tự nhiên nói lưu loát.

Học nguyên câu hiệu quả hơn ghi nhớ từng từ riêng lẻ!

Tên gọi "OCAT" bắt nguồn từ cụm từ tiếng Nhật "おしえてoshiete", nghĩa là "Xin hãy chỉ cho tôi."

Tính năng nổi bật