Dự án Manjinbeop: Đề xuất cách viết số cho các ngôn ngữ Hàn-Trung-Nhật
(myriad-project.org)Tiếng Hàn, tiếng Trung và tiếng Nhật đọc số theo đơn vị vạn (萬), nhưng chữ số Ả Rập lại đặt dấu phẩy theo đơn vị nghìn. Khi nhìn 1,234,567,890, để đọc ngay thành “mười hai ức ba nghìn bốn trăm năm mươi sáu vạn bảy nghìn tám trăm chín mươi”, mỗi lần đều phải đếm lại số chữ số trong đầu.
Vì vậy, có đề xuất dùng dấu gạch dưới (_) làm ký tự phân tách theo đơn vị vạn.
Cách hiện tại: 1,234,567,890
Đề xuất: 12_3456_7890
Dấu gạch dưới nằm trong phạm vi ASCII nên có thể nhập trực tiếp trên bất kỳ bàn phím nào, và nhiều ngôn ngữ như Python, Rust đã dùng nó làm ký tự phân tách trong số literal. Khi dùng cùng với dấu phẩy, cũng có thể biểu diễn hai hệ thống theo dạng phân cấp.
Tác giả đã tạo phiên bản bằng năm ngôn ngữ: tiếng Anh, tiếng Hàn, tiếng Nhật, tiếng Trung giản thể và phồn thể. Cả mã nguồn lẫn nội dung đều được công khai trên Codeberg.
8 bình luận
Hiện vẫn còn hơi rối, nhưng nếu đã quen thì có vẻ sẽ tiện hơn so với việc phân tách theo đơn vị nghìn.
Ý tưởng khá mới mẻ đấy.
Khi biểu diễn trong Markdown, có vẻ sẽ phát sinh khá nhiều vấn đề...
May mắn là, theo đặc tả CommonMark, cú pháp
_của Markdown chỉ hoạt động ở ranh giới từ!Trong Swift, đây có vẻ là một cú pháp có thể dùng ngay mà không cần làm gì thêm.
Khi nói đồng thời cả tiếng Hàn và tiếng Anh, người ta thường cảm thấy rất khó khăn khi nói các con số của Hàn Quốc bằng tiếng Anh hoặc ngược lại.
Cách viết số bằng phương pháp này do bạn phát triển có thể giải quyết sự nhầm lẫn khi đọc số (đối với người Hàn, người Trung Quốc, v.v.), nhưng đáng tiếc là khi nói bằng lời thì dường như không có cách nào.
Như ý kiến bên dưới, khi dùng làm tiêu chuẩn quốc tế thì lại theo đơn vị nghìn, nên đây quả là tình huống khá khó xử. Và tôi cũng biết rằng ngay cả ở Hàn Quốc và Trung Quốc, khi sử dụng thì cũng viết theo đơn vị nghìn. Có lẽ điều này có thể hữu ích liên quan đến TTS, nhưng theo những gì tôi đã thử, tôi nhớ rằng đa số TTS tiếng Hàn đều đọc đúng là "man" ngay cả khi số được viết là 10,000 như vậy.
Sẽ rất hữu ích nếu bạn cho biết trong những trường hợp nào người ta viết theo đơn vị mười nghìn, và trong những tình huống thực tế nào điều đó có ích cho (coding).
Có vẻ để dự án này hoạt động tích cực thì sẽ cần những tính năng như bộ chuyển đổi giữa chữ số Ả Rập và Hán tự, nhưng tôi không chắc nó có ý nghĩa hay không.
Dùng theo đơn vị nghìn thì gần như là chuẩn chung của thế giới rồi.. cũng hơi giống cảm giác như đang đề xuất dùng pound thay vì kg vậy.. ở châu Âu cũng dùng
1.000thay vì1,000nên lỗi xảy ra khá nhiều