Một kỹ sư AI tuyên bố đã giải mã được Linear A
(aiclambake.com)- Chữ viết thời kỳ đồ đồng của người Minoa Linear A đã ở trạng thái chưa được giải mã hơn 100 năm, và nếu cách giải mã của Tom Di Mino là đúng thì đây có thể là một sự kiện lớn đối với ngành ngôn ngữ học
- Di Mino xem Linear A là một ngôn ngữ Semit đã tuyệt chủng gần với ngôn ngữ đi trước Hebrew Kinh Thánh, và các chuyên gia ngôn ngữ học từ Rutgers và Cambridge hiện đang xem xét giả thuyết này
- Việc giải mã trở nên khó khăn hơn do thiếu tư liệu, các bia khắc chủ yếu là danh mục kiểm kê, và 13 ký hiệu không có trong Linear B; các giả thuyết Semit trước đây cũng chưa từng được chấp nhận rộng rãi
- Manh mối cốt lõi xuất hiện từ công thức chính thức của một bài cầu nguyện Linear A vào ngày 22/5/2026, khi Di Mino đọc ký hiệu riêng
*301lànavà liên hệ gốc N-W-Y với nghĩa “cư ngụ” - Sau khi dùng Claude Code để truy vấn và đối chiếu chéo kho ngữ liệu dựa trên GORILA và SigLA, Di Mino đã tạo ra bản đọc cho 40 ký hiệu, bản dịch tiếng Anh của 408 thuật ngữ, và bản thảo bài nghiên cứu dài 9 trang
Vị trí hiện tại của giả thuyết giải mã Linear A
- Tom Di Mino là một kỹ sư AI tự học sống ở Hudson Valley và cũng là một nhà ngôn ngữ học nghiệp dư, người tuyên bố đã giải mã được chữ viết thời kỳ đồ đồng của người Minoa Linear A
- Giả thuyết giải mã này hiện đang được các chuyên gia ngôn ngữ học tại Rutgers và Cambridge xem xét
- Di Mino cho biết ông đã học lịch sử cổ đại, ngôn ngữ học và các ngôn ngữ từ năm 18 tuổi, đã nghiên cứu Linear A suốt 7 năm và đã hai lần đến Crete
- Ông cho biết đã bắt đầu công việc giải mã Linear A vào tháng 1/2026 và có được trực giác quan trọng vào ngày 22/5
- Nếu được xác nhận là đúng, đây có thể là một sự kiện lớn trong lĩnh vực ngôn ngữ học
- Chữ viết liên quan của người Minoa là Linear B đã được giải mã vào năm 1952 và khi đó đã lên trang nhất của New York Times
Cách Di Mino diễn giải hệ ngôn ngữ
- Di Mino diễn giải Linear A là thuộc nhánh Semit đã tuyệt chủng
- Ông cho rằng nó là ngôn ngữ đi trước Hebrew Kinh Thánh, tương tự như mối quan hệ giữa Latin và Italian
- Giả thuyết Semit về Linear A không phải là điều mới
- Cyrus Gordon đã đưa ra cách diễn giải tương tự trong bài báo Antiquity năm 1957
- Các nỗ lực trước đây không dẫn tới bản dịch như cách làm của Di Mino, và công trình của Gordon cũng không được giới học thuật chấp nhận rộng rãi
Điểm tách biệt giữa Linear A và Linear B
- Linear A là chữ viết của người Minoa xuất hiện khoảng năm 1800 TCN và được dùng đến năm 1450 TCN
- Việc sử dụng chấm dứt khi Crete bị người Hy Lạp Mycenae chinh phục vào năm 1450 TCN
- Người Hy Lạp Mycenae đã chỉnh sửa và sử dụng một phần ký hiệu Minoa, và phiên bản Mycenae-Hy Lạp này chính là Linear B
- Cả hai hệ chữ đều được tìm thấy trên phiến đất, bình gốm và các hiện vật khác của thời kỳ đó
- Đơn vị cốt lõi không phải là chữ cái mà là âm tiết
- Âm tiết phần lớn được cấu thành từ cặp phụ âm-nguyên âm
- Hai hệ cùng chia sẻ 60 ký hiệu âm tiết cốt lõi và cũng dùng các logogram biểu thị cả từ
Vì sao các nỗ lực giải mã trước đây bị bế tắc
- Linear B đã được kiến trúc sư, nhà mật mã học và nhà ngôn ngữ học nghiệp dư người Anh Michael Ventris xác định là tiếng Hy Lạp và giải mã vào năm 1952
- Nghiên cứu đi trước của giáo sư Alice Kober tại Brooklyn College có thể đã góp phần vào bước đột phá của Ventris
- Kober và Ventris đã dùng phân tích ngữ pháp và thống kê để tìm vị trí ký hiệu và các mẫu biến đổi
- Họ xem xét những mẫu như khả năng âm tiết đầu tiên là nguyên âm
- Số lượng văn khắc Linear B nhiều hơn rất nhiều so với Linear A, nên thuận lợi hơn cho việc giải mã
- Phần lớn văn khắc Linear A là danh mục kiểm kê ghi chép giao dịch hàng hóa, nên có ít manh mối hơn để xác định chính ngôn ngữ đó
- Vì hai hệ chữ chia sẻ 60 ký hiệu và Linear B đã được giải mã, các chuyên gia có thể suy đoán phần nào âm đọc của các ký hiệu Linear A trùng lặp
- Vấn đề là họ không biết những âm đó mang nghĩa gì
- Linear A có thêm 13 ký hiệu không có trong Linear B, và chưa có cách diễn giải giá trị âm nào được chấp nhận cho chúng
Manh mối từ bài cầu nguyện ngày 22/5
- Di Mino cho biết vào ngày 22/5/2026, ông đang phân tích một chuỗi văn khắc bài cầu nguyện Linear A tuân theo một công thức nhất quán
- Trong công thức đó, mọi từ ở mỗi dòng đều đã được biết đến dựa trên sự trùng lặp với các âm tiết của Linear B, chỉ còn từ đầu tiên là chưa được giải quyết
- Từ đầu tiên dường như là cùng một gốc động từ, xuất hiện dưới các biến thể địa phương khác nhau tại năm khu thánh địa trên đảo
- Động từ đó gồm 5 ký hiệu Linear B đã biết và ký hiệu riêng của Linear A là
*301- Di Mino đọc
*301làna - Từ đó ông giải được gốc
nawayavà xem nghĩa của nó là “cư ngụ” - Trong Hebrew, Akkadian và các ngôn ngữ Semit khác có hệ phụ âm gốc ba âm tiết, và N-W-Y được dùng trong các động từ và danh từ mang nghĩa “cư ngụ” hoặc “sống”
- Di Mino đọc
- Sau khi giải mã, Di Mino diễn giải rằng bài cầu nguyện này tương tự các lời cầu nguyện Hebrew về sau, nhưng đối tượng là một nữ thần
Điểm khác với các giả thuyết Semit trước đây
- Cyrus Gordon từng đề xuất mối liên hệ giữa các phiến dâng hiến Linear A với những phiến tương tự trong Akkadian và Phoenician mà ông đã dịch
- Di Mino tuyên bố mình là người đầu tiên xác định được mối liên hệ giữa văn khắc Linear A và lời cầu nguyện Hebrew
- Trực giác này không chỉ giúp giải động từ trong văn khắc cầu nguyện mà còn có thể giúp hiểu rộng hơn cách dùng logogram trong Linear A
- Di Mino cho rằng cách diễn giải logogram Linear A của mình cũng giải quyết được một số vấn đề dịch thuật trong Linear B, qua đó kiểm chứng kết quả
Công việc kho ngữ liệu và đầu ra được tạo bằng công cụ AI
- Di Mino đã dùng Claude Code để tạo một bộ script Python
- Các script này truy vấn, đối chiếu chéo và sắp xếp một kho ngữ liệu Linear A số hóa lấy từ cơ sở dữ liệu GORILA và SigLA
- Điều này cho phép kiểm thử giả thuyết một cách có hệ thống ở quy mô gần như không thể làm thủ công
- Kết quả nghiên cứu là đề xuất bản đọc cho 40 ký hiệu chữ viết
- Trong đó có 13 ký hiệu mà trước đây chưa biết giá trị âm
- Ông cũng tuyên bố đã giải được giá trị âm của 5 ký hiệu Linear B mà đến nay vẫn chưa rõ
- Ông đã tạo một bảng từ vựng dịch 408 thuật ngữ Linear A sang tiếng Anh
- Ông cũng soạn bản thảo dài 9 trang có tên Ya Diktu: Grammar of the Minoan Peak Sanctuary Libation Formula
- Bản thảo này có thể trở thành nền tảng để nộp lên một tạp chí học thuật bình duyệt
1 bình luận
Ý kiến trên Hacker News
Với tư cách là một người nghiệp dư bị mê hoặc bởi câu đố này, tôi xin bổ sung chút bối cảnh có thể giúp đánh giá mức độ đáng tin của tuyên bố này
Libation Formula mà tác giả dùng làm nền tảng cho bản dịch là cụm văn bản được nghiên cứu nhiều nhất trong Linear A, vì đó là cấu trúc duy nhất lặp đi lặp lại, kể cả với các biến thể ngữ pháp
Toàn bộ kho ngữ liệu cực kỳ rời rạc, chỉ có vài văn bản dài, mà ngay cả những văn bản đó cũng chỉ dài cỡ một câu tiếng Anh trung bình. Phần lớn là các danh sách như kiểm kê, nhân sự, đồ cúng tế; còn các văn bản dài thì có dấu câu dường như phân tách từ, nên cung cấp không ít từ vựng, nhưng lại không khớp với bất kỳ ngôn ngữ nào đã biết
Khi lượng tư liệu còn lại ít như vậy, thậm chí rất khó chắc chắn rằng a) mọi văn bản mà ta gọi là Linear A có thực sự cùng một ngôn ngữ hay không, và b) những từ có thể nhận ra có phải chỉ là dạng viết tắt hay không
Tác giả giả định rằng các ký hiệu Linear A có chữ cái tương ứng trong Linear B sẽ có cùng giá trị âm. Vì vậy có thể dùng chữ vốn đã biểu thị “NA”. Các chữ “trùng lặp” chỉ xuất hiện ở nhóm P, và được suy đoán là biểu thị những âm tiết có phân biệt trong ngôn ngữ Linear A nhưng không có trong tiếng Hy Lạp, chẳng hạn như P bật hơi/không bật hơi. Trong Linear B có chữ “NWA”, và cũng đã tìm thấy ví dụ tương ứng trong Linear A
Trong tiếng Hy Lạp cổ có rất nhiều từ không rõ từ nguyên, và người ta cho rằng chúng đến từ ngôn ngữ nền được dùng ở khu vực đó vào thời người Hy Lạp di cư tới quê hương hiện nay. Ngôn ngữ của Linear A có thể là một ứng viên mạnh cho lớp nền đó. Nếu Linear A là một ngôn ngữ Semit, thì đáng lẽ ta đã phải dựng được từ nguyên Semit từ những dạng còn sót lại của các từ ấy trong tiếng Hy Lạp. Dĩ nhiên, cũng có thể các từ đó đến từ những ngôn ngữ khác chưa từng tiếp nhận chữ viết hoặc không còn truyền lại văn tự
Tôi cũng đã liên hệ với Dr. Ester Salgarella, nên tôi biết các nỗ lực áp dụng phân tích tính toán vào kho ngữ liệu này, cũng như những điểm mà các cách tiếp cận trước đây đã sai
Nếu cư dân tiền Hy Lạp ở Crete dùng ngôn ngữ Semit, thì đáng lẽ phải có nhiều từ vay mượn như vậy hơn nữa, đặc biệt là trong địa danh
Nếu xem cùng nhau tiếng Hy Lạp, Linear B và các ngôn ngữ Semit, thì Cypriot syllabary liên quan đã được giải mã nhờ các bia khắc song ngữ Phoenicia-Hy Lạp: https://en.wikipedia.org/wiki/Idalion_bilingual
Và cũng như ở Crete, cũng có một ngôn ngữ tiền Hy Lạp được viết bằng cùng hệ chữ nhưng đến nay vẫn chưa được giải mã: https://en.wikipedia.org/wiki/Eteocypriot_language
Tiếng Hy Lạp nói ở thời đó gần như chắc chắn có phân biệt phụ âm tắc vô thanh bật hơi và không bật hơi, giống như tiếng Ấn-Âu nguyên thủy và tiếng Hy Lạp cổ điển về sau; nếu ngôn ngữ Linear A có sự phân biệt như vậy thì tại sao người Hy Lạp lại không mang nó sang Linear B? Có vẻ hợp lý hơn nhiều nếu cho rằng chính ngôn ngữ hoặc chữ viết Linear A không có sự phân biệt đó, nên Linear B cũng không thể hiện nó
Việc có tiến triển từ một đoạn văn vốn đã được nghiên cứu rất nhiều dường như ngược lại còn là lý do để hoài nghi, nên tôi muốn biết anh đánh giá ra sao
Có nhiều kẻ lập dị đưa ra những tuyên bố kiểu này, nhưng công trình của Tom đủ đáng tin để được các chuyên gia ngôn ngữ học ở Rutgers và Cambridge xem xét
Là cơ sở kiểm chứng bổ sung, cách tiếp cận của anh ấy đã tạo ra kết quả. Anh ấy đã dịch được hơn 300 từ, điều mà trước đây chưa ai làm được, và lời giải của anh ấy cũng thực sự giải quyết một số vấn đề trong Linear B
Tom là một kỹ sư AI, và Claude Code là trọng tâm của công việc. Công bố xung đột lợi ích: tôi quen Tom ngoài đời, và bài được liên kết là do tôi viết
Có phải là đã gửi email cho vài người ở Rutgers và Cambridge, hay là đang được phản biện đồng cấp không ẩn danh dưới một hình thức nào đó?
Tôi rất muốn nghe thêm về cách Claude được dùng để giải câu đố này
Nếu nhìn một cách hoài nghi, điều này có thể trông như đang công bố quá sớm trước khi được xác nhận hoàn toàn, phần nào làm giảm công lao của anh ấy
“Di Mino used Claude Code to build a suite of Python scripts that query, cross-reference, and organize the digitized Linear A corpus (drawn from the GORILA and SigLA databases), enabling systematic hypothesis testing at a scale that would have been impractical to do manually.”
Nếu Claude được dùng trong các dự án kiểu này, thì đây chính xác là cách tôi muốn thấy nó được dùng. Không phải để “giải” vấn đề như một hộp đen, mà là để xây dựng công cụ
Lý do khiến Linear A khó là vì toàn bộ phần văn bản còn sót lại chỉ khoảng 7.500 ký tự, lại còn rải rác trên khoảng 1.500 bản khắc
Nếu có màn hình 4K, bạn có thể đặt toàn bộ phần văn bản Linear A còn lại lên một màn hình duy nhất với cỡ chữ 14 point
Một kiểu phổ biến khác là các niêm phong đất sét nhỏ có khắc 1–2 ký tự. Trong cả hai trường hợp, rất có thể ta đang xử lý chữ viết tắt
Một số danh sách kết thúc bằng “ku-ro” và một con số; con số đó là tổng của các số phía trước, và kỳ lạ là khá thường xuyên bị lệch đúng 1 đơn vị
Tôi không rõ vì sao người Minoan lại dùng tiếng Hebrew. Theo hiểu biết của tôi, không có dấu hiệu nào cho thấy từng có sự giao lưu văn hóa rộng khắp giữa nền văn minh Minoan và những người nói tiếng Hebrew
Có một thứ bậc khá rõ về độ khó khi dịch các hệ chữ đã chết. Từ dễ đến khó là: a) biết hệ chữ đó ghi ngôn ngữ nào và ghi như thế nào, b1) không biết đó là ngôn ngữ nào nhưng biết hệ chữ vận hành ra sao, b2) biết ngôn ngữ nào nhưng không biết hệ chữ vận hành ra sao, c) không biết cả ngôn ngữ lẫn hệ chữ
b1 và b2 nhìn chung có độ khó tương tự nhau, còn Linear A thuộc nhóm c). Ngoài việc Linear A được tái sử dụng trong Linear B để ghi tiếng Hy Lạp Mycenae, ta hầu như không biết gì về cả hệ chữ lẫn ngôn ngữ này
Không hoàn toàn giống vậy, nhưng do văn bản quá ít nên vẫn còn rất nhiều cách diễn giải khả dĩ
Theo tôi biết thì vấn đề cốt lõi là kho ký tự của Linear A khá nhỏ. Theo một bình luận khác, toàn bộ chỉ có 7.500 ký hiệu và rải trên 1.500 bản khắc, tức trung bình chỉ 5 ký hiệu mỗi bản khắc
Điều kỳ lạ nữa là chỗ này lại kết luận đó là một ngôn ngữ Semit. Nếu là ngôn ngữ Semit thì tôi đã kỳ vọng nó phải được giải mã từ lâu rồi. Các nhà ngôn ngữ học hẳn đã xem xét các ngôn ngữ Semit như một điều hiển nhiên, và còn rất kỹ nữa
Và nếu là ngôn ngữ Semit, thì tại sao nó lại là chữ âm tiết có nguyên âm chứ không phải một hệ chữ phụ âm? Thông thường các ngôn ngữ Semit, và có lẽ cả tiếng Ai Cập, có gốc từ gồm ba phụ âm và các nguyên âm được đan vào giữa để tạo thành từ, nên người ta chỉ ghi phụ âm
Ví dụ, gốc Semit K-T-B có thể thành kataba, yaktubu, kitāb, kutub, kātib, maktūb, maktab, maktabah khi chèn nguyên âm vào giữa. D-R-S cũng biến đổi thành darasa, yadrusu, dirāsah, dāris, madrūs, madrasah
Chính vì hệ thống gốc ba phụ âm này mà các ngôn ngữ Semit thường không ghi nguyên âm; vậy nếu Linear A là một ngôn ngữ Semit thì tại sao nó lại là chữ âm tiết phụ âm+nguyên âm?
Vì nó giúp phân biệt thì, bị động/chủ động, danh từ hóa, v.v.; nói cách khác là giúp phân biệt nhiều từ khác nhau xuất phát từ cùng một gốc
Rất thú vị, và xin chúc mừng thành quả của Tom
Nhưng nói cho rõ thì đây là một nỗ lực giải mã. Nó vẫn chưa được chứng minh, và trước khi các chuyên gia trong lĩnh vực xem xét thì không nên coi Linear A là đã “được giải”
Thực ra sẽ khó mà coi đây là “đã chứng minh” trừ khi tìm thấy thêm nhiều văn bản Linear A và chúng phù hợp với phương pháp được đề xuất. Điều chắc chắn có thể nói lúc này chỉ là đây là một giả thuyết thú vị
Dù vậy, đây vẫn là câu chuyện đáng để tiếp tục theo dõi. Nó có thể là thật. Cần có thêm nghiên cứu và kiểm chứng, và trong vài tuần hay vài tháng tới có lẽ chúng ta sẽ biết rõ hơn liệu Linear A có thực sự được giải mã hay không. Ít nhất thì đây là một nỗ lực thú vị, và nếu lạc quan thì nó có thể mang lại hiểu biết thực sự về văn hóa Minoan
Chẳng phải vấn đề lớn của Linear A là số lượng ký hiệu quá ít, nên tuy có thể tương đối dễ “giải”, nhưng lại không có cách nào biết nó đúng hay sai hay sao?
Nếu điều này được chứng minh là thật, thì nó sẽ hé mở đôi chút cánh cửa nối giữa ngữ hệ Ấn-Âu và ngữ hệ Semit
Vào đầu thế kỷ trước, người ta từng cho rằng hai ngữ hệ này có liên hệ với nhau, rồi sau đó quan điểm đó không còn thịnh hành nữa. Lý do khiến người ta ban đầu có thể sai đến vậy là vì hai ngữ hệ này từng đan xen với nhau. Hiện nay đã có bằng chứng di truyền cho thấy hai ngôn ngữ này lan rộng từ những nơi rất gần Caucasus
Với đa số người đọc thì đây có lẽ là chuyện cũ rồi, nhưng trong khoảng 15 năm qua, điều đã trở nên rõ ràng là châu Âu từng được tái định cư hoàn toàn một lần bởi người Anatolian, và sau đó một phần lại bởi người Ấn-Âu. Ngôn ngữ của người Anatolian vẫn chưa được biết đến
Trùng hợp ngẫu nhiên, đôi khi là từ vay mượn thực sự, và cả thiên kiến của một số người
Khoan đã, tôi nhớ là cũng từng thấy cùng một Libation Formula trên Phaistos disc. Ghi ra đây cho khoảng 10 người có cài phông chữ đó xem nhé
𐇑 𐇘 𐇪 𐇐 | 𐇬 𐇳 𐇖 𐇗𐇽 | 𐇬 𐇗 𐇜 | 𐇬 𐇼 𐇖𐇽 | 𐇥 𐇬 𐇳 𐇖 𐇗𐇽 | 𐇪 𐇱 𐇦 𐇨 | 𐇖 𐇡 𐇲 | 𐇖 𐇼 𐇖𐇽 | 𐇖 𐇡 𐇲 | 𐇥 𐇬 𐇳 𐇖 𐇗𐇽
i-𐇘-wi-jeʳ | ʰau-ni-ti-noʳ au-no-pa au-ndi-tiʳ 𐇥-au-ni-ti-noʳ wa-pi-naᵐwa ti-ru-te ti-nd-tri ti-na-ru-he ʰau-ni-ti-noʳ
i-301-wa-ja/e | ʰau-... jaᵘ-di-ki-to i-pi-na-ma si-ru-te ta-na-ra te-ti-u ta-na-te i-da
𐘚 ᴴI 𐘮 WA 𐘱 JA 𐘱 JA 𐘆 DI 𐘸 KI 𐘹 TU 𐘚 ᴴI 𐘢 PI 𐘅 NA 𐙁 MA ()
Ở đây, giá trị âm của Phaistos có vẻ đã được gán dựa trên sự tương đồng
Chỉ còn thiếu ký tự cuối cùng (); tôi đang tò mò không biết nó thuộc phông nào