- Văn bản là công nghệ giao tiếp mạnh mẽ nhất trong lịch sử nhân loại, với khả năng biểu đạt và hiệu quả vượt trội so với mọi phương tiện khác
- So với hình ảnh, video và âm thanh, đây là phương tiện phù hợp nhất để truyền đạt các khái niệm trừu tượng và tư duy phức tạp một cách chính xác
- Đây là công nghệ đã được kiểm chứng về độ bền và tính ổn định, đến mức chúng ta vẫn có thể đọc được các ghi chép từ hàng nghìn năm trước
- Xét về chi phí lưu trữ và truyền tải, nó hiệu quả vượt trội, và đã nhiều lần đóng vai trò điểm khởi đầu cho sự phát triển của công nghệ truyền thông
- Về phạm vi và chiều sâu ứng dụng xã hội như tìm kiếm, dịch thuật, tóm tắt và cộng tác, không phương tiện nào khác có thể theo kịp
Quan điểm cơ bản về văn bản
- Mỗi khi nhận được câu hỏi về video, 3D, game và các hệ thống đa phương tiện động, tác giả đều lặp lại cùng một lập trường
- Không phủ nhận giá trị của hình ảnh, ảnh chụp, phim và âm nhạc, nhưng cho rằng ưu thế của văn bản là tuyệt đối
- Văn bản được xác định là công nghệ giao tiếp mạnh mẽ, hữu ích và hiệu quả nhất
Công nghệ lâu đời và ổn định nhất
- Lời nói và ngôn ngữ ký hiệu tồn tại tự nhiên trong xã hội loài người, nhưng văn bản là công nghệ được tiếp thu thông qua học tập và truyền lại
- Nó có độ bền theo thời gian đến mức chúng ta vẫn có thể đọc các ghi chép từ khoảng 5.000 năm trước
- Vì được khắc lên các vật liệu vật lý như đá, nó thậm chí có thể tồn tại lâu hơn cả loài người
Phương tiện biểu đạt linh hoạt nhất
- Hình ảnh rất mạnh trong một số tình huống cụ thể, nhưng không thể biểu đạt trực quan một câu trừu tượng tùy ý
- Những câu mang tính khái niệm như định nghĩa về nhân quyền không thể được thay thế bằng tranh vẽ
- Văn bản có thể truyền đạt ý tưởng trong khi kiểm soát được mức độ chính xác và mơ hồ
- Việc văn học, triết học, lịch sử, toán học, logic, lập trình và kỹ thuật đều dựa trên văn bản không phải là ngẫu nhiên
Phương thức truyền thông hiệu quả nhất
- Văn bản có mức hiệu quả khác biệt hẳn về không gian lưu trữ và chi phí truyền tải
- Hàng nghìn byte văn bản thậm chí có thể nhỏ hơn một hình ảnh biểu tượng đơn giản
- Từ điện báo quang học, điện báo, máy teletype đến các mạng máy tính sơ khai, văn bản luôn xuất hiện trước tiên
- Âm thanh, hình ảnh và video chỉ xuất hiện sau khi băng thông trở nên đủ rẻ
- Nó có mật độ thông tin cao đến mức có thể chứa toàn bộ Wikipedia trong một chiếc smartphone
Công nghệ hữu ích nhất về mặt xã hội
- Nó hoạt động hiệu quả trong cả giao tiếp 1:1, 1:N và M:N
- Có thể tìm kiếm và lập chỉ mục, kể cả bằng thao tác thủ công
- Được tối ưu cho xử lý thuật toán như dịch thuật, so sánh, diff, phân cụm, hiệu đính, tóm tắt và lọc
- Có thể sử dụng bất đồng bộ và tự do điều chỉnh tốc độ
- Hỗ trợ biên tập cộng tác, trích dẫn, chú thích, thảo luận phân nhánh, tóm tắt, review và cả sáng tác phái sinh
- Không tồn tại công nghệ nào có thể thay thế độ phức tạp xã hội và nhận thức ở cấp độ thư viện và các bài đăng trên internet
Kết luận
- Vì vậy, lập trường đối với văn bản là rất rõ ràng: luôn chọn văn bản trước (always pick text first)
- Mượn lời của một người sếp cũ: luôn đặt cược vào văn bản (always bet on text)
- Nếu có thể làm điều gì đó bằng văn bản thì hãy làm như vậy. Văn bản hầu như không bao giờ làm bạn thất vọng
3 bình luận
Đúng là văn bản là một công cụ biểu đạt rất tốt và cũng vô cùng quan trọng...
Nhưng không phải mọi thứ đều có thể được lưu trữ dưới dạng văn bản.
Xét cho cùng, văn bản là một hình thức biểu đạt đã được nén lại. Nó là cách nén và biểu đạt năm giác quan mà chúng ta có thể cảm nhận được (thị giác, thính giác, xúc giác, vị giác, khứu giác) theo một khuôn thức được xã hội đồng thuận.
Nhưng nếu không có thông tin về đối tượng gốc làm nên nguyên mẫu đó, thì dù có lưu dữ liệu bằng văn bản đi nữa, về sau nếu người ta không biết đối tượng gốc ấy là gì, văn bản đó cũng sẽ mất đi ý nghĩa.
Chúng ta biết cassette là gì, nhưng nếu chỉ cho những đứa trẻ mới sinh ra gần đây nhìn thấy mỗi từ "cassette" rồi hỏi đó là gì, liệu sẽ có bao nhiêu đứa có thể trả lời đúng? Dù có chăm chỉ giải thích hình dạng, chức năng và cách hoạt động của cassette đến đâu, thì vài nghìn năm sau, chỉ với văn bản đó thôi, liệu có thể tái hiện lại một chiếc cassette một cách hoàn chỉnh hay không?
Trong những trường hợp như vậy, vài tấm ảnh cassette, bản vẽ, hay vài phút video về cách sử dụng cassette có thể còn hữu ích hơn.
Văn bản rõ ràng là ổn định, nhưng tôi không chắc nó có trực quan hay không.
Ý kiến trên Hacker News
Tôi không hiểu tính nhị nguyên của cuộc thảo luận này
Tôi không hiểu vì sao lại phải rơi vào tình huống phải chọn giữa UTF-8 và bản ghi âm người chơi piano
Cảm giác như có ai đó quá hưng phấn với chủ đề này nên chỉ nói theo kiểu đối lập đơn giản “Ford vs. Chevy”
Chúng ta đều thích văn bản rồi, nên mong là đừng cố thuyết phục thêm nữa
Tôi đồng ý với độ linh hoạt vô hạn và độ bền của văn bản, nhưng sau khi xem công trình của Bret Victor, tôi cảm nhận được giới hạn của văn bản
Khi học piano, có một vòng phản hồi tức thì, và kiểu học này rất khó triển khai chỉ bằng văn bản
Ý chính của Victor là hãy áp dụng kiểu học dựa trên phản hồi này cho kỹ thuật và giáo dục nói chung
Văn bản vẫn quan trọng, nhưng tôi nghĩ vẫn còn rất nhiều tiềm năng ở những cách tận dụng trực giác giác quan khác
Các màn trình diễn của Bret Victor rất ấn tượng, nhưng việc triển khai thực tế đòi hỏi nỗ lực khổng lồ
Bản thân ý tưởng thì rất tuyệt, nhưng cần hiểu rằng để hiện thực hóa nó sẽ phải có đầu tư lớn và cam kết lâu dài
Rất khó giải thích dữ liệu hay kết quả chỉ bằng văn bản, nhưng biểu đồ có thể truyền tải rất nhiều thông tin chỉ trong chốc lát
Văn bản tốt ở chỗ nó bất đồng bộ, nhưng con người vốn dĩ thích nói hoặc biểu đạt bằng hình ảnh hơn
Cuối cùng, cách tiếp cận pha trộn tự nhiên hơn là chỉ dùng một phương thức giao tiếp duy nhất
Một đứa trẻ chỉ cần nhìn rồi học, và hiểu bằng trực giác vật lý
Những tri thức học bằng cơ thể như đi xe đạp gần như không thể truyền đạt bằng văn bản
Văn bản là biểu tượng, còn hình ảnh mang tính cảm giác
Không thể diễn đạt hoàn hảo một bức tranh của Norman Rockwell bằng văn bản
Các hệ thống ký hiệu dựa trên văn bản như bản nhạc hay sơ đồ Feynman vẫn rất mạnh mẽ
Tôi tóm tắt bài của OP chỉ trong 30 giây, nhưng video của Bret Victor dài 54 phút nên đa số sẽ không xem
Văn bản vẫn là phương tiện tối ưu về hiệu quả và khả năng chuyển đổi
Tôi nghĩ các phương tiện khác nên được dùng như công cụ bổ trợ
Tôi tự gọi mình là một người theo chủ nghĩa tối đa hóa văn bản
Văn bản là điểm tiếp xúc tự nhiên giữa con người và máy móc, là điểm cân bằng giữa hiệu quả và tính minh bạch
Mọi thứ đều có thể lưu dưới dạng chuỗi, và biểu diễn bằng base64, JSON, HTML, CSS, SQL, v.v.
Rốt cuộc, viên đạn bạc (silver bullet) mà ngành này theo đuổi lại chính là chuỗi
Các định dạng nhị phân phức tạp làm mất tính dễ đọc, và sau khi nén bằng GZIP thì lợi thế cũng gần như biến mất
Các giao thức dựa trên văn bản trở nên kém ổn định do vấn đề của định luật Postel
Chênh lệch băng thông 30% tuyệt đối không nhỏ, và đó cũng là lý do HTTP3 chuyển sang nhị phân
Dù có nén base64 thì tính dễ đọc cũng đã mất từ trước rồi
Tham khảo liên quan: Robustness principle, vấn đề Regex, ReDoS
Dù sao JSON đã nén bằng gzip thì con người cũng không thể tự đọc trực tiếp, nên phải qua công cụ cũng không phải vấn đề lớn
Với các file cấu hình do con người xử lý, text proto hoặc JSON phù hợp hơn
grep, git, chuyển đổi đều dễ
Các bài báo cũ từng được viết bằng Lotus Word Pro giờ không đọc được nữa, nhưng nếu là văn bản thì đã không có vấn đề
Trong các hệ thống quy mô lớn, có rất nhiều file văn bản được luân chuyển, nhưng tính minh bạch thì gần như không có
Trong môi trường quy mô lớn, tiết kiệm vài bit có thể dẫn tới giảm chi phí đáng kể, nên các trường tự gắn nhãn bị loại bỏ
Văn bản rốt cuộc chỉ là biểu diễn của byte
Nhưng lý do người ta bám vào văn bản là vì tính khép kín của các định dạng nhị phân và sự thiếu thốn công cụ
Dù CSV có hàng triệu cột base64 thì nếu không có công cụ phù hợp, nó cũng chẳng tốt hơn nhị phân là bao
Nhờ tiêu chuẩn hóa mà ta có thể chia sẻ ý nghĩa, và các mô hình như LLM có thể học được điều đó
Cũng như câu “hãy thử biểu đạt một câu ngẫu nhiên trên wiki bằng hình vẽ”, không phải mọi thứ đều có thể thay thế bằng văn bản
Ngược lại, cũng không thể mô tả hoàn hảo một đoạn phim chỉ bằng văn bản
Văn bản không phải siêu tập của mọi phương tiện, nó chỉ là một kiểu biểu đạt khác
Ví dụ: Flight management system, NOTAM
Về nhận định “văn bản là công nghệ giao tiếp lâu đời và ổn định nhất”
Thực ra bản thân ngôn ngữ mới là công nghệ lâu đời hơn
Truyền thống truyền miệng đã chuyển giao tri thức qua nhiều thế hệ, và ngôn ngữ loài người là hệ thống phức tạp nhất trong số đó
Ví dụ, người bản địa Úc Gunditjmara truyền lại câu chuyện về một vụ phun trào núi lửa cách đây 30.000 năm (Budj Bim)
Văn bản là thứ độc đáo ở chỗ có thể truyền thông tin qua nhiều thế hệ mà không bị méo nhiều
Kết luận rốt cuộc là “hãy cược vào ngôn ngữ”
Lý do LLM gây kinh ngạc là vì nhân loại đã ghi lại toàn bộ tri thức bằng văn bản suốt hàng nghìn năm
Các mô hình ảnh cũng phát triển nhờ không gian embedding chung giữa văn bản và hình ảnh
Dù tiện lợi, nhưng khó gọi đó là một mô hình thật sự “hiệu quả”
Là một nhà ngôn ngữ học, tôi tin rằng khi ghi chép các ngôn ngữ có nguy cơ tuyệt chủng, văn bản (Unicode) là định dạng bền vững nhất
Những sách ngữ pháp tiếng Hy Lạp hay tiếng Phạn từ hàng nghìn năm trước vẫn còn đọc được
Nhóm chúng tôi xuất bản dưới dạng PDF, nhưng lưu trữ nội bộ bằng XML
Tôi hy vọng 2.000 năm nữa nó vẫn còn được đọc
Có quá nhiều hỗn loạn về mã hóa như UTF-16, SJIS, EUC, trong khi PDF hay JPEG thì vẫn mở hoàn hảo
Nếu dung lượng lưu trữ cho phép, tôi cảm thấy lưu bằng định dạng hình ảnh còn an toàn hơn
Ngoài ra vẫn còn những ký tự không thể biểu diễn ngay cả bằng Unicode
Tranh hang động truyền đạt ý định tốt hơn văn bản
Nếu xem loạt bài Future Text Publishing,
thì “văn bản” về bản chất là hình ảnh 2D
Máy tính không hiểu văn bản, nó chỉ xử lý các con số
Chính con người gán ý nghĩa cho những con số đó để tạo thành hệ thống ký hiệu và ngôn ngữ
DNA/RNA có thể được xem là một ví dụ về hệ thống chữ viết phổ quát được cấu thành về mặt vật lý
Bài này trước đây cũng đã nhiều lần được đăng lên HN
Năm 2014, 2015 và 2021 đều có hàng trăm bình luận
bản 2014, bản 2015, bản 2021