14 điểm bởi GN⁺ 2025-12-28 | 3 bình luận | Chia sẻ qua WhatsApp
  • Văn bản là công nghệ giao tiếp mạnh mẽ nhất trong lịch sử nhân loại, với khả năng biểu đạt và hiệu quả vượt trội so với mọi phương tiện khác
  • So với hình ảnh, video và âm thanh, đây là phương tiện phù hợp nhất để truyền đạt các khái niệm trừu tượng và tư duy phức tạp một cách chính xác
  • Đây là công nghệ đã được kiểm chứng về độ bền và tính ổn định, đến mức chúng ta vẫn có thể đọc được các ghi chép từ hàng nghìn năm trước
  • Xét về chi phí lưu trữ và truyền tải, nó hiệu quả vượt trội, và đã nhiều lần đóng vai trò điểm khởi đầu cho sự phát triển của công nghệ truyền thông
  • Về phạm vi và chiều sâu ứng dụng xã hội như tìm kiếm, dịch thuật, tóm tắt và cộng tác, không phương tiện nào khác có thể theo kịp

Quan điểm cơ bản về văn bản

  • Mỗi khi nhận được câu hỏi về video, 3D, game và các hệ thống đa phương tiện động, tác giả đều lặp lại cùng một lập trường
  • Không phủ nhận giá trị của hình ảnh, ảnh chụp, phim và âm nhạc, nhưng cho rằng ưu thế của văn bản là tuyệt đối
  • Văn bản được xác định là công nghệ giao tiếp mạnh mẽ, hữu ích và hiệu quả nhất

Công nghệ lâu đời và ổn định nhất

  • Lời nói và ngôn ngữ ký hiệu tồn tại tự nhiên trong xã hội loài người, nhưng văn bản là công nghệ được tiếp thu thông qua học tập và truyền lại
  • Nó có độ bền theo thời gian đến mức chúng ta vẫn có thể đọc các ghi chép từ khoảng 5.000 năm trước
  • Vì được khắc lên các vật liệu vật lý như đá, nó thậm chí có thể tồn tại lâu hơn cả loài người

Phương tiện biểu đạt linh hoạt nhất

  • Hình ảnh rất mạnh trong một số tình huống cụ thể, nhưng không thể biểu đạt trực quan một câu trừu tượng tùy ý
  • Những câu mang tính khái niệm như định nghĩa về nhân quyền không thể được thay thế bằng tranh vẽ
  • Văn bản có thể truyền đạt ý tưởng trong khi kiểm soát được mức độ chính xác và mơ hồ
  • Việc văn học, triết học, lịch sử, toán học, logic, lập trình và kỹ thuật đều dựa trên văn bản không phải là ngẫu nhiên

Phương thức truyền thông hiệu quả nhất

  • Văn bản có mức hiệu quả khác biệt hẳn về không gian lưu trữ và chi phí truyền tải
  • Hàng nghìn byte văn bản thậm chí có thể nhỏ hơn một hình ảnh biểu tượng đơn giản
  • Từ điện báo quang học, điện báo, máy teletype đến các mạng máy tính sơ khai, văn bản luôn xuất hiện trước tiên
  • Âm thanh, hình ảnh và video chỉ xuất hiện sau khi băng thông trở nên đủ rẻ
  • Nó có mật độ thông tin cao đến mức có thể chứa toàn bộ Wikipedia trong một chiếc smartphone

Công nghệ hữu ích nhất về mặt xã hội

  • hoạt động hiệu quả trong cả giao tiếp 1:1, 1:N và M:N
  • Có thể tìm kiếm và lập chỉ mục, kể cả bằng thao tác thủ công
  • Được tối ưu cho xử lý thuật toán như dịch thuật, so sánh, diff, phân cụm, hiệu đính, tóm tắt và lọc
  • Có thể sử dụng bất đồng bộ và tự do điều chỉnh tốc độ
  • Hỗ trợ biên tập cộng tác, trích dẫn, chú thích, thảo luận phân nhánh, tóm tắt, review và cả sáng tác phái sinh
  • Không tồn tại công nghệ nào có thể thay thế độ phức tạp xã hội và nhận thức ở cấp độ thư viện và các bài đăng trên internet

Kết luận

  • Vì vậy, lập trường đối với văn bản là rất rõ ràng: luôn chọn văn bản trước (always pick text first)
  • Mượn lời của một người sếp cũ: luôn đặt cược vào văn bản (always bet on text)
  • Nếu có thể làm điều gì đó bằng văn bản thì hãy làm như vậy. Văn bản hầu như không bao giờ làm bạn thất vọng

3 bình luận

 
cronex 2025-12-30

Đúng là văn bản là một công cụ biểu đạt rất tốt và cũng vô cùng quan trọng...
Nhưng không phải mọi thứ đều có thể được lưu trữ dưới dạng văn bản.
Xét cho cùng, văn bản là một hình thức biểu đạt đã được nén lại. Nó là cách nén và biểu đạt năm giác quan mà chúng ta có thể cảm nhận được (thị giác, thính giác, xúc giác, vị giác, khứu giác) theo một khuôn thức được xã hội đồng thuận.
Nhưng nếu không có thông tin về đối tượng gốc làm nên nguyên mẫu đó, thì dù có lưu dữ liệu bằng văn bản đi nữa, về sau nếu người ta không biết đối tượng gốc ấy là gì, văn bản đó cũng sẽ mất đi ý nghĩa.
Chúng ta biết cassette là gì, nhưng nếu chỉ cho những đứa trẻ mới sinh ra gần đây nhìn thấy mỗi từ "cassette" rồi hỏi đó là gì, liệu sẽ có bao nhiêu đứa có thể trả lời đúng? Dù có chăm chỉ giải thích hình dạng, chức năng và cách hoạt động của cassette đến đâu, thì vài nghìn năm sau, chỉ với văn bản đó thôi, liệu có thể tái hiện lại một chiếc cassette một cách hoàn chỉnh hay không?
Trong những trường hợp như vậy, vài tấm ảnh cassette, bản vẽ, hay vài phút video về cách sử dụng cassette có thể còn hữu ích hơn.

 
roxie 2025-12-29

Văn bản rõ ràng là ổn định, nhưng tôi không chắc nó có trực quan hay không.

 
GN⁺ 2025-12-28
Ý kiến trên Hacker News
  • Tôi không hiểu tính nhị nguyên của cuộc thảo luận này
    Tôi không hiểu vì sao lại phải rơi vào tình huống phải chọn giữa UTF-8 và bản ghi âm người chơi piano
    Cảm giác như có ai đó quá hưng phấn với chủ đề này nên chỉ nói theo kiểu đối lập đơn giản “Ford vs. Chevy”
    Chúng ta đều thích văn bản rồi, nên mong là đừng cố thuyết phục thêm nữa

  • Tôi đồng ý với độ linh hoạt vô hạn và độ bền của văn bản, nhưng sau khi xem công trình của Bret Victor, tôi cảm nhận được giới hạn của văn bản
    Khi học piano, có một vòng phản hồi tức thì, và kiểu học này rất khó triển khai chỉ bằng văn bản
    Ý chính của Victor là hãy áp dụng kiểu học dựa trên phản hồi này cho kỹ thuật và giáo dục nói chung
    Văn bản vẫn quan trọng, nhưng tôi nghĩ vẫn còn rất nhiều tiềm năng ở những cách tận dụng trực giác giác quan khác

    • Trong ngắn hạn, để triển khai một phương tiện phong phú hơn văn bản thì độ khó kỹ thuật cao hơn rất nhiều
      Các màn trình diễn của Bret Victor rất ấn tượng, nhưng việc triển khai thực tế đòi hỏi nỗ lực khổng lồ
      Bản thân ý tưởng thì rất tuyệt, nhưng cần hiểu rằng để hiện thực hóa nó sẽ phải có đầu tư lớn và cam kết lâu dài
    • Nếu làm việc trong lĩnh vực khoa học thì điểm này còn rõ hơn
      Rất khó giải thích dữ liệu hay kết quả chỉ bằng văn bản, nhưng biểu đồ có thể truyền tải rất nhiều thông tin chỉ trong chốc lát
      Văn bản tốt ở chỗ nó bất đồng bộ, nhưng con người vốn dĩ thích nói hoặc biểu đạt bằng hình ảnh hơn
      Cuối cùng, cách tiếp cận pha trộn tự nhiên hơn là chỉ dùng một phương thức giao tiếp duy nhất
    • Ví dụ, giải thích bằng văn bản cách gỡ một mớ dây điện là rất kém hiệu quả
      Một đứa trẻ chỉ cần nhìn rồi học, và hiểu bằng trực giác vật lý
      Những tri thức học bằng cơ thể như đi xe đạp gần như không thể truyền đạt bằng văn bản
    • Tôi muốn nói rằng “hãy luôn cược vào biểu đạt mang tính biểu tượng
      Văn bản là biểu tượng, còn hình ảnh mang tính cảm giác
      Không thể diễn đạt hoàn hảo một bức tranh của Norman Rockwell bằng văn bản
      Các hệ thống ký hiệu dựa trên văn bản như bản nhạc hay sơ đồ Feynman vẫn rất mạnh mẽ
    • Chính cuộc thảo luận này cho thấy sự vượt trội của văn bản
      Tôi tóm tắt bài của OP chỉ trong 30 giây, nhưng video của Bret Victor dài 54 phút nên đa số sẽ không xem
      Văn bản vẫn là phương tiện tối ưu về hiệu quả và khả năng chuyển đổi
      Tôi nghĩ các phương tiện khác nên được dùng như công cụ bổ trợ
  • Tôi tự gọi mình là một người theo chủ nghĩa tối đa hóa văn bản
    Văn bản là điểm tiếp xúc tự nhiên giữa con người và máy móc, là điểm cân bằng giữa hiệu quả và tính minh bạch
    Mọi thứ đều có thể lưu dưới dạng chuỗi, và biểu diễn bằng base64, JSON, HTML, CSS, SQL, v.v.
    Rốt cuộc, viên đạn bạc (silver bullet) mà ngành này theo đuổi lại chính là chuỗi
    Các định dạng nhị phân phức tạp làm mất tính dễ đọc, và sau khi nén bằng GZIP thì lợi thế cũng gần như biến mất

    • Nhưng không thể có cả ba thứ “hiệu quả, linh hoạt, minh bạch” cùng lúc
      Các giao thức dựa trên văn bản trở nên kém ổn định do vấn đề của định luật Postel
      Chênh lệch băng thông 30% tuyệt đối không nhỏ, và đó cũng là lý do HTTP3 chuyển sang nhị phân
      Dù có nén base64 thì tính dễ đọc cũng đã mất từ trước rồi
      Tham khảo liên quan: Robustness principle, vấn đề Regex, ReDoS
    • Với lập luận “chi phí CPU cho giải tuần tự hóa là không đáng kể”, thì ngược lại “chi phí dùng công cụ để con người đọc” cũng không đáng kể
      Dù sao JSON đã nén bằng gzip thì con người cũng không thể tự đọc trực tiếp, nên phải qua công cụ cũng không phải vấn đề lớn
    • Tôi làm việc với protobuf hằng ngày, và cấu trúc nhị phân của định dạng này là để đảm bảo khả năng tương thích
      Với các file cấu hình do con người xử lý, text proto hoặc JSON phù hợp hơn
    • Tôi đã chuyển việc lưu tài liệu từ DOC hay PDF sang văn bản Markdown
      grep, git, chuyển đổi đều dễ
      Các bài báo cũ từng được viết bằng Lotus Word Pro giờ không đọc được nữa, nhưng nếu là văn bản thì đã không có vấn đề
    • Phiên bản văn bản của protobuf không phải base64 hay JSON
      Trong các hệ thống quy mô lớn, có rất nhiều file văn bản được luân chuyển, nhưng tính minh bạch thì gần như không có
      Trong môi trường quy mô lớn, tiết kiệm vài bit có thể dẫn tới giảm chi phí đáng kể, nên các trường tự gắn nhãn bị loại bỏ
  • Văn bản rốt cuộc chỉ là biểu diễn của byte
    Nhưng lý do người ta bám vào văn bản là vì tính khép kín của các định dạng nhị phân và sự thiếu thốn công cụ
    Dù CSV có hàng triệu cột base64 thì nếu không có công cụ phù hợp, nó cũng chẳng tốt hơn nhị phân là bao

    • Văn bản không đơn thuần là byte mà là một hệ thống ký hiệu con người có thể đọc được
    • Văn bản áp đặt ràng buộc lên các chuỗi byte được chấp nhận, và mang cấu trúc nén của tiến hóa ngôn ngữ
      Nhờ tiêu chuẩn hóa mà ta có thể chia sẻ ý nghĩa, và các mô hình như LLM có thể học được điều đó
    • Đùa thôi, nhưng cũng có một nền văn minh giao tiếp bằng nhị phânnền văn minh Bynar
  • Cũng như câu “hãy thử biểu đạt một câu ngẫu nhiên trên wiki bằng hình vẽ”, không phải mọi thứ đều có thể thay thế bằng văn bản
    Ngược lại, cũng không thể mô tả hoàn hảo một đoạn phim chỉ bằng văn bản
    Văn bản không phải siêu tập của mọi phương tiện, nó chỉ là một kiểu biểu đạt khác

  • Về nhận định “văn bản là công nghệ giao tiếp lâu đời và ổn định nhất”
    Thực ra bản thân ngôn ngữ mới là công nghệ lâu đời hơn
    Truyền thống truyền miệng đã chuyển giao tri thức qua nhiều thế hệ, và ngôn ngữ loài người là hệ thống phức tạp nhất trong số đó
    Ví dụ, người bản địa Úc Gunditjmara truyền lại câu chuyện về một vụ phun trào núi lửa cách đây 30.000 năm (Budj Bim)
    Văn bản là thứ độc đáo ở chỗ có thể truyền thông tin qua nhiều thế hệ mà không bị méo nhiều
    Kết luận rốt cuộc là “hãy cược vào ngôn ngữ”

    • Nếu tính cả giao tiếp sinh học, thì mã di truyền của RNA có lẽ là “văn bản” lâu đời nhất
    • Trường hợp Gunditjmara rất hấp dẫn, nhưng rốt cuộc chỉ là một suy đoán không thể kiểm chứng
  • Lý do LLM gây kinh ngạc là vì nhân loại đã ghi lại toàn bộ tri thức bằng văn bản suốt hàng nghìn năm
    Các mô hình ảnh cũng phát triển nhờ không gian embedding chung giữa văn bản và hình ảnh

    • Nhưng việc LLM cần hàng chục lượt hỏi đáp mới tìm ra câu trả lời mong muốn thì không hẳn là hiệu quả mà thiên về dò tìm
      Dù tiện lợi, nhưng khó gọi đó là một mô hình thật sự “hiệu quả”
  • Là một nhà ngôn ngữ học, tôi tin rằng khi ghi chép các ngôn ngữ có nguy cơ tuyệt chủng, văn bản (Unicode) là định dạng bền vững nhất
    Những sách ngữ pháp tiếng Hy Lạp hay tiếng Phạn từ hàng nghìn năm trước vẫn còn đọc được
    Nhóm chúng tôi xuất bản dưới dạng PDF, nhưng lưu trữ nội bộ bằng XML
    Tôi hy vọng 2.000 năm nữa nó vẫn còn được đọc

    • Nhưng cá nhân tôi lại từng có trải nghiệm file văn bản lưu từ 10 năm trước khó mở hơn
      Có quá nhiều hỗn loạn về mã hóa như UTF-16, SJIS, EUC, trong khi PDF hay JPEG thì vẫn mở hoàn hảo
      Nếu dung lượng lưu trữ cho phép, tôi cảm thấy lưu bằng định dạng hình ảnh còn an toàn hơn
      Ngoài ra vẫn còn những ký tự không thể biểu diễn ngay cả bằng Unicode
    • Cũng như bản nhạc, có những kiểu biểu đạt không thể chia đơn giản thành văn bản hay nhị phân
      Tranh hang động truyền đạt ý định tốt hơn văn bản
  • Nếu xem loạt bài Future Text Publishing,
    thì “văn bản” về bản chất là hình ảnh 2D
    Máy tính không hiểu văn bản, nó chỉ xử lý các con số
    Chính con người gán ý nghĩa cho những con số đó để tạo thành hệ thống ký hiệu và ngôn ngữ
    DNA/RNA có thể được xem là một ví dụ về hệ thống chữ viết phổ quát được cấu thành về mặt vật lý

  • Bài này trước đây cũng đã nhiều lần được đăng lên HN
    Năm 2014, 2015 và 2021 đều có hàng trăm bình luận
    bản 2014, bản 2015, bản 2021