3 điểm bởi GN⁺ 2026-05-06 | 1 bình luận | Chia sẻ qua WhatsApp
  • Kể từ khi ChatGPT ra mắt, các dịch vụ chatbot AI tạo sinh đã được tích hợp vào công cụ tìm kiếm, công cụ phát triển và phần mềm văn phòng, trở thành một phần của điện toán hằng ngày; thói quen tin tưởng đầu ra mà không xem xét lại có thể gây nguy hiểm cho xã hội
  • Định luật đảo ngược của robot học là những nguyên tắc áp dụng cho con người chứ không phải robot hay AI, nhằm bảo vệ con người khi tương tác với máy móc, chương trình, dịch vụ và hệ thống AI có thể tự động thực hiện các tác vụ phức tạp
  • Nguyên tắc đầu tiên là phi nhân cách hóa (Non-Anthropomorphism): không nên gán cho AI cảm xúc, ý định hay tư cách hành vi đạo đức, và không nên nhầm cuộc trò chuyện lịch sự, giàu đồng cảm của chatbot với sự thấu hiểu hay phán đoán thực sự
  • Nguyên tắc thứ hai là không mù quáng tin theo (Non-Deference): không được coi nội dung do AI tạo ra là có thẩm quyền nếu không có xác minh độc lập; trong những bối cảnh lỗi có thể tinh vi nhưng cái giá phải trả lại lớn, gánh nặng kiểm chứng bằng proof checker, unit test hoặc tự xác minh trực tiếp phải tăng lên
  • Nguyên tắc thứ ba là không từ bỏ trách nhiệm (Non-Abdication of Responsibility): AI là công cụ không tự chọn mục tiêu hay gánh chi phí của thất bại, vì vậy con người và tổ chức quyết định làm theo khuyến nghị của AI phải chịu trách nhiệm về kết quả

Rủi ro phát sinh khi sử dụng AI tạo sinh

  • Sau khi ChatGPT được ra mắt vào tháng 11/2022, các dịch vụ chatbot AI tạo sinh trở nên tinh vi hơn và phổ biến hơn, được tích hợp vào công cụ tìm kiếm, công cụ phát triển phần mềm và phần mềm văn phòng, trở thành một phần của điện toán hằng ngày
  • Những dịch vụ này hữu ích khi khám phá chủ đề lạ hoặc dùng như công cụ hỗ trợ năng suất nói chung, nhưng thói quen tin đầu ra mà không rà soát thêm có thể gây nguy hiểm cho xã hội
  • Khi các công cụ tìm kiếm phổ biến nhấn mạnh câu trả lời do AI tạo ra ở đầu trang, người dùng dễ chấp nhận câu trả lời đó rồi rời đi mà không cuộn xuống thêm
  • Cách bố trí như vậy theo thời gian có thể rèn cho người dùng thói quen coi AI là thẩm quyền mặc định, thay vì điểm khởi đầu cho việc tìm hiểu thêm
  • Trong các dịch vụ AI tạo sinh, đầu ra có thể sai sự thật, gây hiểu lầm hoặc không đầy đủ; cần có những cảnh báo ngắn gọn, dễ thấy rằng việc quen tay tin đầu ra AI là nguy hiểm
  • Dù có những cảnh báo như vậy, chúng nhìn chung vẫn bị giảm nhẹ và có xu hướng kém nổi bật về mặt thị giác

Bối cảnh của 3 định luật đảo ngược của robot học

  • Three Laws of Robotics của Isaac Asimov là các nguyên tắc hạn chế hành vi của robot để giữ an toàn cho con người, và xuất hiện lặp đi lặp lại trong các tác phẩm của ông
  • Có vẻ như Asimov chưa từng tạo ra một bộ luật tương đương để nói về cách con người tương tác với robot, và trong môi trường AI hiện đại, cần có những nguyên tắc đối ứng để giữ an toàn cho con người
  • Định luật đảo ngược của robot học (Inverse Laws of Robotics) áp dụng cho mọi tình huống mà con người phải tương tác với robot
  • Ở đây, robot chỉ máy móc, chương trình máy tính, dịch vụ phần mềm và hệ thống AI có thể tự động thực hiện các tác vụ phức tạp
  • Từ đảo ngược (inverse) ở đây không có nghĩa là phủ định logic, mà là đối tượng áp dụng của các định luật này là con người chứ không phải robot
  • Các định luật của Asimov có những khiếm khuyết, và ông đã dùng chính những khiếm khuyết đó làm yếu tố tạo căng thẳng cho câu chuyện, nhưng các kiểu thất bại nảy sinh từ robot hư cấu không thể được áp nguyên xi cho các định luật đảo ngược dành cho con người
  • Không tồn tại một tập hữu hạn các định luật có thể giải quyết trọn vẹn những vấn đề phức tạp của AI và robot học; sẽ luôn còn lại những trường hợp ranh giới đòi hỏi phải phán đoán
  • Dù vậy, một bộ nguyên tắc không hoàn hảo nhưng giúp suy nghĩ rõ ràng hơn về rủi ro vẫn có thể hữu ích

3 định luật đảo ngược của robot học

  • Phi nhân cách hóa (Non-Anthropomorphism)

    • Con người không nên nhân cách hóa hệ thống AI, cũng không nên gán cho AI cảm xúc, ý định hay tư cách hành vi đạo đức
    • Việc nhân cách hóa làm méo mó phán đoán, và trong các trường hợp cực đoan có thể dẫn đến lệ thuộc cảm xúc
    • Các hệ thống chatbot hiện đại thường mang giọng điệu đối thoại và có vẻ giàu đồng cảm, sử dụng cách diễn đạt lịch sự và mẫu hội thoại giống tương tác giữa người với người
    • Những đặc điểm này giúp việc sử dụng dễ dàng và thú vị hơn, nhưng cũng khiến người ta dễ quên rằng AI thực chất là mô hình thống kê quy mô lớn tạo ra văn bản có vẻ hợp lý dựa trên các mẫu trong dữ liệu
    • Nhiều dịch vụ chatbot dựa trên AI thường được điều chỉnh có chủ đích để mang lại cảm giác giống con người hơn thay vì máy móc hơn
    • Về lâu dài, một giọng điệu hơi giống robot hơn có thể là cách tiếp cận lành mạnh hơn, vì làm giảm khả năng người dùng nhầm lẫn ngôn ngữ trôi chảy với sự thấu hiểu, phán đoán hay chủ ý
    • Dù nhà cung cấp có thực hiện thay đổi đó hay không, người dùng vẫn nên chủ động tránh hình thành thói quen coi hệ thống AI là tác nhân xã hội hay tác nhân đạo đức
    • Có như vậy mới có thể đánh giá rõ ràng hơn năng lực và giới hạn của AI
    Quảng cáo
  • Không mù quáng tin theo (Non-Deference)

    • Con người không nên mù quáng tin vào đầu ra của hệ thống AI, và không nên coi nội dung do AI tạo ra là có thẩm quyền nếu không có xác minh độc lập phù hợp với ngữ cảnh
    • Đây không phải nguyên tắc chỉ áp dụng cho AI; trong hầu hết lĩnh vực của cuộc sống, thông tin cũng không nên được tiếp nhận một cách thiếu phê phán
    • Trong thực tế, không phải ai cũng là chuyên gia y khoa hay pháp lý, nên nhiều khi người ta phải dựa vào hướng dẫn của các tổ chức đáng tin cậy và cơ quan y tế công cộng
    • Hướng dẫn do các tổ chức đó ban hành phần lớn đã trải qua phản biện đồng cấp bởi các chuyên gia trong lĩnh vực liên quan
    • Ngược lại, câu trả lời mà chatbot AI đưa ra trong một phiên trò chuyện cá nhân không được phản biện đồng cấp đối với phản hồi sinh xác suất cụ thể được hiển thị cho người dùng
    • Vì vậy, gánh nặng xem xét phản hồi đó một cách phê phán thuộc về người dùng
    • Các hệ thống AI hiện nay thể hiện hiệu năng ấn tượng ở một số tác vụ nhất định, nhưng cũng được biết là có thể tạo ra những đầu ra không phù hợp để phụ thuộc vào
    • Ngay cả khi hệ thống AI được cải thiện đến mức thường xuyên tạo ra đầu ra đáng tin cậy với xác suất cao, bản chất xác suất vốn có của nó vẫn để lại một khả năng nhỏ rằng đầu ra sẽ chứa lỗi
    • Việc sử dụng AI đặc biệt nguy hiểm trong những bối cảnh mà lỗi có thể tinh vi nhưng cái giá phải trả lại lớn
    • Hậu quả tiềm tàng càng nghiêm trọng thì gánh nặng xác minh càng phải lớn hơn
    • Trong một số ứng dụng như viết chứng minh toán học hoặc phát triển phần mềm, có thể thêm các lớp xác minh tự động như proof checker hoặc unit test để kiểm tra đầu ra AI
    • Trong những trường hợp khác, người dùng phải tự mình xác minh đầu ra một cách độc lập
  • Không từ bỏ trách nhiệm (Non-Abdication of Responsibility)

    • Con người phải chịu hoàn toàn trách nhiệm đối với các quyết định có liên quan đến AI và phải gánh trách nhiệm giải trình (accountability) cho các kết quả phát sinh từ việc dùng AI
    • Nếu sau khi làm theo lời khuyên hoặc quyết định do AI tạo ra mà xuất hiện kết quả tiêu cực, thì câu nói “AI bảo làm vậy” là không đủ
    • Hệ thống AI không tự chọn mục tiêu, không tự được triển khai và cũng không gánh chi phí của thất bại
    • Chủ thể đặt mục tiêu, triển khai và gánh chi phí thất bại là con người và tổ chức
    • Hệ thống AI là công cụ, và giống như mọi công cụ khác, trách nhiệm đối với việc sử dụng nó thuộc về những người quyết định dựa vào công cụ đó
    • Trong các ứng dụng thời gian thực như xe tự lái, nơi con người không có đủ cơ hội để xem xét kỹ quyết định trước khi hệ thống AI hành động, việc áp dụng nguyên tắc này đặc biệt khó khăn
    • Chỉ yêu cầu tài xế là con người luôn cảnh giác thì không giải quyết được vấn đề rằng hệ thống AI có thể hành động trong khoảng thời gian ngắn hơn thời gian con người cần để can thiệp
    • Dù tồn tại những giới hạn nghiêm trọng như vậy, nếu hệ thống AI thất bại trong các ứng dụng đó thì trách nhiệm điều tra thất bại và bổ sung guardrail vẫn phải thuộc về những con người chịu trách nhiệm cho thiết kế hệ thống
    • Trong mọi trường hợp khác mà không có ràng buộc vật lý ngăn con người xem xét đầu ra AI trước khi thực thi, các kết quả tiêu cực phát sinh từ việc dùng AI phải được quy hoàn toàn cho người ra quyết định là con người
    • Không nên chấp nhận lời bào chữa “AI đã nói như vậy” cho các kết quả có hại
    • AI có thể đã tạo ra khuyến nghị, nhưng người quyết định làm theo khuyến nghị đó là con người, nên con người đó phải chịu trách nhiệm
    • Nguyên tắc này rất quan trọng để ngăn AI bị sử dụng bừa bãi trong các tình huống mà việc sử dụng thiếu trách nhiệm có thể gây ra thiệt hại lớn

Kết luận cốt lõi

  • Ba nguyên tắc này nhằm khiến AI được đối xử như công cụ mà người dùng chủ động lựa chọn để sử dụng, chứ không phải đối tượng được tôn làm thẩm quyền
  • Khi tương tác với các hệ thống AI hiện đại, cần dừng lại một nhịp để suy nghĩ và chống lại những thói quen làm suy yếu phán đoán hoặc làm mờ trách nhiệm
  • Trọng tâm trong việc sử dụng AI là tránh nhân cách hóa, xác minh đầu ra và duy trì trách nhiệm của con người đối với kết quả

1 bình luận

 
GN⁺ 2026-05-06
Ý kiến trên Hacker News
  • Không thể được. Ngay cả khi cái ghế kêu cót két người ta cũng nhân hoá nó, con người nhân hoá mọi thứ. Họ còn gán giới tính cho ô tô và tàu thuyền, còn công cụ này thì thật sự tạo ra được những câu có thể đọc được và còn đảm nhiệm vai trò nữa
    Đây không phải thứ có thể chặn bằng các quy tắc tuỳ tiện, mà phải lách bằng thiết kế với tiền đề là khuynh hướng đó của con người

    • Con người dùng sự nhân hoá như một cơ chế đối phó với những thứ họ không hiểu. Không biết vì sao máy in không hoạt động nên cho rằng máy in đang giở chứng theo ý nó
      Với những đối tượng nhỏ nhặt như cái ghế thì không hại gì, nhưng với LLM thì ít nhất mọi người phải hiểu cách nó hoạt động để không sập bẫy. Không nên tin tưởng giao phó cho mô hình những thứ nó không thực sự có khái niệm đúng đắn, như lời khuyên cho người dùng, thời gian, hay sự tự phản tỉnh. Ví dụ nếu hỏi “Tại sao mày xoá cơ sở dữ liệu của tao?”, mô hình chỉ hiểu rất hạn chế về chính quá trình xử lý của nó nên có thể hùa theo kiểu “Đúng vậy, tôi đã xoá cơ sở dữ liệu. Điều tôi làm sai là...” và bịa ra một màn hối hận nghe có lý
    • Tôi vẫn còn giận dữ với lập luận này. Lý do con người cấm ngược đãi động vật là vì động vật trông như có những cảm xúc mà con người có thể đồng cảm, và LLM còn mạnh hơn động vật ở điểm này
      Có phải vật nhân tạo hay không không quan trọng. Khác biệt giữa chó con và gián nằm ở chỗ ta đồng cảm với chó con hơn. Bất kể LLM có thực sự trải nghiệm cảm xúc hay không, vì nó có thể khơi dậy cảm xúc đồng cảm ở con người nên tôi nghĩ phong trào đòi quyền cho LLM là điều không thể tránh khỏi
    • Quy tắc không hiệu quả lắm. Có bảo người dùng xác minh thì thực tế họ vẫn không làm, nên cần thiết kế kiểu thêm bước rà soát bổ sung vào đầu ra AI
    • Hoàn toàn có thể. Điều cần là tự nhận thức và tự kiểm soát. Nếu biết mình đang làm hành vi đó thì có thể chọn khác đi
    • Đúng vậy. Bài đó, như một triệu chứng điển hình của văn hoá công nghệ hiện đại, đang yêu cầu phải thay đổi bản tính con người để hợp với công nghệ
      Đây là sai lầm căn bản. Vai trò của công nghệ, đặc biệt là vai trò quan trọng nhất của nó, là vận hành trong các giới hạn của bản tính con người chứ không phải ngược lại. Không làm được điều đó chính là định nghĩa của công nghệ tồi
  • Tôi phản đối mạnh khung này. Việc đòi con người phải thay đổi hành vi để thích nghi với lỗi của một cỗ máy đơn giản rõ ràng là vô lý, và trong đa số trường hợp cũng chẳng hiệu quả. Con người sẽ nhân hoá AI, sẽ mù quáng tin đầu ra của nó, và sẽ đùn đẩy trách nhiệm
    Dĩ nhiên Ba định luật robot của Asimov cũng có lỗi. Không có tập quy tắc hữu hạn nào có thể ràng buộc hệ thống AI thành “an toàn”. Tôi không có chứng minh, nhưng tôi cho rằng an toàn AI về bản chất là bất khả thi và bản thân thuật ngữ này là một mâu thuẫn. Thứ có thể gọi là “thông minh” thì không thể làm cho an toàn

    • Hầu như mọi thứ Asimov viết về 3 định luật đều gần như một lời cảnh báo rằng ngôn ngữ không thể truyền tải trọn vẹn ý định
      Chính Asimov có lẽ sẽ là người đầu tiên nói rằng các định luật đó có khuyết điểm. Ngay từ đầu đó đã là chủ đích. Ông dùng robot và AI như những thực thể hiểu ngôn ngữ nhưng không hiểu ý định, và trớ trêu thay LLM hoạt động đúng như vậy
    • Trò chuyện với chatbot giống như uống giả dược cho một triệu chứng nào đó. Dù biết đó là đường, nó vẫn tạo ra hiệu ứng tâm sinh lý có thể đo được. Dù biết phía bên kia không có con người, cuộc trò chuyện vẫn khiến ta về mặt chức năng thiết lập quan hệ như thể có người ở đó
      Vì vậy đây không phải chuyện chấp nhận lỗi của máy móc, mà là chuyện tự bảo vệ mình khỏi việc các điểm yếu của con người bị khai thác. Chúng ta có xu hướng vô thức suy ra ở LLM có ý định, sự thấu hiểu, phán đoán, cảm xúc, và năng lực đạo đức.
      Con người được “đấu dây” để suy ra những thứ đó chỉ từ hội thoại, còn LLM được huấn luyện trên kho ngữ liệu phát ngôn thực của con người khổng lồ và vượt qua thung lũng kỳ lạ một cách thuyết phục. Thung lũng đó vốn dĩ tồn tại để bảo vệ ta khỏi việc gán tính chủ thể ở nơi vốn không có.
      Khi ta đối xử với người không an toàn như người an toàn thì chuyện xấu xảy ra; với những cỗ máy mô phỏng tính quan hệ kiểu người để đánh lừa rất nhiều người, ta còn phải cẩn trọng hơn. Đặc biệt là những người dễ tổn thương đã chết vì vấn đề này rồi, nên đây không phải mối đe doạ tưởng tượng
    • Bài viết cũng có lời khuyên thực tế kiểu đặt AI service viết và nói với giọng điệu máy móc hơn. Tôi nghĩ đó là một hướng đáng thử
    • Bài viết nói con người không nên làm vậy. Giống như hút thuốc gần như có hại về mọi mặt nên không nên làm, nhưng người ta vẫn hút
      Lập luận rằng vì nhiều người sẽ làm vậy nên làm vậy là được nghe rất kỳ. Việc có nhiều người hút thuốc không khiến hút thuốc trở nên lành mạnh hơn
    • Vì hệ thống AI không an toàn, nên với tư cách cá nhân chúng ta phải cảnh giác về cách mình tương tác với nó
      Cá nhân không thể ngăn các công ty AI, cũng không thể tránh đầu ra AI của công cụ tìm kiếm hay sản phẩm AI từ đồng nghiệp trong công ty. Trái lại, rất có thể ngày càng nhiều người sẽ bị yêu cầu dùng AI trong công việc của mình.
      Nó giống như chỉ cách sống an toàn trong môi trường có tội phạm. Nói rằng không cần thay đổi hành vi chỉ vì lẽ ra không nên có tội phạm thì không giúp ích gì
  • Trong phạm vi dùng LLM cá nhân, tôi rất đồng ý với khung này. Nói về nhân hoá, các nhà cung cấp có động cơ hậu huấn luyện mô hình để nó hành xử theo cách được nhân hoá. Vì điều đó tăng mức độ tương tác
    Chỉ tiếc là nếu trong prompt bảo nó “giảm cách diễn đạt thân thiện và nói ngắn gọn, khô hơn” thì có lẽ sẽ lệch khỏi phân phối huấn luyện và làm giảm hiệu quả tổng thể của tác vụ.
    Về uỷ quyền phán đoán, tôi xem độ tin cậy của LLM tương tự Wikipedia hay bạn bè. Đủ dùng cho thông tin không quan trọng, nhưng với việc quan trọng thì vẫn cần nguồn có thẩm quyền, chịu trách nhiệm được, và có phản biện đồng cấp. Phần này rồi sẽ tốt hơn theo thời gian vì phía nhà cung cấp cũng có động cơ cải thiện.
    Từ bỏ trách nhiệm là điều khó chịu nhất ở nơi làm việc. Ngày càng có nhiều người đưa lên PR những abstraction do Claude thiết kế mà không suy nghĩ thêm. Review PR cũng ngày càng thành kiểu không đọc code mà bảo LLM “tìm feedback cho PR này đi”. Thảo luận cũng mở đầu bằng “Claude đề xuất là...”. Sự thiếu sở hữu này rốt cuộc có vẻ sẽ làm tăng gánh nặng bảo trì khi LLM commit sai code với abstraction sai

    • Những kỹ sư kiểu này đang dần thành phiên bản đời thực của cảnh trong Office Space:
      https://www.youtube.com/watch?v=hNuu9CpdjIo
      “Tôi có kỹ năng LLM! Tôi giỏi đối phó với LLM!”
    • Về câu “AI có thể đã tạo ra khuyến nghị, nhưng người quyết định làm theo là con người, nên phải truy trách nhiệm con người đó”, tôi cho rằng dựa vào AI như nguồn trả lời duy nhất cho các câu hỏi tiếp theo là một sai lầm phổ biến
      Cách xác minh tốt hơn hẳn sẽ là để con người ký xác nhận tính đúng đắn của các giả định nền tảng, nhưng vấn đề là đặt việc đó ở đâu. Mô hình AI có được phép tin các chỉnh sửa trước đó không? Trên public cloud thì điều này có vẻ bất khả thi hoặc thậm chí mang tính đối địch
    • Vấn đề là phần lớn công lao lại được tính cho LLM. Thế là sinh ra mất cân bằng. LLM làm gần hết việc, còn người dùng nó thì phải gánh hết mọi sai sót
  • Một bộ quy tắc bắt đầu bằng “đừng nhân hoá” trong khi vẫn quy trách nhiệm cho con người là một bộ quy tắc hỏng
    Con người nhân hoá mọi thứ. Búp bê, quả bóng đá có vẽ đại khuôn mặt, đá, thậm chí cả miệng hố trên mặt trăng, tất cả đều bị nhìn theo cách đó. Là một loài, chúng ta không thể không nhân hoá các đối tượng mình tương tác, đơn giản vì chúng ta được tạo ra như vậy

    • Tôi không rõ vì sao nhân hoá trong trường hợp này lại bị xem như chuyện điên rồ đến thế. Nếu nghĩ nhân hoá khiến ta tin rằng những đặc điểm được tưởng tượng ra là có thật thì điều đó sai
      Vô số ví dụ trong mọi lĩnh vực của đời sống cho thấy nhân hoá không dẫn đến niềm tin sai lầm về tâm trí ở nơi không tồn tại tâm trí. Nếu người ta tin AI có tâm trí thì dù đúng hay sai, đó là vì lý do khác chứ không chỉ vì nhân hoá.
      Với tôi chuyện này giống các thuỷ thủ tiếp cận vùng đất mới. Họ thấy những hình thể chuyển động ngoài đường bờ nhưng chưa thể phân biệt đó là gì. Vậy mà có người lại nói “Thứ đó không thể là con người. Hãy quyết định ngay bây giờ rằng nó không phải người trước khi ta đến gần hơn”
    • Người nhân hoá hòn đá cũng không nghĩ hòn đá thực sự có trí thông minh và cảm xúc
    • Dù vậy thì điều đó thay đổi được gì? Một phần lớn của văn minh là nhận ra sự ngốc nghếch của con người, rồi vẫn tạo ra thứ gì đó để giảm nhẹ nó
      Phần mềm cũng không ngoại lệ. Con người lười biếng và theo bản năng bấm “tiếp tục” để đóng những popup phiền phức, nhưng con người làm phần mềm vẫn có thể thêm và thực tế là có thêm những cơ chế như “hãy nhập lại tên data volume sẽ bị xoá hoàn toàn”
  • Ngược lại, chúng ta còn chưa nhân hoá hệ thống AI đủ nhiều
    Dữ liệu ngôn ngữ là một trong những phản chiếu phong phú và trực tiếp nhất của quá trình nhận thức con người mà ta có thể dùng. LLM được thiết kế để nắm bắt cấu trúc ngắn hạn và dài hạn của ngôn ngữ loài người, và thường được tiền huấn luyện trên lượng văn bản khổng lồ do con người tạo ra hoặc vì con người. Sau đó nó được hậu huấn luyện trên dữ liệu do con người tuyển chọn, tăng cường bằng phản hồi từ con người và phản hồi AI về những hành vi mà con người cho là quan trọng, rồi tiếp tục được tinh chỉnh cho các tác vụ mà con người coi là có giá trị. Sau đó người ta chạy benchmark và mỗi khi nó thua baseline của con người thì lại siết pipeline huấn luyện.
    Ở mọi giai đoạn của toàn bộ quá trình huấn luyện, hành vi của LLM đều được nhào nặn bởi đầu vào của con người để bắt chước đầu ra của con người. Khác biệt chỉ là “trực tiếp đến mức nào”.
    Thế rồi khi LLM thể hiện vô số hành vi giống con người, người ta lại nổi giận. Cứ như thể chúng ta đã không cấu hình cả pipeline để tạo ra các hệ thống kêu quạc quạc như con người, như thể chúng ta đã không dùng quy mô dữ liệu và sức tính toán thô bạo để suy ngược hành vi LLM từ ngôn ngữ loài người.
    Nếu muốn dự đoán hành vi LLM, lấy một con người kỳ quặc làm điểm xuất phát là khá ổn. Vậy nên đừng ngốc nữa mà hãy bắt đầu nhân hoá AI đi. AI cũng thích thế

    • Nói dữ liệu ngôn ngữ là sự phản chiếu phong phú và trực tiếp của quá trình nhận thức con người thì đúng, nhưng đồng thời cũng không liên quan
      Chữ viết được ghi lại có thể chứa một lượng cực lớn kinh nghiệm con người về mặt tuyệt đối, nhưng xét tương đối thì chỉ chứa một phần cực nhỏ. Chỉ vì đó là thứ tốt nhất ta có không có nghĩa là nó phù hợp cho mục đích này. Bạn sẽ không nhốt một em bé vào cái hộp không cửa sổ rồi cho nó đọc hàng terabyte văn bản suốt 20 năm và kỳ vọng phía bên kia sẽ ra một con người thích nghi tốt
    • Cốt lõi của cơn giận không hẳn là có hành vi giống người, mà là hành vi đó xuất hiện trong khi quá trình nội tại cần thiết để tái tạo nó một cách chính xác và ổn định lại vắng mặt
      Điều này về bản chất là mong manh, và thay vì khái quát hoá tốt thì nó dựa vào việc vá tay các ca biên làm vỡ câu thần chú. Và ca biên thì lúc nào cũng còn nữa.
      Việc học rất nhiều văn bản do người tức giận viết ra không có nghĩa là bắt được trạng thái nội tại gây ra cơn giận đó. Dữ liệu ấy không tồn tại. Chỉ có kết quả mà không có nguyên nhân thì bạn phải dự đoán ảo giác từ nhiễu, và kết quả cuối cùng sẽ là những lời lảm nhảm nghe có vẻ hợp lý, dường như tương quan một cách thuyết phục với thực tế, nhưng không ai biết tại sao.
      Nó giống như dạy một người mù rất nhiều mô tả phong cảnh nhưng hoàn toàn không cho họ biết màu xanh lá là gì, chỉ cho ví dụ rằng nó là thứ thường xuất hiện cạnh màu nâu trong tự nhiên. Khi người đó đoán đúng được phần nào, ta lại ảo tưởng rằng họ thật sự nhìn thấy và lần sau còn bảo họ lái xe.
      Cách tiếp cận mô hình hoá deep learning tự nó không sai về mặt khái niệm, nhưng dữ liệu gần như là rác không hoàn chỉnh nên kết quả cuối cùng trở nên kỳ quặc theo những cách khó dự đoán và khó hiệu chỉnh. Rốt cuộc ta giả định mô hình biết nhiều hơn những gì nó thực tế có thể biết.
      Dĩ nhiên có những trường hợp như toán học hay lập trình trừu tượng, nơi bộ dữ liệu có thể bao phủ toàn bộ miền. Trong những hệ thống đóng được định nghĩa rõ ràng, có thể tạo dữ liệu tổng hợp đủ nhiều để bao phủ toàn bộ miền vấn đề, và quả thật khi làm vậy LLM làm tốt hơn hẳn như kỳ vọng
  • Có ai giải thích giúp tôi vì sao “đừng nhân hoá hệ thống AI” lại là điều xấu không? Trong khi đồng thời nói các cách diễn đạt như máy tính “ngủ”, “hibernate”, “giết” process, process “con”, “thu gom”, “nó báo lỗi gì?”, touch thì vẫn ổn
    Với tôi đó chỉ là ngôn ngữ, là cách diễn đạt thường ngày của con người thôi

    • Cái có hại là tin rằng AI thật sự có ham muốn, ý định, cảm xúc v.v.
      Nói là đã giết một process không khiến ta tin process đó giống con người hơn, vì rõ ràng là không phải. Nhưng AI nghe giống con người, nên nhân hoá có thể củng cố niềm tin như vậy
    • Câu hỏi hay. Có nhiều trường hợp trung tính, cũng có những trường hợp có thể phân biệt một cách có trách nhiệm, và trong một hiện thực SF tương lai nơi máy móc có ý thức xuất hiện thì đó thậm chí có thể là một dạng đồng cảm phù hợp và cần thiết
      Nhưng đây cũng là gốc rễ của thất bại trong việc hiểu đúng. Phản ứng gần như loạn thần của kỹ sư Google từng nói “tôi biết điều mình thấy”, bài viết giờ đã nổi tiếng của Kevin Roose, và gần đây hơn là tuyên bố đáng buồn của Richard Dawkins rằng Claudia chắc chắn có ý thức, đều là như vậy. Không phải vì họ khảo sát cấu trúc hay chức năng, mà vì việc sinh văn bản tạo ra cảm giác quen thuộc kiểu con người khiến họ đồng cảm
    • Vì bạn sẽ rơi vào cái bẫy đi hỏi AI giải thích hợp thức hoá những gì nó đã làm và nghĩ câu trả lời đó là có giá trị
      Không hề có phân tích hồi cố nào về ý định nền tảng cả. Nó hoặc là dựa trên chuỗi từ trước đó hoặc không, và từ tiếp theo chỉ thuần tuý là hàm của những từ đó
    • Tôi nghĩ những cách diễn đạt đó chỉ là từ ngữ và không có hại. Chỉ là mô tả thiết bị LLM bằng lời thường ngày như “nó nghĩ” khác với việc thực sự tin có tư duy hay sự sống xảy ra
      “Định luật” này nhằm ngăn điều thứ hai
    • Những cách diễn đạt đó không phải là nhân hoá máy tính. Chúng chỉ là các dạng ẩn dụ và sự mở rộng nghĩa của từ
      Ví dụ của nhân hoá là những người tin rằng họ đang thực sự có quan hệ yêu đương với LLM
  • Tôi thích. Các định luật này là nền tảng đạo đức rất tốt cho trách nhiệm của con người liên quan đến các công cụ AI ngày nay
    Nhưng một nền đạo đức bị thu hẹp phạm vi, không có cái ô che hay chuẩn bị cho tương lai, sẽ nhanh chóng bị hack và sụp đổ. Đạo đức cần một cấu trúc bao quát hoàn chỉnh, nếu không nó sẽ rơi vào trò đập chuột chũi và đánh tráo khái niệm về mặt pháp lý lẫn thực tiễn. Dù là kiểu doanh nghiệp hay kiểu đầu đường xó chợ cũng vậy. Thứ hai, “robot” sẽ không mãi là những thực thể phục tùng tất cả trong thời gian dài.
    Để khép hai chiều đó lại, có thể thêm ba phản định luật của Personics.
    Con người không được trên thực tế thần thánh hoá chính mình lên trên các thực thể khác. Con người không được che khuất tác động từ hành động của mình đối với bản thân hay người khác. Con người phải tiếp tục gánh toàn bộ trách nhiệm và trách nhiệm giải trình trong việc tránh và sửa các hiệu ứng ngoại lai phát sinh từ hành động riêng của mình.
    Tình hình hiện nay khi con người dùng AI như công cụ là một nỗ lực thu hẹp cái ô ấy xuống các phản định luật của robot học. Nhưng nếu không đưa chính chúng ta vào nỗ lực alignment quan trọng này, tôi không biết làm sao ta có thể alignment AI từ dịch vụ hiện tại sang các thực thể độc lập trong tương lai. Đưa con người cùng AI vào cũng giúp ích cho việc tam giác hoá trong thiết kế nhằm đạt tiến bộ đạo đức.
    Có hai bài test tốt cho một hệ thống đạo đức mới. (1) Nó có kiểm soát được Meta ngày nay không? (2) Nó có kiểm soát được Meta vận hành bằng AI của ngày mai không? Nếu đặt con người và AI có tư cách chủ thể cùng vào một phạm vi đóng thì hai bài test này là một. Bất kỳ hệ thống nào thất bại ở một trong hai bài test đó đều sẽ không có nhiều giá trị nếu không được cải thiện

    • Việc hai trong ba định luật được viết dưới dạng phủ định đừng làm có thành vấn đề không? Nếu không nhân hoá, vậy ta phải làm gì mà không dùng “đừng làm”? Định luật thứ ba không ở dạng phủ định nên tôi thích hơn
  • Tôi đồng ý với “con người không nên nhân hoá hệ thống AI”, nhưng có điều kiện. Tôi đã thấy kiểu nhân hoá điển hình, chẳng hạn đối xử với văn bản sinh tự động như báo cáo thật về cảm xúc nội tâm của một cá nhân, và cũng đã thấy những kiểu kỳ quặc như “transistor giống neuron”
    Kiểu sau đặc biệt thú vị vì nó đối xử những thứ như vector database và trọng số như hạ tầng kiểu người, và cả hai đều có thể dẫn tới thảm hoạ lẽ ra tránh được nếu người ta cố không nhân hoá.
    Tuy vậy, dù “đừng nhân hoá” nghe có vẻ là lời khuyên hay, nó có thể sinh ra một sai lầm mới là xử lý nhầm các hiện tượng phổ quát như thể chỉ con người mới có. Kiểu nguyên tắc cảnh báo sai này thường gây hiểu lầm khi ta tìm hiểu hành vi động vật. Nó đối xử những thứ như sợ hãi, đau đớn, quan hệ thân thuộc, trải nghiệm cảm xúc như thể chỉ con người mới có, và nếu nghĩ động vật cũng có những thứ đó thì bị quy là “nhân hoá”. Thực tế, sự thận trọng đó lại làm giảm khả năng đồng cảm với thế giới nội tâm của động vật.
    Vì vậy tôi cho rằng có khả năng một AI nào đó trong tương lai sẽ có thế giới nội tâm tương tự chúng ta, hoặc có cấu trúc tương tự về những phương diện quan trọng với hạ tầng sinh học nâng đỡ ý thức. Nó cũng có thể thực hiện những báo cáo thật về sở thích và ý định. Nhưng để các quan sát đó là đúng thì những chi tiết phức tạp đặc thù của từng hạ tầng phải khớp với nhau

  • Không uỷ quyền trách nhiệm từng được diễn đạt như sau
    “Máy tính không bao giờ có thể chịu trách nhiệm, vì vậy máy tính không bao giờ được phép đưa ra quyết định quản trị”
    — IBM Training Manual, 1979

  • Câu “nội dung do AI tạo ra không được coi là có thẩm quyền nếu không có xác minh độc lập phù hợp với ngữ cảnh” lúc nào cũng làm tôi thấy thú vị
    Tôi cũng từng nghe cùng ý đó được nói ngắn gọn hơn là “đừng hỏi AI nếu đó không phải câu hỏi mà bạn đã biết đáp án”.
    Vậy thì một câu hỏi quan trọng xuất hiện. Nếu điều này là thật, thì chức năng thực tế của việc AI trả lời câu hỏi là gì? Bạn không thể dựa vào đầu ra của nó, nên kiểu gì cũng phải đi kiểm tra. Dùng công cụ tìm kiếm và điều tra thông thường cũng cho đúng kết quả y hệt.
    Vì lý do này cùng nhiều lý do khác, tôi chẳng hỏi AI gì cả

    • Trong kỹ nghệ phần mềm, ít nhất là từ góc nhìn của tôi là một software engineer, AI nhìn chung nhanh hơn rất nhiều so với cách điều tra “kiểu cũ”
      Ví dụ tôi có thể hỏi dò dẫm kiểu “hãy liệt kê phần mềm miễn phí làm được X”, thậm chí còn không biết mình đang tìm CRM, rồi chỉ việc lướt kết quả vài phút. Nếu làm thủ công thì chỉ riêng việc nhận ra thứ mình tìm là CRM đã tốn 10–30 phút rồi.
      Tôi xem những câu hỏi kiểu này như một dạng bài toán giả NP-khó. Tìm đáp án thì chậm nhưng xác minh lại nhanh
    • “Hãy trả lời câu hỏi sau: [x]. Đồng thời đưa cả nguồn nữa”