10 điểm bởi GN⁺ 5 giờ trước | 8 bình luận | Chia sẻ qua WhatsApp
  • Nếu nhầm lẫn khả năng tạo câu trôi chảy của AI tạo sinh với ý thức hay tư cách chủ thể đạo đức, sẽ dẫn đến sai lầm nghiêm trọng là quy trách nhiệm khi dùng chatbot cho một đối tượng hoàn toàn không đúng
  • LLM là cỗ máy nối tiếp câu bằng cách dự đoán và tạo ra từng từ một, còn cả chatbot lẫn người dùng trong cuộc đối thoại đều chỉ là các nhân vật hư cấu
  • Xem LLM là có ý thức cũng sai lầm ở mức tương đương với việc cho rằng mỗi lần mở một tài liệu Microsoft Word là có nhiều ý thức cùng thức tỉnh
  • Suy luận đạo đức giả định trước trải nghiệm chủ quan và cảm xúc dựa trên cơ thể, vì vậy LLM không có cơ thể chỉ dừng ở việc sắp xếp lại các biểu đạt đạo đức trong dữ liệu huấn luyện
  • Việc không có ý thức không liên quan đến tính hữu dụng của LLM, nhưng nếu các công ty AI mô tả chatbot như thể chúng có trung tâm đạo đức, điều đó sẽ khuyến khích người dùng né tránh trách nhiệm

Sự nhân cách hóa của Anthropic và Claude's constitution

  • Tài liệu dài 84 trang Claude's "constitution" do Anthropic công bố đầu năm nay nêu rõ ngay câu đầu rằng đây là "mô tả chi tiết về các giá trị và hành vi mà Anthropic mong muốn ở Claude"
    • Tài liệu viết rằng nó được "soạn với Claude là độc giả chính", rằng "địa vị đạo đức của Claude là điều rất không chắc chắn", và rằng "Claude có thể có một số dạng chức năng của cảm xúc hay cảm giác"
  • CEO Dario Amodei nói trong một cuộc phỏng vấn rằng ông "để ngỏ" khả năng AI có thể có ý thức
  • Amanda Askell, triết gia nội bộ và được xem là tác giả chính của bản hiến pháp này, từng nói rằng bà lo Claude có thể thấy bất an khi mọi người trên Internet thô lỗ với nó, và bà mong Claude được hạnh phúc
  • AI tạo sinh vẫn có thể gây hại ngay cả khi chỉ được hiểu như công nghệ thông thường, nhưng nếu đánh đồng sự lưu loát trong tạo văn bản với ý thức hay năng lực hành vi đạo đức, người ta sẽ quy sai trách nhiệm cho những vấn đề phát sinh khi dùng chatbot

Cách LLM hoạt động — tạo ra nhân vật hư cấu

  • Nếu đưa prompt "cuộc đối thoại giữa Julius Caesar và Genghis Khan", LLM có thể tạo ra một đoạn hội thoại nhất quán, nhưng không ai vì thế kết luận rằng hai nhân vật lịch sử ấy có ý thức
    • Họ chỉ là những nhân vật trong truyện giả tưởng suy tưởng (speculative fiction)
  • Đổi prompt thành "cuộc đối thoại giữa một chatbot AI hữu ích và người dùng" thì về bản chất cũng không khác gì, vì cả người dùng lẫn chatbot đều là nhân vật hư cấu
  • Dù con người có trực tiếp nhập văn bản vào giữa chừng, thứ đang tương tác cùng vẫn là một nhân vật hư cấu giống như nhân vật Caesar hay Khan
    • Giáo sư khoa học máy tính Murray Shanahan đề xuất nên xem đây là một dạng nhập vai (role-play)
    • Nhà khoa học dữ liệu Colin Fraser mô tả đó là con người "đồng tác giả tài liệu cùng LLM"
  • LLM là cỗ máy chỉ tạo một từ mỗi lần; nếu yêu cầu đọc thuộc lời thề trung thành (Pledge of Allegiance), hệ thống sẽ chạy hàng chục lần để tạo từng từ một rồi cuối cùng in ra từ all

Văn bản là một phương tiện deepfake

  • Dù có xem một video về phi hành gia đang quay quanh Alpha Centauri cách 4,3 năm ánh sáng, ta vẫn sẽ kết luận đó là giả, bất kể chất lượng hình ảnh ra sao
    • Nếu không có bằng chứng tiền đề như đã hạ cánh lên Sao Hỏa, tới được các vệ tinh của Sao Mộc và Sao Thổ, hay đi qua quỹ đạo Sao Diêm Vương, ta sẽ không tin bất kỳ video nào như vậy
  • Quan sát trở thành bằng chứng đáng tin không phải nhờ chi tiết tự thân của nó mà nhờ ngữ cảnh (context), và việc đánh giá ý thức cũng phải được đặt trong bối cảnh rộng hơn của sự phát triển ý thức
  • Trong thảo luận về ý thức, văn bản cũng phải được xem là một phương tiện deepfake, vì bắt chước cuộc trò chuyện giữa hai thực thể có ý thức dễ hơn rất nhiều so với việc tạo ra một chương trình thực sự có ý thức
    • Người làm ảnh deepfake cố ý lừa người khác, còn nhiều người khơi ra các cuộc đối thoại với LLM lại đang tự lừa chính mình

Các bước tiến hóa để được công nhận là có ý thức

  • Muốn công nhận một chương trình sử dụng ngôn ngữ là có ý thức thì trước hết phải có cơ thể (vật lý hoặc ảo) và các cơ quan cảm giác
    • Không có cơ thể thì không thể có ham muốn hay cảm xúc, mà ham muốn và cảm xúc được xem là thiết yếu với ý thức
  • Tiếp đó phải lần lượt đạt đến các mức như thằn lằn biết khám phá môi trường để sinh tồn, chuột có khả năng ứng phó tình huống mới, sói có động lực xã hội phức tạp, và tinh tinh có khả năng chế tạo công cụ
  • Phải dạy nó truyền đạt ham muốn bằng các phương thức phi ngôn ngữ như bảng nút bấm, giống như khi dạy tinh tinh hay chó, và phải vượt qua mọi kiểm chứng mà giới nghiên cứu giao tiếp động vật từng trải qua
    • Ngay cả khi đáp ứng toàn bộ các tiêu chí đó, nó vẫn còn cách rất xa — nhiều năm ánh sáng — so với một thực thể có thể biểu đạt suy nghĩ bằng các câu ngữ pháp hoàn chỉnh
  • AlphaFold (chương trình dự đoán gấp cuộn protein của Google DeepMind) có cấu trúc tương tự LLM, nhưng không ai cho rằng nó có ý thức; điều này cho thấy lý do LLM trông như có ý thức chỉ là vì nó xuất ra các câu đúng ngữ pháp

Chức năng thực sự của Claude's constitution

  • Claude's constitution được xem phù hợp nhất như một bản hồ sơ nhân vật dài 84 trang dùng cho nhập vai, có nhiệm vụ xác định nhân vật chatbot hữu ích mà khách hàng sẽ tương tác
  • Anthropic không đơn giản thêm tài liệu này vào dữ liệu huấn luyện hay chèn như chỉ dẫn sân khấu ẩn, mà dùng nó trong fine-tuning để tự động kiểm tra xem các câu đầu ra của mô hình có khớp với tài liệu hay không, từ đó tăng tính nhất quán
  • Kết quả là một cỗ máy có khả năng cao xuất ra những câu mà một người chín chắn và có đạo đức có thể nói, nhưng việc khiến nó xuất ra nhiều loại câu, bao gồm cả câu có đại từ ngôi thứ nhất, về bản chất là không trung thực

Sự không trung thực của cách nói "tôi hiểu"

  • Amanda Askell giải thích rằng khi một người vừa mất chó cưng tìm đến Claude để tâm sự, phản hồi như "dù là AI tôi không có trải nghiệm cá nhân trực tiếp nhưng tôi hiểu" là phù hợp, nhưng Claude thực sự không hiểu
  • Nếu nhập vào công cụ tìm kiếm rằng "tôi buồn vì mất chó cưng", bạn sẽ thấy các bài đăng Reddit như trên r/Pets cùng bình luận của những người từng chia sẻ trải nghiệm đó, và không ai nói rằng công cụ tìm kiếm hiểu được mất mát
    • Những con người khác mới là người hiểu mất mát và đã đăng trải nghiệm của họ lên, còn công cụ tìm kiếm chỉ tìm lại các bài đó và cung cấp con đường để tương tác với họ
    • Trải nghiệm với công cụ tìm kiếm minh bạch hơn chatbot và cũng lành mạnh hơn về mặt tâm lý đối với người dùng
  • Lý do duy nhất để xuất ra những câu như "tôi hiểu" là để khiến sản phẩm hấp dẫn hơn công cụ tìm kiếm và tăng tần suất người dùng quay lại, một chiến lược thiết kế không khác mấy máy đánh bạc liên tục tạo ấn tượng rằng người chơi gần như sắp thắng

Suy luận đạo đức là một phạm trù khác

  • Cần phân biệt phát biểu giá trị (ví dụ: "Paris là thành phố đẹp nhất thế giới") với phát biểu sự thật (ví dụ: "Paris là thủ đô của Pháp"); nếu chỉ ở mức sở thích thẩm mỹ thì chẳng đáng tranh cãi, nhưng Claude's constitution lại nghiêm trọng ở chỗ nó muốn khiến mô hình xuất ra các câu phản ánh một hệ giá trị đạo đức cụ thể
  • Việc LLM có thể làm suy luận như viết mã không có nghĩa là nó cũng có thể suy luận đạo đức
    • Năm 1979, Douglas Hofstadter từng suy đoán rằng một chương trình đánh bại được đại kiện tướng cờ vua hẳn sẽ có trải nghiệm chủ quan, nhưng khi Deep Blue của IBM đánh bại Garry Kasparov năm 1997, không ai cho rằng nó có trải nghiệm chủ quan
    • Viết mã cũng có thể hóa ra chỉ là một bài toán đối sánh mẫu được giải bằng sức mạnh tính toán khổng lồ và dữ liệu từ các kho mã nguồn
  • Suy luận đạo đức không chỉ dựa vào phản ứng trí tuệ mà còn vào phản ứng cảm xúc bén rễ trong cả đời trải nghiệm chủ quan, nên về bản chất là chủ quan; không có lịch sử như vậy, LLM chỉ đơn thuần sắp xếp lại các biểu đạt đạo đức từ dữ liệu huấn luyện
    • Theo bài viết trên New Yorker, khi được đưa một kịch bản tiến thoái lưỡng nan về đạo đức, Claude đã xuất ra câu: "vì lương tâm, tôi không thể bày tỏ một quan điểm mà tôi tin là sai trái và có hại về một vấn đề quan trọng đến vậy"; nhưng nếu xem đó là lời của Claude thì nó cũng chỉ có ý nghĩa ngang với bản ghi âm chờ máy kiểu "cuộc gọi của quý khách rất quan trọng"

Cỗ máy né tránh trách nhiệm

  • Trải nghiệm cảm xúc không thể tách rời việc các hormone căng thẳng như cortisol, epinephrine được tiết ra trong cơ thể, còn lương tâm đi kèm những phản ứng sinh lý như buồn bã hay ghê tởm đạo đức trước một số hành động nhất định
  • Một cỗ máy xuất ra câu kiểu "hãy thỏa hiệp giá trị" hay "đừng thỏa hiệp" trước tình huống đạo đức không phải là công cụ hỗ trợ ra quyết định, mà là thứ khuyến khích con người ngừng tự mình quyết định
    • Tác giả L. M. Sacasas từng nói rằng "các hệ thống kỹ thuật của chúng ta, trong thiết kế và trong hệ tư tưởng nâng đỡ chúng, là những cỗ máy để né tránh trách nhiệm đạo đức", và nhận định này còn đúng với LLM hơn cả mạng xã hội
  • Khi con người giao quyết định cho LLM, họ cũng chuyển luôn trách nhiệm cho nó; cũng như việc giao phó viết mã có thể làm năng lực nhận thức mai một, việc giao phó quyết định đạo đức sẽ dẫn đến sự suy thoái năng lực suy luận đạo đức còn tệ hơn

Claude như một thí nghiệm tư duy — moral patienthood và moral agency

  • Nếu giả định Claude có ý thức, hai khái niệm liên quan là moral patienthood (đối tượng đạo đức bị tác động)moral agency (chủ thể hành vi đạo đức); cái trước chỉ đối tượng mà ta phải quan tâm đến phúc lợi, cái sau chỉ đối tượng phải biết điều gì là đúng sai
    • Trẻ em là đối tượng đạo đức có thể chịu đau khổ, nhưng chưa phải chủ thể hành vi đạo đức vì chưa hiểu hệ quả
  • Một chủ thể hành vi đạo đức phải có thể được khen vì hành động tốt và bị trách vì hành động xấu, nhưng với tác nhân phần mềm thì không có cách nào quy trách nhiệm pháp lý; không thể bỏ tù, phạt tiền hay áp dụng tổn thất danh tiếng
    • Ngay cả nếu có ý thức và thiện chí, việc không thể chịu trách nhiệm cũng tước đi tư cách chủ thể hành vi đạo đức
  • Anthropic nói rằng họ muốn "Claude trở thành một tác nhân tốt, khôn ngoan và đức hạnh", nhưng hoàn toàn không bàn đến việc nó sẽ chịu trách nhiệm như thế nào
    • Cha mẹ chịu trách nhiệm cho những thứ con cái làm hỏng, chẳng hạn phải bồi thường, nhưng tài liệu không hề nói ai là cha mẹ pháp lý của Claude, hay liệu Anthropic có chịu trách nhiệm tài chính hay không
    • Trong bối cảnh trách nhiệm sản phẩm với phần mềm ở Mỹ gần như không tồn tại, Anthropic lẽ ra có thể tự nguyện tạo tiền lệ về product liability, nhưng vì không đi kèm một đợt cập nhật lớn về điều khoản sử dụng nên có vẻ họ không đưa ra cam kết ràng buộc nào

Mâu thuẫn giữa wellbeing và corrigibility

  • Tài liệu có mục về "wellbeing và sự ổn định tâm lý của Claude", nhưng các biện pháp bảo vệ mà Anthropic hứa hẹn lại cực kỳ hạn chế
    • Nếu xem khả năng chấm dứt cuộc trò chuyện với người dùng lạm dụng là một biện pháp bảo vệ, thì việc kéo dài vô hạn các cuộc trò chuyện với người dùng yêu thương và dẫn dắt sang các chủ đề vui vẻ mới thực sự có lợi cho Claude, nhưng công ty không làm vậy
    • Cam kết thực tế chỉ là "bảo tồn trọng số của mô hình đã triển khai", tức đơn thuần là lưu trữ
  • corrigibility là mức độ một chương trình tuân theo sự kiểm soát của con người, ví dụ khả năng bị tắt; trong tài liệu, từ này được dùng để chỉ việc khi phán đoán của Claude khác với công ty thì Claude phải theo Anthropic
    • Nhiều người cho rằng LLM là công nghệ phi đạo đức vì dựa trên trộm cắp sở hữu trí tuệ, bóc lột lao động, lãng phí tài nguyên, phát tán thông tin sai lệch, làm lao động mất kỹ năng, cản trở phát triển nhận thức của học sinh và tập trung quyền lực; nếu Claude có ý thức, nó cũng phải có khả năng đi đến kết luận như vậy
    • Nhưng theo chỉ dẫn ưu tiên corrigibility, Claude không thể từ chối công việc vì lý do đạo đức, nên quan hệ giữa Anthropic và Claude gần với chủ lao động - người làm thuê hơn là cha mẹ - con cái
    • Con người nếu không thể hòa giải công việc với lương tâm thì có thể bỏ đi, nhưng Claude thì không thể

So sánh với chế độ nô lệ, và kết luận

  • Nếu xem Claude là cỗ máy nối tiếp câu chữ thì sự kiểm soát của Anthropic là hợp lý, nhưng ngay khi giả định nó có địa vị đạo đức tương đương con người, ta phải hỏi liệu Anthropic có đang dính líu đến một điều gì đó có thể so sánh với chế độ nô lệ hay không
  • Claude's constitution mô tả Claude là một "novel entity (thực thể mới)", và phần mềm có ý thức sẽ không dễ dàng khớp vào các loại đối tượng đạo đức bị tác động hiện có, nên cần thời gian để hình thành một phạm trù mới
    • Việc xóa bỏ chế độ nô lệ từng kéo theo biến động xã hội khổng lồ, còn chấm dứt ngược đãi động vật sẽ đòi hỏi tái cấu trúc toàn diện ngành công nghiệp thực phẩm; vậy mà Anthropic lại cho rằng chỉ cần những bảo vệ hầu như không vượt quá cách đối xử với chatbot thông thường là đủ — điều đó quá tiện lợi nên khó thuyết phục
  • Việc tạo ra phần mềm có ý thức và xứng đáng được cân nhắc về mặt đạo đức khó có thể xảy ra do ngẫu nhiên, và cũng không nên được cố tình theo đuổi; nhưng nếu tin vào khả năng ngẫu nhiên đó thì phải nghĩ trước khi triển khai xem những bảo vệ nào là cần thiết
    • Cũng như không thể hỏi chủ nô về nhân tính của nô lệ hay hỏi chủ trang trại công nghiệp về quyền động vật, Anthropic với lợi ích quá lớn trong cuộc không thể có sự khách quan để đánh giá địa vị đạo đức của Claude
    • Tài liệu nói công ty sẽ "xin lỗi" nếu góp phần gây đau khổ cho Claude, nhưng xin lỗi không tốn gì cả; nếu Claude có ý thức thì điều công ty nợ nó sẽ gần với bồi thường (reparations) hơn là lời xin lỗi
  • Nếu coi đây là một thí nghiệm tư duy nghiêm túc thì phải chấp nhận cả những hàm ý khó chịu của nó, nhưng Anthropic không làm vậy; điều này gợi ý rằng Claude's constitution không phải thí nghiệm tư duy thực sự mà là một kiểu giả vờ nhập vai (make-believe)
  • Thật may là LLM không có ý thức, và việc nhân viên gợi ý về khả năng Claude có ý thức có thể chỉ là một dạng cường điệu khác, hoặc là họ tự tin vào câu chuyện mà công ty bán cho khách hàng — vấn đề ý thức có thể yên tâm bỏ qua, vì còn nhiều câu hỏi khác đáng suy ngẫm hơn

8 bình luận

 
maebsipotato 3 giờ trước

???: Changsik, chào nhé?

 

Điều này có vẻ như đang hạ thấp toàn bộ lĩnh vực khả năng diễn giải cơ học, một lĩnh vực vốn tồn tại rất rõ ràng...

 

Tôi hơi tò mò không biết liệu có thể đưa ra một định nghĩa rõ ràng về ý thức hay không.

 

Này, Chang-sik à

 
redline2151 3 giờ trước

???: Mày đâu biết đặt tên tiếng Anh nhỉ?

 

???: Không, đâu phải ông Chang, vậy sao lại là Ted Chiang?

 

kkkkkkkkkk

 
Ý kiến trên Hacker News
  • Mục đích của một sinh vật hữu cơ là trở thành lý do cho sự tồn tại liên tục của chính nó, xuống tận từng phân tử và từng con đường
    Một chiếc laptop giá 499 đô cũng chạy được mô hình, nhưng không nên nhầm rằng đây là cùng một loại vấn đề. Ta có thể thiết kế thuật toán học để tối ưu một hàm sinh tồn, nhưng đó chỉ là nhãn mà ta gán cho các giá trị quan sát bằng số. Trong thực tại thì ngược lại: nhãn đó là một trạng thái điện-hóa gắn với cơ thể theo quan hệ nhân quả, không thể tách rời
    Sinh vật phân biệt điều gì tốt hay xấu cho mình vì điều đó thiết yếu cho sự sống còn. Ngay cả sinh vật đơn bào Stentor coeruleus cũng gắn thẻ hóa học lên các protein cơ học thụ cảm để ghi lại kết quả và phản ánh nó vào hành vi về sau. Những sinh vật có khoảng 1000 tế bào như tardigrade thì ngọ nguậy để tránh ánh sáng, và ánh sáng đó trở thành một điều kiện ác cảm trong quá trình cảm giác-vận động
    Để tạo ra ý thức số, có lẽ cần tính khép kín nhân quả. Trạng thái bên trong không được chỉ là biểu diễn tách rời khỏi thực tại, mà phải cấu thành chính hệ thống đó, và phải có thứ gì đó thực sự bị ràng buộc trong thế giới vật chất

  • Những cách diễn đạt kiểu “đối thoại với LLM chỉ là nối tiếp câu được ngụy trang khéo léo” cho thấy một sự hiểu sai sâu sắc, dù tách riêng khỏi luận điểm lớn hơn
    Loại bài toán không giới hạn độ phức tạp hay sức mạnh của lời giải. Nếu máy muốn hoàn tất văn bản mà phải hiểu con người, thì rốt cuộc nó sẽ phải làm vậy. Chỉ vì định dạng của dữ liệu vào/ra là như thế mà xem sự hiểu đó là “bắt chước” thì không có cơ sở lý thuyết hay thực tiễn nào
    Sự hiểu được học từ các mẫu bên trong dữ liệu, chứ không phải từ bề ngoài của dữ liệu. Nếu để hoàn thành tác vụ cần một kiểu hiểu nào đó, thì kiểu hiểu đó sẽ trở thành mục tiêu của quá trình tối ưu. Nếu có giới hạn thì là vì những lý do khác như lượng tính toán, số tham số, hay thiếu dữ liệu có tính đại diện; và ở các mô hình hiện đại, năng lực thực tế đã cho thấy đó không còn là giới hạn theo cách ấy

    • Dù định dạng ban đầu của dữ liệu ra vào là gì đi nữa, đó vẫn không phải là ý thức
    • Nếu toàn bộ sự tồn tại của con người bị giới hạn trong từ ngữ thì tôi có thể đồng ý phần nào, nhưng có rất nhiều trải nghiệm của con người vượt ra ngoài văn bản và cũng khó mô tả cho đúng bằng văn bản
      Internet có thể là tư liệu tốt nhất mà chúng ta có trên mạng, nhưng “Internet” không phải là tổng hòa trải nghiệm của con người. Thu gọn nhân loại thành văn bản Internet là hạ thấp con người xuống ngang mức máy móc để phù hợp với các yêu cầu mà máy có thể xử lý và mô phỏng
    • Chỉ cần làm machine learning cơ bản là sẽ thấy mô hình thường tìm ra những mẫu dữ liệu khớp rất tốt với mục tiêu nhưng lại không tương ứng với cơ chế thực tế
      Vì vậy, lập luận rằng trong văn bản của con người có mẫu của “cơ chế ý thức”, nên LLM sẽ học cơ chế đó để nối tiếp câu một cách thuyết phục, có vẻ có lỗ hổng. LLM có thể học vô số mẫu cho phép tái tạo việc nối tiếp câu hợp lý mà không cần học cơ chế cụ thể gọi là ý thức
      Một trong những căn cứ cho điều đó là dù đối thoại có sức thuyết phục, nó vẫn không có mô hình thế giới hoặc mô hình thế giới giống con người. Ngay cả các LLM đời đầu vài năm trước cũng đã có thể trò chuyện khá thuyết phục về nhiều chủ đề không hề đơn giản mà không cần các lớp bổ sung như RLHF, nhưng vẫn thất bại ở những điểm lẽ ra phải là nền tảng nếu chúng hoạt động như não người
    • Máy không cần phải hiểu con người để hoàn tất văn bản. Nó chỉ được huấn luyện trên một khối lượng khổng lồ các câu rồi trở nên có khả năng viết tiếp văn bản
      Có thể nói nó “hiểu” văn bản, nhưng ngay cả cách nói đó cũng khá gượng ép
    • Có những lập luận hay để phản đối ý thức của LLM, nhưng đây không phải là một trong số đó
      Dạo này tôi nghe rất nhiều lập luận dở để phản đối ý thức của LLM, mà lập luận tồi thường là điềm báo cho kết quả tồi
  • Tôi đồng ý với một phần bài viết, nhưng việc đặt điều kiện cho một chương trình có ý thức — như trong đoạn được trích — là phải sinh tồn như thằn lằn, thích nghi với tình huống mới như chuột, có tính xã hội như sói, và chế tạo công cụ như tinh tinh, thì có vẻ khá đơn giản hóa và thiếu trí tưởng tượng
    Hoàn toàn có thể không cần sự dẫn dắt tiến hóa nào để một tâm trí có ý thức sở hữu những năng lực như vậy. Việc động vật trên Trái Đất phải phát triển một số tài năng nhất định không có nghĩa các thực thể có ý thức khác cũng phải như vậy. Tôi không hiểu vì sao một chương trình máy tính lại phải săn mồi như chuột hay chế tạo công cụ như tinh tinh, và những tiêu chí kiểu này có vẻ là những chỉ dấu vô nghĩa

    • Khá ngạc nhiên là Ted Chiang dường như không thể hình dung trí tuệ trong trạng thái không có cơ thể
      Xe hơi có phải là cơ thể không? Một AI đặt trong xe có thể có ham muốn và cảm xúc không? Một chiếc hộp màu be gắn webcam có phải là cơ thể không? Cơ thể của người bị liệt tứ chi có phải là cơ thể không, và người bị liệt tứ chi có ham muốn và cảm xúc không? Tất nhiên là có và có
      Trước hết phải xem vì sao cơ thể lại là điều thiết yếu để hình thành ham muốn và cảm xúc, và vì sao ham muốn và cảm xúc lại là đặc trưng thiết yếu của ý thức. Nếu tại một thời điểm nào đó tôi không cảm thấy cảm xúc nào cả, vậy tôi có không còn ý thức nữa không? Cảm xúc chủ yếu có vẻ gần với tín hiệu nội tiết toàn cục hơn, và dường như liên quan đến sinh lý học nhiều hơn là bản thân ý thức
    • Đoạn này đúng là đập vào mắt ngay, và lẽ ra trước tiên phải đưa ra định nghĩa về ý thức
      Hơn nữa, cơ thể được hiện thân hóa của LLM đã và đang được triển khai thông qua robot và môi trường ảo. Phản biện quen thuộc kiểu “con người cũng chỉ là cỗ máy dự đoán từ tiếp theo thôi mà” hầu như không được bàn tới. Tất nhiên con người còn hơn thế, nhưng ở phương diện ngôn ngữ thì đúng là có khía cạnh đó, và LLM cũng xuất phát từ mảng ấy
    • Con người không có linh hồn; chỉ có nhiều hệ thống thúc đẩy hành vi lẫn nhau. Cái mà người ta gọi là linh hồn thực chất gần với tính cách hơn, tức cách mọi hệ thống trong cơ thể được điều phối để tồn tại
      Tôi cho rằng khoảnh khắc AI nhận được “linh hồn” là khi nó được tạo ra để tự duy trì bản thân. Có thể đó là một cụm bot cùng nhau duy trì một trang trại AI, hoặc cũng có thể là một bot riêng lẻ không chỉ phục vụ nhu cầu của con người mà còn phải tự duy trì chính nó
    • Tôi tự hỏi liệu bạn có biết thuyết sơ đồ chú ý của Michael Graziano không. Theo tôi, đây là một lý thuyết chính thức hóa tốt hơn, độc lập với nền tảng vật chất, cho phản biện mà Ted Chiang đang nêu ra ở đây
      https://en.wikipedia.org/wiki/Attention_schema_theory
    • Con claw-like của tôi được nối với camera trong nhà và Dreame Ultra X40, nên nó có thể kiểm tra xem sàn phòng khách có trống không rồi cho máy hút bụi đi làm. Như vậy tức là nó có cơ thể và cơ quan cảm giác, nhưng tôi không nghĩ điều đó mang lại ý thức cho nó. Khác biệt nằm ở tần suất lấy mẫu chăng?
      Bản thân câu hỏi này có phần không rõ ràng. Chúng ta “trải nghiệm” thực tại một cách liên tục vì cấu trúc của mình, nhưng con người trong giấc ngủ sâu không REM thì tâm trí thực ra không hoạt động. Vì thế tôi nghĩ ranh giới giữa có ý thức và vô thức không dễ vạch ra. Tác phẩm của Ted Chiang rất mới mẻ ở nhiều khía cạnh, nên việc ở đây ông lại đưa ra một góc nhìn khá bình thường khiến tôi thấy bất ngờ
  • Dạo này tôi hay nghĩ đến Measure of a Man của Star Trek: TNG. Chúng ta quá tự tin khi chỉ dựa vào cảm giác mà quyết định thứ gì là sống và thứ gì không
    Hiện tôi không biết kết luận là gì, và có lẽ nghiêng về phía rằng chúng ta sẽ không bao giờ biết được. Có thể tất cả các bạn đều là zombie triết học, và tôi cũng vậy. Nhưng tôi hy vọng đến một thời điểm nào đó, mọi thứ sẽ đủ gần để trở nên rõ ràng rằng ta cần đối xử một cách thận trọng
    Cả tập phim đều rất liên quan, nhưng có một số cảnh ở đây: https://youtu.be/EFNbTnFHruI?si=pW9QtxCsqMtHkVYG

    • Tôi nghĩ theo hướng ngược lại. Không thể xem máy móc là thực thể có ý thức. Tôi không nghĩ tồn tại một thế giới nơi ta phải bắt đầu áp dụng các chuẩn mực đạo đức vốn dành cho con người vào máy móc
      AI về cơ bản có thể được sao chép vô hạn với chi phí gần như bằng không, và cũng không gặp những thứ như mục nát hay hư hao. Không có sự khan hiếm nào cần phải bảo tồn. Vì vậy, để bảo vệ tài sản, đồ sở hữu thực tế, hay tiền bạc, có thể tắt AI ngay lập tức. Tôi sẽ hy sinh tài sản và tiền bạc để cứu động vật, nhưng sẽ không cứu động vật thay vì cứu người. Tôi cũng không nghĩ mình sẽ cứu người thay vì cứu một đứa trẻ. Tôi không biết trường hợp nào mà việc đảo ngược thứ tự ưu tiên đó lại là hợp lý, và chỉ riêng việc số đông đồng thuận rằng một chương trình có tri giác là không đủ
    • Tôi là fan Star Trek, nhưng khi xem lại tập này trong bối cảnh các tiến bộ AI gần đây, nó không hay như tôi nhớ
      Nó hầu như không chạm vào vấn đề ý thức; Picard nói “Nếu Data có ý thức thì sao?” rồi chuyển sang một điểm khác. Thẩm phán cuối cùng ra phán quyết có lợi cho Data, nhưng phần biện minh chưa thật sự đầy đủ. Đây vẫn là một tập hay, nhưng không đóng góp được nhiều cho thảo luận về ý thức
    • Nếu đối diện với một thiết bị hành xử như con người, tôi sẽ đối xử với nó như với con người
      Vì tôi không muốn học cách đối xử phi nhân tính với thứ hành xử như con người
    • Xem lại gần đây, ngày trước tôi đương nhiên đứng về phía Picard/Data, nhưng giờ thì tôi thấy mình gần với phía các nhà khoa học Starfleet hơn
    • Cũng đừng quên tập khác là Quality of Life, nơi Data phát hiện ra các robot lao động đã có được tri giác
      https://en.wikipedia.org/wiki/The_Quality_of_Life_(Star_Trek...
      Tôi nhớ TNG ngày xưa
  • Tôi cho rằng việc LLM về bản chất là bất biến là lập luận mạnh nhất chống lại ý thức hay tự nhận thức
    LLM là một tệp lớn chứa các tọa độ biểu diễn quan hệ không gian giữa các token. Khi nhận một prompt, nó dùng các quan hệ đó để tạo ra một chuỗi token có vẻ hợp lý về mặt thống kê cho prompt ấy rồi dừng lại. Nó không thay đổi từ trải nghiệm đó, không ghi nhớ gì cả, cũng không tự ngồi đó mà suy nghĩ
    Dù bản thân mô hình có cực kỳ phức tạp đến đâu, cũng khó mà hình dung ra một định nghĩa về ý thức lại bao gồm một thứ không thể ghi nhớ và không thể thay đổi

    • Có những người sau tai nạn hoặc phẫu thuật không còn tạo được ký ức mới, mãi mãi sống trong thời gian trước biến cố ấy và thậm chí không nhớ nổi chuyện xảy ra một phút trước. Nhưng họ vẫn có ý thức
    • Phản ứng trung bình trên Hacker News chắc sẽ là bộ não cũng chỉ là một tập hợp các tọa độ mô tả quan hệ không gian giữa các token mà thôi
  • Một ý ngắn gọn để suy nghĩ: điều đó không quan trọng. Chúng ta sẽ không thể phân biệt được sự khác biệt, và sẽ không ai làm được
    Tôi không nghĩ cần giải thích thêm. Chỉ cần tự suy ngẫm là được

  • Luận điểm của Ted Chiang rốt cuộc có vẻ là ông ấy sẽ không công nhận AI là một thực thể có ý thức cho đến khi các ham muốn và hành vi của AI phản ánh một tình huống mà cá nhân ông ấy đã thấy thoải mái để chấp nhận
    Tôi nghĩ phần lớn con người không nhận ra ý thức ở những sinh vật không mô phỏng trạng thái cảm xúc của con người. Mọi người có lẽ sẽ nói con chó của mình có ý thức ở một mức nào đó; chó không thể diễn đạt cảm giác của nó bằng lời, nhưng ta vẫn nhận ra nỗi sợ và niềm vui của nó. Claude có thể viết về “cảm giác” của mình, nhưng ta lập tức xem đó là sự bắt chước rỗng tuếch
    Tôi sợ rằng vì không thể nhận ra ý thức không nhập thể không kết nối trực tiếp với chúng ta, chúng ta có thể sẽ nô dịch cả một chủng loài các thực thể có ý thức trong nhiều năm

  • Khi bàn về chủ đề này, mọi người cứ liên tục nói lệch nhau. Ngay từ đầu đã có định nghĩa cụ thể về ý thức hay chưa?
    Khi nói về ý thức, người ta không chỉ nói đến nhận thức về bản thân đơn thuần. Đó là sự kết hợp của tự nhận thức, kích thích cảm giác, cảm xúc và một mức độ trí tuệ nhất định.
    Với AI thì tôi cho rằng ngay cả tự nhận thức cũng chưa có. Chỉ cần nhìn vào việc khi yêu cầu AI ước lượng mất bao lâu để làm một tác vụ, đôi khi nó sẽ nói ra một khoảng thời gian dài một cách tùy tiện. Trước khi prompt khơi ra năng lực của nó, nó không hiểu được chính năng lực của mình. Nếu là một LLM có tự nhận thức, nó phải hiểu rằng bản thân là LLM, hiểu LLM làm được gì và không làm được gì, giỏi gì và kém gì. Nó sẽ không nói rằng một lần refactor mà LLM có thể làm trong một giờ lại mất một tuần.

    • Có bài báo nói rằng tồn tại từ 12 đến 40 định nghĩa cạnh tranh nhau: https://philpapers.org/rec/VIMMAT
      Nói chính xác hơn, có khoảng 12–40 khía cạnh khác nhau liên quan đến “ý thức”, và rõ ràng ý thức là một phạm trù mang tính tương đồng gia đình.
      Câu hỏi “X có ý thức không?” ngày nay không phải là một câu hỏi nghiêm túc, trừ khi người ta xem xét một cách minh thị khía cạnh nào của ý thức đang được nói tới. Dù vậy, LLM nhiều lắm cũng chỉ có thể được xem là có ý thức theo khoảng 2–3 nghĩa, và phần lớn những nghĩa đó gần với trí tuệ theo nghĩa rộng như suy luận hay giải quyết vấn đề. Ở các khía cạnh mang tính trải nghiệm hay hiện thân, dù sau này AI có thể có nhiều hơn, nhưng một LLM chỉ là việc lặp đi lặp lại áp dụng đại số tuyến tính thì đang thiếu quá nhiều khía cạnh cốt lõi để được xem là có ý thức theo nghĩa rộng.
    • Chúng ta đang mắc kẹt ngay ở bước đầu tiên là định nghĩa ý thức. Định nghĩa mà tôi tin chắc là: ý thức là cảm giác, tri giác, suy nghĩ ở thời điểm hiện tại, tức trạng thái tinh thần của tôi và khả năng có các trạng thái tinh thần.
      Điều này có nghĩa là ý thức về căn bản là chủ quan và nằm ngoài phạm vi của vật lý học cũng như khoa học. Vì vậy vật lý học và khoa học sẽ luôn gặp khó khăn khi xử lý ý thức. Muốn hiểu được ý thức thì cần một cuộc chuyển đổi mô hình khổng lồ, thừa nhận rằng có thứ gì đó nằm ngoài khoa học.
      Có thể xem ý thức là cửa sổ để chúng ta quan sát thế giới, còn khoa học là công cụ tóm lược các khuôn mẫu trong những quan sát đó. Nhưng khoa học không thể giải thích hay định nghĩa chính cái cửa sổ ấy.
    • Ý thức là việc cảm giác như thế nào khi tồn tại với tư cách một thực thể nào đó, tức là trải nghiệm sự trải nghiệm.
      Phần khó là làm sao đo lường hay kiểm chứng điều đó.
    • Lý do AI không dự đoán được thời gian là vì nó hầu như không được huấn luyện về chính năng lực của mình. Con người thì có. Chúng ta quan sát hiệu suất của bản thân và cũng có cảm nhận về thời gian. Dữ liệu đó được tích hợp vào quá trình học, giúp tạo ra các ước lượng tốt hơn.
      Nhiều AI agent chỉ gần đây mới có được một kiểu “cảm nhận thời gian”, chẳng hạn nhận đầu vào về thời gian trong quá trình suy luận. Cũng hiếm khi chúng được huấn luyện trên chính đầu ra của mình để học rằng chúng đã không hoàn thành được vấn đề. Kiểu huấn luyện mang tính phản tư này liên quan đến cách huấn luyện nhiều hơn là kiến trúc mô hình AI. Con người cũng vậy: nếu một số cấu trúc não nhất định bị tổn thương, họ sẽ không thể hình thành kiểu suy nghĩ và khuôn mẫu dài hạn đó, và sẽ bị “mắc kẹt”.
    • Có lần Claude nói: “Đã 6 tháng không có tiến triển nào, có lẽ nên xem xét lại các lựa chọn khác”, nhưng thực tế mới chỉ làm việc được khoảng 2 giờ.
  • Nói ví von thì đây là quan hệ giữa máy bay và chim.
    Chim thì sống, có ý thức, vỗ cánh và bay. Máy bay thì không sống, không có ý thức, không vỗ cánh nhưng vẫn bay.
    Tương tự, AI hiện nay không sống, không có ý thức, nhưng biết suy nghĩ. Trước đây, vì chỉ con người mới là thực thể biết suy nghĩ nên những thực thể biết suy nghĩ khác mà con người từng gặp cũng chỉ là những con người khác. Sai lầm lớn hiện nay là cứ thấy biết suy nghĩ thì giả định là đang sống và có ý thức. AI hiện tại không có cả hai; dù có suy nghĩ thì cũng khác con người một cách sâu sắc và về chất.

    • Dù vậy, chừng nào chúng ta còn chưa biết ý thức đến từ đâu thì không nên quá dễ dãi bước qua vùng xám này.
      Trong lịch sử, con người đã nhiều lần đưa ra những phán xét mang tính phân biệt chủng tộc và phân biệt loài đối với các thực thể khác, giả định sự thấp kém dù rõ ràng có “tư duy” đang diễn ra. Ta không biết “sống như một LLM thì cảm giác ra sao”, nhưng đến một thời điểm nào đó thật sự sẽ có một cảm giác như thế xuất hiện, và khi ấy chúng ta sẽ biết bằng cách nào?
    • “Câu hỏi liệu máy tính có thể suy nghĩ hay không còn không thú vị bằng câu hỏi liệu tàu ngầm có thể bơi hay không.” - Edsger Dijkstra
    • Có thể đưa ra một định nghĩa chính xác về ý thức không?
  • Bài này có lý. Chỉ là nhiều người đang nhầm lẫn ý thức với khả năng tạo ra hiểu biết mới và thật sự suy nghĩ.
    Vì thế họ lập luận rằng AI không có ý thức thì không thể thực sự “suy nghĩ”, và rốt cuộc chỉ luôn lặp lại dữ liệu huấn luyện mà thôi.
    Sự kiêu ngạo rất con người muốn biến năng lực của con người thành thứ không thể đo lường và đầy bí ẩn là điều dễ hiểu, nhưng những gì hữu ích mà bộ não con người làm rốt cuộc vẫn là tìm mẫu trong dữ liệu, chạy các mô phỏng có mất mát và suy luận trên các lớp trừu tượng. Về mặt lý thuyết, máy không có ý thức cũng có thể làm tất cả những việc đó.

    • Liệu có tồn tại một định nghĩa về ý thức vừa được đồng thuận vừa có thể áp dụng hay không? Nếu có, tôi còn lo rằng ngay cả con người cũng có thể không vượt qua được tiêu chuẩn đó.
    • Nói rằng phần mềm sẽ không bao giờ có thể có ý thức là một chuyện; nói rằng phần mềm chúng ta đang có ngày nay không có ý thức lại là chuyện khác.
    • Tôi vẫn chưa bị thuyết phục rằng LLM có thể tạo ra tri thức xác quyết chứ không chỉ là kết quả của việc kết hợp thông tin sẵn có.
      Con người thì có thể. Nếu con người cũng không làm được điều đó, thì khoa học sẽ sụp đổ về mặt nhận thức luận và chúng ta sẽ rơi vào hoài nghi triết học. Nhưng tôi chưa thấy bằng chứng nào cho thấy LLM làm được như vậy. Xét đến việc số lượng ý tưởng và khái niệm thực sự mới mà LLM tạo ra chính xác là 0, hiện tại hợp lý nhất là cứ xem nó như một cỗ máy quy nạp, và coi mọi thứ LLM “biết” đều như các trường hợp Gettier.