- Mô hình AI đủ hữu dụng cho nhiều tác vụ lập trình, nhưng gần với một công cụ khuếch đại năng lực kỹ thuật hiện có hơn là thay thế lập trình viên
- Không thấy bằng chứng cho thấy LLM sẽ sớm thiết kế và xây dựng hoàn toàn các dự án ở mọi quy mô đến mức không còn cần lập trình viên con người
- Trong công việc ở Motion, Matt Perry đã đóng 160 issue, vượt xa mục tiêu 60 issue của Q1, và cũng hoàn tất đợt refactor quy mô lớn cho Q2 vào một buổi chiều tháng 1
- Vibe-coding của những người dùng có ít kinh nghiệm phát triển thường dễ bị chững lại sau giai đoạn MVP, và phán đoán về kiến trúc cùng kiến thức miền là yếu tố tạo nên khác biệt kết quả
- AI mạnh mẽ như bộ giáp của Iron Man, nhưng không tự mình tạo ra cùng thành quả; học tập có cấu trúc và mức độ thành thạo quyết định hiệu quả sử dụng
Trường hợp năng suất của Matt Perry
- Matt Perry là lập trình viên đã tạo ra nhiều thư viện animation như Popmotion, Motion One và Motion (trước đây là Framer Motion)
- Layout projection engine của Motion là kết quả của kỹ thuật tinh vi
- Matt Perry đã tăng cường sử dụng AI trong năm 2026, và vượt mục tiêu đóng 60 issue của Q1 để đạt 160 issue
- Đợt refactor lớn của Motion dự định làm trong Q2 cũng được hoàn thành chỉ trong một buổi chiều tháng 1
- Điều này cho thấy không hẳn bản thân LLM vượt trội hơn những lập trình viên giỏi nhất, mà là năng suất có thể được khuếch đại mạnh khi một lập trình viên lành nghề sử dụng AI
Giới hạn của vibe-coding khi thiếu kiến thức miền
- Trên
/r/vibecoding, nhiều người gần như không có hoặc có rất ít kinh nghiệm phát triển chia sẻ trải nghiệm vibe-coding, và thường bị mắc kẹt ở giai đoạn sau MVP
- LLM được dùng mà không có định hướng thường tập trung tạo mã để giải quyết từng prompt riêng lẻ, nhưng không thể nhìn tổng thể kiến trúc ứng dụng nên dễ đi vào ngõ cụt
- Lập trình viên lành nghề có thể khuếch đại những gì AI làm được, còn người dùng thiếu kiến thức miền thì khó vượt qua giai đoạn “MVP”
- Ngay cả khi dùng cùng một công cụ AI, kết quả cũng không giống nhau; năng lực phán đoán và hiểu biết có cấu trúc của người dùng mới là khác biệt cốt lõi
Cách tư duy xem AI là công cụ
- AI là công cụ, và công cụ chỉ phát huy hiệu quả khi được sử dụng thành thạo
- Sở hữu cây guitar của Jimi Hendrix, căn bếp của Gordon Ramsey hay cây vợt tennis của Serena Williams không có nghĩa là bạn sẽ tạo ra cùng kết quả
- Con người có xu hướng đánh giá quá cao tầm quan trọng của công cụ, và marketing khai thác thiên kiến này, giống như giày “air technology” của Michael Jordan được quảng bá như thể có thể giúp bạn úp rổ
- Tác nhân AI dễ bị nhân hoá nên còn khó được nhìn nhận như một công cụ hơn, và nếu đối xử với nó như robot tự hành thì người ta dễ gán cho nó công lao lớn hơn thực tế
- Phép so sánh phù hợp hơn là bộ giáp của Iron Man: nó cho phép làm những điều đáng kinh ngạc, nhưng bản thân nó không tự vận hành để tạo ra cùng thành quả
- Kể cả khi Matt Perry trao quyền truy cập kho lưu trữ Motion và công cụ LLM cho tôi, nếu cố làm với cùng tốc độ thì rất có thể kết quả không phải là tương đương mà là một mớ hỗn loạn lớn
- Khi nhìn vào những gì một lập trình viên lành nghề làm được với LLM, yếu tố cốt lõi là năng lực của lập trình viên đó nhiều hơn là bản thân LLM
Whimsical Animations và học tập có cấu trúc
- Whimsical Animations là một khoá học mới ra mắt về web animation
- Trong khoảng 20 năm xây dựng website và ứng dụng web, tác giả đã tích luỹ cách tạo ra những animation và tương tác đáng nhớ, có sức ảnh hưởng
- Không có nhiều tài liệu về animation dành cho lập trình viên web, nên tác giả đã áp dụng các khái niệm từ lĩnh vực phát triển game sang web
- Các khái niệm như linear interpolation, simplex noise và delta time thường không nằm trong phạm vi kỹ năng điển hình của lập trình viên web, nhưng có thể giúp dự án nổi bật hơn
- Các công cụ như ChatGPT đã giúp việc học chủ đề mới trở nên dễ hơn, nhưng để học hiệu quả thì trước hết phải biết nên hỏi điều gì
- Khoá học cung cấp một chương trình học được tuyển chọn kỹ lưỡng để giới thiệu nhiều kỹ thuật khác nhau
- Nền tảng khoá học tuỳ chỉnh đã được cập nhật để mọi bài tập và code snippet đều có thể chạy cục bộ
- Nhờ hỗ trợ chạy cục bộ, bạn có thể hoàn thành các thử thách trong chính môi trường lập trình và workflow quen thuộc của mình
1 bình luận
Ý kiến trên Hacker News
Tuần trước khi vibe coding cho thiết kế UI, tôi đã có một khoảnh khắc kiểu Iron Man khi vừa làm vừa mở sẵn kiểm thử component ở màn hình bên cạnh
Tôi lặp đi lặp lại việc bảo nó di chuyển các phần tử, thêm điểm nhấn, và khám phá các lựa chọn bố cục, và vòng lặp đó diễn ra gần như theo thời gian thực nên cực kỳ ấn tượng
Đoạn mã được tạo ra thì khủng khiếp, nhưng nó dễ dàng hội tụ đến một thiết kế mà một mình tôi không thể làm ra, và sau đó tôi có thể nhìn vào thiết kế tham chiếu đó để tự triển khai lại bằng mã tốt hơn
Các nhà thiết kế có thể nói điều ngược lại: “Claude Design Studio làm ra một UI rác, nhưng tôi tự sửa lại được, và đổi lại nó tạo cho tôi đoạn mã tuyệt vời mà tôi không thể tự viết”
Đại loại là đừng lo nó được nối với nhau như thế nào, miễn chạy được là được, và khi nó hỏng thì bảo AI sửa
Cũng có cảm giác giải phóng thật, nhưng tôi chưa chắc mình đã đạt tới kiểu niết bàn AI để chấp nhận điều đó, dù có vẻ khoảnh khắc ấy cũng đang đến gần
Hiện tại tôi vẫn hiểu các kỹ năng nền tảng và vẫn có thể tự làm, nhưng đang ở giai đoạn chọn lặp nhanh dù biết ở đâu đó có một đống mã lộn xộn có thể còn sắp xếp lại được
Điều đó khả thi vì tôi biết đại khái “nó nên trông như thế nào” và có thể dẫn framework tự động hóa theo hướng đó, nhất là trong những dự án do chính tôi tạo ra
Nếu các công ty tồn tại đủ lâu, phần tri thức đó sẽ biến mất hoàn toàn và chỉ còn công cụ, và lúc đó sẽ không còn là Iron Man mà gần với iron lung hơn
Prototype giờ gần như miễn phí, và bạn có thể để AI thử từng phương án kiến trúc hay phong cách rồi xem mình thích đoạn mã nào hơn
Việc viết lại và thiết kế lại cũng khá hiệu quả, nên tôi thích kiểu làm nhiều hướng giải quyết bằng vibe coding, sau đó chọn cách tiếp cận, tăng cường kiểm thử và thực hiện các đợt refactor lớn để có thể bảo trì được
Kỹ năng cần ở đây là biết thế nào là kiến trúc tốt, và biết thiết kế prompt lẫn bước xác minh sao cho mức độ kiểm thử giúp vòng phản hồi nhanh hơn hoặc giúp dễ đọc các thay đổi từ LLM hơn
Nó không tuân thủ 100%, nhưng kết quả đủ tốt, và sau đó tôi xem lại sản phẩm đầu ra, chỉnh nó theo template, đồng thời đưa những ý tưởng mình thích quay lại vào template kỹ năng
Điều này không chỉ áp dụng cho kiến trúc hệ thống mà còn cho backend, frontend, kiểm thử end-to-end và viết tài liệu
Vì tôi biết mục tiêu mong muốn là gì, mã nên được tổ chức như thế nào, và nên viết kiểm thử ra sao, nên LLM đóng vai trò giảm bớt sự nhàm chán khi cứ phải lặp lại cùng một template mỗi lần
Tuy vậy vẫn cần giám sát liên tục, vì đôi khi nó đụng vào những phần đã bảo đừng đụng hoặc không làm theo chỉ dẫn, và lượng đầu ra có thể quá tải nên khâu review đồng cấp vẫn cần thiết
Càng tăng tốc công việc bằng công cụ AI, tôi càng cảm nhận rõ việc phát hành phần mềm hữu ích thực sự là một tay nghề thủ công khó đến mức nào
Claude Code và Codex có thể viết phần lớn mã, nhưng tri thức kỹ thuật cần để quyết định sẽ làm gì và làm như thế nào vẫn là rất lớn
Hiện tôi đang xây một hệ thống kiểu Claude Artifacts để chạy an toàn các ứng dụng HTML+JS tùy biến của người dùng trong một sandbox iframe bên trong một ứng dụng lớn hơn, và để hiểu vì sao việc này hữu ích và khả thi thì cần kiến thức sâu về sandboxing, các mối đe dọa bảo mật, mô hình bảo mật trình duyệt, cùng nhiều tính năng nền tảng đã tiến hóa suốt hàng chục năm
Nếu không có sự hiểu biết đó mà chỉ vibe coding thì gần như không thể tạo ra những thứ như thế, dù LLM có hướng dẫn thế nào đi nữa
Mỗi khi thấy các lập trình viên nói sẽ bỏ nghề vì AI, tôi thấy buồn, vì đây lại chính là thời điểm mà kinh nghiệm kỹ thuật sâu tích lũy từ trước trở nên có giá trị hơn bao giờ hết
Tôi thích viết mã, nhưng không thích đi tìm câu thần chú để cỗ máy viết đúng mã, hay sửa nó khi nó sai
Nếu biết tương lai sẽ như vậy thì có lẽ tôi đã không bước vào ngành này
Hơn nữa, cách những công cụ này được tạo ra, theo tiêu chuẩn của tôi, là trộm cắp, và bản thân việc dùng những công cụ được tạo ra một cách phi đạo đức cũng là phi đạo đức
Chưa kể cũng không rõ liệu có thể được trả nhiều hơn cho các kỹ năng giá trị hơn hay không, trong khi lương kỹ sư nhìn chung đang đi xuống
Nếu nhà tuyển dụng lấy hết toàn bộ giá trị thì tôi chẳng có lý do gì để quan tâm việc mình tạo ra nhiều giá trị hơn
Nhiều kỹ sư phần mềm quanh tôi đã kết luận rằng AI sẽ lấy mất việc và đang nghĩ đến chuyện chuyển nghề, nhưng tôi vẫn thấy còn quá sớm để kết luận
Toàn bộ prompt tôi dùng đều rất kỹ thuật, và nếu không có chuyên môn của tôi thì khó mà chỉ nói chuyện với agent là xử lý được
Mỗi khi làm việc ngoài chuyên môn của mình, mọi thứ không nhanh như người ta tưởng tượng, và chuyên môn giúp giữ mọi thứ có trật tự rất nhiều
Nếu họ tin AI có thể thay thế kỹ sư thì rất có thể mọi chuyện sẽ đi theo hướng đó, mà các lãnh đạo cũng hiếm khi thực sự hiểu chất lượng là gì
Họ chỉ nhìn doanh thu và lợi nhuận, nên dù nói rằng kinh nghiệm kỹ thuật sâu có giá trị hơn là đúng, thực tế đáng buồn có thể lại không diễn ra như vậy
Có lẽ chúng ta sẽ dần dần bị đẩy vào cảnh thất nghiệp
LLM trong thực tế không thay đổi được sự thật đó
Đó là lý do các sản phẩm giá trị cao không bùng nổ thêm, vì ngay từ đầu việc tạo ra sản phẩm thực sự tạo ra giá trị đã là cực kỳ, cực kỳ khó
Thái độ xem nhẹ điều này chỉ vì có LLM khiến tôi thấy buồn cười
Về nhận định “công cụ AI giống bộ giáp Iron Man hơn”, có một repository khá thú vị với 63.600 sao trên GitHub
Nhà phát triển này là người đóng góp thịnh hành số 1 tuần trên GitHub, nhưng ứng dụng thì có vẻ khác với mô tả, và ngay cả các lập trình viên cũng dường như không thể trả lời rõ ràng liệu nó có thật hay không
Rốt cuộc nó chỉ là đầu ra LLM bừa bộn, cho thấy rằng chỉ có bộ giáp thì không thể thành Iron Man
https://github.com/ruvnet/RuView
https://github.com/trending/developers?since=weekly
https://github.com/deletexiumu/wifi-densepose
AI tạo ra một dự án không chạy được, rồi AI lại chứng minh rằng nó không chạy được, đúng là một thế giới mới thật tuyệt vời
Có rất nhiều dự án, nhưng chỉ toàn là một lượng đầu ra AI khổng lồ, như thể đang làm ngập hạ tầng GitHub, nên cũng dễ hiểu vì sao GitHub đang chật vật
Là một nhà toán học, tuần trước tôi cũng có một khoảnh khắc Iron Man
Tôi đã làm nghiên cứu toán học chung với hai người bạn là giáo sư trong nhiều năm, và thử dùng ChatGPT để khám phá một phần nghiên cứu
Mỗi khi nảy ra ý tưởng, tôi đưa cho GPT, bảo nó viết ra các định lý dễ chứng minh, rồi tạo bản chứng minh bằng LaTeX, và tôi luôn kiểm tra các chứng minh đó rất cẩn thận
Tiếp đó tôi để nó tạo mã Mathematica, rồi dùng kết quả chạy để xác minh chứng minh hoặc gợi thêm ý tưởng, sau đó lại lặp tiếp
Giữa chừng có chỗ tôi chưa hiểu đủ nên không thể chặn trên một biểu thức cụ thể, và việc tự ngồi suy diễn lại bằng giấy bút giúp ích rất nhiều
Toàn bộ quá trình nhanh hơn khoảng 10 lần so với khi không dùng GPT, và chỉ sau vài giờ tôi đã có khoảng 20 trang chứng minh đúng cùng toàn bộ mã cần cho các mô phỏng số liên quan
Tôi xem AI không phải là bộ nhân năng lực mà là công cụ rút ngắn thời gian
Với lập trình viên ít kinh nghiệm, nó lập tức tiết kiệm thời gian ngay từ đầu dự án, nhưng những quyết định ban đầu có thể trói chân họ về sau
Với lập trình viên senior, nếu giải thích đủ rõ thì nó hoạt động như một lập trình viên junior hoặc mid-level có thể xử lý ngay các việc nằm trong phạm vi năng lực
Nhưng nếu giao cho nó các quyết định quan trọng thì nó có thể sai hoàn toàn hoặc sai một cách tinh vi, mà lỗi tinh vi lại khó phát hiện nhất nên nguy hiểm nhất
Nếu senior đặt chỉ dẫn tốt và nhận ra được vấn đề, tốc độ phát triển thực sự tăng lên nhanh đến mức vô lý
Nếu có tinh thần muốn học, AI có thể rút ngắn thời gian cần để mài giũa và tiếp thu kỹ năng, và vì thế có thể trở thành một bộ nhân năng lực thực sự
Tôi cũng dùng AWS tốt hơn bây giờ nhiều so với sau vài năm tự mày mò, và dùng dòng lệnh hiệu quả hơn hẳn
Đó vốn là những thông tin tôi cũng có thể tìm được, nhưng trước đây mất quá nhiều thời gian; khi thời gian đi đến câu trả lời mong muốn giảm mạnh, thì đầu ra thực tế và năng lực cũng thay đổi theo
Tôi muốn chạy một web server nhỏ trên Raspberry Pi nên đã nhờ Gemini viết mã và một script Bash cấu hình để chạy nó như một service systemd
Đây là việc tôi có thể làm trong lúc buồn ngủ nhưng vẫn cần thời gian và sự tập trung, còn nó thì tạo đúng thứ tôi cần chỉ trong thời gian tôi viết bình luận này
Xét riêng thì không quá ghê gớm, nhưng nhờ vậy tôi bắt đầu xử lý được các việc tự động hóa nhà ở mà trước đây cứ để đó vì không còn năng lượng sau các trách nhiệm khác
Đúng vậy. AI không khiến năng lực hay tài năng thuần túy trở nên lỗi thời, mà ngược lại còn làm chúng giá trị hơn
Kiến thức kỹ thuật sâu tạo ra nhiều điểm tiếp xúc hơn để áp dụng AI, nên trong thực tế tạo ra hiệu ứng đòn bẩy lớn hơn
Chính nhận thức này khiến tôi quyết định tự xây một trung tâm dữ liệu homelab để host SaaS kỹ thuật của mình thay vì dùng dịch vụ cloud như AWS
Giá trị của việc học networking cơ bản, DevOps và phần cứng máy chủ nhờ AI mà có thể được áp dụng nhanh hơn và rộng hơn
Trước đây để học RouterOS và cấu hình một router Mikrotik cấp độ datacenter có thể mất vài giờ hoặc vài ngày, nhưng nhờ Claude giờ chỉ là việc 20 phút, và tôi còn học được rất nhiều về cấu hình định tuyến
Tôi có được mức độ kiểm soát riêng mà nếu chỉ dùng cloud thì sẽ không bao giờ có, và giờ thậm chí còn muốn thử làm hệ điều hành của riêng mình, điều mà trước thời AI tôi còn không dám nghĩ tới
Có lẽ người ta cũng từng nghĩ tương tự khi dụng cụ điện và súng bắn đinh xuất hiện, nhưng kết quả là nhà có thể xây nhanh hơn rất nhiều, còn lương thì giảm, chất lượng công việc đi xuống và giá trị của tay nghề lẫn kinh nghiệm cũng giảm mạnh
Trát tường trước đây là nghề lành nghề lương cao, và khi drywall xuất hiện người ta nghĩ sẽ bớt thời gian cho các bức tường phẳng đơn điệu để dành nhiều thời gian hơn cho góc cạnh và trát trang trí, nhưng rồi những chi tiết trang trí đó biến mất
Trang trí tốn quá nhiều thời gian so với phần còn lại của bề mặt tường, và những người duy trì hoặc học kỹ năng đó vẫn muốn được trả công tử tế
Ngay cả công việc drywall bình thường cũng bị đòi hỏi năng suất cao hơn trong khi lương dậm chân tại chỗ, và giờ nhiều khi cả đường nối cũng làm rất tệ; thứ kiếm ra tiền chỉ còn là tốc độ sản xuất và thái độ không than phiền
“Con voi trong phòng” nghĩa là một chủ đề lớn mà ai cũng né không nói, nhưng AI thì ai cũng đang nói rồi
Tiêu đề tốt hơn có lẽ sẽ là “Vì sao AI khuếch đại kỹ năng lập trình viên thay vì thay thế chúng”
Nó là “con voi trong phòng” theo nghĩa là cho đến thời điểm đó, chiến dịch marketing ấy vẫn chưa đụng đến AI
Link này là bản xem trên web được tạo ra để đọc khi email client hiển thị không đúng, chứ không phải bài viết nhắm đến độc giả rộng hơn
Nếu số lập trình viên cần để làm cùng một việc giảm xuống thì nhiều người sẽ mất việc
Mức lương của những người còn lại cũng có khả năng giảm
Nếu bạn nghĩ có thể đạt “cùng một kết quả” bằng lương junior cộng với phí đăng ký AI thì tại sao lại trả lương senior
Có vẻ các lập trình viên phần mềm sắp phải trải qua giai đoạn khó khăn, và dù đã làm 15 năm tôi cũng không thấy háo hức gì
Thành thật mà nói tôi đang cân nhắc đào tạo lại sang ngành khác, dù kiếm ít hơn cũng có thể vẫn tốt hơn là phải chịu cái mớ hỗn độn này
Tôi phần lớn đồng ý với Josh, nhưng nhiều bài viết nói về kinh nghiệm senior và junior khi làm với AI nghe khá nhảm
Đúng là senior có kết quả tốt hơn với công cụ AI còn junior thì vất vả hơn, nhưng điều thay đổi chỉ là khoảng cách đó đã bị khuếch đại lên thôi
Điều mọi người né tránh là junior trong bất kỳ lĩnh vực nào cũng có thể học nhanh hơn rất nhiều với một trợ lý nghiên cứu AI, và với người có sức bền để đào sâu thì tốc độ trở thành chuyên gia cũng tăng lên
Tôi đặt cho công cụ AI những câu hỏi như “cái này hoạt động thế nào?” hay “có thể gợi ý công cụ khác không?” nhiều không kém gì các yêu cầu kiểu “làm cái này đi” hay “sửa cái kia đi”
Nhiều người nhìn AI như một quan hệ đầu vào/đầu ra đơn thuần, trong khi dù có AI hay không thì quá trình mày mò ở giữa mới luôn là điều quan trọng
Người mới bắt đầu tất nhiên ban đầu sẽ chưa làm được, nhưng vốn dĩ xưa nay cũng vậy, và tôi nghĩ những người giỏi sẽ rút ngắn đáng kể khoảng thời gian bất lực so với thời tôi từng trải qua
Tuy vậy, cảm giác thỏa mãn tức thì mà AI mang lại có thể làm suy yếu quá trình phải vật lộn với ma sát, và người bản địa AI có thể sẽ không hiểu hoặc nghi ngờ chính khái niệm ma sát đó
Nhìn vào tình hình ở bậc đại học thì cũng khó mà kỳ vọng như thế
Điều này bị che khuất vì mọi người khó chịu với những lời khẳng định kiểu vibe coding dở tệ hay tăng tốc gấp 10 lần
Việc học quan trọng nhất không xảy ra khi bạn đặt câu hỏi và nhận câu trả lời ngay, mà xảy ra khi bạn cố tìm lời giải, thất bại vài lần, suy nghĩ thật sâu, nghỉ một chút rồi mới giải được vấn đề
Kiểu tri thức đó đáng giá vì nó không chỉ cho câu trả lời mà còn cho bạn biết những ngả sai nên tránh về sau và sự tin tưởng vào chính tư duy của mình
Nếu thế hệ tiếp theo bỏ qua giai đoạn này, họ sẽ nghĩ rằng câu trả lời lẽ ra phải luôn dễ tìm, ngày càng phụ thuộc vào AI và ngày càng bớt tin vào bộ não của chính mình
Trong trường hợp này, chỉ đọc đầu ra của LLM không thực sự mang lại giáo dục có ý nghĩa
Tôi chưa từng thấy ai đào sâu hơn nhờ công cụ AI
Lập trình viên senior học được bằng cách vượt qua cả một núi những dự án thất bại do chính mình làm ra
Nếu ai đó đề xuất làm một cơ sở dữ liệu flat file, hay xây kiến trúc microservice với hơn 50 Lambda, thì tôi đã từng đi qua rồi và biết vì sao dù về mặt kỹ thuật có thể làm được nhưng không nên làm
Với tôi, AI giúp tôi chạy 100 dặm một giờ theo đúng hướng, còn với junior thì tôi thấy họ chạy 100 dặm một giờ lao ra biển hoặc đâm vào tường
Cũng như AWS làm chúng ta ngu đi đến mức có junior không biết reverse proxy, hay ngôn ngữ bậc cao khiến người ta không hiểu quản lý bộ nhớ, thì AI chỉ là mắt xích tiếp theo trong chuỗi đó
Có lẽ 10 năm nữa phần lớn lập trình viên sẽ không còn đọc nổi mã nữa
Nhiều, thậm chí có thể là phần lớn kỹ sư phần mềm, là chuyên gia trong chính codebase của mình nên khá nhiều kỹ sư đang nhận được giá trị lớn từ AI
Điều chưa rõ là khi mỗi kỹ sư có thể viết nhiều mã hơn thì số lập trình viên có giảm đi không, hay là sẽ có nhiều phần mềm hơn ở những mảng vốn thường bị đẩy xuống sau như UX, kiểm thử, trải nghiệm lập trình viên hay tài liệu
Cũng có thể chỉ là mặt bằng tiêu chuẩn được nâng lên mà thôi
Tôi nhận ra điều này khi nói chuyện với Claude
Tôi nói “chẳng phải việc X tốt hơn Y là điều đáng ngạc nhiên sao”, và Claude đáp lại rằng đó là một “phê bình sâu sắc”, rồi trình bày rất mạch lạc lý do vì sao Y tốt hơn X
Bản thân câu trả lời thì tốt, chu đáo và hợp lý, nhưng lại ngược hẳn điều tôi muốn nói, nên tôi phải đính chính: “Không, điều tôi nói là luận điểm phản trực giác rằng X tốt hơn Y”
Thế là Claude lại quay sang nói “đúng vậy, X tốt hơn Y”, và cũng đưa ra các lý do được trình bày rất mạch lạc
Nó giống một dạng meme thiên tài ngốc nghếch thông minh
Người ta cứ dao động giữa “nó chỉ là tự động hoàn thành thôi” và “không, nó có mô hình trong đầu”, nhưng rốt cuộc nó giống như Thư viện Babel: có chứa toàn bộ thiên tài của thế giới đi nữa thì cũng chỉ dùng được nếu bạn có đúng khóa chỉ mục
Ở phép gần đúng bậc một, LLM dự đoán câu trả lời mà người dùng muốn hoặc kỳ vọng
Câu trả lời cho prompt đầu tiên buồn cười là vì LLM đã hiểu sai hoàn toàn người dùng và dự đoán dựa trên điều mà nó nghĩ người dùng đã viết
Câu trả lời cho prompt thứ hai càng cho thấy rõ rằng mục tiêu của LLM là dự đoán điều người dùng muốn hoặc mong đợi
Một trong những tác nhân lớn gây ra ảo giác là khi kỳ vọng mà LLM diễn giải từ người dùng không khớp với thực tại, và LLM cố uốn thực tại theo kỳ vọng mà nó hiểu được
Một cách tốt để giảm ảo giác là loại bỏ tối đa các mệnh đề khẳng định trong prompt
“Chẳng phải X tốt hơn Y là điều đáng ngạc nhiên sao” có chứa một khẳng định rõ ràng, và dù LLM hiểu sai hướng nhưng nó vẫn nắm được việc có một khẳng định ở đó, nên đã đưa ra lý do vì sao thực tại phù hợp với khẳng định ấy
Chuyện luật sư gặp rắc rối vì trích dẫn án lệ giả cũng tương tự: “hãy tìm cho tôi án lệ cho thấy X” là nguy hiểm, còn “có những án lệ nào liên quan đến X” là điểm khởi đầu tốt hơn