- Bất chấp làn sóng thổi phồng xung quanh các công cụ lập trình dựa trên LLM, chất lượng kết quả phát triển phần mềm trong thực tế không cải thiện đáng kể, mà ngược lại còn tràn lan các sản phẩm đầu ra gần với hàng giả (forgery) hơn
- Bản chất công việc mà LLM thực hiện là giúp một cá nhân bắt chước những sản phẩm đầu ra tiềm năng của chính mình hoặc của người khác để tạo ra nhanh hơn, và vấn đề phát sinh khi dùng nó như vật thay thế cho hàng thật
- Các dự án mã nguồn mở đang chịu thiệt hại thực tế vì các PR chất lượng thấp do AI tạo ra, đến mức đóng góp công khai bị đóng lại hoặc chương trình thưởng lỗi bị dừng
- Trong khi ngành game đang chống trả hiệu quả bằng việc do người tiêu dùng dẫn dắt, yêu cầu gắn nhãn và lọc nội dung AI, thì các kỹ sư phần mềm lại đang chấp nhận nó trong tình trạng gần như không phòng bị
- Nếu muốn LLM ngừng nói dối thì quy nguồn đúng đắn (source attribution) là điều bắt buộc, nhưng với kiến trúc mô hình hiện nay thì điều đó bất khả thi về mặt kỹ thuật
Phản biện khung nhìn cho rằng việc dùng AI là điều không thể tránh khỏi
- Theo kiểu thổi phồng của ngành, phát triển phần mềm truyền thống đã kết thúc, nhưng sau nhiều năm dùng các công cụ dựa trên LLM thì kết quả đầu ra vẫn gần như không khác trước
- Một lượng cường điệu khổng lồ về công nghệ kéo theo đầu tư khổng lồ, rồi chính khoản đầu tư đó lại đòi hỏi thêm nhiều cường điệu hơn, tạo thành một vòng lặp
- Các mô hình mới tiếp tục được huấn luyện để thực hiện những lời hứa mà các mô hình nay đã bị loại bỏ lẽ ra phải đạt được
- "Hoàn toàn không sao nếu bạn không dùng AI" — đây không phải là thái độ lỗi thời, và thậm chí còn có thể ít căng thẳng hơn, hài lòng hơn so với phía đã chấp nhận AI
Tay nghề thủ công (Craft) vs sản xuất hàng loạt (Kraft): khung nhìn về hàng giả
- Trong nhiều cách đóng khung khác nhau về việc LLM đang làm gì (hỗ trợ, sáng tạo, năng suất vs lười biếng, dùng một lần, đạo nhái), từ còn thiếu một cách đáng ngạc nhiên chính là hàng giả (forgery)
- Vẽ tranh theo phong cách Van Gogh rồi ký tên ông là hàng giả, giả làm văn bản pháp lý là hàng giả, nghiên cứu thao túng dữ liệu là hàng giả — việc có phải hàng giả hay không nằm ngay trong bản thân đối tượng và cách nó được tạo ra
- LLM là công cụ cho phép một cá nhân tạo ra hàng giả của các sản phẩm đầu ra tiềm năng của chính mình hoặc của người khác nhanh hơn
- Bản thân việc bắt chước là hợp pháp như một hình thức tự do biểu đạt, nhưng vấn đề xuất hiện khi cố dùng hàng giả như vật thay thế cho hàng thật
- Bạn sẽ không bị bắt vì "giả mạo" thư từ Santa Claus, nhưng ngay cả việc chỉ sưu tầm "tiền giả" cực kỳ tinh vi như đồ trưng bày cũng không được phép ở bất kỳ khu vực tài phán nào
Ẩn dụ về bảo hộ xuất xứ và tiêu chuẩn chất lượng
- Các thực phẩm được kiểm soát xuất xứ như "Brie de Meaux" của Pháp đều đòi hỏi phương thức sản xuất truyền thống, nguyên liệu đầu vào chất lượng cao và xuất xứ địa lý cụ thể
- Nếu cho phép sản xuất ở nước ngoài thì tất yếu sẽ dẫn đến sự tràn lan của hàng nhái giá rẻ, làm tổn hại thương hiệu hàng thật và đe dọa chuyên môn địa phương hiếm có được truyền qua nhiều thế hệ
- Chỉ dựa vào phán đoán của từng người tiêu dùng riêng lẻ thì không thể bảo đảm thị trường vận hành đúng đắn, và phạm vi hàng hóa được bày trên kệ vốn đã do những yếu tố ngoài tầm kiểm soát của người tiêu dùng quyết định
- Chất lượng của pho mát thủ công đại diện cho toàn bộ chuỗi cung ứng vận hành bằng phương thức hiện đại, và để cấy ghép nó sang nơi khác cần đầu tư khổng lồ vào vốn con người, hạ tầng và nông nghiệp
- Mọi xã hội đều phải vạch ra ranh giới ở đâu đó giữa "pho mát thủ công truyền thống" và "trứng giả làm từ hóa chất công nghiệp", và chỉ những xã hội hiểu cũng như duy trì được giá trị của nghề thực phẩm thủ công mới tránh được tỷ lệ béo phì trên 70% (trường hợp Nauru)
Thiệt hại của AI slop trong mã nguồn mở và lập trình hằng ngày
- Các maintainer mã nguồn mở là những người cảm nhận tác dụng phụ đầu tiên — vốn dĩ họ đã rất khó tìm được cộng tác viên đủ động lực và giúp họ thích nghi với mục tiêu dự án cùng tư duy kỹ thuật
- Xuất hiện những người gửi PR viết bằng slop để tô đẹp hồ sơ GitHub
- tldraw đã đóng góp công khai, dự án curl dừng bug bounty, còn các dự án khác thì phản ứng bằng cách chế giễu những cộng tác viên giả
- Hiệu ứng tương tự cũng xuất hiện trong công việc hằng ngày với đồng nghiệp vibe-coding — trông có vẻ như nhân viên mới hòa nhập rất nhanh, nhưng thực chất là đẩy quá trình học ban đầu cho bot làm thay
- Tính đến năm 2026, nếu một nhân viên mới gửi PR với phần giải thích và bình luận cực kỳ chi tiết thì bạn phải nghi ngờ từng câu chữ
Kỹ sư kỳ cựu và ảo tưởng năng suất 10x/100x
- Người ta nói các cựu binh giàu kinh nghiệm dùng AI có thể tạo ra lượng mã nhiều gấp 10 lần, 100 lần trước đây, nhưng họ vẫn không hiểu rằng mọi dòng mã được chạy và bị phụ thuộc vào đều là một khoản nợ (liability)
- Phát biểu kiểu "AI coding tuyệt vời vì mọi thứ agent cần đều đã được mô tả trong codebase" là một khẳng định sai lầm chết người — nếu điều đó là thật thì về thực chất đã chẳng còn việc lập trình nào để làm
- Khác biệt cốt lõi nằm ở chỗ kỹ sư đã dành phần lớn sự nghiệp để giải quyết các vấn đề do phần mềm khác tạo ra, hay để giải quyết những vấn đề con người đã có từ trước cả khi phần mềm tồn tại
- Chỉ kiểu thứ hai mới dạy được cách suy nghĩ về các ràng buộc thực tế của vấn đề và nhu cầu người dùng
- Khi xem phần mềm là mục đích tự thân, người ta sẽ biến thứ chỉ cần một VPS $10/tháng thành hạ tầng đám mây bị over-engineer quá mức
Đặc điểm của slop code và phản ứng của ngành
- Kỹ sư có tay nghề thủ công có thể dễ dàng phát hiện slop khi review — dưới dạng mã lặp lại quá mức, độ phức tạp không cần thiết, từ chối refactor v.v.
- Ngay cả senior, dù có nhiều năm kinh nghiệm, cũng được ghi nhận là phạm những lỗi lúng túng khi vibe-coding rồi chuyển tiếp nguyên trạng
- Vụ việc Microsoft cấm từ miệt thị "Microslop" trên Co-pilot Discord — phản ứng của người dùng bị đóng khung là "spam" hay "độc hại", cho thấy hiện tượng lời hứa được xem trọng hơn kết quả thực tế
- Những công cụ này được gọi là "gây nghiện" hoặc là "người bạn tốt nhất mà bạn có thể có", nhưng không thấy đâu một vụ nổ Cambri của sáng tạo và thành tựu đi kèm
Vấn đề cấu trúc của ngành phần mềm và vai trò của AI
- Thứ mà AI tạo ra phần lớn là glue code vốn trở nên cần thiết khi các ứng dụng phần mềm từ sau cuộc cách mạng PC ngày càng đóng hơn, phân tán hơn và mang tính doanh nghiệp hơn
- HTTP API đòi hỏi các JSON blob tài liệu sơ sài với schema thay đổi mỗi đêm, nên không mang lại tính mở thực sự
- Nhiều công ty vẫn vận hành chủ yếu bằng Excel, nhưng không tồn tại công cụ nào là phiên bản tương đương Excel cho JSON
- Người ta từng nói SQL sẽ giải phóng doanh nghiệp khỏi sự phụ thuộc vào các công cụ độc quyền, nhưng điều đó đã thất bại, và lịch sử đang lặp lại
- Trong bối cảnh các ứng dụng Electron được vibe-coding vẫn tiếp tục được ưa chuộng hơn ứng dụng native đa nền tảng, thật khó hiểu năng suất gấp 100 lần thực sự nằm ở đâu
- Ngay cả Apple còn không duy trì nổi biểu mẫu và hệ thống biểu tượng tử tế trên OS hiện đại, thì khả năng của AI được huấn luyện bằng web slop lại càng thấp hơn
Sự kháng cự hiệu quả của ngành game
- Các kỹ sư phần mềm thì lao vào không áo phao, còn ngành game lại đang chống trả hiệu quả nhờ động lực từ người tiêu dùng
- Nhiều game đã xin lỗi và gỡ bỏ nội dung AI không có nhãn
- Steam có chính sách rõ ràng về nội dung AI, còn SteamDB cung cấp công cụ lọc game được tạo bằng AI
- Chính sách Steam gần đây đã được cập nhật, loại trừ trường hợp dùng cho mục đích "nâng cao hiệu quả" của các công cụ phát triển không tạo ra nội dung hiển thị cho người chơi
- Có hai lý do khiến thị trường game kháng cự hiệu quả:
- Đây là thị trường D2C thuần túy (bán trực tiếp cho người tiêu dùng) trong phân phối số — game thủ có toàn bộ quyền lựa chọn, và những người tạo khẩu vị đòi hỏi tính minh bạch cũng chính là game thủ
- Phần lớn game mang tính nghệ thuật, được mua vì sức hấp dẫn nghệ thuật cụ thể — trong nghệ thuật, bắt chước bị xem là làm giảm giá trị của tác phẩm gốc và cướp đi phần ghi công
Tương phản giữa tái sử dụng mã và tính độc đáo nghệ thuật
- Nhìn chung, code không bị tổn hại bởi việc tái sử dụng, hoặc trong trường hợp hạ tầng còn có thể được lợi
- Đây là lý do các dự án mã nguồn mở đặc biệt không phù hợp để thu hút những nhà sáng tạo nghệ thuật tài năng — tinh thần chia sẻ miễn phí có nghĩa là thiết kế nghệ thuật dễ bị lấy dùng ngay lập tức ngoài ngữ cảnh ban đầu
- Sinh nội dung theo thủ tục (procedural generation) cổ điển là một tiền lệ đáng chú ý, nhưng phần lớn đã không đáp ứng kỳ vọng
- Trường hợp No Man's Sky (bản 2016) — lời hứa tạo ra nội dung tăng theo cấp số nhân từ nguồn đầu vào hạn chế đã làm sự đa dạng của chính đầu ra trở nên vô giá trị
AI tạo sinh, thư viện hải tặc và vùng mờ pháp lý
- Việc các nghệ sĩ lên án AI tạo sinh là đạo văn hàng loạt là điều tự nhiên, cũng như việc các doanh nhân công nghệ và bên dọn dữ liệu không hiểu điều đó rồi huấn luyện mô hình trên các thư viện bóng tối hải tặc
- Nvidia bị cáo buộc đã tìm cách đạt thỏa thuận truy cập tốc độ cao vào bộ sưu tập sách hải tặc khổng lồ của Anna's Archive
- Có lý do rõ ràng khiến đầu ra tầm thường, vụng về và đáng ngờ — chính các mẫu huấn luyện đa dạng trong nguồn học liệu cũng chỉ là slop dành cho máy
- Điều này tạo ra một dạng khả năng chối bỏ hợp lý (plausible deniability) khiến không thể phân định đâu là trích dẫn, đâu là ảo giác, đâu là sáng tạo gốc
- Việc gắn nhãn AI-generated hay watermark lên nội dung AI phần lớn chỉ là né trách nhiệm, chứ không phải công bố có trách nhiệm thực sự
- Để vibe-coding được chấp nhận và biện minh, kỹ sư buộc phải ở vào vị thế nghịch lý rằng sản phẩm đầu ra của chính mình chỉ để dùng một lần, không sáng tạo và không xứng đáng được ghi công
Quy nguồn (Source Attribution) như một lời giải
- Không tòa án nào lẽ ra nên phán quyết toàn bộ đầu ra AI là hợp pháp hay có thể được bảo hộ bản quyền; thay vào đó, đầu ra không có nguồn nên bị xem là hàng giả
- Lời giải cho vấn đề của LLM thì rõ ràng nhưng không thể đạt được: LLM phải thực hiện quy nguồn đúng đắn cùng với quá trình suy luận
- Điều này không chỉ liên quan tới khía cạnh nghệ thuật, mà còn có thể phơi bày việc phần lớn vibe code thực chất là copy/paste từ codebase sẵn có mà bỏ qua tác giả gốc, giấy phép và liên kết
- Với mô hình hiện nay, quy nguồn thật sự là bất khả thi về mặt kỹ thuật — năng lực nhắc tới và trích dẫn nguồn của LLM vốn là thuộc tính nổi lên (emergent property) từ dữ liệu được thu thập
- LLM chỉ có thể viện dẫn nguồn khi điều đó phù hợp với vị trí hiện tại trong văn bản, tức về cơ bản chỉ là đóng vai trích dẫn (citation role-play) cho những thứ vốn thường được trích dẫn đúng
- Hệ quả của việc yêu cầu quy nguồn là rất lớn: nếu trọng số phải có thể quy nguồn và quá trình suy diễn xuôi phải có thể audit, thì lan truyền ngược (backpropagation) sẽ trông như thế nào — chắc chắn không thể nhét vào
int4
- Đây chính là vấn đề mà các "công cụ phát hiện AI" đang cố giải quyết theo chiều ngược lại
- Thật nghịch lý khi công nghệ thế hệ tiếp theo sau World Wide Web và các máy tìm kiếm quy mô Google lại là một công nghệ về bản thiết kế không thể cho biết nguồn gốc thông tin
- Muốn máy móc ngừng nói dối thì chúng phải trích dẫn nguồn tử tế, và các công ty AI cũng vậy
3 bình luận
Gì vậy trời, mình bắt đầu thấy vốn từ của mình yếu đi rồi.
Ngồi tra cứu mấy từ như "tính trồi, slop, quy thuộc nguồn gốc, hiệu ứng khung, vụ nổ Cambri" đây.
Ý kiến trên Hacker News
Thị trường game có vẻ là một trong số ít trường hợp người tiêu dùng phản ứng với AI, nhưng thực ra họ chỉ phản ứng với AI art asset
Còn việc code có được viết bằng AI hay không thì hầu như chẳng ai quan tâm. Nhìn vào bảng khảo sát AI của Steam có thể thấy việc sinh mã đã được chấp nhận rồi
Cuối cùng thì sự lan rộng của việc lập trình bằng LLM là điều không thể tránh khỏi. Tương tự, procedural generation cũng không phải vấn đề của công cụ mà phụ thuộc vào năng lực của người sử dụng
Tôi thấy cuộc tranh cãi về LLM ngày càng phát ngán. Công nghệ này đang được dùng theo hướng kiểm soát con người thay vì trao thêm năng lực cho họ, khiến việc sa thải dễ hơn và của cải tập trung hơn
Cứ như lợn đang tranh luận về lợi ích của một cỗ máy làm thịt xông khói vậy
Phong trào Luddite không đơn thuần là chống công nghệ. Họ lo ngại chất lượng suy giảm, và thực tế họ đã đúng
Những chiếc khăn len thủ công ở châu Âu thời trung cổ hoàn toàn khác với sản phẩm nhà máy hiện đại. Tiến bộ công nghệ không phải lúc nào cũng là thay thế 1:1
Ngay cả bây giờ, khi thấy các công cụ nội bộ do người không chuyên kỹ thuật làm ra vẫn tiết kiệm được hàng trăm giờ, tôi cảm nhận rõ rằng không cần hoàn hảo, chỉ cần hiệu quả là đủ
Điều LLM phơi bày là phần lớn việc lập trình thực chất chỉ là boilerplate code
Giá trị thật sự nằm ở những đổi mới nhỏ ở tầng cao hơn
Cách dùng lý tưởng của LLM là làm giáo viên. Tốt hơn là dùng nó như công cụ dạy nhanh các khái niệm thay vì viết code
Giống như phô mai hay giăm bông thủ công, trong tương lai có thể sẽ xuất hiện Artisanal Coding
Nó chẳng khác nào một cỗ máy chuyển đặc tả thành code thay cho con người
Thực tế lạnh lùng là chẳng ai quan tâm đến bản thân code của chúng ta
Đa số chỉ quan tâm nó có chạy không, nhanh không, rẻ không. Rốt cuộc chúng ta gần với công nhân nhà máy hơn
Cảm giác đó cũng giống như nỗi mất mát mà một người thợ đồng hồ từng cảm nhận khi nhìn thấy máy tiện tự động
Cuối cùng, câu chuyện lãng mạn rằng đây là một nghề nghiệp sáng tạo đang dần sụp đổ
Toàn bộ cuộc thảo luận này rốt cuộc cũng giống meme TTP(Time To Penis), lặp đi lặp lại như một vấn đề thuộc về bản tính con người
Bài này thật sự cho thấy một góc nhìn thực tế và cân bằng
Cả bài lẫn phần bình luận đều tiêu cực đến mức kỳ lạ. Chẳng lẽ mọi người còn chưa từng thử chạy Claude Code sao..