Chữ L trong LLM là viết tắt của "Nói dối"

(acko.net)

13 điểm bởi GN⁺ 2026-03-06 | 3 bình luận | Chia sẻ qua WhatsApp

Bất chấp làn sóng thổi phồng xung quanh các công cụ lập trình dựa trên LLM, chất lượng kết quả phát triển phần mềm trong thực tế không cải thiện đáng kể, mà ngược lại còn tràn lan các sản phẩm đầu ra gần với hàng giả (forgery) hơn
Bản chất công việc mà LLM thực hiện là giúp một cá nhân bắt chước những sản phẩm đầu ra tiềm năng của chính mình hoặc của người khác để tạo ra nhanh hơn, và vấn đề phát sinh khi dùng nó như vật thay thế cho hàng thật
Các dự án mã nguồn mở đang chịu thiệt hại thực tế vì các PR chất lượng thấp do AI tạo ra, đến mức đóng góp công khai bị đóng lại hoặc chương trình thưởng lỗi bị dừng
Trong khi ngành game đang chống trả hiệu quả bằng việc do người tiêu dùng dẫn dắt, yêu cầu gắn nhãn và lọc nội dung AI, thì các kỹ sư phần mềm lại đang chấp nhận nó trong tình trạng gần như không phòng bị
Nếu muốn LLM ngừng nói dối thì quy nguồn đúng đắn (source attribution) là điều bắt buộc, nhưng với kiến trúc mô hình hiện nay thì điều đó bất khả thi về mặt kỹ thuật

Phản biện khung nhìn cho rằng việc dùng AI là điều không thể tránh khỏi

Theo kiểu thổi phồng của ngành, phát triển phần mềm truyền thống đã kết thúc, nhưng sau nhiều năm dùng các công cụ dựa trên LLM thì kết quả đầu ra vẫn gần như không khác trước
Một lượng cường điệu khổng lồ về công nghệ kéo theo đầu tư khổng lồ, rồi chính khoản đầu tư đó lại đòi hỏi thêm nhiều cường điệu hơn, tạo thành một vòng lặp
Các mô hình mới tiếp tục được huấn luyện để thực hiện những lời hứa mà các mô hình nay đã bị loại bỏ lẽ ra phải đạt được
"Hoàn toàn không sao nếu bạn không dùng AI" — đây không phải là thái độ lỗi thời, và thậm chí còn có thể ít căng thẳng hơn, hài lòng hơn so với phía đã chấp nhận AI

Tay nghề thủ công (Craft) vs sản xuất hàng loạt (Kraft): khung nhìn về hàng giả

Trong nhiều cách đóng khung khác nhau về việc LLM đang làm gì (hỗ trợ, sáng tạo, năng suất vs lười biếng, dùng một lần, đạo nhái), từ còn thiếu một cách đáng ngạc nhiên chính là hàng giả (forgery)
Vẽ tranh theo phong cách Van Gogh rồi ký tên ông là hàng giả, giả làm văn bản pháp lý là hàng giả, nghiên cứu thao túng dữ liệu là hàng giả — việc có phải hàng giả hay không nằm ngay trong bản thân đối tượng và cách nó được tạo ra
LLM là công cụ cho phép một cá nhân tạo ra hàng giả của các sản phẩm đầu ra tiềm năng của chính mình hoặc của người khác nhanh hơn
Bản thân việc bắt chước là hợp pháp như một hình thức tự do biểu đạt, nhưng vấn đề xuất hiện khi cố dùng hàng giả như vật thay thế cho hàng thật
Bạn sẽ không bị bắt vì "giả mạo" thư từ Santa Claus, nhưng ngay cả việc chỉ sưu tầm "tiền giả" cực kỳ tinh vi như đồ trưng bày cũng không được phép ở bất kỳ khu vực tài phán nào

Ẩn dụ về bảo hộ xuất xứ và tiêu chuẩn chất lượng

Các thực phẩm được kiểm soát xuất xứ như "Brie de Meaux" của Pháp đều đòi hỏi phương thức sản xuất truyền thống, nguyên liệu đầu vào chất lượng cao và xuất xứ địa lý cụ thể
Nếu cho phép sản xuất ở nước ngoài thì tất yếu sẽ dẫn đến sự tràn lan của hàng nhái giá rẻ, làm tổn hại thương hiệu hàng thật và đe dọa chuyên môn địa phương hiếm có được truyền qua nhiều thế hệ
Chỉ dựa vào phán đoán của từng người tiêu dùng riêng lẻ thì không thể bảo đảm thị trường vận hành đúng đắn, và phạm vi hàng hóa được bày trên kệ vốn đã do những yếu tố ngoài tầm kiểm soát của người tiêu dùng quyết định
Chất lượng của pho mát thủ công đại diện cho toàn bộ chuỗi cung ứng vận hành bằng phương thức hiện đại, và để cấy ghép nó sang nơi khác cần đầu tư khổng lồ vào vốn con người, hạ tầng và nông nghiệp
Mọi xã hội đều phải vạch ra ranh giới ở đâu đó giữa "pho mát thủ công truyền thống" và "trứng giả làm từ hóa chất công nghiệp", và chỉ những xã hội hiểu cũng như duy trì được giá trị của nghề thực phẩm thủ công mới tránh được tỷ lệ béo phì trên 70% (trường hợp Nauru)

Thiệt hại của AI slop trong mã nguồn mở và lập trình hằng ngày

Các maintainer mã nguồn mở là những người cảm nhận tác dụng phụ đầu tiên — vốn dĩ họ đã rất khó tìm được cộng tác viên đủ động lực và giúp họ thích nghi với mục tiêu dự án cùng tư duy kỹ thuật
Xuất hiện những người gửi PR viết bằng slop để tô đẹp hồ sơ GitHub
- tldraw đã đóng góp công khai, dự án curl dừng bug bounty, còn các dự án khác thì phản ứng bằng cách chế giễu những cộng tác viên giả
Hiệu ứng tương tự cũng xuất hiện trong công việc hằng ngày với đồng nghiệp vibe-coding — trông có vẻ như nhân viên mới hòa nhập rất nhanh, nhưng thực chất là đẩy quá trình học ban đầu cho bot làm thay
Tính đến năm 2026, nếu một nhân viên mới gửi PR với phần giải thích và bình luận cực kỳ chi tiết thì bạn phải nghi ngờ từng câu chữ

Kỹ sư kỳ cựu và ảo tưởng năng suất 10x/100x

Người ta nói các cựu binh giàu kinh nghiệm dùng AI có thể tạo ra lượng mã nhiều gấp 10 lần, 100 lần trước đây, nhưng họ vẫn không hiểu rằng mọi dòng mã được chạy và bị phụ thuộc vào đều là một khoản nợ (liability)
Phát biểu kiểu "AI coding tuyệt vời vì mọi thứ agent cần đều đã được mô tả trong codebase" là một khẳng định sai lầm chết người — nếu điều đó là thật thì về thực chất đã chẳng còn việc lập trình nào để làm
Khác biệt cốt lõi nằm ở chỗ kỹ sư đã dành phần lớn sự nghiệp để giải quyết các vấn đề do phần mềm khác tạo ra, hay để giải quyết những vấn đề con người đã có từ trước cả khi phần mềm tồn tại
- Chỉ kiểu thứ hai mới dạy được cách suy nghĩ về các ràng buộc thực tế của vấn đề và nhu cầu người dùng
Khi xem phần mềm là mục đích tự thân, người ta sẽ biến thứ chỉ cần một VPS $10/tháng thành hạ tầng đám mây bị over-engineer quá mức

Đặc điểm của slop code và phản ứng của ngành

Kỹ sư có tay nghề thủ công có thể dễ dàng phát hiện slop khi review — dưới dạng mã lặp lại quá mức, độ phức tạp không cần thiết, từ chối refactor v.v.
Ngay cả senior, dù có nhiều năm kinh nghiệm, cũng được ghi nhận là phạm những lỗi lúng túng khi vibe-coding rồi chuyển tiếp nguyên trạng
Vụ việc Microsoft cấm từ miệt thị "Microslop" trên Co-pilot Discord — phản ứng của người dùng bị đóng khung là "spam" hay "độc hại", cho thấy hiện tượng lời hứa được xem trọng hơn kết quả thực tế
Những công cụ này được gọi là "gây nghiện" hoặc là "người bạn tốt nhất mà bạn có thể có", nhưng không thấy đâu một vụ nổ Cambri của sáng tạo và thành tựu đi kèm

Vấn đề cấu trúc của ngành phần mềm và vai trò của AI

Thứ mà AI tạo ra phần lớn là glue code vốn trở nên cần thiết khi các ứng dụng phần mềm từ sau cuộc cách mạng PC ngày càng đóng hơn, phân tán hơn và mang tính doanh nghiệp hơn
HTTP API đòi hỏi các JSON blob tài liệu sơ sài với schema thay đổi mỗi đêm, nên không mang lại tính mở thực sự
Nhiều công ty vẫn vận hành chủ yếu bằng Excel, nhưng không tồn tại công cụ nào là phiên bản tương đương Excel cho JSON
Người ta từng nói SQL sẽ giải phóng doanh nghiệp khỏi sự phụ thuộc vào các công cụ độc quyền, nhưng điều đó đã thất bại, và lịch sử đang lặp lại
Trong bối cảnh các ứng dụng Electron được vibe-coding vẫn tiếp tục được ưa chuộng hơn ứng dụng native đa nền tảng, thật khó hiểu năng suất gấp 100 lần thực sự nằm ở đâu
Ngay cả Apple còn không duy trì nổi biểu mẫu và hệ thống biểu tượng tử tế trên OS hiện đại, thì khả năng của AI được huấn luyện bằng web slop lại càng thấp hơn

Sự kháng cự hiệu quả của ngành game

Các kỹ sư phần mềm thì lao vào không áo phao, còn ngành game lại đang chống trả hiệu quả nhờ động lực từ người tiêu dùng
Nhiều game đã xin lỗi và gỡ bỏ nội dung AI không có nhãn
Steam có chính sách rõ ràng về nội dung AI, còn SteamDB cung cấp công cụ lọc game được tạo bằng AI
- Chính sách Steam gần đây đã được cập nhật, loại trừ trường hợp dùng cho mục đích "nâng cao hiệu quả" của các công cụ phát triển không tạo ra nội dung hiển thị cho người chơi
Có hai lý do khiến thị trường game kháng cự hiệu quả:
- Đây là thị trường D2C thuần túy (bán trực tiếp cho người tiêu dùng) trong phân phối số — game thủ có toàn bộ quyền lựa chọn, và những người tạo khẩu vị đòi hỏi tính minh bạch cũng chính là game thủ
- Phần lớn game mang tính nghệ thuật, được mua vì sức hấp dẫn nghệ thuật cụ thể — trong nghệ thuật, bắt chước bị xem là làm giảm giá trị của tác phẩm gốc và cướp đi phần ghi công

Tương phản giữa tái sử dụng mã và tính độc đáo nghệ thuật

Nhìn chung, code không bị tổn hại bởi việc tái sử dụng, hoặc trong trường hợp hạ tầng còn có thể được lợi
Đây là lý do các dự án mã nguồn mở đặc biệt không phù hợp để thu hút những nhà sáng tạo nghệ thuật tài năng — tinh thần chia sẻ miễn phí có nghĩa là thiết kế nghệ thuật dễ bị lấy dùng ngay lập tức ngoài ngữ cảnh ban đầu
Sinh nội dung theo thủ tục (procedural generation) cổ điển là một tiền lệ đáng chú ý, nhưng phần lớn đã không đáp ứng kỳ vọng
- Trường hợp No Man's Sky (bản 2016) — lời hứa tạo ra nội dung tăng theo cấp số nhân từ nguồn đầu vào hạn chế đã làm sự đa dạng của chính đầu ra trở nên vô giá trị

AI tạo sinh, thư viện hải tặc và vùng mờ pháp lý

Việc các nghệ sĩ lên án AI tạo sinh là đạo văn hàng loạt là điều tự nhiên, cũng như việc các doanh nhân công nghệ và bên dọn dữ liệu không hiểu điều đó rồi huấn luyện mô hình trên các thư viện bóng tối hải tặc
- Nvidia bị cáo buộc đã tìm cách đạt thỏa thuận truy cập tốc độ cao vào bộ sưu tập sách hải tặc khổng lồ của Anna's Archive
Có lý do rõ ràng khiến đầu ra tầm thường, vụng về và đáng ngờ — chính các mẫu huấn luyện đa dạng trong nguồn học liệu cũng chỉ là slop dành cho máy
Điều này tạo ra một dạng khả năng chối bỏ hợp lý (plausible deniability) khiến không thể phân định đâu là trích dẫn, đâu là ảo giác, đâu là sáng tạo gốc
Việc gắn nhãn AI-generated hay watermark lên nội dung AI phần lớn chỉ là né trách nhiệm, chứ không phải công bố có trách nhiệm thực sự
Để vibe-coding được chấp nhận và biện minh, kỹ sư buộc phải ở vào vị thế nghịch lý rằng sản phẩm đầu ra của chính mình chỉ để dùng một lần, không sáng tạo và không xứng đáng được ghi công

Quy nguồn (Source Attribution) như một lời giải

Không tòa án nào lẽ ra nên phán quyết toàn bộ đầu ra AI là hợp pháp hay có thể được bảo hộ bản quyền; thay vào đó, đầu ra không có nguồn nên bị xem là hàng giả
Lời giải cho vấn đề của LLM thì rõ ràng nhưng không thể đạt được: LLM phải thực hiện quy nguồn đúng đắn cùng với quá trình suy luận
- Điều này không chỉ liên quan tới khía cạnh nghệ thuật, mà còn có thể phơi bày việc phần lớn vibe code thực chất là copy/paste từ codebase sẵn có mà bỏ qua tác giả gốc, giấy phép và liên kết
Với mô hình hiện nay, quy nguồn thật sự là bất khả thi về mặt kỹ thuật — năng lực nhắc tới và trích dẫn nguồn của LLM vốn là thuộc tính nổi lên (emergent property) từ dữ liệu được thu thập
- LLM chỉ có thể viện dẫn nguồn khi điều đó phù hợp với vị trí hiện tại trong văn bản, tức về cơ bản chỉ là đóng vai trích dẫn (citation role-play) cho những thứ vốn thường được trích dẫn đúng
Hệ quả của việc yêu cầu quy nguồn là rất lớn: nếu trọng số phải có thể quy nguồn và quá trình suy diễn xuôi phải có thể audit, thì lan truyền ngược (backpropagation) sẽ trông như thế nào — chắc chắn không thể nhét vào int4
Đây chính là vấn đề mà các "công cụ phát hiện AI" đang cố giải quyết theo chiều ngược lại
Thật nghịch lý khi công nghệ thế hệ tiếp theo sau World Wide Web và các máy tìm kiếm quy mô Google lại là một công nghệ về bản thiết kế không thể cho biết nguồn gốc thông tin
Muốn máy móc ngừng nói dối thì chúng phải trích dẫn nguồn tử tế, và các công ty AI cũng vậy

3 bình luận

hungryman 2026-03-06

Gì vậy trời, mình bắt đầu thấy vốn từ của mình yếu đi rồi.
Ngồi tra cứu mấy từ như "tính trồi, slop, quy thuộc nguồn gốc, hiệu ứng khung, vụ nổ Cambri" đây.

GN⁺ 2026-03-06

Ý kiến trên Hacker News

Thị trường game có vẻ là một trong số ít trường hợp người tiêu dùng phản ứng với AI, nhưng thực ra họ chỉ phản ứng với AI art asset
Còn việc code có được viết bằng AI hay không thì hầu như chẳng ai quan tâm. Nhìn vào bảng khảo sát AI của Steam có thể thấy việc sinh mã đã được chấp nhận rồi
Cuối cùng thì sự lan rộng của việc lập trình bằng LLM là điều không thể tránh khỏi. Tương tự, procedural generation cũng không phải vấn đề của công cụ mà phụ thuộc vào năng lực của người sử dụng
- Nói procedural generation đã thất bại là một góc nhìn thiếu hiểu biết. Từ các game kinh điển như Elite, Powermonger đến những game roguelike gần đây đều có nhiều ví dụ thành công
- Đúng là LLM giúp giảm phần mã lặp lại, nhưng đó không phải là tái sử dụng mã. Đây vốn là vấn đề đã có thể giải quyết bằng thư viện
- Tôi thấy thật mâu thuẫn khi một người bạn làm nghệ thuật chê AI nhưng lại dùng AI để viết nội dung marketing
- Khảo sát của Steam tuy nói bao gồm cả sinh mã, nhưng rốt cuộc điều đó cũng không khác gì dùng thư viện
- Sự hấp dẫn của game thế giới mở giảm đi là vì cảm giác mới mẻ đã biến mất. Lập luận rằng LLM tiết kiệm thời gian cũng không mấy vững chắc. Kết quả tức thì không đảm bảo lợi ích dài hạn
Tôi thấy cuộc tranh cãi về LLM ngày càng phát ngán. Công nghệ này đang được dùng theo hướng kiểm soát con người thay vì trao thêm năng lực cho họ, khiến việc sa thải dễ hơn và của cải tập trung hơn
Cứ như lợn đang tranh luận về lợi ích của một cỗ máy làm thịt xông khói vậy
- AI giá 20 USD/tháng mà ai cũng dùng được thì rõ ràng là một công cụ phổ cập. Thậm chí nó còn đang hạ thấp rào cản. Có vẻ đây là phản ứng của những người sợ thay đổi
- Kiểu lập luận này đã lặp đi lặp lại với mọi công nghệ tự động hóa kể từ sau Cách mạng Công nghiệp
- AI có thể giải phóng chúng ta khỏi sự lệ thuộc vào các sản phẩm thương mại. Có thể rồi ta sẽ tự làm được OS hay ứng dụng
- Điều cần đòi hỏi là tự động hóa hoàn toàn và đảm bảo thu nhập cơ bản. Nguy cơ thật sự còn không phải AGI mà là con người
- Nếu đa số mất việc thì bản thân thị trường cũng sẽ sụp đổ. Nhưng vì cạnh tranh, doanh nghiệp cuối cùng vẫn sẽ tạo ra công việc mới
Phong trào Luddite không đơn thuần là chống công nghệ. Họ lo ngại chất lượng suy giảm, và thực tế họ đã đúng
Những chiếc khăn len thủ công ở châu Âu thời trung cổ hoàn toàn khác với sản phẩm nhà máy hiện đại. Tiến bộ công nghệ không phải lúc nào cũng là thay thế 1:1
Ngay cả bây giờ, khi thấy các công cụ nội bộ do người không chuyên kỹ thuật làm ra vẫn tiết kiệm được hàng trăm giờ, tôi cảm nhận rõ rằng không cần hoàn hảo, chỉ cần hiệu quả là đủ
- Nhật Bản là một xã hội công nghiệp hóa nhưng vẫn tôn trọng truyền thống thủ công
- Sau 800 năm, thứ code còn lại trong viện bảo tàng có lẽ chỉ là code thật sự xuất sắc. Ở đây có thiên kiến sống sót đang tô hồng quá khứ
- Tôi khuyến nghị bài nói chuyện của Jonathan Blow Preventing the Collapse of Civilization
- Gọi kỹ sư phần mềm là Luddite là sai. Phần lớn công việc kỹ thuật thực ra gần với lao động thủ công, mang tính lặp lại và dựa trên kinh nghiệm
- Đòi quay lại thời tiền công nghiệp chỉ là một kiểu hoài niệm quý tộc. Ngược lại, LLM đang mở ra khả năng tiếp cận phần mềm tùy biến cho số đông
Điều LLM phơi bày là phần lớn việc lập trình thực chất chỉ là boilerplate code
Giá trị thật sự nằm ở những đổi mới nhỏ ở tầng cao hơn
- Nếu tốc độ phát triển thực sự quan trọng, thì cơ cấu tổ chức đáng lẽ đã phải thay đổi từ lâu. Vấn đề trong thực tế là bộ máy quan liêu kém hiệu quả
- Thư viện và abstraction lại thường gây ra phình to mã nguồn. Vì LLM học từ loại code này nên rất khó để nó tạo ra mã gọn gàng
- Ngay cả mã lặp cũng có thể chứa tay nghề của người thợ. Làm tốt phần nền tảng cũng là việc có giá trị
- Trước đây người ta chia quá trình lập trình thành các bước “chọn việc cần làm – viết – debug”, nhưng giờ nhìn lại thấy khá lỗi thời
- Sách rốt cuộc cũng giống như những luận văn đơn giản được kéo dài bằng hàng trăm trang boilerplate
Cách dùng lý tưởng của LLM là làm giáo viên. Tốt hơn là dùng nó như công cụ dạy nhanh các khái niệm thay vì viết code
- Bây giờ chính là lúc thích hợp. Chỉ cần ghi rõ trong prompt: “Đừng viết code, hãy làm một người thầy giỏi”
- Nhưng học từ một người thầy không đáng tin là một trải nghiệm bất an. Có lẽ học chậm mà chắc còn tốt hơn
Giống như phô mai hay giăm bông thủ công, trong tương lai có thể sẽ xuất hiện Artisanal Coding
- Thực tế thì ‘Handmade Network’ đã theo đuổi triết lý đó rồi. LLM chỉ là điểm cuối của phát triển phần mềm công nghiệp hóa
  Nó chẳng khác nào một cỗ máy chuyển đặc tả thành code thay cho con người
- Những trường hợp như Steve Gibson tự tay viết assembly có lẽ là ví dụ gần nhất. Nhưng đó chưa bao giờ là xu hướng đại chúng
- Lập luận bảo vệ truyền thống kiểu chỉ dẫn địa lý phần lớn khá thiếu cơ sở
Thực tế lạnh lùng là chẳng ai quan tâm đến bản thân code của chúng ta
Đa số chỉ quan tâm nó có chạy không, nhanh không, rẻ không. Rốt cuộc chúng ta gần với công nhân nhà máy hơn
Cảm giác đó cũng giống như nỗi mất mát mà một người thợ đồng hồ từng cảm nhận khi nhìn thấy máy tiện tự động
- Người ta chỉ giật mình khi hệ thống sụp đổ vì nợ kỹ thuật, sau một thời gian dài bỏ mặc chất lượng
- Phần mềm doanh nghiệp thì “chỉ cần chạy được là đủ”, nhưng sản phẩm cho người tiêu dùng lại coi trọng chất lượng và độ hoàn thiện
- Tôi xem code là nợ. Khi không còn cần nữa mà có thể mạnh dạn vứt bỏ, tôi thấy rất thích
- Lập trình không hề sáng tạo, cũng chẳng quyến rũ. Thế giới chỉ nhìn vào việc “nó có chạy tốt không, có nhanh không, có rẻ không, có ra mắt trước đối thủ không”
  Cuối cùng, câu chuyện lãng mạn rằng đây là một nghề nghiệp sáng tạo đang dần sụp đổ
Toàn bộ cuộc thảo luận này rốt cuộc cũng giống meme TTP(Time To Penis), lặp đi lặp lại như một vấn đề thuộc về bản tính con người
Bài này thật sự cho thấy một góc nhìn thực tế và cân bằng

parkindani 2026-03-06

Cả bài lẫn phần bình luận đều tiêu cực đến mức kỳ lạ. Chẳng lẽ mọi người còn chưa từng thử chạy Claude Code sao..