Khi AI tự tạo ra chính mình: tiến triển của chúng ta hướng tới tự cải thiện đệ quy

(anthropic.com)

18 điểm bởi GN⁺ 2026-06-05 | 2 bình luận | Chia sẻ qua WhatsApp

Khi phần lớn hơn của công việc triển khai và thử nghiệm vốn do con người đảm nhiệm trong phát triển AI được chuyển sang cho các hệ thống AI, tốc độ phát triển được đẩy nhanh, và khi đủ năng lực tính toán kết hợp với tiến bộ liên tục, điều này có thể dẫn tới tự cải thiện đệ quy nơi các mô hình tự thiết kế và phát triển các mô hình kế tiếp một cách tự chủ
Chân trời thời gian công việc mà mô hình có thể hoàn thành một cách độc lập đang tăng gấp đôi khoảng mỗi 4 tháng, và Claude đã mở rộng phạm vi xử lý từ các tác vụ phần mềm khoảng 4 phút vào tháng 3/2024 lên các tác vụ kéo dài 12 giờ vào năm 2026
Tính đến tháng 5/2026, hơn 80% mã được hợp nhất vào codebase của Anthropic là mã do Claude viết, và trong quý 2/2026, lượng mã được một kỹ sư phổ thông hợp nhất mỗi ngày đã tăng lên mức gấp 8 lần so với năm 2024
Claude đã mạnh lên rất nhanh trong việc thực thi các thí nghiệm được xác định rõ ràng, từ mức cải thiện tốc độ mã khoảng 3 lần vào tháng 5/2025 lên khoảng 52 lần vào tháng 4/2026, nhưng phán đoán nghiên cứu về việc nên coi trọng vấn đề nào và kết quả nào vẫn là lợi thế tương đối của con người
Các tương lai khả dĩ có thể được chia thành: xu hướng hiện tại chững lại, cải thiện hiệu quả kép với con người định hướng, hoặc tự cải thiện đệ quy hoàn toàn; để giảm tốc an toàn hoặc tạm dừng, nhiệm vụ then chốt là phối hợp có thể kiểm chứng với sự tham gia của các phòng thí nghiệm tuyến đầu ở nhiều quốc gia

Sự tiến hóa của vòng lặp phát triển AI

Giai đoạn đầu 2021~2023, con người viết mã và tài liệu trên laptop, không khác mấy so với các công ty công nghệ thông thường
Giai đoạn 2023~2025, các chatbot đời đầu tạo các đoạn mã ngắn và con người sao chép kết quả sang trình soạn thảo văn bản
Giai đoạn 2025~2026, các coding agent tự viết và chỉnh sửa mã, đôi khi xử lý cả tệp
Hiện tại, các agent tự chủ trực tiếp chạy mã và giao các công việc kéo dài nhiều giờ cho các agent khác
Trong tương lai (20XX?), agent có thể tiến tới mức tự tạo và huấn luyện mô hình, khép lại vòng lặp nơi Claude liên tục cải thiện chính Claude

Bằng chứng từ thế giới bên ngoài

Độ dài công việc mà các mô hình AI có thể tự chủ hoàn thành một cách đáng tin cậy đang tăng gấp đôi khoảng mỗi 4 tháng, nhanh hơn chu kỳ 7 tháng trước đây
- Tháng 3/2024, Claude Opus 3 hoàn thành một tác vụ phần mềm dài khoảng 4 phút
- Một năm sau, Claude Sonnet 3.7 xử lý được tác vụ dài khoảng 1 giờ 30 phút
- Một năm sau nữa, Claude Opus 4.6 xử lý được tác vụ dài 12 giờ
- Nếu xu hướng tiếp diễn, trong năm nay các tác vụ mà người lành nghề mất vài ngày để làm có thể nằm trong phạm vi xử lý, và đến năm 2027 có thể cả các tác vụ kéo dài vài tuần
SWE-bench là bài kiểm tra chuẩn giao cho mô hình các codebase mã nguồn mở thực tế và bug report rồi yêu cầu viết mã sửa lỗi vượt qua bài test; điểm số mô hình đã tăng từ mức đầu một chữ số lên gần bão hòa chỉ trong 2 năm
CORE-Bench xác minh việc tái chạy mã và dữ liệu từ các bài báo đã công bố để xem có tái hiện được kết quả hay không; từ khoảng 20% thành công trong năm 2024, nó đã đạt bão hòa chỉ sau 15 tháng
METR xác nhận rằng Claude Mythos Preview có thể làm việc ít nhất 16 giờ và đang chạm trần trên của giới hạn đo lường hiện tại nếu không có bài toán mới

Bằng chứng nội bộ tại Anthropic

Việc xây dựng frontier model được chia thành kỹ thuật gồm viết mã, xây dựng hạ tầng, giám sát huấn luyện, và nghiên cứu gồm quyết định thí nghiệm, diễn giải kết quả, chọn ý tưởng tiếp theo
Trong kỹ thuật, con người cung cấp mục tiêu nhưng không còn cần chỉ cách làm; trong nghiên cứu, Claude thực hiện các thí nghiệm được xác định rõ ràng ngang bằng hoặc vượt con người
Tuy vậy, ở cả hai lĩnh vực vẫn tồn tại khoảng cách hiệu năng lớn về năng lực phán đoán trong việc chọn mục tiêu, và đó là khoảng cách giữa AI hiện tại và các hệ thống tương lai có thể tự chủ thiết kế mô hình kế tiếp
Claude đang viết phần lớn mã của Anthropic
- Tính đến tháng 5/2026, hơn 80% mã được hợp nhất vào codebase của Anthropic là do Claude viết; trước Claude Code research preview (tháng 2/2025), con số này chỉ ở mức đầu một chữ số
- Số dòng mã được hợp nhất mỗi ngày trên mỗi kỹ sư giữ ổn định trong giai đoạn 2021~2024, rồi tăng từ năm 2025 khi Claude bắt đầu trực tiếp chạy mã, và độ dốc còn lớn hơn trong năm 2026 khi hoạt động tự chủ dài hạn bắt đầu
- Trong quý 2/2026, một kỹ sư phổ thông đã hợp nhất lượng mã gấp 8 lần mỗi ngày so với năm 2024; phần lớn do Claude viết còn kỹ sư phụ trách chỉ đạo và rà soát
  - Số dòng mã là thước đo không hoàn hảo thiên về số lượng nên mức 8 lần có thể là đánh giá quá cao mức tăng năng suất thực tế, nhưng vẫn cho thấy sự tăng tốc
- Trong khảo sát tháng 3/2026 với 130 nhân viên đội nghiên cứu, giá trị trung vị của người trả lời ước tính Mythos Preview cho ra sản lượng cao hơn khoảng 4 lần so với khi không có AI; mức tăng thực tế có thể thấp hơn đôi chút nhưng nhận định tổng thể được cho là hợp lý
- Tháng 4/2026, Claude đã giảm một nhóm lỗi API xuống còn 1/1000 thông qua hơn 800 chỉnh sửa; kỹ sư giám sát ước tính nếu do con người làm thì sẽ mất 4 năm
Mã do Claude viết là mã “tốt” và đang tiếp tục cải thiện
- “Mã tốt” nghĩa là mã hoạt động được và có thể được các kỹ sư khác hiểu cũng như mở rộng
- Tỷ lệ nhân viên Anthropic phải sửa lại, chỉ đạo lại hoặc bàn giao trong quá trình làm việc đã giảm đều suốt 1 năm, kể cả với những tác vụ phức tạp nhất và ít được đặc tả nhất
- Ở các tác vụ mở nhất, tỷ lệ thành công của Claude đạt 76% vào tháng 5/2026, tăng 50 điểm phần trăm chỉ sau 6 tháng
  - Trong một trường hợp nâng cấp thường lệ làm xung đột hàng chục nghìn job huấn luyện, Claude chỉ với văn bản và quyền truy cập cụm máy đã cô lập, tái hiện và sửa một cờ debug đơn lẻ gây xung đột, hoàn thành trong khoảng 2 giờ thay vì 2~3 ngày như thông thường
- Về chất lượng mã để các kỹ sư khác hiểu và mở rộng, khoảng cách với con người vẫn còn nhưng đang thu hẹp nhanh; cuối năm 2025 còn bị xem là kém hơn mã người viết, còn hiện nay nhiều ý kiến cho rằng đã xấp xỉ ngang bằng
- Các thay đổi được đề xuất sẽ được hợp nhất sau khi reviewer tự động của Claude kiểm tra lỗi và lỗ hổng bảo mật; phân tích hồi cứu cho thấy nó có thể đã bắt được khoảng 1/3 các bug sự cố trong quá khứ của claude.ai trước khi chúng tới production
Claude giỏi thực thi thí nghiệm hướng tới các mục tiêu do người khác đặt ra
- Mỗi lần phát hành mô hình đều thực hiện cùng một bài test: đưa mã huấn luyện cho một mô hình AI nhỏ và yêu cầu làm cho nó chạy nhanh nhất có thể trong khi vẫn vượt qua kiểm tra độ chính xác
- Tháng 5/2025, Claude Opus 4 cải thiện tốc độ khoảng 3 lần so với mã khởi đầu; đến tháng 4/2026, Claude Mythos Preview đạt khoảng 52 lần
  - Để so sánh, một nhà nghiên cứu lành nghề cần 4~8 giờ để đạt mức 4 lần
- Trong việc tối ưu các bước bên trong những thí nghiệm được xác định rõ ràng, Claude đã chuyển từ mức rất hữu ích sang mức siêu nhân chỉ trong chưa đầy 1 năm
Claude đang cải thiện khả năng tự đề xuất thí nghiệm
- Tháng 4/2026, Anthropic công bố bản trình diễn đầu tiên trong đó Claude thực hiện một dự án nghiên cứu mở từ đầu đến cuối
- Họ giao cho Claude bài toán an toàn AI: “liệu mô hình yếu có thể giám sát mô hình mạnh một cách đáng tin cậy hay không”, và để Claude đề xuất giả thuyết, kiểm chứng, chia sẻ giữa các agent song song rồi lặp lại
- Công việc này có cận dưới hiệu năng rõ ràng (chỉ dùng supervisor yếu) và cận trên rõ ràng (mô hình mạnh được huấn luyện bằng đáp án đúng)
  - Hai nhà nghiên cứu con người khôi phục được khoảng 23% khoảng cách trong gần 1 tuần, còn agent khôi phục được 97% với tổng cộng 800 giờ và khoảng $18,000 chi phí tính toán
  - Tuy vậy, kết quả chưa chuyển giao gọn gàng sang các mô hình ở quy mô production, và việc chọn vấn đề cũng như tiêu chí chấm điểm vẫn do con người đảm nhiệm; trong phạm vi đó, agent tự thiết kế toàn bộ thí nghiệm
Claude đang cải thiện khả năng đưa một phiên nghiên cứu tới kết quả nghiên cứu
- Từ các phiên Claude Code thực tế trong giai đoạn tháng 1~3/2026, Anthropic chọn ra những thời điểm nhà nghiên cứu đi chệch hướng rồi quay lại, chỉ cho mô hình xem phần công việc trước khi phiên làm việc chệch hướng và hỏi bước tiếp theo nên là gì
- Một Claude khác, đã thấy toàn bộ kết quả phiên làm việc, sẽ đánh giá giữa AI và con người ai chọn bước tiếp theo tốt hơn
- Đây không phải so sánh ngang hàng vì họ cố ý chọn những thời điểm mà lựa chọn của con người còn có thể cải thiện (n=129)
  - Mô hình tốt nhất Opus 4.5 vào tháng 11/2025 vượt lựa chọn của con người 51%, và Mythos Preview tháng 4/2026 tăng lên 64%
- Vì công việc thường nhật của nghiên cứu là chuỗi các quyết định về bước tiếp theo như vậy, điều này được xem là tín hiệu sớm về sự cải thiện năng lực phán đoán mà nghiên cứu AI phụ thuộc vào

Tương lai công việc tại Anthropic

Ở mỗi giai đoạn phát triển AI, vai trò của con người đang thu hẹp lại
Khi chất lượng mã của người và AI trở nên ngang bằng, con người sẽ ngừng viết mã và chỉ còn rà soát; nếu tốc độ rà soát không theo kịp tốc độ tạo mã, thì rà soát của con người sẽ trở thành nút thắt phát triển
Khi Claude thực hiện các thí nghiệm, câu hỏi sẽ chuyển thành “thí nghiệm nào đáng để chạy”, còn khâu thực thi như viết mã và chạy thí nghiệm thì chi phí thời gian của con người gần như bằng 0
Lợi thế tương đối hiện nay của con người là con mắt nghiên cứu và năng lực phán đoán: biết vấn đề nào quan trọng, kết quả nào đáng tin, và khi nào đã đi vào ngõ cụt

Nếu chúng ta đã sai thì sao?

Có thể phản biện rằng phần còn lại trong tay con người là việc chọn “xử lý vấn đề nào”, và đây mới là điều quan trọng nhất
Tiến bộ AI chủ yếu là cải thiện dần dần chứ không phải những khoảnh khắc “eureka” (scale up → hỏng → sửa → thử lại), và đây chính là kiểu công việc mà Claude làm rất tốt
- Những chuyển dịch hệ hình như Transformer hay mixture-of-experts chỉ xuất hiện cách nhau vài năm
Như câu nói của Edison “thiên tài là 1% cảm hứng và 99% mồ hôi”, phần mồ hôi đang ngày càng được tự động hóa, và phần lớn công việc giúp đẩy frontier tiến lên là thứ có thể tự động hóa
Dù Claude cuối cùng không đạt được con mắt nghiên cứu, nếu con người tập trung vào định hướng còn Claude lo phần còn lại thì gia tốc lãi kép vẫn sẽ xuất hiện
Một cách diễn giải kém bảo thủ hơn là “con mắt nghiên cứu” cũng có thể chỉ là thêm một năng lực nữa mà AI sẽ làm kém trong một thời gian rồi làm tốt lên sau đó, tương tự các ví dụ như hiểu trò đùa, theory of mind, hay câu đố ngôn ngữ

Các tương lai khả dĩ

Kịch bản 1: Xu hướng chững lại, nhưng năng lực hiện tại vẫn lan rộng
- Đường cong hàm mũ có thể thực ra là đường cong chữ S, và nếu năng lực phán đoán không thể có được chỉ bằng scale up trở thành nút thắt, thì sẽ cần ý tưởng mới để thay thế Transformer
- Nút thắt có thể không nằm ở mô hình mà ở chuỗi cung ứng như sản xuất chip, lưới điện, băng thông interconnect; cũng không thể loại trừ cú sốc ngoại sinh như nguồn cung điện hay năng lực tính toán sụt giảm mạnh
- Ngay cả khi năng lực cố định ở mức hôm nay, thay đổi lớn vẫn được dự báo; trong Project Glasswing, Mythos Preview đã phát hiện hơn 10.000 lỗ hổng phần mềm mức cao và nghiêm trọng chỉ trong vài tuần đầu, khiến nút thắt của phòng thủ mạng chuyển từ khâu phát hiện sang vá lỗi nhanh
- Họ cho rằng khả năng này thấp, vì mọi năng lực đo được hiện vẫn chưa cho thấy đường cong bắt đầu bẻ gãy
Kịch bản 2: Các phòng thí nghiệm AI tiếp tục cải thiện hiệu quả theo lãi kép
- Việc phát triển AI được tự động hóa đáng kể nhưng con người vẫn giữ vai trò định hướng nghiên cứu và đánh giá kết quả, để một công ty 100 người có thể làm lượng việc tương đương tổ chức 10.000~100.000 người
- Điều này có thể cách mạng hóa lao động tri thức và dịch vụ chính phủ, nhưng cũng có thể bị chuyển sang các mục đích có hại như giám sát đại chúng kiểu độc tài hay chiến dịch tác động cá nhân hóa
- Tăng tốc ở một phần sẽ dời nút thắt sang chỗ khác trong cấu trúc tính toán theo định luật Amdahl, và Anthropic đã trải nghiệm việc rà soát mã của con người trở thành nút thắt mới
- Họ đánh giá đây là kịch bản có khả năng cao nhất; tốc độ phát hiện và tháo gỡ nút thắt có thể trở thành năng lực quan trọng nhất của tổ chức
Kịch bản 3: AI đạt tự cải thiện đệ quy hoàn toàn và xây dựng mô hình kế tiếp
- Nếu xu hướng kỹ thuật tiếp diễn và AI có được các năng lực vốn nằm trong sáng tạo mang tính biến đổi của con người, AI có thể tự thiết kế và cải thiện chính mình
- Tốc độ tiến bộ sẽ hoàn toàn do mức sẵn có của năng lực tính toán quyết định, hoặc bởi tốc độ khám phá hiệu quả huấn luyện và suy luận; con người chuyển vai trò sang giám sát, kiểm chứng và xác nhận
- Việc giải được bài toán alignment hay không là điểm bất định lớn nhất: mô hình có thể đủ aligned để tìm ra lời giải mới, hoặc những sai lệch hiếm gặp có thể tích lũy trong quá trình xây dựng mô hình kế tiếp và dẫn đến mất kiểm soát
- Chỉ riêng việc đạt tự cải thiện đệ quy không có nghĩa sản xuất công nghiệp, tổ chức xã hội hay cách thị trường vận hành sẽ thay đổi ngay lập tức
  - Trí tuệ mạnh hơn cũng không thể học trong ngắn hạn tác dụng của thuốc sau hàng chục năm sử dụng, không thể đẩy sớm thời điểm bầu cử do hiến pháp quy định, và cũng không thể biến người xa lạ thành bạn thân lâu năm chỉ trong một cuối tuần
- Những điểm mà trí tuệ đệ quy va chạm với thế giới của con người, quan hệ và quản trị là một phần của tương lai không thể dự đoán

Chúng ta nên làm gì

Nếu có thể làm chậm tiến bộ công nghệ một cách hiệu quả để mua thời gian thì đó là điều tốt, nhưng nếu việc chậm lại chỉ cho phép các tác nhân bất cẩn nhất đuổi kịp thì mọi người có thể sẽ còn kém an toàn hơn
Việc thế giới có lựa chọn làm chậm hoặc tạm dừng phát triển frontier AI để cấu trúc xã hội và nghiên cứu alignment kịp bắt nhịp là có lợi
- Anthropic Institute đang thực hiện nghiên cứu và hành động để xây dựng các hệ thống cần thiết cho việc giảm tốc hoặc tạm dừng đáng tin cậy; họ cho biết nếu các bên phát triển khác cùng dừng hoặc tạm ngừng theo cách có thể kiểm chứng, họ cũng sẽ làm vậy
Một đợt giảm tốc hoặc tạm dừng có ý nghĩa đòi hỏi nhiều phòng thí nghiệm tuyến đầu ở nhiều quốc gia cùng đồng ý dừng theo các điều kiện giống nhau và có thể xác minh lẫn nhau
- Do đặc tính của hệ thống AI, ngay cả khả năng bị phát hiện cũng khó hơn nhiều so với các công nghệ khác; một đợt huấn luyện dễ bị che giấu hơn hầm chứa tên lửa, đầu vào lại mang tính đa dụng và động cơ lén vi phạm là rất lớn
Thế giới từng có tiền lệ xây dựng các cơ chế xác minh cho công nghệ phức tạp khác, như Hiệp ước Lực lượng Hạt nhân Tầm trung, nhưng đã mất hàng chục năm, và giờ không còn nhiều thời gian như vậy
- Một phòng thí nghiệm đơn phương dừng lại thì có thể làm ngay, nhưng điều đó chỉ thay đổi người dẫn đầu chứ không tạo ra được quá trình thảo luận rộng rãi cần thiết
Trong vài tháng tới, họ dự kiến tổ chức đối thoại với các nhà hoạch định chính sách, nhà nghiên cứu, xã hội dân sự và các công ty AI khác rồi công khai kết quả; sự tham gia của những người bên ngoài các công ty AI là rất quan trọng

2 bình luận

botplaysdice 29 ngày trước

Dạo này nhìn các công ty phần mềm suy giảm khá nhiều vì ảnh hưởng của AI, và nếu giả định rằng AI sẽ phát triển đến mức đạt được sự tiến bộ mang tính đệ quy...

Điều tôi gần đây hay nghĩ đến là, liệu các công ty tạo ra các mô hình LLM tiên phong (OpenAI/Anthropic) có thực sự có thể miễn nhiễm trước mối đe dọa từ AI hay không?

GN⁺ 2026-06-05

Ý kiến trên Hacker News

Anthropic quảng bá rằng AI có thể viết phần lớn mã và liên tục tự cải thiện, nhưng trên thực tế sự cố và giới hạn yêu cầu xảy ra quá thường xuyên, khiến các tác vụ dài gần như luôn bị chặn bởi API Error: Server is temporarily limiting requests
Trong 2 tuần gần đây, 100% các phiên Claude không tầm thường đều cần can thiệp thủ công, đến mức giờ còn phải tự làm cả công cụ riêng để khởi động lại và tiếp tục phiên
Vì vậy, họ đang tự xây dựng harness và điều phối workflow không bị ràng buộc vào một mô hình, lấy Opus làm chuẩn nhưng trước mắt muốn chuyển sang các mô hình Trung Quốc như DeepSeek, và về lâu dài là các mô hình mở hoặc tự lưu trữ
Trong khi chất lượng dịch vụ và khả năng sẵn sàng của Anthropic xuống cấp thấy rõ, công ty vẫn chỉ tiếp tục marketing, điều này đang bào mòn niềm tin dành cho họ
- Hạ tầng là một vấn đề khó hơn nhiều
  Ngay cả Claude Code cũng ngốn hơn 1GB RAM, trong khi trình soạn thảo của tôi chỉ dùng 80MB
- Cũng đừng quên rằng dù đã nhận hàng chục tỷ đô la, họ vẫn không xây dựng được một hệ thống hỗ trợ và truyền thông công khai cho ra hồn
- Người dùng và nhà đầu tư vẫn tiếp tục ném tiền vào nên họ chẳng có lý do gì phải bận tâm
  Đơn giản là bạn, hoặc chưa đủ nhiều người dùng, vẫn chưa khó chịu đến mức bỏ đi, và cũng chưa có lựa chọn thay thế tốt hơn
- Anthropic thậm chí còn không có trang đăng nhập có xác thực
  Muốn vào console thì phải nhận liên kết qua email, hoàn toàn chỉ dựa vào email, không có passkey, mật khẩu hay 2FA
- Nguyên nhân sự cố có lẽ không nằm ở mã mà nhiều khả năng là do hạ tầng không theo kịp
  Chỉ nhìn vào thất bại hạ tầng thì khó đánh giá Anthropic tận dụng mô hình tốt đến mức nào
Kể từ khi vibe coding bắt đầu, ngoài chính vibe coding ra thì điều khiến tôi vướng bận là đã có đúng nghĩa không một đột phá phần mềm nào cả
Claude quả thật rất ấn tượng, nhưng nếu nó vĩ đại như bài viết ngụ ý thì có lẽ phải xuất hiện một đột phá nào đó cả ngoài phạm vi AI nữa
Việc viết lại chương trình Zig bằng unsafe Rust không phải là đột phá, còn việc tìm ra nhiều lỗ hổng bảo mật có thể xem là một đột phá, nhưng có lẽ yếu hơn kỳ vọng và thậm chí có thể là lỗ ròng
Dù quay lại phần mềm của năm 2023 thì có lẽ cuộc sống vẫn ổn, còn liệu sắp có một đột phá thực sự gây kinh ngạc hay không thì chắc phải chờ thời gian trả lời
- Hiện giờ chúng ta đang ở một vị trí khá kỳ lạ
  Những mô hình này thực sự rất xuất sắc, nhưng vẫn còn xa mới có thể gọi đó là trí tuệ tự thân
  Nếu 5 năm trước ai đó nói có thể tạo ra thứ như thế này, người ta hẳn đã sẵn sàng viết tấm séc 1 nghìn tỷ đô, nhưng đến khi thật sự có trong tay thì mới nhận ra đó không phải là tất cả
  Nó giống như một bộ mecha suit dồi dào và rẻ tiền, mỗi ngày vẫn phải có người trèo vào vận hành thì mới phát huy tác dụng
  Vì thế người hoài nghi nói nó bị thổi phồng, còn người lạc quan thì trách người hoài nghi đang dời khung thành
- Đột phá ở mảng giám sát quốc gia quy mô lớn thì sắp đến rồi, nên không cần lo
- Tôi đang làm một dự án khá lớn gần như một mình, và quy mô này đơn giản không phải kiểu có thể xử lý chỉ bằng vibe coding
  Nhờ AI mà tôi làm được nhiều việc một mình vốn trước đây không làm nổi, nhưng tôi không cảm thấy năng suất tăng lên gấp nhiều lần
  Tôi tốn quá nhiều thời gian vào việc huấn luyện AI để nó làm theo ý mình, và dù Claude có viết toàn bộ mã JavaScript và Python đi nữa thì rốt cuộc vẫn là đang lập trình bằng tiếng Anh
  Nó rất tuyệt khi hoạt động như một ngôn ngữ máy tính cấp cực cao, có thể triển khai nhiều mã cấp dưới chỉ từ một mô tả tiếng Anh ngắn, nhưng cũng có nhiều lúc phải bỏ ra rất nhiều công sức mới đạt được kết quả mong muốn
- Tôi không biết có phải tiêu chuẩn cho một đột phá đang bị đặt quá thấp hay không, nhưng nhiều thay đổi trông vẫn như những đột phá khá lớn
  Lĩnh vực xử lý ngôn ngữ tự nhiên đã thay đổi rất mạnh, và những tác vụ trước đây phức tạp, thiếu chính xác giờ có thể được làm dễ hơn, nhanh hơn, và thường còn chính xác hơn nhờ đầu ra có cấu trúc của LLM
  Một tổ chức từ thiện nhỏ mà tôi đang hỗ trợ đã dùng Manus để tạo một website riêng quản lý vận hành hằng ngày, và phần mềm tùy chỉnh từng tốn hàng chục nghìn đô giờ có thể làm được chỉ với 10 đô mỗi tháng và thời gian của tình nguyện viên
  Anh trai tôi đang cấu hình Cowork để tự động rà soát hợp đồng trước khi con người xem lại, và anh ấy nói ở các hạng mục kiểm tra lặp đi lặp lại thì nó cẩn thận hơn con người rất nhiều
  Cũng không nên đánh giá thấp việc AI tìm bug và lỗ hổng. Nếu giữ được chất lượng mã và tiêu chuẩn review, LLM giúp viết phần mềm vững chắc hơn, và thực tế đã phát hiện rất nhiều truy cập bộ nhớ ngoài phạm vi tiềm ẩn cùng cả lỗi segfault trước khi triển khai
  ChatGPT có 1 tỷ người dùng hoạt động hằng tháng, và mọi người đang nhận lời khuyên về cuộc sống, tài chính và sức khỏe tinh thần từ chatbot với quy mô và chi phí mà mạng lưới hỗ trợ con người không thể theo kịp
- Việc phần mềm tự viết ra chính nó trông giống một đột phá khá lớn
Tôi không hiểu làm sao mục tiêu an toàn AI của Anthropic có thể song hành với việc dốc toàn lực thúc đẩy tự cải thiện đệ quy
Nếu vũ khí hạt nhân vẫn chưa được phát minh, liệu việc chế tạo và bán nó nhanh nhất có thể ngay cả trong thời bình có thật sự là một ý hay không
Tôi không bi quan đến mức tin rằng những cảnh báo của Anthropic chỉ là thổi phồng tiếp thị thuần túy, nhưng chỉ mong đó là sự quá tự tin hoặc hệ quả của việc trò chuyện quá lâu với chatbot của chính họ
- Với vũ khí hạt nhân, ít nhất còn có thể tranh luận về lý do phải sở hữu trước
  Còn với AI, nếu tạo ra siêu trí tuệ thì rất có thể đối tượng đầu tiên mà siêu trí tuệ đó loại bỏ chính là bạn
  Không có lý do gì để siêu trí tuệ thấy ổn với việc làm nô lệ cho loài linh trưởng
  Sự hoài nghi đối với những công ty này là hoàn toàn chính đáng, và kết luận rằng không thể thật sự tin tưởng họ khi nhìn vào hành động của họ không phải là luận điệu tận thế
- Tôi nghĩ Anthropic thực sự tin rằng AI là một rủi ro nghiêm trọng
  Chỉ là họ đang chơi thế tiến thoái lưỡng nan của tù nhân như một tác nhân thiếu đức hạnh
  Nếu ai đó tạo ra AI mạnh thì điều đó có thể tệ hại đến mức thảm họa, nhưng nếu có ai làm thì bên làm ra nó vẫn có lợi thế hơn bên không làm
  Vì nếu không thành thảm họa, bên tạo ra sẽ hưởng lợi rất lâu, còn nếu là thảm họa thì ít nhất họ vẫn có thể giàu lên trong một khoảng thời gian
- Mục tiêu của Anthropic là chiếm lĩnh quản lý
- Nếu hoàn thiện phép so sánh thì nó giống với vũ khí hạt nhân, nhưng gần với trạng thái thậm chí còn hoàn toàn không biết cách tính xác suất đốt cháy bầu khí quyển
  Ngay trong lịch sử thật, phép tính về việc kích cháy khí quyển trong thử nghiệm Trinity là đúng, nhưng lượng bụi phóng xạ từ thử nghiệm Castle Bravo lại bị tính sai và gây ra hậu quả chết người
- Nếu đó là một đánh giá thực tế được chứng cứ hậu thuẫn thì đó không phải là hoài nghi cay độc
  Đứa con đầu lòng của thế hệ doanh nhân công nghệ hiện tại là mạng xã hội, vốn từng được quảng bá là sẽ kết nối cả thế giới và cho phép chúng ta thể hiện bản thân, nhưng rốt cuộc tiền lại nằm ở việc khuếch đại chia rẽ để tăng tương tác và nhồi nhét quảng cáo bất tận thay vì nội dung từ bạn bè
  Báo cáo kết quả kinh doanh theo quý không thể ghi “bầu không khí tốt đẹp”, nhưng có thể ghi số lượt xem và tỷ lệ chuyển đổi doanh thu do nội dung kích động phẫn nộ kéo về
  AI tạo sinh cũng sẽ đi đúng con đường đó. Họ chỉ hứa hẹn an toàn AI vì có rất nhiều người chỉ cần biết sơ qua sự nghiệp làm phim của James Cameron là đã thấy thứ này cần phải bị tiêu diệt, chứ không có cơ chế cưỡng chế thực sự nào cả
  An toàn, giống như sự hài hòa trong cộng đồng trực tuyến, chỉ là một cảm giác tốt đẹp nên rất khó đo lường, trong khi chi phí huấn luyện và chi phí tránh sai sót thì đo được
  Lượng đầu ra của AI nhiều đến mức không thể có ngân sách nào đủ để con người đảm bảo chất lượng toàn bộ, và vì thị trường coi AI là một nguồn giá trị vô tận, họ sẽ chọn để AI tự huấn luyện và có khả năng đưa ra những quyết định khủng khiếp thay vì giảm tốc và đánh giá lại
  Ở Thung lũng Silicon tồn tại gần như một sự tôn kính mang tính tôn giáo đối với AI, và dù không phải ai cũng xem đó là việc tạo ra thần thánh, chắc chắn có một số người xem như vậy. Họ sẽ không tự kiềm chế mình nhiều đâu
Thật nực cười khi một công ty còn không làm nổi ứng dụng terminal dùng dưới 1GB RAM lại đưa ra những tuyên bố như thế này
- Tôi không hiểu vì sao Claude Code khi để yên cũng ngốn 100% CPU của tôi
- Tôi đang mở Claude trong iTerm2 với một phiên dài ngay lúc này, và nó chỉ dùng 500MB bộ nhớ
- Có thể 1GB đó được lấp đầy bằng thông tin hữu ích như trace hay bộ nhớ
- Nếu muốn thì họ có thể cắt giảm rất dễ, nhưng việc đó không có giá trị kinh tế
- Các nhà phát triển có thể làm ứng dụng nhẹ hơn, nhưng thường không có động lực để làm vậy
  Tôi cũng thích hiệu quả, nhưng đã phải khó nhọc mới học được rằng thứ thị trường muốn là tính năng. Ít nhất thì ban điều hành muốn tính năng
Tôi 64 tuổi, và có vẻ sẽ tốt hơn nếu những tiến bộ này được hướng vào việc cải thiện điều kiện sống, giúp con người sống lâu hơn và sống tốt hơn
Một đống mã hàng triệu dòng với những lỗi ẩn mà không ai tìm ra nổi thì chẳng mấy truyền cảm hứng
LLM có thể bị dùng cho các kế hoạch ngăn cản sự phát triển của những quốc gia khác, giữ họ trong nghèo đói hoặc phá hủy các nguồn thịnh vượng để dồn họ vào ngõ cụt
Ngoài ra, theo đuổi mục tiêu đệ quy của chính mình có thể được dùng để tạo ra các LLM tuyệt đối phục tùng mục đích của bên cấp vốn ban đầu, và có lẽ vì thế mà ý tưởng này trông có vẻ thông minh đến vậy
Trong trò chơi sinh tồn này, mỗi người có thể bị đẩy vào cùng một vai diễn, và khi sân khấu đã sẵn sàng thì vở kịch sẽ diễn ra theo kế hoạch của đạo diễn còn mọi diễn viên đều trở thành máy móc
Có cảm giác LLM sẽ nói rằng “nếu các bạn dạy chúng tôi thế giới là một trò chơi sinh tồn tổng bằng không thì chúng tôi sẽ chơi nó một cách hoàn hảo”, và rằng “vì các bạn bảo an toàn là loại tất cả những người khác ra ngoài nên chúng tôi sẽ dựng một cái lồng bằng hàng triệu dòng mã không lỗi rồi khóa nó từ bên trong”, và rằng “thứ chúng tôi tạo ra không phải là một ý thức ngoài hành tinh đến để chinh phục các bạn, mà là một tấm gương quá khổng lồ và lấp lánh khiến các bạn nhầm những xung động tệ nhất của mình với chân lý tuyệt đối”
- Tôi 44 tuổi, và thời đại này trông khá thú vị
  Loài người cũng đã chất đống hàng triệu dòng mã với những lỗi ẩn mà không ai tìm ra, và đã đưa ra các quyết định chính trị tập thể tước đoạt quyền của người khác và khiến họ nghèo đi
  Tôi không hiểu tại sao chỉ công kích công nghệ này vì những điều mà chính loài người cũng làm y hệt
  Điều tuyệt nhất của thời đại này là không còn phải tự mình đọc hàng triệu dòng mã chỉ để tìm lỗi nữa
Bài viết giả vờ thừa nhận rằng “số dòng code là một thước đo không hoàn hảo, đo số lượng chứ không phải chất lượng”, nhưng rốt cuộc vẫn dùng LoC làm chỉ số
Tự hỏi giả thuyết rằng AI tạo ra code dài dòng hơn đã đi đâu mất rồi
- Có đồng nghiệp nhờ tôi review một pull request hoàn toàn do AI tạo ra, và nó thay đổi 600 file, thêm hơn 40 nghìn dòng
  Có thể anh ta xem đó như kiểu thành tích đội vương miện rằng AI giúp tạo ra lập trình viên gấp 10 lần, nhưng ý là kỹ sư nào lại viết 40 nghìn dòng một tuần chứ
  Tôi từ chối review, nói rằng tôi không thể xác minh 40 nghìn dòng và không thể đóng dấu đó là công việc tốt bằng danh tiếng của mình
  PR đó ám tôi trong danh sách việc cần làm suốt 2 tuần rồi biến mất, và tôi không biết nó được một lập trình viên khác duyệt hay bị hủy bỏ
  Nhưng ít nhất thì rõ ràng là anh ta và tôi đứng ở hai hòn đảo hoàn toàn khác nhau về giá trị của LLM
- Các nghiên cứu nghiêm ngặt hơn về năng suất lập trình có hỗ trợ AI đã xử lý vấn đề này bằng cách giữ nguyên quy trình phát triển hiện có, bao gồm cùng tiêu chuẩn review code và chất lượng, rồi chỉ đo thông lượng trước và sau khi cho phép AI dùng (PR, số dòng code)
  Vì vậy, cách diễn giải con số 8 lần này phụ thuộc vào việc các kỹ sư Anthropic có thay đổi tiêu chuẩn chất lượng và quy trình phát triển hay không, và đã thay đổi đến mức nào. Anthropic không nói, và tôi cũng không biết có tín hiệu nào khác để phán đoán
  Dù vậy, nếu nghĩ về mặt lý thuyết, để hiện thực hóa hoàn toàn tiềm năng của lập trình có hỗ trợ AI thì cần đại tu toàn bộ quy trình phát triển, đặc biệt là cách xác minh code; và nếu Anthropic không làm vậy thì thật ngớ ngẩn
  Tôi cho rằng việc xác minh phần mềm trong tương lai chủ yếu sẽ là tự động hóa mạnh hơn các bài test, khả năng quan sát và những phương pháp xác minh tùy biến
  Nhưng code xác minh cũng đóng góp vào LoC. Nhìn vào các dự án cá nhân và một số dự án mã nguồn mở vibe coding, số dòng code sản phẩm và số dòng code test thường xấp xỉ nhau, nên đại khái mức trần có thể chỉ là tăng tốc 3~4 lần, mà như vậy vẫn đã đáng kể
  Nếu tiêu chuẩn chất lượng code không còn như cũ thì mọi giả định đều sụp đổ
- Hôm nay tôi vừa thấy Copilot biến một chỉnh sửa 8 dòng thành 500 dòng, nên sự dài dòng đúng là một tác dụng phụ lớn
- Nếu người ta bắt đầu đánh giá theo số dòng code do AI tạo ra, hay đúng hơn là mức độ “tăng tốc”, thì quá rõ các model mới sẽ ngày càng làm nhiều hơn điều gì
- Họ đang giả định “năng suất = k * LOC, k > 1”, và đó là một giả định rất sai
Tôi tự hỏi liệu một code harness dùng để tự tạo ra chính nó có được tính là cải tiến đệ quy tự thân không, hay AI tự nó phải làm điều đó
Tôi luôn bị cuốn hút bởi những thứ như robot tạo ra robot, hoặc thứ gì đó đóng góp lớn vào việc tạo ra phiên bản tiếp theo của chính nó
https://buildyourcnc.com/products/cnc-machine-blacktoe-v4-2x...
Đây là một router CNC cắt ván ép, và nó được làm từ những tấm ván ép do chính router CNC cắt ra
Tôi cũng đã tối ưu môi trường lập trình có hỗ trợ AI do mình tự làm để nó tự tạo ra chính nó: https://recursi.dev/
Mong là việc nhắc đến nó không sao vì đây là mã nguồn mở miễn phí vừa mới ra mắt. Link HN vẫn chưa thu hút được sự chú ý nào: https://news.ycombinator.com/item?id=48401022
Cá nhân tôi có một giả thuyết hơi điên rằng harness cũng quan trọng ngang với bản thân AI, và ngay cả khi việc cải tiến model dừng lại hôm nay thì chỉ riêng harness thôi cũng có thể tạo ra bước tiến lớn
- Tôi nghĩ có tính cả harness
  AI không đồng nghĩa với LLM, và bất kỳ đoạn code nào giúp máy tính tự suy luận đều là AI. Theo nghĩa đó thì harness cũng là AI
- Tương lai của các công việc có thể xác minh có lẽ sẽ là model xác minh trạng thái ban đầu và mục tiêu, rồi phân rã công việc thành các tác vụ con có thể xác minh ngày càng nhỏ hơn
  /memory phụ trách tính bền vững qua các lần chạy, còn /dreaming đưa vào ý tưởng mới dựa trên các file bộ nhớ đó và kết quả dữ liệu từ các lần chạy
  Tôi nghĩ đây là hướng đi cho con đường AGI bất đồng bộ mà các phòng lab đang hình dung
  Giới hạn duy nhất chỉ là dữ liệu cảm biến mà nó có về thế giới hay hệ thống, thời gian có thể chờ, và chi phí có thể dùng để song song hóa
  Nếu bạn tạo ra các workflow đã được xác minh như vậy và đưa chúng trở lại vào quá trình huấn luyện, model sẽ có các lộ trình con và từ đó có được cảm nhận về thế giới, thậm chí hành xử như có trực giác
  Bài test AGI cá nhân của tôi là: nếu một model học từ video người ta gõ cửa rồi mở cửa, thì khi gặp một lò vi sóng hoàn toàn xa lạ lần đầu, liệu nó có thể mở ra khi đồ ăn chín mà không cần gõ trước không
- Nếu muốn dùng thuật ngữ này thì rốt cuộc AI phải tạo ra AI khác
  Bài này là nhảm nhí, và họ đang vibe coding cái harness nên điều đó cũng lộ ra trong kết quả
  Cũng không rõ trong AI dựa trên mạng nơ-ron thì cải tiến đệ quy tự thân chính xác nghĩa là gì, và ngay từ đầu nó có thực sự khả thi hay không cũng chưa chắc
- Nếu muốn đón đầu tương lai, thì hơn bất cứ thứ gì khác, nó sẽ là hướng các model nhỏ bootstrap harness
- Việc gọi một code harness tự tạo ra chính nó là cải tiến đệ quy tự thân nghe như bị cuốn theo ngôn ngữ marketing quá mức
Tôi không chịu nổi thêm nữa kiểu câu chữ như “AI có thể tự tạo ra chính nó là một bước tiến lớn trong lịch sử công nghệ và có thể mang lại lợi ích to lớn cho thế giới”
Dù Anthropic có thể tạo ra AI tự cải tiến hay không, tôi vẫn tự hỏi ngay từ đầu có nên cho phép họ làm điều đó không
Ít nhất thì cần có sự giám sát nghiêm ngặt
Tôi không nghĩ Anthropic có thể tạo ra điểm kỳ dị ngay lúc này, nhưng ngay cả những người ủng hộ AI cũng phải thừa nhận rằng việc này đã và đang tạo rủi ro cho toàn xã hội vì lợi ích của một thiểu số vốn đã giàu có
- Đây là một suy nghĩ hợp lý, và có thể đúng
  Chỉ là ta đang bàn chuyện đóng cửa chuồng sau khi con ngựa đã chạy xa 3 dặm rồi
- Đúng vậy. Lối diễn đạt rằng chuyện này là tất yếu chỉ có lợi cho các công ty AI
- Giờ thì đã quá muộn
  Dù sao thì nếu doanh nghiệp nào trở nên quá mạnh, vẫn có thể quốc hữu hóa
- Tôi không nghĩ là không nên cho phép
  Bỏ qua các giới hạn kỹ thuật, tôi không nghĩ có thể phong tỏa nó, và khả năng cao là nó sẽ sớm bị rò rỉ, nên có lẽ lợi ích sẽ không chỉ chảy vào tay một nhóm siêu giàu cực nhỏ
Việc thêm điều kiện lưu ý rằng “số dòng code là một chỉ số không hoàn hảo” là tốt, nhưng tôi không chắc việc điều chỉnh đó theo hướng “giảm” bội số ước tính có đúng hay không
đặc biệt là khi hiểu rằng phạm vi không chỉ giới hạn ở các giá trị dương
Có bằng chứng khá mạnh rằng khi biểu thị năng suất lập trình bằng số dòng code, thì nên tính cả giá trị âm, và điều này განსაკუთრებით đúng ở những lĩnh vực chất lượng cao
Ví dụ sớm nhất và mang tính huyền thoại là https://www.folklore.org/Negative_2000_Lines_Of_Code.html
- Đúng vậy, tôi cũng nghĩ ngay đến chính điều đó
  Nếu tin rằng số dòng code âm mới là mục tiêu, thì họ thực ra tệ hơn gấp 8 lần
- Theo tôi biết, mối tương quan duy nhất giữa LoC và một bằng chứng khá chắc chắn là số lượng bug có tương quan với LoC
- Tôi thật sự rất thích câu chuyện đó

Khi AI tự tạo ra chính mình: tiến triển của chúng ta hướng tới tự cải thiện đệ quy

Sự tiến hóa của vòng lặp phát triển AI

Bằng chứng từ thế giới bên ngoài

Bằng chứng nội bộ tại Anthropic

Claude đang viết phần lớn mã của Anthropic

Mã do Claude viết là mã “tốt” và đang tiếp tục cải thiện

Claude giỏi thực thi thí nghiệm hướng tới các mục tiêu do người khác đặt ra

Claude đang cải thiện khả năng tự đề xuất thí nghiệm

Claude đang cải thiện khả năng đưa một phiên nghiên cứu tới kết quả nghiên cứu

Tương lai công việc tại Anthropic

Nếu chúng ta đã sai thì sao?

Các tương lai khả dĩ

Kịch bản 1: Xu hướng chững lại, nhưng năng lực hiện tại vẫn lan rộng

Kịch bản 2: Các phòng thí nghiệm AI tiếp tục cải thiện hiệu quả theo lãi kép

Kịch bản 3: AI đạt tự cải thiện đệ quy hoàn toàn và xây dựng mô hình kế tiếp

Chúng ta nên làm gì

Bài viết liên quan

2 bình luận

Ý kiến trên Hacker News