- Công cụ lập trình kiểu agent Claude Code tạo ra thay đổi lớn hơn không phải ở việc tự viết mã, mà ở cách xây dựng sản phẩm và tái cấu trúc quy trình công việc
- Trong khảo sát người dùng AI cho công việc của Microsoft, cùng lúc xuất hiện áp lực phải nhanh chóng tiếp nhận AI, việc tạo ra sản phẩm công việc mới, và thời gian dành cho công việc có giá trị cao hơn tăng lên, nhưng mức thưởng cho việc thử nghiệm AI vẫn ở mức thấp
- Nếu tổ chức lấy lượng sử dụng đơn thuần làm mục tiêu thì sẽ xuất hiện bảng xếp hạng token và tình trạng thổi phồng mức sử dụng, nên các chỉ số gắn với cách tạo thêm giá trị bằng AI mới quan trọng hơn
- Boris Cherny cho rằng chức danh kỹ sư có thể chuyển thành vai trò gần với builder hơn, người không phải kỹ sư cũng sẽ tạo ra mã, còn kỹ sư sẽ tập trung nhiều hơn vào phán đoán, lập kế hoạch và hiểu người dùng thay vì trực tiếp gõ mã
- Việc AI nâng cao năng suất không nhất thiết chỉ dẫn đến giảm giờ làm hay giảm việc làm; doanh nghiệp sẽ tái cấu trúc workflow theo hướng lấy AI làm trung tâm, còn cá nhân sẽ có nhiều lựa chọn và đòn bẩy hơn
Dữ liệu công việc với AI và cái bẫy của chỉ số tổ chức
- Microsoft đã khảo sát 20.000 người dùng đang dùng AI trong công việc thực tế, và xuất hiện hiện tượng mà họ gọi là "nghịch lý chuyển đổi (transformation paradox)"
- 65% lo rằng nếu không nhanh chóng tiếp nhận AI thì sẽ bị tụt lại
- 58% đang tạo ra những sản phẩm công việc mà 1 năm trước họ không thể làm được nếu không có AI
- 66% trả lời rằng nhờ AI họ dành thời gian cho công việc có giá trị cao hơn
- Trong khi đó, chỉ 13% nói rằng họ được thưởng tại nơi làm việc vì thử nghiệm AI, cho thấy có khoảng cách giữa ý chí sử dụng và tổ chức
- Trong một nghiên cứu khác của Microsoft, khi quản lý trực tiếp cho thấy cách dùng AI của mình thì mức sử dụng tăng 17%, còn độ tin cậy với agent tăng 30%
- Thay vì những khẩu hiệu kiểu "AI là tương lai", việc quản lý cho thấy cách họ thực sự sử dụng một cách cụ thể mới tạo ra kết quả
- Nếu nhân viên tin rằng họ có thể cùng chia sẻ thành quả năng suất tăng lên nhờ AI thì động lực sử dụng có thể thay đổi, nhưng hầu như không nơi nào thưởng bằng tiền theo cách đó
- Một số nơi làm việc trợ cấp chi phí token, nhưng hỗ trợ đó không phải lúc nào cũng dẫn đến kết quả tốt
Token maxing — tác dụng phụ của chỉ số sử dụng
- Tại các công ty công nghệ lớn đã xuất hiện hiện tượng token maxing, tức tiêu hao token quá mức để tăng lượng sử dụng
- Theo nhân viên Amazon chia sẻ với Financial Times, Amazon đã triển khai công cụ nội bộ mesh claw lấy cảm hứng từ OpenClaw và khuyến khích sử dụng
- Trong nhóm có bảng xếp hạng mức dùng token, nên một số nhân viên chạy những agent không hiệu quả chỉ để kéo số sử dụng lên
- Ở Meta, mức sử dụng tối đa lên tới hàng trăm tỷ token, và một lượng tương đương hàng triệu USD chi phí về thực chất đã bị lãng phí
- Quan điểm chính thức của Amazon là mức dùng token không phải chỉ số đánh giá quản lý, nhưng nhân viên tin rằng quản lý có xem nên vẫn tăng mức sử dụng thô
- Ở Amazon có mục tiêu từ cấp trên là khiến 80% lập trình viên dùng AI hằng tuần
- Nếu không có phần thưởng cụ thể thì người ta chỉ làm theo câu "hãy dùng AI" mà bỏ lỡ mục tiêu gốc là "hãy làm việc tốt hơn"
- Với lập trình viên, thay vì cách theo dõi mơ hồ thì cần rõ ràng những chỉ số năng suất gắn với tạo ra giá trị
Sự ra đời và lan rộng nhanh chóng của Claude Code
- Claude Code là công cụ lập trình kiểu agent do Anthropic ra mắt vào tháng 5 năm trước, một công cụ cho ra mã khi bạn nhập từ ngữ
- Chỉ trong 8 tháng sau khi ra mắt, nó đã chiếm khoảng 4% toàn bộ mã được đưa lên GitHub
- Đến tháng 2 năm đó, sản phẩm đạt run rate doanh thu hằng năm 2,5 tỷ USD, trở thành sản phẩm doanh nghiệp đạt mốc này nhanh nhất
- Nhà sáng lập Boris Cherny không có bằng khoa học máy tính mà học kinh tế, bỏ đại học ở tuổi 18, điều hành startup, làm việc tại quỹ đầu cơ rồi làm kỹ sư principal ở Meta trong 5 năm trước khi gia nhập vào cuối năm 2024
- Hiện nay Cherny không trực tiếp viết một dòng mã nào, mà chạy song song 5 agent trong 5 tab terminal và xử lý 20–30 pull request mỗi ngày
- Ban đầu đây không phải nhiệm vụ làm công cụ lập trình mà là side project khi ông tìm hiểu API
- Ban đầu chỉ là dạng đơn giản nối Claude với AppleScript để hiện bài nhạc ông đang nghe
- Chỉ trong hai tháng đã có phiên bản Claude Code, và ngày đầu tiên đã có 20% đội ngũ kỹ thuật của Anthropic sử dụng
- Ông gia nhập vào tháng 9/2024 và thuộc về một nhóm labs rất nhỏ
- Nhóm này đã làm ra Claude Code, MCP, skills và ứng dụng desktop, với nhiều ý tưởng thử nghiệm chưa rõ có thành công hay không
- Anthropic vốn tập trung vào doanh nghiệp, lập trình và an toàn, nên nếu làm sản phẩm thì một sản phẩm lập trình vừa giúp có mô hình lập trình tốt hơn vừa giúp nghiên cứu an toàn là lựa chọn hợp lý
- Vào thời điểm đó, phần lớn sản phẩm lập trình vẫn là mở rộng IDE, và ở mức Sonnet 3.5 thì gần với tự động hoàn thành nâng cao hơn
- Họ cảm nhận được một model overhang: mô hình làm được nhưng chưa có sản phẩm nào kéo được năng lực đó ra, và cảm giác này đến giờ vẫn vậy
- Sản phẩm được tạo chỉ trong vài ngày dưới dạng rẻ nhất có thể, chạy trong terminal mà không cần UI hay ứng dụng riêng
- Người dùng lan ra từ những người xung quanh, chỉ sau vài tuần đã có số đông trong công ty dùng hằng ngày, và chỉ trong 5 ngày sau khi ra mắt đã có một nửa đội ngũ kỹ thuật sử dụng
- Ngay cả kỹ sư ngại terminal cũng dùng, và thay vì phân tích rằng "kỹ nghệ phần mềm đã thay đổi mãi mãi", Cherny chỉ tập trung vào việc ra mắt
Kỹ sư có biến mất không — sự pha trộn của các vai trò
- Cú sốc đầu tiên là khoảnh khắc Claude cho biết ông đang nghe nhạc gì
- Khi được hỏi, Claude đã viết mã AppleScript để mở trình phát nhạc; Cherny không biết ngôn ngữ đó và cũng không nghĩ tới cách trả lời như vậy
- Nó giải quyết vấn đề bằng cách mà một kỹ sư có lẽ đã không chọn
- Mô hình đang tiến bộ rất nhanh, nên khi xây sản phẩm trên mô hình thì cần điều chỉnh lại hằng tháng
- Với Co-work, hệ thống đã đặt 8 chuyến bay và 5 khách sạn; lỗi duy nhất là một khách sạn giá khoảng 5.000 USD một đêm nên vượt ngân sách → chỉ riêng trường hợp đó phải đặt lại
- Vì xu hướng là đường cong hàm mũ, không ai biết chính xác và đang có hai điều cùng xảy ra
- Có công ty nhờ năng suất kỹ sư tăng lên nên cần ít kỹ sư hơn cho cùng một công việc
- Cũng có công ty nhờ năng suất mỗi người tăng mà mở ra nhiều sản phẩm và hoạt động kinh doanh hơn nên cần nhiều kỹ sư hơn (đội của Cherny vẫn luôn bị chặn bởi thiếu kỹ sư giỏi và đang tuyển nhanh nhất có thể)
- Các vai trò đang trộn lẫn một cách thú vị
- Quản lý Fiona đã 15 năm không lập trình nhưng sau khi gia nhập lại bắt đầu viết mã; product manager Cat và designer Megan cùng toàn bộ nhóm đều viết mã
- Người không phải kỹ sư viết nhiều mã hơn một chút, còn kỹ sư như Cherny thì hơn 6 tháng không trực tiếp viết mã mà vẫn xây thứ gì đó cả ngày
- Chưa rõ nên gọi là builder, kỹ sư hay product manager, nhưng bản thân vai trò thì rõ ràng đang thay đổi
Ẩn dụ máy kéo — thời gian để công nghệ lan rộng
- Máy kéo được John Frick phát minh ở Iowa vào thập niên 1890, nhưng phải đến thập niên 1960 số máy kéo ở Mỹ mới vượt số ngựa, tức mất khoảng 70 năm
- Máy kéo giúp tăng mạnh sản lượng và năng suất, nhưng cần đào tạo để biết cách dùng và ban đầu rất đắt nên ngựa rẻ hơn
- Hiệu năng cũng còn thiếu, kiểu như dùng được cho lúa mì nhưng không dùng được cho ngô, và phải mất rất lâu mới thích nghi được với nhiều loại cây trồng
- Quá trình chuyển đổi AI hiện nay là cùng những vấn đề đó nhưng diễn ra theo kiểu speedrun
- Điều này gắn với góc nhìn AI as normal technology — dù xuất hiện mô hình rất mạnh thì thay đổi ở con người và tổ chức vẫn chậm
- Tuy vậy, nhìn vào quỹ đạo doanh thu của Anthropic thì cũng có phản biện rằng lần này tốc độ nhanh hơn, nên hiện vẫn đang ở giai đoạn ước lượng tốc độ thay đổi thực tế
- Máy tính làm tăng năng suất, nhưng điều đó không đồng nghĩa với giảm giờ lao động — con người sẽ làm được nhiều việc hơn trong cùng khoảng thời gian
Lập trình đã được "giải quyết" chưa
- "coding is solved" là cách nói chỉ giới hạn trong "kiểu lập trình mà tôi đang làm"
- Những thứ Cherny làm như cloud CLI, ứng dụng desktop và ứng dụng mobile là các codebase tương đối mới và đơn giản
- Ngược lại, với những codebase lớn và phức tạp của khách hàng lớn như NASA thì chuyện này vẫn chưa được giải quyết, và mô hình cũng không hoàn hảo nên vẫn mắc lỗi
- Phản biện từ kỹ sư rằng lập trình không phải gõ mã mà là phán đoán, cảm nhận và tư duy phản biện, những điểm mà agent còn yếu, là hoàn toàn hợp lý
- Một ngày làm việc trước đây của Cherny cũng chỉ khoảng 50% là thực sự gõ mã, phần còn lại là trò chuyện với người dùng, brainstorm, debug, thiết kế và lập kế hoạch
- Khi mô hình đảm nhận phần coding thì kỹ sư được giải phóng để làm những việc thú vị hơn như nói chuyện với người dùng và nghĩ ra bước tiếp theo
- Claude Code đã được viết 100% bằng chính Claude Code trong hơn 6 tháng, các sản phẩm khác như Co-work cũng vậy
- Trong một buổi trò chuyện gần đây của lứa Y Combinator, khi hỏi "ai viết 100% mã bằng Claude Code" thì khoảng một nửa trong số hàng trăm người giơ tay; khi hỏi "ai hoàn toàn không viết bằng mô hình" thì chỉ có một người, còn lại nằm trong khoảng 50–100%
- Ông cho rằng sự thay đổi của ngành kỹ thuật là chỉ báo sớm cho mọi lĩnh vực ngoài kỹ thuật
-
Lo ngại teo năng lực và sự tiến hóa của lập trình
- Có lo ngại rằng nếu không trực tiếp viết mã thì sự hiểu biết về chính nghề nghiệp của mình có thể teo đi (atrophy)
- Kỹ sư Lena trong nhóm vẫn tự tay viết C++ vào mỗi cuối tuần để vui, và kiểu lựa chọn đó luôn có chỗ đứng
- Cherny không xem đây là teo năng lực mà là dòng chảy lập trình vốn luôn thay đổi
- Thời Liên Xô là thẻ đục lỗ, thời chương trình Apollo là tính toán thủ công trên giấy, và lúc đó những thứ đó cũng được xem là "lập trình"
- Sau đó chuyển từ machine code → assembly → JavaScript và Python, còn bây giờ là trò chuyện với agent, rồi có lẽ sắp tới sẽ là agent nói với agent để viết mã
- Điều đó giống như việc kỹ năng toán có thể suy giảm phần nào vì máy tính cầm tay nhưng người ta vẫn dùng máy tính; chỉ là nếu công cụ đó trở thành siêu trí tuệ và ngấm ngầm làm suy yếu người dùng thì lại là câu chuyện khác
- Có lo ngại rằng nếu không trực tiếp viết mã thì sự hiểu biết về chính nghề nghiệp của mình có thể teo đi (atrophy)
-
Tranh cãi về việc hiệu năng mô hình bị thoái lui
- Sau mỗi lần ra mắt mô hình mới thường lặp lại phản ứng rằng "hiệu năng đã tụt mạnh"
- Thực tế có 2 trường hợp do bug, và Anthropic đã công khai nguyên nhân cùng cách sửa trên blog
- Ngoài ra phần lớn có thể chỉ là hiện tượng giống giai đoạn trăng mật, khi đã quen với mô hình thì cảm giác kinh ngạc ban đầu giảm đi
- Khác với 1 năm trước, hiện nay mã do mô hình viết tốt hơn mã Cherny tự viết
- Trước đây ông phải rà lại từng dòng tới ba lần, còn giờ thì giao cho Claude rồi để nó tự kiểm tra lại kết quả và test, đồng thời chạy song song 15 Claude
- Sau mỗi lần ra mắt mô hình mới thường lặp lại phản ứng rằng "hiệu năng đã tụt mạnh"
Nghịch lý năng suất và sự mở rộng lựa chọn
- Dù năng suất tăng, việc giờ làm không giảm phần lớn vẫn phụ thuộc vào lựa chọn cá nhân và hoàn cảnh doanh nghiệp
- Ông giải thích bằng câu chuyện máy giặt
- Trước khi có máy giặt, mỗi lần giặt mất 5–6 tiếng và phải đi bộ khoảng 3.000 ft, phải nhóm lửa, đun nước, chà trên bàn giặt, vắt đồ, và lặp lại hằng ngày theo số thành viên trong gia đình
- Máy giặt giúp rút ngắn khoảng 3 giờ cho mỗi lần giặt
- Đây là một trong những yếu tố giúp phụ nữ tham gia quy mô lớn vào thị trường lao động
- Thời gian tiết kiệm được tạo ra các lựa chọn cá nhân như ở bên con cái, đi dạo, đọc sách, gặp bạn bè, hoặc bước vào nhà máy hay công việc văn phòng; AI cũng mở rộng lựa chọn theo cách tương tự
- Lời khuyên cho người 22 tuổi vừa tốt nghiệp ngành CS: vẫn có việc cho người mới, nhưng nếu có chút xu hướng khởi nghiệp thì nên lập startup
- Đây là thời kỳ hoàng kim tốt nhất lịch sử để khởi nghiệp, khi "bạn và các agent" có thể xây dựng một công ty khổng lồ
- Trên thực tế đã có những nhóm 1–3 người tạo ra công ty quy mô tỷ USD và các startup xuất sắc, và đòn bẩy của một cá nhân là cực lớn
- Có thể 3 năm nữa người ta sẽ không còn gọi là "kỹ sư", nhưng số người viết mã hoặc tạo mã bằng agent sẽ gấp 100 lần hiện nay
Claude Co-work — mở rộng cho người không phải kỹ sư
- Co-work bắt đầu từ việc thấy mọi người cài Claude Code trong terminal để khai thuế, tức dùng cho mục đích không phải coding
- Nó được dùng cho đủ loại công việc phi kỹ thuật như kế toán, tài chính, pháp lý, đặt vé máy bay, mua vé hòa nhạc, thậm chí mua giấy phép đào sò ở bang Washington
- Các sản phẩm coding trước đây là kỹ sư làm cho chính mình rồi hóa ra hữu ích cho người khác, còn Co-work là thách thức mới được làm cho toàn bộ nhóm người không phải kỹ sư
- Khả năng chạy lâu là hướng đi cốt lõi
- Khoảng 1 năm rưỡi trước, do giới hạn mô hình nên Claude Code chỉ cần qua 30 giây là đã lệch hướng, phải có người can thiệp
- Bây giờ mỗi đêm có hàng trăm đến hàng nghìn agent chạy 5, 10, 20 giờ, và đó chính là cách làm kỹ thuật hiện tại
- Co-work cũng sẽ đi theo hướng đó, nhưng vẫn chưa rõ chính xác những công việc nào cần chạy dài đến thế
- Khi bộ nhớ và khả năng hiểu người dùng tốt hơn, nó sẽ phát triển theo hướng dự đoán trước nhu cầu
- Ví dụ: nắm được còn bao nhiêu tập podcast và khách mời nào chưa được mời, rồi brainstorm ứng viên và để sẵn email liên hệ ban đầu trong thư nháp
- Định nghĩa công việc có thể chia thành kiểu ngang như "toàn bộ thiết kế", và kiểu dọc là hoàn thành một mục tiêu cụ thể đến cùng
- Ví dụ dọc: Claude tạo tính năng, rồi test, merge và deploy luôn
- Từ Opus 4.7, Claude trở nên chủ động hơn
- Sau khi phát hành tính năng, nó tự lên lịch nhắc bản thân kiểm tra phản hồi người dùng sau 12 giờ và nếu có bug thì tìm cách sửa — việc xử lý trước những chuyện con người dễ quên như vậy đem lại mức hài lòng cao
- Claude Mythos chưa được công bố rộng rãi ra bên ngoài cho đa số người dùng, và thông tin được công khai chủ yếu là về hiệu năng trong lập trình và an ninh mạng — đây là bước nhảy lớn hơn thường lệ và đặc biệt mạnh ở cyber và coding
Trách nhiệm thay thế việc làm thuộc về ai
- Quá trình chuyển đổi này sẽ trộn lẫn tác động tốt và xấu, còn thời điểm chính xác và tỷ lệ thì không thể dự đoán
- Anthropic đang ở một vị trí đặc biệt, vì có thể trở thành nguồn gây thất nghiệp cho những nghề như kỹ sư phần mềm
- Với tư cách kỹ sư, họ thường xuyên bàn trong nhóm về cảm giác nghĩa vụ mạnh mẽ phải báo trước thay đổi sắp đến và hướng dẫn mọi người dùng công cụ để cùng đi qua
- Đây không phải vấn đề một công ty có thể giải quyết, và cũng không nên để một công ty giải quyết một mình (vì có thể dẫn tới lời giải sai)
- Đây là vấn đề cả xã hội cần bàn luận và tranh luận, còn Anthropic đóng góp bằng báo cáo kinh tế, thảo luận chính sách và công khai những gì họ quan sát được
- Một trong những lý do Anthropic vừa là phòng nghiên cứu an toàn vừa làm sản phẩm là để mọi người trực tiếp trải nghiệm, hiểu và tham gia phản ứng ở cấp xã hội — nếu khóa công nghệ lại thì rất khó để ai hình thành được quan điểm
Power user và khoảng cách AI
- Có lo ngại khoảng cách số sẽ biến thành khoảng cách AI, và dữ liệu cho tới nay cho thấy người tận dụng AI tốt nhất thường đã ở gần nhóm thu nhập cao
- Anthropic có một số chương trình nhằm mở rộng khả năng tiếp cận, nhưng không nêu tên hay cách làm cụ thể
- Những người tạo ra giá trị lớn nhất thường không giống dự đoán
- Người thắng hackathon ra mắt Opus 4.7 đa phần không phải kỹ sư chuyên nghiệp mà là thợ điện, bác sĩ, thợ mộc làm ứng dụng; ở hackathon 4.6 ngay trước đó cũng có xu hướng tương tự
- Mô hình đã tinh vi đến mức người không chuyên cũng có thể sử dụng tốt
- Chìa khóa để doanh nghiệp lớn triển khai là thay đổi quy trình công việc và đặt Claude vào trung tâm
- Một cách làm hiệu quả là cấp token cho mọi người và để họ thử nghiệm an toàn, nhờ vậy ý tưởng có thể xuất hiện từ những người không ngờ tới
- Ý tưởng tốt nhất có thể không đến từ kỹ sư cấp cao mà từ nhân viên kế toán ở góc phòng hoặc người phụ trách GTM với một dashboard nội bộ
- Không có gì đảm bảo người dùng công cụ giỏi nhất hôm nay vẫn là người giỏi nhất ngày mai, nên điều quan trọng là mọi người đều học cách sử dụng công cụ
Triển vọng 1 năm tới
- Năm tới sẽ có rất nhiều hỗn loạn, và các tay chơi lớn sẽ cố gắng thích nghi, trong đó nhiều bên sẽ thành công
- Một số hào lũy kinh doanh truyền thống sẽ yếu đi, còn một số vẫn giữ nguyên
- Hiệu ứng mạng lưới (càng nhiều người dùng càng có giá trị) vẫn tồn tại bất kể AI
- Kinh tế theo quy mô (chi phí biên giảm xuống) cũng là lợi thế tự nhiên nên không biến mất
- Ngược lại, chi phí chuyển đổi sẽ suy yếu — nếu Claude có thể giúp chuyển từ vendor A sang B thì đó không còn là hào lũy lớn nữa
- Những công ty dựa vào các hào lũy đang biến mất sẽ gặp khó, còn phần lớn sẽ đi tìm hào lũy mới
- Sẽ có những đổi mới lớn hơn nhiều so với dự đoán
- Ý tưởng mới sẽ bùng ra không phải từ doanh nghiệp lớn mà từ các startup nhỏ quy mô 1, 2, 10 người, và số lượng của chúng sẽ tăng bùng nổ
- Ví dụ startup khám phá vật liệu: với câu chuyện nhân loại đi từ thời đồ đá, đồ sắt đến thời silicon, họ tin rằng tìm được vật liệu mới sẽ mở ra thời đại tiếp theo, và dùng Claude để khám phá các phân tử, thiết kế khả thi
- Những việc trước đây khó huy động vốn giờ đây có thể được một nhóm nhỏ biến thành đột phá mà 20 năm trước là bất khả thi
- Khi người hiểu sâu một domain có trong tay "đội quân Claude", họ làm được nhiều việc hơn rất nhiều so với khi có một đội quân con người
- Cherny đã tự động hóa việc phản hồi người dùng trên X và Threads, nhưng vẫn thích tự làm hơn
- Ông chuyển vòng lặp của Claude Code thành routine chạy mỗi 30 phút, dùng Threads API và X API để thu thập phản hồi
- Tương tác trực tiếp với người dùng là việc ông thích nhất, và ngay cả phản hồi kiểu "không hoạt động" cũng là nguồn để cải thiện sản phẩm
- Claude Code còn nhiều khiếm khuyết và còn xa mới là sản phẩm lý tưởng, nhưng lắng nghe phản hồi và cải thiện từng chút mỗi ngày là cách duy nhất để tạo ra sản phẩm tốt
Chưa có bình luận nào.