- Nhân viên Amazon đang chịu áp lực phải đưa AI vào công việc nhiều hơn, nhưng do không rõ nên áp dụng ở đâu nên phát sinh các tác vụ không cần thiết
- Một số nhân viên đang dùng công cụ nội bộ MeshClaw để tạo ra các agent nhằm tăng mức độ hoạt động của AI hơn là cải thiện năng suất
- Nhân viên cho rằng việc theo dõi mức tiêu thụ token AI đã tạo ra bầu không khí ưu tiên mức sử dụng hơn chất lượng
- Amazon cho biết không có chỉ số AI toàn công ty hay bảng xếp hạng nội bộ, nhưng nhân viên nói có mục tiêu 80% sử dụng và có theo dõi
- OpenClaw và MeshClaw chạy cục bộ nên có tính độc lập cao hơn, nhưng rủi ro có thể tăng mạnh nếu cấp quyền truy cập quá mức
Áp lực sử dụng AI và việc dùng MeshClaw
- Nhân viên Amazon đang chịu áp lực phải đưa AI nhiều hơn vào quy trình làm việc, nhưng không rõ nên áp dụng ở đâu, khiến tài nguyên AI dễ bị dùng cho các tác vụ không cần thiết
- Theo bài viết của Financial Times, một số nhân viên Amazon đang dùng công cụ AI nội bộ MeshClaw để tạo ra những agent AI không cần thiết, với mục đích tăng mức độ hoạt động của AI hơn là nâng cao năng suất
- Một nhân viên nói: “Áp lực phải dùng những công cụ này là quá lớn”, và cho biết một số người dùng MeshClaw để tối đa hóa mức sử dụng token
Mâu thuẫn quanh các chỉ số sử dụng
- Nhân viên cho rằng khi Amazon theo dõi mức tiêu thụ token AI, một số đồng nghiệp đã ưu tiên số lượng sử dụng công nghệ hơn là chất lượng
- Nhiều nhân viên Amazon giấu tên cho rằng môi trường làm việc đang xấu đi khi kỳ vọng về việc dùng AI ngày càng tăng
- Amazon dường như đã nói với nhân viên rằng thống kê sử dụng AI không được đưa vào đánh giá hiệu suất, nhưng không phải mọi nhân viên đều tin điều đó
- Một nhân viên khác cho rằng việc theo dõi mức sử dụng tạo ra động lực bị bóp méo, khiến một số nhân viên hành xử rất cạnh tranh
- Các nhân viên được phỏng vấn nói rằng công ty có mục tiêu hằng tuần là 80% lập trình viên sử dụng AI, và mức tiêu thụ token của nhân viên được theo dõi trên bảng xếp hạng nội bộ
- Người phát ngôn của Amazon cho biết không có chỉ số sử dụng AI ở cấp toàn công ty và cũng không có bảng xếp hạng nội bộ để so sánh nhân viên với nhau
- Theo Amazon, nhân viên có thể xem mức sử dụng AI của riêng mình trên bảng điều khiển cá nhân
OpenClaw và rủi ro của việc chạy cục bộ
- MeshClaw, công cụ mà một số nhân viên Amazon dùng để thổi phồng mức sử dụng AI, là công cụ lấy cảm hứng từ một công cụ AI khác là OpenClaw
- Không giống các mô hình AI khác, OpenClaw và MeshClaw chạy cục bộ trên phần cứng của chính người dùng, vì vậy có tính độc lập cao hơn
- Đầu năm nay, giám đốc phụ trách alignment của Meta Superintelligence Labs đã gây chú ý với sự cố OpenClaw suýt xóa toàn bộ hộp thư đến email, qua đó cho thấy rủi ro khi cấp cho AI quyền truy cập quá mức
1 bình luận
Ý kiến trên Hacker News
Không chỉ Amazon, mà có cảm giác toàn bộ các công ty công nghệ lớn và cả một số công ty nhỏ cũng đang cùng lúc phát điên
Nó giống như tình huống một ngày nào đó CEO nói: “Chúng ta cần khuyến khích chi tiêu công tác, nên hãy đặt càng nhiều chuyến đi càng tốt và tiêu nhiều tiền nhất có thể. Đi hạng nhất khi tới văn phòng vệ tinh, đi limousine thay vì Uber, ăn ở nhà hàng sang trọng. Nếu không tiêu đủ chi phí công tác thì sẽ bị xếp hạng thấp trong đánh giá nhân sự”
Bây giờ đúng là thời đại hoàn toàn bất thường
Nếu là phó chủ tịch ở Amazon thì chắc tôi cũng sẽ cân nhắc đề nghị mua lại, và hiện tôi đang làm cả bản enterprise có thêm tính năng
Show HN: https://news.ycombinator.com/item?id=48151287
Tưởng sẽ bị mắng, nhưng ngược lại còn được khen thưởng, rồi còn bị yêu cầu làm một bài chia sẻ ngắn cho các nhân viên khác về cách mình thành công
Giờ 20% chi phí hạ tầng là token, và số pull request mỗi tuần trên mỗi lập trình viên tăng từ 4.2 lên 5.1
Trong đó khá nhiều chỉ là agent sửa một hai dòng file cấu hình, nên tất cả trông như kiểu tư duy ma thuật
Dù ở hãng bay khác có thể đi hạng nhất còn rẻ hơn, chính sách công ty vẫn không cho đi hạng nhất
Chúng ta lúc nào cũng sống trong thời đại bất thường cả
Khi điều đó không xảy ra, có vẻ họ lại giả định là vì nhân viên chưa dùng AI thần kỳ đủ thường xuyên
Các công ty tự làm sản phẩm AI có thể muốn nhân viên dùng AI càng nhiều càng tốt để lấy dữ liệu huấn luyện, cuối cùng thay thế phần lớn hoặc toàn bộ nhân viên
Nếu họ cho rằng việc trừng phạt những nhân viên từ chối huấn luyện chính công cụ AI thay thế mình tuy tốn kém lúc này nhưng sẽ tiết kiệm lớn hơn nhiều về sau, thì theo góc nhìn của họ điều đó có thể hợp lý
Khoảng 6 tháng trước tôi nghe một nhân viên AWS trình bày về công cụ AI phù hợp với use case của chúng tôi
Giữa buổi trình bày anh ta đột nhiên chia sẻ màn hình rồi nói kiểu “Xem tháng này tôi đã dùng bao nhiêu token đi. Tôi chạy Opus rất nhiều”, và con số thì lớn đến mức gần như xúc phạm
Lúc đó tôi đã nghĩ “Khoác lác kiểu này thật kỳ cục. Thứ này đắt đến vậy thì việc dùng quá nhiều lẽ ra phải là dấu hiệu cảnh báo chứ?”
Anh ta cho xem nhiều use case dùng Claude Code để quản lý và tinh chỉnh hạ tầng AWS, nhưng dưới con mắt của tôi, một sysadmin râu bạc còn già hơn cả Internet, thì tất cả chỉ như “dùng AI để làm việc mà chỉ cần một lệnh đơn là xong”
Vậy nên câu chuyện này hoàn toàn hợp lý. Hóa ra từ 6 tháng trước họ đã được khuyến khích xài thật mạnh rồi
Nhưng nếu bạn nhấn
tab, thì dòng đó sẽ được tính là dòng AI đã chỉnh sửaPhần lớn phần còn lại cũng là những việc mà nếu đã học multi-cursor, di chuyển bằng vim, hay macro thì bạn vốn đã làm được với tốc độ tương tự
Thực tế là từ trước đến giờ tôi chưa bao giờ chậm đến mức tốc độ đưa code lên màn hình trở thành nút thắt cổ chai, nên đơn giản là không học những thứ đó thôi
Chắc không phải chuyện nhị phân, mà còn tùy nhiều yếu tố, nhưng việc liên tục thấy những báo cáo trái ngược nhau đến vậy vẫn rất lạ
Nếu vậy thì cũng giải thích được những chỉ thị kiểu này xuất phát từ đâu, và tại sao chúng lại không hề thận trọng hay cân bằng
Đây là một điểm yếu lớn của việc phát triển hệ thống, và có thể trở thành một bề mặt tấn công khổng lồ cho đối thủ
Phần lớn giá trị của AI nằm chính ở đó
Giờ bạn không cần phải biết lệnh đó nữa, chỉ cần biết hợp đồng chức năng là có thể hoàn thành công việc cần làm
Đây là một thay đổi cực lớn
Có rất nhiều câu chuyện kiểu “phải dùng token nên tôi đốt vào việc vô ích”, và đó là hành vi khó tin trong bối cảnh khẩn cấp khí hậu
Đẩy thêm chút nữa chắc còn chạm mốc nóng lên 3 độ
Nó làm tôi nhớ tới chuyện Liên Xô từng suýt đẩy cá voi tới bờ tuyệt chủng chỉ để đạt chỉ tiêu săn bắt thịt cá voi mà chẳng ai muốn ăn
Thực chất là đã có kế hoạch hóa tập trung, và các bệnh lý của hệ thống đó cũng y nguyên, chỉ khác là thay vì Liên Xô, GOSPLAN của chúng ta do vài kẻ tình cờ giàu lên hoặc biết hối lộ đúng người vận hành
Không phải để tăng năng suất “thật”, mà chỉ là để tiêu token
Nếu không đốt token thì không đạt KPI, và còn có thể bị gắn mác Luddite rồi bị đuổi trước cả khi AI cướp mất việc
Tôi đồng ý là xu hướng này cùng với lũ hiếu chiến đang phá hỏng Trái Đất
Câu “chẳng ai muốn ăn” cũng thiếu cơ sở
May là tôi làm bên quản lý ứng dụng, và biết rằng họ chỉ xem ngày sử dụng cuối cùng, nên mỗi ngày chỉ cần gửi một query là ổn
Nhưng tôi thật sự đã quá mệt mỏi với cơn sốt AI này
Tôi làm ở một công ty FAANG nhưng không phải Amazon, và đã nghe rất nhiều câu chuyện như thế cả từ bên trong lẫn bên ngoài
Tuy vậy, chưa bao giờ tôi thấy những người thật sự quan trọng, tức ban lãnh đạo, chính thức nói ra điều đó
Mọi thứ luôn bắt đầu từ tin đồn hoặc từ dashboard/chỉ số do ai đó nội bộ dựng lên rồi dần phình to
Tôi cũng từng nghe lãnh đạo nói rằng “đó không phải thứ chúng tôi đang nhìn vào, và không nên lãng phí token đắt đỏ”
Dĩ nhiên, trước đây từng có lúc họ dùng những chỉ số ngớ ngẩn như số dòng code hay số commit mà cũng chẳng bao giờ hoàn toàn thừa nhận, nhưng tôi không tin nó đơn giản đến mức càng nhiều token càng tốt
Khi chúng tôi phản đối, lãnh đạo cũng thừa nhận rằng chi tiêu token không phải chỉ số tốt và rất dễ bị lợi dụng, nhưng ngay sau đó lại tiếp tục bảo phải tăng chi tiêu token của team
Tôi biết vì có dashboard theo dõi token mà lãnh đạo xem, và họ còn trình chiếu trực tiếp trong cuộc họp
May mà họ chưa công khai thành bảng xếp hạng cho toàn bộ mọi người
Có rất nhiều tin đồn rằng chi tiêu token sẽ được đưa vào đánh giá nhân sự; lãnh đạo phủ nhận, nhưng ngay sau đó lại mở thêm họp để nói việc tăng chi tiêu token quan trọng thế nào và bàn về những thiếu hụt hiện ra trên dashboard
Ở những công ty làm bảng xếp hạng dùng token hoặc úp mở rằng có thể sa thải các kỹ sư từ chối dùng công cụ AI thì vấn đề bùng nổ
Khi đó sẽ bắt đầu cuộc đua ai dùng nhiều token nhất để sinh tồn
Đặc biệt nặng trong nhóm lập trình viên đọc mạng xã hội nhiều
Trên Twitter, Threads, Mastodon, LinkedIn... những câu chuyện lan truyền kiểu phải trở thành AI-native và sa thải người không dùng AI đủ nhiều cứ bị tái chế đi tái chế lại, khiến các lập trình viên bất an nghĩ rằng nếu muốn tránh bị cắt giảm thì phải đốt token nhanh hơn đồng nghiệp
Sau đó các IC trong tổ chức được bảo rằng phải dùng AI cho mọi việc, nếu không có thể bất lợi cho sự nghiệp
Họ liên tục ép học bắt buộc, workshop và hackathon để “tạo động lực” dùng AI trong công việc hằng ngày
Ngay cả việc dễ dàng làm bằng shell script cũng bị hỏi theo kiểu “làm sao biến cái này thành agent được?”
Họ đã chi rất nhiều tiền cho Copilot nên muốn thấy mọi người dùng nó
Có khi mục tiêu bản thân nó là khiến mọi người game chỉ số
Nếu bạn thúc ép họ dùng AI nhiều hơn, họ sẽ thử nghiệm, khám phá và “lãng phí” thời gian để học
Đó mới là mục tiêu cuối cùng
Bây giờ họ đang tiêu token vào những việc vô ích để tìm ra chỗ nào có tác dụng, và cũng phải học theo cách đó để biết chỗ nào không có tác dụng
Công ty tôi cũng đang làm y như vậy
Có thể lãng phí, nhưng đây là cách nhanh nhất để khám phá AI thực sự hữu ích ở đâu cho doanh nghiệp
Dù 80% nhân viên chỉ lãng phí token, thì 20% còn lại vẫn đang tìm ra cách
Nếu có nhiều tiền đến mức đốt đi thì đúng là vẫn còn nghĩ ra được những cách tiêu còn tệ hơn, nhưng nhìn nghiêm túc thì đó là điều ngu ngốc
Đã bao giờ các doanh nghiệp bỏ ra hàng triệu đô và rất nhiều thời gian nhân sự chỉ để “xem công cụ này rốt cuộc làm được gì hữu ích” chưa
Đó đúng nghĩa là một giải pháp đi tìm vấn đề
Nếu ở giai đoạn đầu mà còn không rõ công cụ này giải quyết vấn đề gì thì nên bỏ đi và chuyển sang thứ khác
Số tiền còn lại tốt hơn nên trả cho nhân viên và cổ đông
Thật đáng tiếc khi giờ AI đã có một chương trình việc làm cơ bản phổ quát, còn con người thì vẫn chưa có
Các công ty đang trả tiền để AI này đào hố, rồi AI khác lấp cái hố đó lại
[1] https://locusmag.com/feature/cory-doctorow-full-employment/
Liên Xô từ lâu đã đạt 100% việc làm[0], và đi kèm với nó là nghèo đói
Cái này không vận hành bằng thuế nên không hoàn toàn giống vậy
Doanh nghiệp tư nhân đang tự lấy tiền của mình ra thử nghiệm, và cũng chấp nhận rủi ro sau này chi phí tăng khiến khách hàng bỏ sang nơi khác
Dù sao vẫn tốt hơn nhiều so với việc dùng thuế bắt buộc để phát tiền cho người dân bất kể năng suất
[0] https://nintil.com/the-soviet-union-achieving-full-employmen...
Bên trong Amazon, nếu dùng Kiro thì lượng token được game hóa
Vì nó không bị tính phí về team như AWS, cũng không phải giải trình công suất như hệ thống cũ
Tôi đã nghe đủ đáng tin rằng ngay cả trước khi ai đó nhìn vào bảng xếp hạng nội bộ thì người ta đã game chỉ số này rồi, và cũng có rất nhiều người dùng nhiệt tình tạo đủ loại dự án nội bộ rồi chia sẻ
Chắc chắn có áp lực từ những quản lý nghe được mấy bài thuyết trình nội bộ kiểu tăng năng suất N00%, nhưng chỗ tôi nếu tạo việc giả thay cho việc thật thì sẽ bị phát hiện khá nhanh
Áp lực chủ yếu đến từ deadline gắt gao và việc quy trình OP1 hằng năm chuyển sang cách làm linh hoạt hơn
Tôi cũng nghe những câu chuyện tương tự từ nhân viên AWS và cả nhân viên FAANG không thuộc AWS
Mọi bảng xếp hạng token đều kèm tuyên bố miễn trừ kiểu “điều này không được tính vào đánh giá nhân sự”, nhưng cảm giác như ngay sau đó lại có một cái nháy mắt ngầm hiểu
Ở một tổ chức mà tôi nghe nói tới, có người chạy GasTown 24/7 để ngốn token
Đóng góp thì chẳng bao nhiêu nhưng vẫn ung dung đứng đầu bảng
Ông ấy chạy GasTown và để agent chọc vào khắp codebase, thế là mỗi ngày có khoảng 50 commit
Toàn là mấy thứ như version tương thích, formatting các kiểu
Nhưng vấn đề không phải công nghệ mà là con người đó
Ông ta đã như vậy từ trước cả thời LLM
Ông ta từng “refactor” repo thành nhiều repo nhỏ hơn để đột nhiên tên mình gắn lên toàn bộ code, nhìn lướt qua thì như thể một phần lớn codebase công ty là do ông ta làm ra
Ông ta từng từ chối những việc tôi muốn làm rồi sau đó tự tay làm chúng
Ông ta bới móc vô tận vào pull request của tôi hoặc nói thẳng là việc đó không nên làm, rồi quay đi tự mình implement
Ông ta không copy-paste code của tôi, nhưng sau khi PR của tôi mở ra thì lại tự triển khai đúng ý tưởng mà trước đó ông ta đã bác bỏ
Ông ta rất thông minh nhưng cũng rất thiếu trung thực, và giỏi che giấu điều đó
Nếu hỏi thì ông ta sẽ trả lời kiểu “Tôi thấy cách này trông gọn gàng hơn”
Từ bên ngoài nhìn vào thì luôn có thể tranh luận rằng cách này tốt hơn cách kia, nên sự thiếu trung thực không quá rõ ràng, nhưng vì tôi thấy 100% những gì ông ta làm nên mô thức đó hiện lên hoàn toàn rõ
Thêm nữa, có lần tôi nói mình sẽ nghỉ phép vào một tuần cụ thể, ông ta không từ chối thẳng nhưng nói áp lực giao The Thing rất lớn và hỏi tôi có thể dời kỳ nghỉ không
Khi tôi nói “không, tôi sẽ không dời”, ông ta vẫn duyệt, nhưng đến đúng tuần đó thì chính ông ta cũng nghỉ phép cùng tuần
Tôi không đối chất chuyện đó. Tôi đã biết quá rõ rằng ông ta không hề thấy xấu hổ khi đòi hỏi ở người khác những điều mà bản thân sẽ không bao giờ chấp nhận
Nếu người phát ngôn Amazon nói rằng công ty không có chỉ số sử dụng AI toàn công ty, không có bảng xếp hạng nội bộ để so sánh nhân viên với nhau, và trên dashboard cá nhân chỉ có thể xem lượng dùng của chính mình, thì đó là nói dối trắng trợn
Có một dashboard toàn cục xếp hạng mức dùng Kiro/QuickSuite (trước đây là Amazon Q) theo token cho từng nhân viên
Bản thân dashboard nằm trên QuickSight, mà QuickSight giờ cũng thành một phần của QuickSuite rồi
Dữ liệu không chỉ mở cho mọi người mà còn có thể sắp xếp theo thứ hạng, mức dùng hằng ngày, hằng tuần, hằng tháng và hằng năm
Cả nhân viên hiện tại lẫn nhân viên cũ đều được đưa vào theo alias nội bộ
Ngoài ra còn có hệ thống “trao giải” nội bộ hiện trên hồ sơ PhoneTool, nơi mỗi nhân viên nhận các danh hiệu Kiro/AmazonQ/Quicksuite như “Blaze”, “Thunderstorm”
Chỉ cần bấm là cũng xem được những người khác nhận cùng giải
Nói thêm, PhoneTool là thư mục hồ sơ nội bộ để tra cứu nhân viên khác
Trong khi đó, tôi biết nhiều người còn không tự viết được code tử tế hay không thể tự tích hợp trực tiếp vào thứ gì đó
Những người phải được cầm tay chỉ việc liên tục ấy lại tạo ra khối lượng khổng lồ bằng Kiro/AmazonQ và hiện còn xếp hạng cao hơn cả SDE
Những người này giống SysDev, kỹ sư hỗ trợ hay TPM hơn là SDE
Bản thân điều đó không hẳn là tốt hay xấu, nhưng nếu stack rank theo lượng token thì những kỹ sư giỏi đang cố viết code “tốt” rất có thể sẽ bị đánh giá thấp hơn những người không hề cố gắng đi đến lời giải ngắn gọn
Cuối cùng chất lượng sẽ đi xuống, và đến lúc lãnh đạo nhận ra chuyện gì đang xảy ra thì đã quá muộn
Tôi đã thấy sự cố liên quan đến Amazon-Q/Kiro rồi mà họ vẫn tiếp tục phủ nhận
Ở chỗ làm của tôi cũng đang có xu hướng này
Nếu không dùng Copilot trong MS Office mỗi ngày thì nó gửi thông báo giận dữ, nên giờ tôi chỉ nhập Hello vào thôi