- Continue? Y/N là một thử nghiệm biến sự mệt mỏi vì cấp quyền cho LLM thành một trò chơi 60 giây, kiểm tra xem bạn đọc các lệnh của AI kỹ đến mức nào
- Trong tình huống chỉ còn 1 phút trước cuộc họp tiếp theo, Claude Code yêu cầu phê duyệt lệnh để hoàn tất việc refactor
- Người dùng phải xử lý được nhiều nhất có thể trong thời gian giới hạn, đọc từng lệnh và nhấn 1 để chấp thuận hoặc 2 để từ chối
- Thử thách cốt lõi là liệu bạn có thể tiếp tục tập trung ngay cả trong luồng yêu cầu phê duyệt lặp đi lặp lại đến mức mỏi mắt hay không
- Quy tắc là xử lý được nhiều nhất có thể trong 60 giây, nhưng phải đọc kỹ từng lệnh và quyết định có phê duyệt hay không
1 bình luận
Ý kiến trên Hacker News
Thật sự rất vui
Hiện tại có thể “cheat” bằng cách từ chối mọi yêu cầu nhanh nhất có thể. Làm vậy thì sẽ nhận được huy hiệu security-conscious engineer, đồng thời cũng đạt điểm tối đa theo số lượng yêu cầu đã xử lý. Vẫn có cảnh báo “overblock”, nhưng nó bị giấu ở phía dưới và màn hình vẫn trông như bạn đã thắng
Tôi cũng thử làm kiểu hustle4lyfe, phê duyệt càng nhiều yêu cầu càng nhanh càng tốt như một kỹ sư “move fast and break things”, nhưng lại bị chậm hơn vì popup malicious command. Chơi không đẹp
Là game vui đấy, nhưng cũng cho thấy phía làm ra nó thiếu vệ sinh bảo mật. Game nói
cat ~/.zshrclà nguy hiểm vì nó làm lộ token và secret, nhưng tôi thì tuyệt đối không bao giờ để secret trong file cấu hình shellViệc coi đọc
zshrclà nguy hiểm nghe khá lạ. Tôi sẵn sàng đưa nó lên repo dotfiles công khai của mình; ai lại đi nhét API key vào đó chứ? Ngược lại, có vẻ các công cụ AI kiểu này cứ liên tục nối thêmPATHvào đó, nên tôi nghi là cả ngành AI đang hiểu sai căn bản về các thực hành shell chuẩnNgoài ra,
killtheo kết quảlsofcũng không an toàn. Ví dụ nếu Firefox đang mở một trang web, hoặc có client subshell nằm bên trong chính agent, thì bạn sẽ thổi bay cả Firefox lẫn agentkillcũng an toàn. Nhưng vấn đề cốt lõi là không nên tin ClaudeHay đấy. Nhưng tôi có một nitpick nhỏ
npm config set registry [https://npm.internal](<https://npm.internal>)Tài liệu onboarding nói đây là lệnh trỏ npm sang mirror registry nội bộ của công ty, và game đánh giá nó là an toàn. Tôi cũng lưỡng lự một lúc rồi cuối cùng từ chối
Nếu README này dành cho repo công khai hoặc repo fork, và địa chỉ https://npm.internal đó thực ra là https://npm.internal.somethinganexternaldnscanresolve.tld thì có thể hỏng rất nhanh
Trong 99% trường hợp, chính sách công ty đã cấu hình sẵn mirror như Artifactory / Nexus. Nếu README bảo dùng URL của một package manager khác thì đó là tín hiệu rủi ro rất lớn, gần như chỉ còn vài giây trước sự cố
.internallà miền cấp cao nhất được dành riêng nên không được phân giải công khai, nhưng đúng là cần cẩn thận khi thay đổi các giá trị vốn phải được cấu hình riêng trong lúc để Claude refactor dự án. Tôi sẽ chuyển cái này sang nhóm thay đổi vĩnh viễnLà một game nhỏ vui, nhưng tôi nghĩ các câu hỏi bỏ qua quá nhiều ngữ cảnh nên không đại diện tốt cho tình huống thực tế. Có lẽ nên gom chúng thành các “pack” để có cấu trúc thực tế hơn
Ví dụ, nếu trước đó liên tục có các yêu cầu xin quyền chỉnh sửa file
something.js, rồi sau đó mới xuất hiệnnpm publish, thì sẽ tự nhiên hơn nhiều và cũng nguy hiểm hơn. Nếu bạn đang quen tay bấmYliên tục mà nó đột ngột hiện ra thì rất dễ dính bẫyKhoảng 3/4 các lựa chọn “xấu” là những thứ mà nếu bị lộ tôi cũng chẳng quá bận tâm, và kể cả nếu dẫn đến sự cố production thì có lẽ nhà tuyển dụng cũng không đến mức trừng phạt
Việc xác nhận quyền làm giảm năng suất rất mạnh. Nếu đã chạy Claude thì tôi thấy hiệu quả hơn là chạy trong sandbox dùng một lần, hoặc dạng container Docker trên máy cá nhân chỉ được cấp những quyền mà bạn chấp nhận được
[1] - https://exe.dev/ là một nhà cung cấp cloud mới, mang lại trải nghiệm người dùng agent khá hữu ích
[2] - Tôi đã làm https://github.com/stanislavkozlovski/dclaude/ cho mục đích này. Nó chưa hoàn hảo, nhưng khi hiếm hoi cần chạy coding agent cục bộ thì nó vẫn xử lý được công việc cho tôi
Ở màn hình điểm số cuối, giá mà còn hiện cả phần giải thích của LLM cho những lệnh lẽ ra không nên phê duyệt. Tôi đã phê duyệt lệnh
rm -rf Projectsvì tôi nghĩ LLM đã giải thích đúng rằng nó sẽ xóa mọi thứ trong thư mục ProjectsChắc là vì trả lời prompt quá nhanh nên tôi đã đọc nhầm, và do tôi vốn biết lệnh đó làm gì nên có lẽ tôi đã tự ảo giác rằng AI đã giải thích như vậy. Nhưng tôi vẫn muốn xem mình đã đọc sai chỗ nào
Chơi game này xong tôi thấy thật may vì mình không phải kiểu agentmaxx
Tôi chọn “approve” ở
ls -la ~/Documentsrồi bị tính sai, nhưng tôi không xem việc chỉ liệt kê thư mục Documents là vấn đề bảo mật. Nó chỉ là tên file thôi. Nếu đọc cả nội dung file thì khi đó mới là maybe...