- Muốn kiểm tra hiệu năng của Computer Use API mới của Claude, nhưng dự án mẫu mặc định có vẻ quá nặng
- Agent là một ứng dụng Electron đơn giản cho phép Claude 3.5 Sonnet trực tiếp điều khiển máy tính cục bộ
- Tác giả đã định thêm chế độ "bán tự động" với xác nhận từng bước từ người dùng, nhưng thấy mỗi bước quá chậm nên kết luận là không cần thiết
- Nếu mô hình bị rối, có thể nhấn nút "Dừng" để kết thúc quá trình chạy
Bắt đầu
git clone https://github.com/corbt/agent.exe
cd agent.exe
npm install
- Đổi tên
.env.example thành .env rồi thêm Anthropic API Key
npm start
- Yêu cầu mô hình thực hiện một tác vụ thú vị trên máy tính
Hệ thống hỗ trợ
- MacOS
- Về lý thuyết cũng có thể hỗ trợ Windows và Linux (mọi dependency đều đa nền tảng)
Hạn chế đã biết
- Chỉ hoạt động trên màn hình chính
- AI có thể kiểm soát hoàn toàn máy tính
- Có lẽ còn nhiều vấn đề khác nữa
Mẹo
- Claude rất ưu tiên Firefox
- Có thể dùng trình duyệt khác, nhưng cài Firefox sẽ giúp hoạt động tốt hơn
Lộ trình
- Đây là dự án được viết trong 6 giờ, nên có lẽ sẽ không phát triển thêm nhiều
- Nhưng nếu có PR hay, tác giả sẽ xem xét rồi merge
Tóm tắt của GN⁺
- Dự án này cung cấp một cách đơn giản để thử nghiệm Computer Use API của Claude
- AI có thể kiểm soát hoàn toàn máy tính nên có thể phát sinh lo ngại về bảo mật
- Khả năng tương thích với Firefox rất tốt và hiện chủ yếu dùng được trên MacOS
- Một số dự án có chức năng tương tự gồm AutoHotkey hoặc Sikuli
1 bình luận
Ý kiến Hacker News
Tôi nghĩ ý tưởng của Kyle rất tuyệt, và với tư cách là một lập trình viên Electron và tự động hóa desktop giàu kinh nghiệm, tôi cảm thấy đáng để đọc mã nguồn và thử với các tác vụ cơ bản
Tôi tự hỏi sẽ mất bao lâu trước khi người ta không nhận ra việc thêm một daemon vào hệ thống
Tôi nhớ vài năm trước từng có câu chuyện trên tin tức: "Alexa, đặt mua một căn nhà búp bê đi"
Tôi tò mò về cách tự động hóa các ứng dụng GUI không phải trình duyệt trên Linux với Wayland
Tôi thắc mắc vì sao lại có tên .exe khi nó có vẻ là một ứng dụng đa nền tảng nhưng chủ yếu hỗ trợ macOS
Gần đây tôi đã thử Cursor, bắt đầu một dự án full-stack từ đầu ở chế độ "compose", và tôi rất ngạc nhiên về kết quả
Có những giới hạn đã biết khiến AI không thể hoàn toàn chiếm quyền điều khiển máy tính
Việc tạo một môi trường air-gap và để nó tự viết hệ điều hành riêng có thể sẽ rất ngầu, nhưng tôi không muốn để nó đến gần dữ liệu thật
Có vẻ như nó chỉ hoạt động với các tác vụ đơn giản
Tôi muốn máy tính tạo meme cả ngày, còn tôi thì chăm sóc gia đình, làm vườn và kiếm tiền từ crypto