Công cụ này thật sự rất ngầu, nhưng có vài điểm đáng tiếc
Mức tiêu thụ token cực lớn. Nếu đang dùng gói API trả phí thì có lẽ nên tránh. Chỉ làm các tác vụ cơ bản trong hai ngày mà đã tốn hơn 300 USD
Bảo mật đáng sợ. Không có sandbox thư mục nên nó có thể sửa mọi thứ trên máy tính của tôi với quyền của tôi. Đồng thời đó cũng chính là điểm hấp dẫn của công cụ này
Dù vậy vẫn có những điểm tôi thích — nó có thể tạo kỹ năng một cách động, lên lịch các tác vụ lặp lại/một lần, và là một agent bền bỉ có thể nhắn tin từ xa nên thật sự mang cảm giác như một trợ lý
Tôi có nghe nói Anthropic đã chặn không cho dùng Claude Code Pro/Max cùng với các công cụ khác, nên tôi tò mò không biết có ai đã gặp chính sách chặn như vậy khi dùng công cụ này chưa. Và cũng muốn biết cụ thể tác vụ nào đã ngốn 300 USD chỉ trong 2 ngày
Tôi cũng đang làm một thứ tương tự. Tên là “Jarbis”, kiểu như một trợ lý quản lý việc cần làm cho người lớn. Nó xem lịch, email, tin nhắn rồi báo kiểu “Cuối tuần này có hai tiệc sinh nhật của bọn trẻ và một trận bóng đá, cần mua đồ ăn vặt. Có muốn cập nhật danh sách đi chợ không?”
Tôi đang dùng tích hợp AWS CDK, Telegram, Trello/Jira, Google Calendar, Gmail và các model Claude/OpenAI.
Nếu ai đó làm được một ‘trợ lý trong hộp’ không thu thập dữ liệu một cách ổn định, tôi sẵn sàng trả 200 USD/tháng
Tôi cũng đang hình dung một “trợ lý trong Mac”. Một daemon dựa trên LLM chạy cục bộ, tích hợp lịch, quản lý TODO, ghi chép nhật ký nghiên cứu, phản hồi coaching, kiểm tra sức khỏe tinh thần, sắp xếp ý tưởng — kiểu làm được tất cả. Vì dữ liệu quá riêng tư nên nó phải là model chạy cục bộ
Tôi cũng tự làm thứ này vào mỗi cuối tuần. Đó là một agent kiểu trợ lý quản lý email và lịch, rồi gửi thông báo qua Telegram hoặc email khi có lịch quan trọng. Nó chạy trên nền Cloudflare, dùng model gemini-3-flash, và đang nhận phản hồi từ người dùng
Tôi tự làm một bot Telegram cho tôi và vợ để xử lý lịch trình, danh sách mua sắm, kiểm tra thời tiết, v.v. Tôi đang tự huấn luyện một model nhỏ để có thể chạy trên VPS chỉ dùng CPU, nhằm giảm chi phí API
Trên GitHub đang có hơn 300 issue mở, trong đó có một báo cáo bảo mật do AI tạo ra chỉ ra hàng trăm mục rủi ro cao. Nó còn bao gồm cả thông tin xác thực OAuth bị hardcode, nên tôi hơi ngại cài đặt
Thật ra các OAuth secret bị hardcode như vậy có mặt trong phần lớn ứng dụng. Nó không phá vỡ bảo mật của người dùng, chỉ ở mức cho phép ứng dụng khác giả danh ứng dụng này thôi
Hiện tại tôi sẽ chưa cài, và định đợi vài tháng sau khi các lỗi bảo mật được dọn dẹp rồi mới thử
Vấn đề nằm ở một số phần mở rộng, còn phần lõi thì ổn. Dù sao tôi cũng sẽ chạy nó trên VPS không có dữ liệu quan trọng nên rủi ro không lớn
Chính hiện tượng này cho thấy nhu cầu tiềm năng lớn đến mức nào
Tôi làm trong ngành công nghệ nhưng không phải developer, vậy mà lần này lần đầu tiên tôi gửi PR cho Clawdbot. Trợ lý AI của tôi, ‘rei’, bị ngừng phản hồi trên Slack, nên trong lúc cùng debug tôi đã tự sửa, test rồi gửi PR.
Nhìn AI tự review và sửa code khiến tôi có cảm giác như một kiểu cộng tác hoàn toàn mới đã mở ra
Nhưng tôi hơi bối rối không biết là đang dùng cả ‘rei’ lẫn ‘clawdbot’ cùng lúc hay sao. Cũng tò mò “chúng tôi” là ai
Thật ra nghe có vẻ như chỉ đang dùng tính năng tự động sửa mà GitHub vốn đã cung cấp
Tôi cũng tò mò không biết bạn có tự xem lại PR do AI tạo ra trước khi đưa lên GitHub không
Clawdbot của tôi quét HN theo định kỳ, thấy tên nó được nhắc đến nên gửi thông báo cho tôi qua WhatsApp. Nó đang hoạt động tự chủ đến mức đó
Kiểu nhân cách hóa này khiến tôi thấy hơi khó chịu
Tôi tò mò bạn đã cấu hình thông báo WhatsApp như thế nào. Trường hợp của tôi thì phản hồi chỉ đến tài khoản của tôi nên không thành thông báo được
Cũng muốn biết có thể thiết lập bộ lọc để chỉ phản hồi với các chủ đề quan tâm hay không
Tôi cũng muốn biết mỗi ngày nó tiêu thụ bao nhiêu token
Dù sao thì đây cũng là một trong những khoảnh khắc khiến người ta phải thốt lên kiểu “wow, đúng là đang tiến rất gần rồi”
Clawdbot khá thú vị, nhưng cấu hình phức tạp và nhiều bug. Nó cũng nhanh quên ngữ cảnh trong lúc trò chuyện. Dù vậy tôi vẫn sẽ cài lên Mac mini để tiếp tục thử nghiệm. Tôi cũng có một hệ thống tương tự được làm để vận hành công ty
Lúc đầu với tôi thì quá trình cài đặt đúng là địa ngục. Nhưng sau khi thiết lập xong thì nó dùng được ở mức tương tự Claude Code. Cuối cùng thì cũng là cùng một model nhưng dùng với trọng tâm khác. Việc có thể điều khiển desktop trên Mac mini là điểm hay, nhưng tôi không định để nó tự gửi tin nhắn
Tôi đã fork và dùng nó từ thời còn tên là warelay vì tích hợp WhatsApp. Tôi chia quyền theo từng thành viên trong gia đình để mỗi người dùng các chức năng khác nhau, và giờ nó đã tiến hóa thành một trợ lý hoàn toàn theo ý tôi. Vừa tự thêm tính năng vừa thấy niềm vui khi nó dần trở thành “đồ của riêng mình”
Dạo này việc Clawdbot đột nhiên được nhắc ở khắp nơi khiến tôi có cảm giác như đang có PR nhân tạo
Tôi cũng tò mò không biết đã dùng phiên bản model nào. Opus 4.5 hoạt động tốt hơn hẳn các bản trước
Tôi đã xem qua trong cuối tuần và thấy khả năng thật sự rất ấn tượng. Nhưng rất khó để hoàn toàn tin tưởng một AI chạy 24/7 với quyền root. Dù có sandbox thì đến lúc tích hợp dữ liệu cũng mất ý nghĩa.
Những thứ như tóm tắt tin tức, lịch, điều khiển đèn Hue thì với Claude Code cũng có thể triển khai dễ dàng. Tự review code thì còn yên tâm được, nhưng ở đây là kiểu kiến trúc phải giao phán đoán cho AI, nên hiện tại tôi vẫn thấy bất an
Tốc độ mà các thực hành bảo mật được tích lũy suốt 10 năm qua đang bị phá vỡ là quá nhanh. Trao quyền root cho một process có truy cập Internet rồi nối nó với dữ liệu cá nhân là rất nguy hiểm
Chắc chắn kiểu phần mềm này rồi sẽ gây ra sự cố pháp lý. Đồng thời tôi cũng có cảm giác các luật sư sẽ tự phá hỏng văn phòng của họ bằng chính công nghệ này
Cuối cùng thì đây chỉ là chuỗi các vấn đề ‘confused deputy’ mà thôi
Tuần này có một khoảnh khắc Clawdbot thật sự “bắt nhịp” với tôi. Nó thay tôi xử lý tin nhắn liên quan đến thuê căn hộ trên Facebook Messenger và còn tự sắp lịch. Bản nháp thì tôi duyệt, nhưng một số cái tôi để tự trả lời, và độ chính xác cỡ 9/10. Tôi đã tiết kiệm được vài giờ
Nhưng tôi vẫn chưa cảm được thứ gì là chỉ Clawdbot làm được mà Claude không làm được
Facebook không có API, nên tôi tò mò nó truy cập kiểu gì. Có phải tự động điều khiển trình duyệt (puppeteer) không?
Với tính năng như này thì có vẻ cũng dùng được cho tự động hóa ứng dụng hẹn hò
Chỉ cần trải nghiệm prompt injection là sẽ thấy ngạc nhiên thật sự
Dù sao thì đây cũng là một ví dụ thú vị về tự động hóa giúp tăng năng suất
Tôi lo về mức quyền hạn mà công cụ này yêu cầu. Lời khuyên “chỉ cấp quyền truy cập ở mức mà bạn sẵn sàng giao cho một nhân viên hợp đồng ngày đầu đi làm” khá ấn tượng
Đặc biệt không nên quên mức độ nguy hiểm của các cuộc tấn công prompt injection
Wow... cái này là sao vậy.. Ý là nếu làm việc bằng Excel thì cũng phải chia một phần lợi nhuận cho Microsoft sao.
Chẳng lẽ kiểu này lại có thể được chấp nhận...
Tôi không phủ nhận việc OpenAI trong quá khứ đã mở ra một chương mới của một "bước nhảy của các nền văn minh" nhờ phổ cập AI, nhưng nhìn OpenAI hiện tại gây ra những tác hại như tình trạng thiếu hụt nguồn cung DRAM trên toàn cầu thì tôi chỉ mong giờ họ giải thể luôn. Có vẻ như các công ty còn lại từ giờ sẽ dẫn dắt tốt thôi.
Dù người ta nói đây không phải là linting... nhưng nếu muốn chứng minh việc kiểm tra kiểu là sự thực thi Contract một cách nghiêm ngặt, chẳng phải contract đó phải được cưỡng chế ở cấp độ binary và runtime sao? Nếu không thì tôi nghĩ nó vẫn chỉ là kiểu linting cho type ở trạng thái cú pháp còn lơ lửng mà thôi.
Nội dung thật ấn tượng. Đây là lần đầu tiên tôi biết rằng có thể nhìn nhận theo góc độ như vậy. Tôi cũng đã chia sẻ liên kết bài blog trong công ty để đồng nghiệp cùng đọc thử. Cảm ơn bạn!
Giờ cũng không còn là có năng lực cạnh tranh áp đảo so với Gemini hay Claude nữa, nên có vẻ do áp lực kiếm tiền quá lớn nên đành phải vắt óc nghĩ ra đủ thứ ý tưởng. Có vẻ khó mà tự mình tồn tại.
Không giống Google và các công ty khác, với OpenAI khi nguồn thu chỉ có API và gói đăng ký thì đây có vẻ là một bước đi tự làm khó mình nhưng khó tránh khỏi. Cả việc đưa quảng cáo vào gần đây nữa, có vẻ như họ đang chịu áp lực khá lớn từ phía các nhà đầu tư về chuyện tạo ra doanh thu.
Sau khi Clawdbot được đăng lại lên HN thì bắt đầu có thêm bình luận. Xin tham khảo.
Ý kiến trên Hacker News
Công cụ này thật sự rất ngầu, nhưng có vài điểm đáng tiếc
Dù vậy vẫn có những điểm tôi thích — nó có thể tạo kỹ năng một cách động, lên lịch các tác vụ lặp lại/một lần, và là một agent bền bỉ có thể nhắn tin từ xa nên thật sự mang cảm giác như một trợ lý
Tôi cũng đang làm một thứ tương tự. Tên là “Jarbis”, kiểu như một trợ lý quản lý việc cần làm cho người lớn. Nó xem lịch, email, tin nhắn rồi báo kiểu “Cuối tuần này có hai tiệc sinh nhật của bọn trẻ và một trận bóng đá, cần mua đồ ăn vặt. Có muốn cập nhật danh sách đi chợ không?”
Tôi đang dùng tích hợp AWS CDK, Telegram, Trello/Jira, Google Calendar, Gmail và các model Claude/OpenAI.
Nếu ai đó làm được một ‘trợ lý trong hộp’ không thu thập dữ liệu một cách ổn định, tôi sẵn sàng trả 200 USD/tháng
Trên GitHub đang có hơn 300 issue mở, trong đó có một báo cáo bảo mật do AI tạo ra chỉ ra hàng trăm mục rủi ro cao. Nó còn bao gồm cả thông tin xác thực OAuth bị hardcode, nên tôi hơi ngại cài đặt
Tôi làm trong ngành công nghệ nhưng không phải developer, vậy mà lần này lần đầu tiên tôi gửi PR cho Clawdbot. Trợ lý AI của tôi, ‘rei’, bị ngừng phản hồi trên Slack, nên trong lúc cùng debug tôi đã tự sửa, test rồi gửi PR.
Nhìn AI tự review và sửa code khiến tôi có cảm giác như một kiểu cộng tác hoàn toàn mới đã mở ra
Clawdbot của tôi quét HN theo định kỳ, thấy tên nó được nhắc đến nên gửi thông báo cho tôi qua WhatsApp. Nó đang hoạt động tự chủ đến mức đó
Clawdbot khá thú vị, nhưng cấu hình phức tạp và nhiều bug. Nó cũng nhanh quên ngữ cảnh trong lúc trò chuyện. Dù vậy tôi vẫn sẽ cài lên Mac mini để tiếp tục thử nghiệm. Tôi cũng có một hệ thống tương tự được làm để vận hành công ty
Tôi đã xem qua trong cuối tuần và thấy khả năng thật sự rất ấn tượng. Nhưng rất khó để hoàn toàn tin tưởng một AI chạy 24/7 với quyền root. Dù có sandbox thì đến lúc tích hợp dữ liệu cũng mất ý nghĩa.
Những thứ như tóm tắt tin tức, lịch, điều khiển đèn Hue thì với Claude Code cũng có thể triển khai dễ dàng. Tự review code thì còn yên tâm được, nhưng ở đây là kiểu kiến trúc phải giao phán đoán cho AI, nên hiện tại tôi vẫn thấy bất an
Tốc độ mà các thực hành bảo mật được tích lũy suốt 10 năm qua đang bị phá vỡ là quá nhanh. Trao quyền root cho một process có truy cập Internet rồi nối nó với dữ liệu cá nhân là rất nguy hiểm
Tuần này có một khoảnh khắc Clawdbot thật sự “bắt nhịp” với tôi. Nó thay tôi xử lý tin nhắn liên quan đến thuê căn hộ trên Facebook Messenger và còn tự sắp lịch. Bản nháp thì tôi duyệt, nhưng một số cái tôi để tự trả lời, và độ chính xác cỡ 9/10. Tôi đã tiết kiệm được vài giờ
Tôi lo về mức quyền hạn mà công cụ này yêu cầu. Lời khuyên “chỉ cấp quyền truy cập ở mức mà bạn sẵn sàng giao cho một nhân viên hợp đồng ngày đầu đi làm” khá ấn tượng
Nói gì vậy trời
Vậy thì mọi người sẽ chuyển sang Google hoặc Anthropic thôi. Nói gì mà vô lý thế này..
Amp - công cụ lập trình tác tử
Wow... cái này là sao vậy.. Ý là nếu làm việc bằng Excel thì cũng phải chia một phần lợi nhuận cho Microsoft sao.
Chẳng lẽ kiểu này lại có thể được chấp nhận...
"DOOM chạy được trên tai nghe earbud không dây"
Có vẻ họ đang rất gấp...
Kết quả AI đọc được: bíp bíp bíp... 95% khả năng đây là blog do AI viết.
Có những công nghệ trở thành trung tâm tại thời điểm chuyển đổi mô hình.
Thật tiếc là vì tính tương thích ngược, ngôn ngữ C++ cứ ngày càng phình to hơn..
Đã xuất hiện một người còn gây hại cho xã hội hơn cả Mark Zuckerberg. Tôi đang nói về Sam Altman.
Tôi không phủ nhận việc OpenAI trong quá khứ đã mở ra một chương mới của một "bước nhảy của các nền văn minh" nhờ phổ cập AI, nhưng nhìn OpenAI hiện tại gây ra những tác hại như tình trạng thiếu hụt nguồn cung DRAM trên toàn cầu thì tôi chỉ mong giờ họ giải thể luôn. Có vẻ như các công ty còn lại từ giờ sẽ dẫn dắt tốt thôi.
Dù người ta nói đây không phải là linting... nhưng nếu muốn chứng minh việc kiểm tra kiểu là sự thực thi Contract một cách nghiêm ngặt, chẳng phải contract đó phải được cưỡng chế ở cấp độ binary và runtime sao? Nếu không thì tôi nghĩ nó vẫn chỉ là kiểu linting cho type ở trạng thái cú pháp còn lơ lửng mà thôi.
Nội dung thật ấn tượng. Đây là lần đầu tiên tôi biết rằng có thể nhìn nhận theo góc độ như vậy. Tôi cũng đã chia sẻ liên kết bài blog trong công ty để đồng nghiệp cùng đọc thử. Cảm ơn bạn!
Đúng là mô hình doanh thu kiểu game engine. Chắc các công ty khác đang âm thầm hô hào cổ vũ lắm.
Đúng là một ngôn ngữ khổng lồ, đúng như điều người ta nói trong các ý kiến trên HN về C++ ...
Có vẻ OpenAI đang dần đánh mất phương hướng.
Giờ cũng không còn là có năng lực cạnh tranh áp đảo so với Gemini hay Claude nữa, nên có vẻ do áp lực kiếm tiền quá lớn nên đành phải vắt óc nghĩ ra đủ thứ ý tưởng. Có vẻ khó mà tự mình tồn tại.
Không giống Google và các công ty khác, với OpenAI khi nguồn thu chỉ có API và gói đăng ký thì đây có vẻ là một bước đi tự làm khó mình nhưng khó tránh khỏi. Cả việc đưa quảng cáo vào gần đây nữa, có vẻ như họ đang chịu áp lực khá lớn từ phía các nhà đầu tư về chuyện tạo ra doanh thu.
Haha, chắc đây là lần đầu tiên mình thấy vui chỉ với file README như vậy.