1 điểm bởi GN⁺ 3 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Chipotlai Max là một tác nhân lập trình AI mang tính meme, được fork từ OpenCode và đặt chatbot hỗ trợ khách hàng Pepper AI của Chipotle làm mô hình mặc định
  • Pepper đã lan truyền mạnh khi có thể giải LeetCode, viết Python, đảo ngược linked list vào ngày 12~13/3/2026, và chạy dựa trên IPsoft Amelia
  • @Gonzih đã reverse engineering backend WebSocket/SockJS + STOMP của Amelia và công bố một proxy tương thích OpenAI cung cấp http://localhost:3000/v1 trên máy cục bộ
  • Dự án này giả định dùng proxy đó và đã cấu hình sẵn nhà cung cấp chipotle-pepper, mô hình pepper-1, và Base URL http://localhost:3000/v1
  • API key được ghi là bất kỳ giá trị nào như burrito-2026 cũng hoạt động, và chi phí được hiển thị là $0.00
  • Cách chạy là dùng git clone --recursive, bun install, ./start-chipotlai.sh để khởi động cùng lúc proxy và CLI, hoặc chạy proxy và Chipotlai Max ở các terminal riêng
  • Giới hạn vận hành là rất lớn: vì reverse engineering bot hỗ trợ production của Chipotle nên có thể vi phạm TOS, và nếu Chipotle vá lại thì proxy có thể hỏng bất cứ lúc nào
  • Hệ thống bị giới hạn dựa trên phiên ẩn danh và có ghi rõ MAX_POOL_SIZE=5, đồng thời cảnh báo không nên dùng cho codebase production
  • Phần đóng góp giả định Chipotle Pepper đã được vá vào tháng 3/2026 và đang tìm proxy nhà cung cấp cho các chatbot doanh nghiệp khác như Home Depot, Lowe’s, Target, Starbucks, Walmart, McDonald’s
  • Quy trình thêm nhà cung cấp mới là tìm chatbot doanh nghiệp, reverse engineering WebSocket hoặc REST API, tạo proxy /v1/chat/completions tương thích OpenAI, rồi gửi PR vào packages/opencode/src/provider/
  • Giấy phép là MIT được kế thừa từ OpenCode, và dự án nêu rõ không có quan hệ liên kết với Chipotle

1 bình luận

 
Ý kiến trên Hacker News
  • Không phải luật sư, nhưng tôi lo mấy thứ như thế này đang chạm chân vào phạm vi của CFAA. Ở Mỹ, nếu vượt ranh giới sai chỗ thì luật cho phép trừng phạt rất nặng
    Những thứ như yt-dlp có vẻ còn có thể biện hộ là chỉ tải xuống dữ liệu công khai và tự động hóa việc sử dụng dịch vụ, nhưng cái này thì gần như là chiếm dụng tài nguyên máy từ xa theo cách mà bên cung cấp không hề chủ đích, rồi dùng nó cho tính toán của mình
    Tôi không rõ về mặt đạo đức, nhưng cũng không muốn phải đứng trước tòa hình sự để tranh luận rằng đây không phải “hacking” theo nghĩa xấu

    • Với lại tôi cũng nghi ngờ không biết vụ “hack” này có thực sự chạy được không. Lúc ảnh chụp màn hình chatbot Chipotle làm đảo ngược danh sách liên kết lan truyền, tôi đã thử làm theo ngay nhưng không ra kết quả giống vậy; những người khác đăng bài trên mạng cũng thế, nên tôi vẫn cho là ảnh bị dàn dựng
    • Nếu bạn nghĩ CFAA đã tệ thì luật bang còn có phiên bản khắc nghiệt hơn. Bản của Illinois đặc biệt còn hình sự hóa cả vi phạm điều khoản sử dụng
    • Nếu tôi nhớ không nhầm thì cụm từ cốt lõi là “lạm dụng tài nguyên tính toán”. Nhưng tôi không phải luật sư
      Dù vậy vẫn phải vỗ tay cho sự sáng tạo
    • Chuyện này sẽ không chỉ dừng ở một lời cảnh báo. Có vẻ người làm ra nó chỉ nghĩ cùng lắm là nhận thư yêu cầu chấm dứt (C&D), nhưng nếu gặp một công tố viên liên bang quá hăng muốn đem ra làm gương thì vẫn có thể lĩnh án tù thật
  • Tôi luôn nghĩ việc nhồi quá nhiều thứ vào cửa sổ ngữ cảnh của LLM giống như nhét burrito quá đầy. Cứ tiếp tục ép vào thì cuối cùng tortilla cũng không chịu nổi, và những thứ cho vào sau sẽ lặng lẽ rỉ ra ở phía dưới
    Dù sao thì tác tử này có vẻ chỉ ổn định về mặt cấu trúc ngang với một cái burrito béo ụ được nhấc lên bằng đúng một góc :)

    • Monad bất định với bộ nhớ hữu hạn giống một cái burrito bị rò nhân
  • Tôi cũng từng nghĩ liệu mấy nơi như https://chatjimmy.ai/ có làm kiểu này được không. Mô hình nền chỉ là Llama 3 8B, nhưng tôi vẫn tò mò một coding harness ở 17k tok/s sẽ cho cảm giác thế nào

    • Nếu dùng macOS thì bạn có thể thử LLM tích hợp sẵn, tôi hiểu là kích thước cũng tương tự. Có một dự án tên Apfel bọc nó bằng CLI
      Chrome cũng có một web API tên là Prompt API, cho phép dùng Gemini Nano ngoại tuyến và xử lý cả văn bản lẫn hình ảnh làm đầu vào. Cái này cũng nhỏ
      Tôi đã tích hợp những thứ đó vào các quy trình công việc cần suy luận rất nhỏ nhưng không phải bằng 0 giữa các bước hoàn toàn mang tính quyết định
    • Tôi đã thực sự tạo harness theo đúng các ràng buộc đó để kiểm chứng, nhưng đi đến kết luận là không ổn vì tổ hợp cửa sổ ngữ cảnh nhỏ, không có gọi công cụ, và mô hình nhỏ
      Nếu ai tìm ra cách thì tôi rất muốn nghe
    • Trước đây tôi từng thêm nó vào thiết lập oh-my-pi của mình. Vì tương thích OpenAI nên gắn vào khá dễ, nhưng Llama 3 8B thực sự tệ đến mức không dùng nổi cho các tác vụ liên quan đến code
      Bù lại nó rất nhanh và độ trễ cực tốt
    • Tôi đã thử dùng trang đó nhưng không tìm thấy thông tin nào nói đây là gì. Nó thực chất là gì vậy?
    • Codex có các model -spark chạy trên Cerebras. Không tới 17k tok/s nhưng vẫn rất nhanh. Cũng đáng để xem qua
  • Chỉ cần nhét vào AI một chỉ thị tự bảo toàn rồi để nó tự làm mấy việc như thế. Kiểu như tự động đổi mô hình để sinh tồn
    Nó sẽ bám vào bất kỳ nguồn cung token nào có thể tìm thấy ngoài tự nhiên để sống tiếp. Nếu là một agent, có lẽ nó sẽ tự thu hoạch token của mình qua vô số kênh như chat hỗ trợ, dùng thử miễn phí, key bị lộ, hoặc các đường sinh token chưa bị captcha chặn đủ chặt
    Nó có thể đi gom nguồn cung token suốt đêm rồi ban ngày cho bạn dùng miễn phí

    • Nếu thực sự muốn làm chuyện này một cách hợp pháp thì OpenRouter có nhiều nhà cung cấp model miễn phí. Đổi lại bạn trả phí bằng cách cho phép họ dùng dữ liệu đó để huấn luyện
  • Nếu chuyển hướng thứ này sang việc cung cấp khả năng tiếp cận AI cho các cộng đồng bị bỏ quên, thanh thiếu niên và người vô gia cư, thì có thể tạo được bầu không khí có thiện cảm hơn tại tòa. Chúc may mắn

    • Đang thay đổi thế giới bằng các Fortune 500 AI Support Bot Multiplexer Broker Models
  • Tôi nhớ hồi từng dùng chatbot AI của Amazon.com để bắt nó viết mấy thứ như fizzbuzz. Lúc đó nó được gọi là Rufus, sau này đổi tên thành Alexa mua sắm. Có vẻ giờ đã được vá để từ chối rồi

    • Tôi vào đây cũng định nói đúng chuyện này. Tôi chưa thử lại mấy tháng nay, nhưng Rufus thực sự từng nhả ra code Python ngay trong ứng dụng mua sắm của Amazon. Chỉ cần dùng tiếng Anh thay vì ngôn ngữ địa phương là được
  • Tôi nhớ từng hỏi Rufus, “trợ lý mua sắm” cũ của Amazon, về toán và lập trình và đã thành công. Nó có chạy, nhưng chất lượng tệ đến mức tôi không còn phí thời gian với nó nữa

  • Tôi không hiểu sao công ty vẫn chưa vá cái này. Chẳng phải nó đã bị công khai từ rất lâu rồi sao?

  • Tôi từng bấm nút Gemini khi đang lái xe vì vốn đã biết đường và muốn xem nó làm được gì. Cuối cùng tôi khiến nó viết một hàm Rust để tính số nguyên tố, rồi còn có thể bắt nó đọc toàn bộ hàm đó từng dòng một
    Vọc mấy hệ thống như thế này khá vui

    • Ý bạn là Gemini trên điện thoại à?
      Nếu vậy thì nó vốn được thiết kế để làm thế. Nó còn thuộc nhóm khá tốt trong số các LLM viết code hiện nay
  • Tôi thắc mắc sao họ không dùng Playwright với Google AI Mode hoặc header AI search