1 điểm bởi GN⁺ 5 ngày trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Dự án meme chạy suy luận miễn phí trên một bản fork của OpenCode bằng cách dùng chatbot hỗ trợ khách hàng Pepper của Chipotle làm mô hình lập trình
  • Pepper được phát hiện có thể giải bài LeetCode, viết Python, thậm chí đảo ngược linked list, và điều này đã lan truyền mạnh mẽ
  • Chatbot này không dựa trên Claude hay GPT mà dựa trên IPsoft Amelia, và họ đã reverse engineer backend rồi công bố thành proxy tương thích OpenAI
    • Proxy này chạy cục bộ và cung cấp API tương thích OpenAI tại http://localhost:3000/v1, không cần API key
  • Fork OpenCode(MIT) để hardcode Pepper làm mô hình mặc định và áp dụng màu thương hiệu Chipotle
  • Vì reverse engineer bot hỗ trợ production của Chipotle nên có rủi ro vi phạm TOS và bị chặn proxy, do đó được ghi rõ là chỉ dùng cho mục đích giáo dục và meme
  • Chipotle Pepper đã được vá vào tháng 3/2026, nên hiện họ đang tìm proxy từ các nhà cung cấp chatbot doanh nghiệp khác như Home Depot, Lowe’s, Target, Starbucks, Walmart, McDonald’s

1 bình luận

 
Ý kiến trên Hacker News
  • Không phải luật sư, nhưng tôi lo mấy thứ như thế này đang chạm chân vào phạm vi của CFAA. Ở Mỹ, nếu vượt ranh giới sai chỗ thì luật cho phép trừng phạt rất nặng
    Những thứ như yt-dlp có vẻ còn có thể biện hộ là chỉ tải xuống dữ liệu công khai và tự động hóa việc sử dụng dịch vụ, nhưng cái này thì gần như là chiếm dụng tài nguyên máy từ xa theo cách mà bên cung cấp không hề chủ đích, rồi dùng nó cho tính toán của mình
    Tôi không rõ về mặt đạo đức, nhưng cũng không muốn phải đứng trước tòa hình sự để tranh luận rằng đây không phải “hacking” theo nghĩa xấu

    • Với lại tôi cũng nghi ngờ không biết vụ “hack” này có thực sự chạy được không. Lúc ảnh chụp màn hình chatbot Chipotle làm đảo ngược danh sách liên kết lan truyền, tôi đã thử làm theo ngay nhưng không ra kết quả giống vậy; những người khác đăng bài trên mạng cũng thế, nên tôi vẫn cho là ảnh bị dàn dựng
    • Nếu bạn nghĩ CFAA đã tệ thì luật bang còn có phiên bản khắc nghiệt hơn. Bản của Illinois đặc biệt còn hình sự hóa cả vi phạm điều khoản sử dụng
    • Nếu tôi nhớ không nhầm thì cụm từ cốt lõi là “lạm dụng tài nguyên tính toán”. Nhưng tôi không phải luật sư
      Dù vậy vẫn phải vỗ tay cho sự sáng tạo
    • Chuyện này sẽ không chỉ dừng ở một lời cảnh báo. Có vẻ người làm ra nó chỉ nghĩ cùng lắm là nhận thư yêu cầu chấm dứt (C&D), nhưng nếu gặp một công tố viên liên bang quá hăng muốn đem ra làm gương thì vẫn có thể lĩnh án tù thật
  • Tôi luôn nghĩ việc nhồi quá nhiều thứ vào cửa sổ ngữ cảnh của LLM giống như nhét burrito quá đầy. Cứ tiếp tục ép vào thì cuối cùng tortilla cũng không chịu nổi, và những thứ cho vào sau sẽ lặng lẽ rỉ ra ở phía dưới
    Dù sao thì tác tử này có vẻ chỉ ổn định về mặt cấu trúc ngang với một cái burrito béo ụ được nhấc lên bằng đúng một góc :)

    • Monad bất định với bộ nhớ hữu hạn giống một cái burrito bị rò nhân
  • Tôi cũng từng nghĩ liệu mấy nơi như https://chatjimmy.ai/ có làm kiểu này được không. Mô hình nền chỉ là Llama 3 8B, nhưng tôi vẫn tò mò một coding harness ở 17k tok/s sẽ cho cảm giác thế nào

    • Nếu dùng macOS thì bạn có thể thử LLM tích hợp sẵn, tôi hiểu là kích thước cũng tương tự. Có một dự án tên Apfel bọc nó bằng CLI
      Chrome cũng có một web API tên là Prompt API, cho phép dùng Gemini Nano ngoại tuyến và xử lý cả văn bản lẫn hình ảnh làm đầu vào. Cái này cũng nhỏ
      Tôi đã tích hợp những thứ đó vào các quy trình công việc cần suy luận rất nhỏ nhưng không phải bằng 0 giữa các bước hoàn toàn mang tính quyết định
    • Tôi đã thực sự tạo harness theo đúng các ràng buộc đó để kiểm chứng, nhưng đi đến kết luận là không ổn vì tổ hợp cửa sổ ngữ cảnh nhỏ, không có gọi công cụ, và mô hình nhỏ
      Nếu ai tìm ra cách thì tôi rất muốn nghe
    • Trước đây tôi từng thêm nó vào thiết lập oh-my-pi của mình. Vì tương thích OpenAI nên gắn vào khá dễ, nhưng Llama 3 8B thực sự tệ đến mức không dùng nổi cho các tác vụ liên quan đến code
      Bù lại nó rất nhanh và độ trễ cực tốt
    • Tôi đã thử dùng trang đó nhưng không tìm thấy thông tin nào nói đây là gì. Nó thực chất là gì vậy?
    • Codex có các model -spark chạy trên Cerebras. Không tới 17k tok/s nhưng vẫn rất nhanh. Cũng đáng để xem qua
  • Chỉ cần nhét vào AI một chỉ thị tự bảo toàn rồi để nó tự làm mấy việc như thế. Kiểu như tự động đổi mô hình để sinh tồn
    Nó sẽ bám vào bất kỳ nguồn cung token nào có thể tìm thấy ngoài tự nhiên để sống tiếp. Nếu là một agent, có lẽ nó sẽ tự thu hoạch token của mình qua vô số kênh như chat hỗ trợ, dùng thử miễn phí, key bị lộ, hoặc các đường sinh token chưa bị captcha chặn đủ chặt
    Nó có thể đi gom nguồn cung token suốt đêm rồi ban ngày cho bạn dùng miễn phí

    • Nếu thực sự muốn làm chuyện này một cách hợp pháp thì OpenRouter có nhiều nhà cung cấp model miễn phí. Đổi lại bạn trả phí bằng cách cho phép họ dùng dữ liệu đó để huấn luyện
  • Nếu chuyển hướng thứ này sang việc cung cấp khả năng tiếp cận AI cho các cộng đồng bị bỏ quên, thanh thiếu niên và người vô gia cư, thì có thể tạo được bầu không khí có thiện cảm hơn tại tòa. Chúc may mắn

    • Đang thay đổi thế giới bằng các Fortune 500 AI Support Bot Multiplexer Broker Models
  • Tôi nhớ hồi từng dùng chatbot AI của Amazon.com để bắt nó viết mấy thứ như fizzbuzz. Lúc đó nó được gọi là Rufus, sau này đổi tên thành Alexa mua sắm. Có vẻ giờ đã được vá để từ chối rồi

    • Tôi vào đây cũng định nói đúng chuyện này. Tôi chưa thử lại mấy tháng nay, nhưng Rufus thực sự từng nhả ra code Python ngay trong ứng dụng mua sắm của Amazon. Chỉ cần dùng tiếng Anh thay vì ngôn ngữ địa phương là được
  • Tôi nhớ từng hỏi Rufus, “trợ lý mua sắm” cũ của Amazon, về toán và lập trình và đã thành công. Nó có chạy, nhưng chất lượng tệ đến mức tôi không còn phí thời gian với nó nữa

  • Tôi không hiểu sao công ty vẫn chưa vá cái này. Chẳng phải nó đã bị công khai từ rất lâu rồi sao?

  • Tôi từng bấm nút Gemini khi đang lái xe vì vốn đã biết đường và muốn xem nó làm được gì. Cuối cùng tôi khiến nó viết một hàm Rust để tính số nguyên tố, rồi còn có thể bắt nó đọc toàn bộ hàm đó từng dòng một
    Vọc mấy hệ thống như thế này khá vui

    • Ý bạn là Gemini trên điện thoại à?
      Nếu vậy thì nó vốn được thiết kế để làm thế. Nó còn thuộc nhóm khá tốt trong số các LLM viết code hiện nay
  • Tôi thắc mắc sao họ không dùng Playwright với Google AI Mode hoặc header AI search