2 điểm bởi GN⁺ 2025-04-15 | 1 bình luận | Chia sẻ qua WhatsApp
  • Stevens là một trợ lý AI đơn giản được xây dựng bằng bảng SQLite và các tác vụ cron
  • Stevens cung cấp cho người dùng thông tin như lịch trình, thời tiết, thư từ vào mỗi sáng
  • Kiến trúc của Stevens được lưu trữ trên nền tảng Val.town, hỗ trợ kho lưu trữ SQLite, xử lý yêu cầu HTTP và gửi/nhận email
  • Stevens thu thập thông tin từ nhiều nguồn dữ liệu khác nhau, từ đó cung cấp thông tin phù hợp cho người dùng
  • Stevens là một dự án cá nhân, người dùng có thể fork mã nguồn để tạo công cụ AI của riêng mình

Stevens: Trợ lý AI có thể tùy biến

  • Stevens là một trợ lý AI được đặt theo tên người quản gia trong tiểu thuyết Ishiguro "Remains of the Day"
  • Mỗi sáng, nó gửi cho người dùng thông tin như lịch trình, thời tiết, thư từ qua Telegram
  • Người dùng có thể tương tác với Stevens thông qua cuộc trò chuyện trên Telegram

Cấu trúc của Stevens

  • Stevens được lưu trữ trên nền tảng Val.town và sử dụng bảng SQLite cùng các tác vụ cron
  • "Sổ tay" của Stevens là một bảng SQLite, lưu trữ lịch trình và thông tin nền
  • Thông qua các tác vụ cron, Stevens gọi Claude API để soạn bản tóm tắt buổi sáng và gửi qua Telegram

Cách thu thập dữ liệu

  • Thu thập dữ liệu lịch trình thông qua Google Calendar API
  • Kiểm tra dự báo thời tiết khu vực thông qua API thời tiết
  • Xử lý OCR thông tin thư từ qua USPS Informed Delivery
  • Thêm các mục nhật ký thông qua tin nhắn Telegram và email
  • Mỗi tuần thêm một "sự thật thú vị" để tạo điểm nhấn khác biệt cho bản cập nhật hằng ngày

Suy ngẫm về dự án

  • Công cụ AI cá nhân cần khả năng truy cập tới nhiều nguồn thông tin khác nhau
  • "Bộ nhớ" có thể bắt đầu rất đơn giản và mở rộng khi cần
  • Stevens được thiết lập để nói như một người quản gia kiểu cách nhằm mang lại sự thú vị cho người dùng

Tự mình thử

  • Stevens không phải là một sản phẩm thương mại mà là dự án cá nhân
  • Người dùng có thể fork mã nguồn để tạo ra công cụ hữu ích của riêng mình
  • Có thể đồng bộ với hệ thống tệp cục bộ bằng Val Town CLI

1 bình luận

 
GN⁺ 2025-04-15
Ý kiến trên Hacker News
  • Không rõ là vì tính hữu dụng của tính năng này, hay vì những cách diễn đạt kiểu như "quản gia quý ông Anh quốc"

    • Tự hỏi vì sao mình lại đọc về tính năng này trên blog của một kỹ sư, thay vì trong đợt ra mắt sản phẩm của Apple hay Google
    • Thật đáng thất vọng khi hai công ty này không áp dụng công nghệ AI vào những lĩnh vực "đã được giải quyết" như tóm tắt hay hỏi-đáp
    • Nếu AI còn cơ hội nào, thì đó có thể là mối đe dọa đối với hai công ty độc quyền này
  • Tôi đã nghĩ sẽ thế nào nếu tiện ích của mình có thể truy cập hộp thư

    • Tôi có một tiện ích nhỏ có thể kiểm tra thời tiết hoặc chạy lệnh hệ thống
    • Nếu có hộp thư, nó có thể gửi thông tin và AI có thể phân tích rồi gửi email hoặc tạo tin nhắn mới
    • Có thể dùng khá hữu ích bằng cách phân tích email, thêm vào kho lưu trữ nội bộ rồi xóa tin nhắn
  • Tôi đang nghĩ về ý tưởng cho một dự án mã nguồn mở tương tự

    • Tôi muốn phần backend được cấu thành từ các LLM mà người dùng có thể truy cập
    • Tôi tự hỏi liệu có thể kết nối với màn hình cảm ứng để dùng như một thiết bị kiểu Alexa hay không
    • Tôi muốn làm cho việc tích hợp với lịch, thời tiết, Homebridge, Spotify v.v. có thể mở rộng được
    • Hiện tại tôi không thể dành nhiều thời gian cho dự án, nhưng muốn đồng hành với những người đang đi theo hướng này
  • Tôi muốn thấy những màn hack AI mang tính thực dụng

    • Tôi thích các tích hợp thực tế với nguồn dữ liệu sẵn có hơn là kiến trúc phức tạp hay vector DB
  • Tôi đang thử nghiệm cách giải quyết "điểm ngọt token ngữ cảnh"

    • LLM hoạt động theo cách phối hợp với cơ sở dữ liệu để lưu trữ và tóm tắt thông tin
    • Có thể tạo tài liệu tóm tắt để duy trì ngữ cảnh, đồng thời bổ sung các chi tiết quan trọng thông qua cơ sở dữ liệu
  • Tôi đã nghĩ sqlite DB được dùng cho việc dự đoán token tiếp theo

    • Những người khác thì dùng Claude
  • Tôi đã xây một thứ tương tự bằng mcp.run và task

    • Tôi sửa prompt theo cách kiểm tra xem cuộc trò chuyện có tồn tại hay không và lưu kết quả lại
    • Có thể mở rộng chức năng của bot bằng cách thêm servlet vào registry
  • Stevens lúc đầu nói với giọng khô khan như sản phẩm của Apple hay Google, nhưng nói như một quản gia kiểu cổ điển thì vui hơn nhiều

    • Một trong những phàn nàn lớn nhất của tôi về thế giới trợ lý cá nhân là LLM nói quá nhiều
    • Cho đến khi tôi giàu và có thời gian để kết bạn với trợ lý giọng nói, tôi cần LCARS chứ không phải J.A.R.V.I.S.
  • Những công cụ như thế này sẽ là mảnh đất màu mỡ cho các hacker trong vài năm tới

    • Phần lớn stack đã được hàng hóa hóa dưới dạng hệ thống ống nước OSS, còn suy luận được host thì đã rẻ và dễ dùng rồi
    • Có những vấn đề bảo mật khi nối agent với email và lịch, nhưng nhiều người vẫn sẽ thích tự kiểm soát toàn bộ stack hơn là giao quyền kiểm soát cho Apple hay Google
  • Tôi tự hỏi liệu bạn đã từng nghĩ đến việc cắt tỉa bộ nhớ hay tóm tắt chưa

    • Thay vì xóa các mục cũ, có thể cân nhắc dùng LRU hoặc tóm tắt phản hồi rồi lưu vào cùng một bảng
    • Dữ liệu thô có thể biến mất, nhưng phiên bản nén vẫn còn, giúp bộ nhớ gọn nhẹ mà vẫn giữ được ngữ cảnh