35 điểm bởi xguru 2025-07-04 | 1 bình luận | Chia sẻ qua WhatsApp
  • Công cụ mã nguồn mở sử dụng OpenAI GPT-4o để tạo bộ dữ liệu chân thực theo cách tương tác, đồng thời hỗ trợ xem trước, xuất CSV/SQL và tích hợp Metabase trong một lần
  • Trình xây dựng prompt tương tác giúp thiết lập trực quan loại hình kinh doanh, schema, số lượng hàng, v.v.
  • Hỗ trợ xem trước trực tiếp trên trình duyệt
  • Có thể xuất dưới dạng CSV (một file đơn hoặc file Zip nhiều bảng) hoặc câu lệnh SQL Insert
  • Có thể chạy Metabase chỉ với một cú nhấp để khám phá dữ liệu
  • Stack công nghệ: Next.js + Tailwind CSS + ShadCN UI + OpenAI API + Metabase
  • Chỉ dùng OpenAI API (khoảng $0.05) khi xem trước/tạo đặc tả, còn tải xuống/phân tích dữ liệu đều được tạo miễn phí bằng Faker cục bộ — đảm bảo cả quyền riêng tư dữ liệu lẫn chi phí
    • Khi xem trước bộ dữ liệu, OpenAI được dùng để tạo đặc tả dữ liệu chi tiết (schema, quy tắc kinh doanh, logic sự kiện) cho loại hình kinh doanh và các tham số đã chọn
    • Tất cả các hàng dữ liệu thực tế đều được tạo cục bộ bằng Faker dựa trên đặc tả do LLM sinh ra
    • Khi tải xuống hoặc xuất dữ liệu, không cần gọi OpenAI nữa
  • Tùy chọn schema
    • One Big Table (OBT): một bảng đơn phi chuẩn hóa chứa tất cả các cột liên quan
    • Star Schema: nhiều bảng để phân tích nâng cao (fact + dimension). Cấu trúc được quyết định theo đặc tả LLM, và trình tạo sẽ xuất tất cả các bảng cục bộ

1 bình luận

 
nicewook 2025-07-04

Có vẻ sẽ khá hữu ích trong công việc thực tế. Dường như họ cũng đã cân nhắc kỹ cả khía cạnh chi phí.