8 điểm bởi GN⁺ 2024-07-25 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bổ sung các tính năng mở rộng cho Notion + Jupyter
    • Lên lịch notebook, chuyển thành dashboard và ứng dụng, truy vấn SQL trả kết quả dưới dạng data frame, v.v.
  • Giải quyết các vấn đề của notebook hiện có
    • Khó chia sẻ: cần cài Docker + Python để xem công việc của nhóm dữ liệu
    • Notebook quá phức tạp: có quá nhiều khối mã, làm giảm khả năng đọc hiểu và khiến người không chuyên khó nắm bắt
    • Ngay cả các tác vụ đơn giản như truy vấn cơ sở dữ liệu, gọi API, vẽ biểu đồ cũng trở nên phức tạp
  • Cách Briefer giải quyết
    • Giải quyết vấn đề chia sẻ
      • Đưa notebook lên đám mây để có thể lên lịch chạy
      • Dùng CRDTs và Yjs để quản lý trạng thái, phản ánh chỉnh sửa theo thời gian thực
    • Sắp xếp notebook gọn gàng
      • Thiết kế sạch sẽ và có thể nhóm các khối để tổ chức nội dung
      • Có thể nhóm các khối theo tab và chọn khối nào sẽ hiển thị trong phiên bản công khai
      • Cung cấp tính năng xây dựng dashboard
    • Đơn giản hóa các tác vụ đơn giản
      • Tạo biểu đồ bằng thao tác nhấp, dùng trợ lý AI để sinh mã biểu đồ phức tạp
      • Tự động chuyển kết quả truy vấn SQL thành data frame, có thể truy vấn tệp bằng DuckDB

Các tính năng chính

  • Cây tệp
    • Cây tệp là nơi quản lý và duyệt notebook
    • Giống như Notion, có thể chọn biểu tượng cho từng notebook, đổi thứ tự hoặc đặt notebook này vào trong notebook khác
    • Khi xóa notebook, một bản sao sẽ được giữ trong thùng rác để có thể khôi phục khi cần
  • Khối và tab: notebook Briefer được tạo thành từ nhiều loại khối khác nhau
    • Khối văn bản: dùng để thêm ngữ cảnh cho notebook
    • Khối truy vấn: dùng để thu thập dữ liệu từ tệp hoặc từ các nguồn dữ liệu đã kết nối như Postgres, BigQuery, Redshift, Athena, v.v.
    • Khối tải tệp lên: dùng để thêm CSV, XLS hoặc các tệp khác vào notebook khi dữ liệu không có trong nguồn dữ liệu đã kết nối
    • Khối Python: dùng để viết mã Python nhằm xử lý dữ liệu, tạo trực quan hóa hoặc thực hiện các tác vụ khác mong muốn
    • Khối đầu vào: dùng để thêm các thành phần tương tác như nhập văn bản hoặc danh sách thả xuống vào notebook
    • Khối trực quan hóa: dùng để tạo trực quan hóa mà không cần viết mã
    • Sau khi thêm các khối vào notebook, có thể nhóm chúng theo tab để notebook dễ tổ chức và dễ điều hướng hơn
  • Tệp và cơ sở dữ liệu
    • Có thể dùng khối truy vấn để truy vấn dữ liệu từ tệp và cơ sở dữ liệu mà không cần viết wrapper hay connector
    • Nếu dữ liệu nằm trong cơ sở dữ liệu, có thể dùng khối truy vấn để viết truy vấn SQL và lấy dữ liệu cần thiết
    • Nếu dữ liệu nằm trong tệp (CSV, XLSX, Parquet, v.v.), có thể tải tệp lên và truy vấn bằng SQL thông thường
    • Cũng có thể dùng khối truy vấn để truy vấn data frame bằng SQL thông thường
  • Data frame tự động
    • Mọi khối truy vấn đều tự động tạo ra một Pandas data frame chứa kết quả truy vấn
    • Nhờ đó có thể dùng dữ liệu này trong các khối Python tiếp theo
    • Mặc định, data frame sẽ được đặt tên như query_1, nhưng có thể đổi thành tên có ý nghĩa hơn
  • Trợ lý AI
    • Các khối SQL và Python đều có tích hợp trợ lý AI
    • Bất cứ khi nào cần trợ giúp từ trợ lý AI, có thể nhấp vào "Chỉnh sửa bằng AI" và cho trợ lý biết bạn muốn làm gì
    • Sau đó trợ lý AI sẽ tạo đề xuất và hiển thị diff để bạn có thể thử, chấp nhận hoặc từ chối
    • Trong khối Python, trợ lý AI nhận biết các data frame và cột hiện có
    • Trong khối SQL, trợ lý AI đã biết các bảng và cột trong cơ sở dữ liệu, nên có thể đưa ra đề xuất tốt hơn và giúp viết đúng các truy vấn phức tạp
    • Mỗi khi xảy ra lỗi, có thể nhấp vào "Sửa bằng AI" để trợ lý AI thử khắc phục
  • Lịch chạy
    • Có thể lên lịch để notebook chạy theo các khoảng thời gian cụ thể như hàng giờ, hàng ngày, hàng tuần hoặc hàng tháng
    • Khi tạo lịch, cũng có thể thiết lập thông báo để nhận email hoặc tin nhắn Slack khi lịch chạy thành công hoặc thất bại. Với các lần chạy thành công, bạn cũng sẽ nhận được tệp PDF chứa đầu ra của notebook
  • Snapshot và quản lý phiên bản
    • Mỗi lần xuất bản notebook, trạng thái của notebook sẽ được lưu tự động để có thể xem các thay đổi theo thời gian và quay lại phiên bản trước nếu cần
    • Nhờ đó có thể theo dõi các thay đổi của notebook và quay lại phiên bản cũ nếu có vấn đề phát sinh
    • Ngoài ra, mọi lần chạy theo lịch thành công cũng tạo ra snapshot về trạng thái notebook tại thời điểm đó
    • Snapshot hữu ích khi muốn xem kết quả đã thay đổi như thế nào theo thời gian hoặc so sánh đầu ra giữa các lần chạy khác nhau
  • Từ notebook thành dashboard
    • Có thể tạo dashboard bằng cách sử dụng đầu ra của notebook
    • Có thể chia sẻ kết quả với người khác mà không kèm theo mã hay giải thích không cần thiết, chẳng hạn trong trường hợp phải xử lý rất nhiều dữ liệu trước khi vẽ biểu đồ
    • Chế độ xem dashboard cũng hữu ích khi xây dựng ứng dụng dữ liệu cho phép người dùng tương tác với input và dropdown nhưng không muốn hiển thị mã nội bộ

Ý kiến của GN⁺

  • Nền tảng này có vẻ hữu ích cho các công việc phân tích và trực quan hóa dữ liệu theo phong cách notebook
  • Nhờ hoạt động trên nền tảng đám mây, hỗ trợ cộng tác thời gian thực, giao diện thân thiện và các tính năng sắp xếp gọn gàng, khả năng đọc hiểu được cải thiện và cả người không chuyên cũng có thể dễ dàng xem kết quả phân tích dữ liệu, từ đó nâng cao hiệu quả cộng tác
  • Việc trợ lý AI hỗ trợ viết truy vấn SQL và mã Python cũng có thể giúp tăng năng suất cho công việc phân tích dữ liệu. Tuy vậy, độ chính xác và tính hữu ích của các đề xuất AI vẫn cần được kiểm chứng qua sử dụng thực tế
  • Các tính năng lên lịch và quản lý phiên bản của notebook có vẻ sẽ hữu ích cho các công việc phân tích dữ liệu lặp lại hoặc làm việc cộng tác. Tuy nhiên, điều này đòi hỏi hạ tầng vận hành ổn định
  • Khả năng tạo dashboard để dễ dàng chia sẻ kết quả phân tích với người không phải nhà phát triển cũng là một ưu điểm. Tuy nhiên, vẫn chưa rõ mức độ tự do trong bố cục và thiết kế dashboard sẽ đến đâu
  • Các nền tảng tương tự gồm có Jupyter Notebook, Google Colab, Deepnote, v.v. Cần xem Briefer sẽ tạo khác biệt bằng những điểm mạnh riêng nào so với chúng, chẳng hạn như khả năng sử dụng đơn giản hơn hoặc tính năng cộng tác mạnh hơn

1 bình luận

 
GN⁺ 2024-07-25
Ý kiến trên Hacker News
  • Các quản lý sản phẩm cố gắng giúp công việc trở nên dễ dàng hơn bằng cách thiết lập các công thức Excel đơn giản và biểu đồ

    • Bao gồm cả những việc như chụp màn hình
  • Các kỹ sư dữ liệu dùng những giải pháp mã nguồn mở như Superset và dbt để thực hiện các công việc mang tính kỹ thuật hơn

  • Các công ty thường cố tự xây dựng UI cuối cùng

    • Nhớ là Pinterest từng mã nguồn mở một thứ như vậy
  • Hiểu rất sâu việc xây dựng các công cụ kiểu notebook khó đến mức nào

    • Có vấn đề về cộng tác và UX
  • Khó đề xuất tính năng vì chính dữ liệu và thị trường cạnh tranh khốc liệt

    • Nhớ rằng Popsql đã không thể phát triển mạnh
  • Khen ngợi công việc của Lucas, đồng thời đề xuất bổ sung CLI, connector, tính toán ký hiệu, hỗ trợ offline và namespace được mã hóa

    • Những thứ này sẽ giúp vượt lên trước các đối thủ khác
    • Nói rằng chắc hẳn đang rất bận, nhưng nếu muốn thảo luận thì hãy liên hệ
  • Dạy rất nhiều về Python và khoa học dữ liệu (pandas, Polars, scikit learn, XGBoost trong Jupyter, v.v.)

    • Cũng dạy các thực hành tốt nhất của kỹ nghệ phần mềm
  • Chia sẻ kinh nghiệm rằng nhiều vấn đề được giải quyết thông qua đào tạo

    • Gần đây lại xác nhận điều này ở một khách hàng
  • Thay vì tập trung viết code thân thiện với người mới bắt đầu, cho rằng nên viết code ở mức chuyên gia

    • Người mới bắt đầu sẽ không thích kiểu code này
  • Bị chỉ trích trên mạng xã hội, nhưng nhận được phản hồi tích cực từ học viên và độc giả

  • Có kinh nghiệm xây dựng workflow dùng notebook, tác vụ cron và lưu trạng thái

    • Vui khi thấy nỗ lực giải quyết vấn đề một cách toàn diện
  • Chúc mừng ra mắt, đồng thời nhắc rằng phần chrome kiểu Mac Finder thập niên 90 trong GIF minh họa gây xao nhãng

    • Đề xuất sắp xếp lại cho gọn hơn cả về mặt thị giác lẫn ngữ nghĩa
  • Hỗ trợ Python/code block khá thú vị

    • Jupyter notebook có thể chạy ở bất cứ đâu
    • Hỏi liệu có hỗ trợ thông qua cài đặt cục bộ hoặc trung chuyển kết nối tới môi trường Python cục bộ hay không
    • Hỏi liệu mọi mã Python có phải chạy trên máy chủ đám mây, và như vậy có đồng nghĩa không thể truy cập GPU hiệu năng cao hay không
  • Chúc mừng ra mắt và tò mò công cụ này sẽ phát triển ra sao khi so với các công cụ hiện có như Hex

  • Nhắc rằng cũng có thể bán nó như một công cụ cộng tác trực tuyến cho các tổ chức không mang tính kỹ thuật

    • Nói rằng nhiều người muốn một công cụ thuận tiện hơn Microsoft Access
  • Nhắc rằng đây có thể là công cụ hữu ích để xây dựng catalog truy vấn nội bộ và dashboard

    • Hỏi liệu có hỗ trợ bộ chọn trường động tương tự "biến" của Grafana hay không
  • Nhắc rằng vấn đề đầu tiên của notebook là khó chia sẻ

    • Chia sẻ notebook với các PM thông qua liên kết GitHub