7 điểm bởi mssmss 10 ngày trước | 2 bình luận | Chia sẻ qua WhatsApp

Chúng tôi chia sẻ legalQ — chatbot công khai cho phép hỏi luật và án lệ Hàn Quốc bằng ngôn ngữ tự nhiên.

Tôi là kỹ sư đang tham gia phát triển legalQ tại Dnotitia. Tách biệt với thông báo chính thức của công ty, tôi chia sẻ bằng tài khoản cá nhân để nhận phản hồi kỹ thuật từ người dùng GeekNews.

Luật và án lệ thường khó tìm chỉ bằng từ khóa. Ngược lại, nếu hỏi trực tiếp các LLM phổ dụng như ChatGPT hay Claude thì tiện thật, nhưng số điều luật hoặc trích dẫn án lệ có thể không chính xác.

Để giảm vấn đề này, legalQ hoạt động dựa trên RAG. Hệ thống chuyển câu hỏi ngôn ngữ tự nhiên của người dùng thành dạng phù hợp cho tìm kiếm, tra cứu dữ liệu luật và án lệ liên quan, rồi cố gắng hiển thị kèm các điều luật và thông tin án lệ đã tham chiếu trong câu trả lời.

Dữ liệu được sử dụng dựa trên legalize-kr, dự án từng được giới thiệu trên GN cách đây không lâu.
Hiện tại, việc xử lý dữ liệu trong các phụ lục đánh dấu sao dưới đây vẫn chưa đủ tốt. Vì vậy, với những câu hỏi mà nội dung phụ lục là trọng tâm, hệ thống sẽ xử lý theo cách hiển thị thêm liên kết đến luật liên quan thay vì chỉ dựa vào câu trả lời để kết luận.

Điểm khác với các cách hiện có

  • Dịch vụ tìm kiếm luật·án lệ truyền thống
    Mạnh về tìm kiếm theo từ khóa, nhưng đôi khi khá bất tiện khi người dùng muốn diễn đạt tình huống của mình bằng ngôn ngữ tự nhiên để đặt câu hỏi.
  • Hỏi trực tiếp ChatGPT hoặc Claude
    Tính dễ dùng rất tốt, nhưng số điều luật hoặc trích dẫn án lệ có thể sai. legalQ được thiết kế để trả lời dựa trên chỉ mục tìm kiếm và cố gắng hiển thị kèm các điều luật, thông tin án lệ làm căn cứ.
  • Các công cụ như Beopmang, Korean Law MCP
    Tôi hiểu đây là những công cụ gần với lớp API hoặc MCP. legalQ hướng tới một UI có thể dùng ngay trên trình duyệt mà không cần cài đặt riêng.

Stack

Backend dùng FastAPI, frontend dùng React. Việc gọi LLM được xử lý qua OpenRouter, còn tìm kiếm sử dụng dữ liệu legalize-kr đã được lập chỉ mục vào vector DB nội bộ của công ty (Seahorse Cloud).
Phần gọi công cụ được tách riêng bằng MCP. Hệ thống chuyển câu hỏi ngôn ngữ tự nhiên thành truy vấn tìm kiếm, lấy thông tin luật và án lệ cần thiết, rồi tạo câu trả lời dựa trên các kết quả đó.

Quyền riêng tư

Câu hỏi về luật hay án lệ là lĩnh vực có thể làm lộ hoàn cảnh cụ thể của người dùng, nên hệ thống được thiết kế theo hướng giảm thiểu việc lưu hội thoại.

  • Không có đăng ký thành viên hay đăng nhập.
  • Nội dung hội thoại không được lưu trong DB máy chủ.
  • Cấu trúc stateless, trong đó ở mỗi yêu cầu, client gửi kèm phần history cần thiết.
  • Lịch sử hội thoại chỉ còn lại trong localStorage của trình duyệt; xóa bộ nhớ trình duyệt thì dữ liệu cũng bị xóa.
  • IP chỉ được dùng trong bucket in-memory phục vụ rate limit.
  • Metadata yêu cầu trong access log tiêu chuẩn được lưu luân phiên theo chu kỳ 30 ngày.
  • Để tạo câu trả lời, truy vấn của người dùng có thể được gửi tới LLM API.

Giới hạn

Đây vẫn là phiên bản đầu nên còn nhiều hạn chế.

  • Không phải dịch vụ tư vấn pháp lý, mà là công cụ tìm kiếm thông tin luật·án lệ mang tính tổng quát.
  • Câu trả lời có thể sai, nên với các vấn đề quan trọng, nhất thiết phải kiểm tra nguyên văn điều luật và có chuyên gia thẩm định.
  • Dữ liệu phụ lục đánh dấu sao hiện vẫn chưa được xử lý đầy đủ, nên có những trường hợp hệ thống chỉ dẫn sang liên kết luật liên quan.
  • Việc tìm kiếm và trích dẫn án lệ có thể bị thiếu hoặc không chính xác tùy theo phạm vi dữ liệu và chất lượng tìm kiếm.
  • Với các câu hỏi cần tham chiếu đồng thời nhiều thông tin pháp luật, số lượng tool call có thể tăng lên, khiến câu trả lời chậm hơn hoặc thiếu một phần thông tin.

Những phần muốn nhận phản hồi

Vì đây là bản công khai ban đầu, tôi muốn nghe thật nhiều điểm còn thiếu sót. Đặc biệt, các phản hồi như dưới đây sẽ rất hữu ích.

  • Câu trả lời cho một câu hỏi cụ thể có gì đó bất thường
  • Trích dẫn điều luật hoặc án lệ bị sai
  • Không tìm được đúng luật liên quan
  • Có điểm nào gây vướng trong UX
  • Khi so với các dịch vụ hoặc công cụ hiện có, có góc nhìn nào còn thiếu
  • Có những cách diễn đạt mang cảm giác như tư vấn pháp lý hoặc có thể trở nên lỗi thời

Rất mong mọi người dùng thử và cho phản hồi sắc bén.
Xin cảm ơn vì đã đọc.

2 bình luận

 
leejinahn 9 ngày trước

Tôi cũng từng thử tạo một dịch vụ tương tự trong lĩnh vực thuế, nên thấy rất vui khi thấy dự án này.
Tôi đã thử đặt câu hỏi về thuế thu nhập doanh nghiệp và Luật Hạn chế thuế đặc biệt liên quan đến tín dụng thuế đầu tư, và xác nhận rằng hệ thống trả lời bằng cách tham chiếu đúng các luật và điều khoản tương ứng. Tôi cũng ấn tượng với việc khi trả lời, hệ thống trực tiếp hiển thị nguyên văn và giải thích bằng cách chia theo từng trường hợp nếu có thể.
Nếu bạn có ý định mở rộng sang mảng thuế, thì trong lĩnh vực này, các diễn giải hành chính, án lệ của Hội đồng thẩm phán thuế, tiền lệ hành chính, và các văn bản hỏi-đáp của Bộ Kinh tế và Tài chính, Cơ quan Thuế Quốc gia, hay Viện Tài phán Thuế thường cung cấp thông tin chi tiết hơn, nên sẽ còn tốt hơn nữa nếu phần đó được bổ sung (thông thường các dịch vụ về thuế đã coi các tài liệu đó là thành phần bắt buộc trong corpus).

 

Cảm ơn bạn vì phản hồi và những thông tin quý giá!
Có vẻ phía mảng thuế cũng không có dữ liệu dễ xử lý.
Chúng tôi sẽ tìm cách để bổ sung.