1 điểm bởi GN⁺ 2025-10-17 | 1 bình luận | Chia sẻ qua WhatsApp
  • Sở Thuế vụ Liên bang Mỹ (IRS) đã công bố mã nguồn mở một knowledge graph có tên Fact Graph
  • Fact Graph được dùng để mô hình hóa luật thuế Mỹ và các quy định pháp lý liên quan, đồng thời có thể sử dụng trong cả môi trường JVM và JavaScript
  • Mã nguồn của dự án được cập nhật thường xuyên và việc phát triển diễn ra trong kho lưu trữ riêng tư, sau đó các thay đổi đã được phê duyệt sẽ được phản ánh theo thời gian thực
  • Fact Graph được phát triển và công bố theo nhiều cơ sở pháp lý và chính sách mã nguồn mở của liên bang
  • Người dùng phải tự chịu mọi trách nhiệm phát sinh từ việc sử dụng và chỉnh sửa phần mềm, IRS không cung cấp bảo hành hay hỗ trợ riêng

Tầm quan trọng và lợi ích của việc công bố mã nguồn mở

  • Việc IRS mã nguồn mở dự án Fact Graph là một bước đi có ý nghĩa trong xu hướng thúc đẩy tính minh bạchkhả năng tái sử dụng của dữ liệu chính phủ và thông tin pháp lý
  • Khác với các dự án knowledge graph thông thường, dự án này được thiết kế như một cấu trúc chất lượng cao sẵn sàng cho môi trường production chuyên biệt cho luật thuế Mỹ và quy định liên bang, nên có mức độ hữu dụng và độ tin cậy cao trong cùng lĩnh vực
  • Hỗ trợ cả JavaScript và hệ sinh thái ngôn ngữ JVM (ví dụ: Java, Kotlin, Scala, Clojure...), từ đó có khả năng tương thích với nhiều tech stack
  • Duy trì trạng thái cập nhật nhờ việc cập nhật kho mã thường xuyên và cơ chế phản ánh thay đổi theo thời gian thực
  • Việc tuân thủ rõ ràng các căn cứ pháp lý và chính sách mã nguồn mở giúp tạo nền tảng để cơ quan công, doanh nghiệp tư nhân và cá nhân đều có thể tin cậy và sử dụng

Tổng quan dự án

  • Fact Graph là knowledge graph có thể dùng ngay trong môi trường production, chủ yếu nhằm mô hình hóa Bộ luật Thuế vụ Liên bang Mỹ (Internal Revenue Code) và các luật thuế liên quan
  • Có thể sử dụng không chỉ với JavaScript mà còn với mọi ngôn ngữ dựa trên JVM (Java, Kotlin, Scala, Clojure...), nên có thể áp dụng vào nhiều nền tảng và môi trường phát triển khác nhau

Khai thác kho mã và tham gia phát triển

  • Có thể xem môi trường phát triển và cách thiết lập trong ONBOARDING.md
  • Những cải tiến của phiên bản mới nhất (v3.1) so với phiên bản trước được cung cấp trong tài liệu và liên kết riêng
  • Cách đóng góp cho mã nguồn mở và hướng dẫn được trình bày chi tiết trong CONTRIBUTING.md

Đặc điểm chính

  • Mã nguồn của dự án được cập nhật định kỳ; quá trình phát triển thực tế diễn ra trong kho lưu trữ riêng tư, sau đó chỉ các thay đổi đã được rà soát mới được merge theo thời gian thực vào kho này (nhánh main)
  • Tài liệu có nhắc đến ScalaTest (framework kiểm thử) và scala-xml (triển khai XML), đồng thời giải thích rõ các dependency và công cụ chính

Quyền pháp lý và lưu ý

  • Nền tảng pháp lý của dự án này được thiết lập bởi nhiều luật và chính sách liên bang Mỹ (ví dụ: Source Code Harmonization And Reuse in Information Technology Act, Federal Source Code Policy, Digital Government Strategy...)
  • IRS không bảo đảm cũng không chịu trách nhiệm về độ chính xác, tính đầy đủ hay chức năng của đoạn mã này
  • Mọi trách nhiệm liên quan đến việc sử dụng phần mềm đều do người dùng tự chịu (bao gồm kết quả thuế, lỗi tính toán, mất dữ liệu, v.v.)
  • Cần tuân thủ giấy phép mã nguồn mở và giấy phép của bên thứ ba

Thông tin ngôn ngữ và kỹ thuật

  • 99.9% toàn bộ mã nguồn được viết bằng Scala
  • Ngoài ra còn có một phần nhỏ như Makefile và một số chuỗi ký tự khác

Thông tin khác

  • Dự án này hiện vẫn chưa phát hành release chính thức; có 235 star và 11 fork
  • Tổng cộng có 11 contributor đang cùng tham gia

1 bình luận

 
GN⁺ 2025-10-17
Ý kiến trên Hacker News
  • Tôi đang tự hỏi không biết mình có đang hiểu nhầm gì không, hay là kho này thực sự không chứa các fact liên quan đến luật thuế. Tôi muốn biết liệu tệp /demo/all-facts có nên được xem là các fact “thật” hay không, và các tệp fact XML có thể lấy từ nơi khác hay không. Cách IRS định nghĩa và quản lý các công thức tính thuế khá hay, và ý tưởng về một bộ luật thuế mà máy có thể đọc được cũng thực sự rất thú vị.
    • Phần triển khai luật thuế thực tế của IRS nằm trong một kho riêng: https://github.com/IRS-Public/direct-file. Kho được liên kết ban đầu phụ trách công cụ fact graph, tách biệt với phần triển khai thuế vụ.
    • Trong tài liệu này: "Chuẩn hóa từ điển fact thành một định dạng chuẩn để mô hình hóa logic thuế theo kiểu khai báo"
    • Nó trông giống một giao diện HTTP cho cơ sở dữ liệu hơn là dữ liệu thực tế.
    • Theo hiểu biết của tôi, fact ở đây nghĩa là các giả định hoặc sự thật được chia sẻ. Với luật thuế thì cách tiếp cận này hoàn toàn hợp lý.
  • Tôi đã có trải nghiệm cực kỳ bực bội với TurboTax vì giao diện quá phức tạp, kiểu thu thập dữ liệu rất hung hăng trong khi giả vờ như đang giúp bạn tiết kiệm tiền nhưng thực ra không phải vậy, và cấu trúc phí cũng rối rắm chẳng kém gì IRS. Tôi hy vọng dự án này có thể giúp các chuyên gia trong lĩnh vực hoặc những người có thiện chí dễ dàng tạo ra một giải pháp thay thế minh bạch và thân thiện hơn với người dùng để thách thức sự thống trị thị trường của TurboTax. Không biết có ai từng gặp công cụ hay cách tiếp cận nào tốt để cải thiện những vấn đề này chưa.
    • Tôi chỉ dùng DirectFile trong một năm thôi nhưng thấy nó thực sự ổn, và nó giải quyết được các vấn đề nêu ở trên. Sau đó cũng đã có các động thái liên quan, nên không cần lo nữa. Bài viết liên quan
    • FreeTaxUSA thực sự rất tuyệt.
    • Tôi nghĩ quảng cáo của TurboTax gần như ở mức lừa đảo. Freetaxusa.com (không liên quan) cũng tốt y hệt và thật sự miễn phí.
    • Năm ngoái tôi đã dùng Free Fill Fillable Forms cho cả liên bang lẫn tiểu bang. Tôi tự hỏi sao mình không dùng sớm hơn, vì trước đây cứ sợ phải tự điền tờ khai, nhưng với hoàn cảnh của tôi thì thực sự rất đơn giản.
  • Thật vui khi thấy luật thuế Mỹ được triển khai dưới dạng mã nguồn mở. Phần mã này từng là một phần của codebase IRS Direct File, nhờ đó mọi người có thể khai thuế trực tiếp với IRS miễn phí. Đầu năm nay chính quyền Trump đã chấm dứt nó. Fact Graph thực ra đã được mã nguồn mở từ vài tháng trước rồi, và phiên bản đó ở đây. Nhưng tôi thắc mắc tại sao lại có thêm kho thứ hai.
    • Tôi cũng thắc mắc. Có lẽ mục đích là tách nó ra khỏi dự án direct file để có thể dùng độc lập cho các mục đích tổng quát hơn chăng.
    • Tôi vẫn tiếc vì Direct File đã biến mất, đó thực sự là một khởi đầu đầy tiềm năng.
  • Tôi tự hỏi liệu có thể kết hợp nó với LLM để đưa ra những tư vấn thú vị về luật thuế hay không. Sẽ thật tuyệt nếu có thể thường xuyên đặt những câu hỏi thắc mắc về luật thuế một cách dễ dàng.
    • patio11 nói rằng đã tiết kiệm được hơn $2,000 rồi. Có lẽ sau này sẽ còn viết một bài đánh giá chính thức hơn. (Chuỗi liên quan: thứ nhất, thứ hai)
    • Tôi tự hỏi liệu đã có ai tạo mô hình được huấn luyện trên luật thuế chưa. Chắc chắn sẽ rất thú vị.
    • Nếu chỉ dùng cho vui thì không sao, nhưng tuyệt đối KHÔNG được làm theo tư vấn thuế/pháp lý mà LLM bịa sai trong thực tế.
  • Dự án này là tác phẩm của chính phủ Hoa Kỳ nên thuộc phạm vi public domain tại Hoa Kỳ.<br> Tôi tự hỏi cụm giấy phép “thuộc phạm vi public domain tại Hoa Kỳ” có nghĩa chính xác là gì. Không biết phần mềm này có phải là không dùng được bên ngoài nước Mỹ hay không.

    • Nếu thắc mắc “thuộc phạm vi public domain tại Hoa Kỳ” nghĩa là gì, thì nhất định phải đọc cả câu đầy đủ (thậm chí cả hai câu ngay trước đoạn văn bản CC 1.0 Universal). <br>> Không dùng được ngoài nước Mỹ à? <br>Giấy phép này đang giải thích hai điều:<br> (1) Không cần giấy phép riêng, vì là tác phẩm của chính phủ liên bang Hoa Kỳ nên ở Mỹ nó tự động thuộc public domain. <br>(2) Ở ngoài nước Mỹ, khi chủ sở hữu bản quyền là chính phủ liên bang Hoa Kỳ (đặc biệt tại các quốc gia áp dụng nguyên tắc theo Công ước Berne), họ từ bỏ bản quyền trên phạm vi toàn cầu thông qua tuyên bố CC 1.0 Universal. <br>Vì vậy trên thực tế, bạn có thể tự do sử dụng nó ở bất kỳ đâu trên thế giới mà không bị ràng buộc về bản quyền.

    • Một số quốc gia không công nhận khái niệm public domain. Ở Mỹ, nhiều tác phẩm của chính phủ thuộc public domain. Vì các khác biệt pháp lý quốc tế như vậy, chính phủ Mỹ nêu rõ public domain trong nước, đồng thời cấp một giấy phép quốc tế có ý định tương tự public domain để đạt được mục tiêu đó.
    • Câu hỏi hay đấy. Vì luật bản quyền ở mỗi nước khác nhau, đây có thể là một nỗ lực nhằm làm rõ rằng bên ngoài nước Mỹ thì sẽ áp dụng một giấy phép khác.
  • Trong mắt tôi thì mã nguồn có vẻ là Scala, nhưng não tôi lại nhầm thành Clojure nên trong vài giây đầu tôi đã bối rối không hiểu tại sao lại không có dấu ngoặc.
  • Đây là phần cực kỳ thú vị và hay ho khi mã Direct File được công bố. Thảo luận HN trước đây Đặc biệt, bản phát hành đó vẫn còn giữ lại một tutorial inline khá ổn để tham khảo. Liên kết tutorial
  • Tôi tự hỏi liệu các quy tắc (quy tắc thuế) có được quản lý phiên bản hay không. Tôi đã kiểm tra nhưng không tìm thấy.
  • Tôi tự hỏi làm sao có thể hack cái này để tiết kiệm tiền.
  • Tôi vẫn ngạc nhiên là IRS còn tồn tại.