6 điểm bởi scm1400 5 giờ trước | 2 bình luận | Chia sẻ qua WhatsApp

Xin chào. Chúng tôi đang xây dựng Housing Compass, một dịch vụ tập hợp các thông báo nhà ở cho thuê công cộng từ LH, SH, GH... và dùng AI để phân tích các thông báo tuyển chọn phức tạp.

Lý do tạo ra

Khi tự mình quan tâm và theo dõi các thông báo nhà ở cho thuê công cộng, tôi nhận ra rằng việc tiếp cận thông tin khó hơn tưởng tượng.

Mỗi cơ quan có một định dạng thông báo khác nhau, và các tài liệu tuyển chọn thường được đăng lên dưới dạng PDF/HWP dài hàng chục trang, trong khi thông tin mình thực sự cần lại bị phân tán khắp nơi.

Ví dụ như:

  • Ngày bắt đầu và hạn chót nộp hồ sơ
  • Loại hình cung cấp như thanh niên/vợ chồng mới cưới/người cao tuổi
  • Tiêu chí thu nhập
  • Tiêu chí tài sản
  • Điều kiện không sở hữu nhà ở
  • Các hạng mục cộng điểm
  • Ngày công bố người trúng tuyển
  • Hồ sơ cần nộp

Để tìm những thông tin này, mỗi lần tôi đều phải mở tài liệu dài, tìm kiếm, đọc bảng và tự ghi nhớ từng mốc ngày.
Tôi đã tạo Housing Compass để giảm bớt quá trình đó.

Tính năng chính

1. AI phân tích thông báo

Trích xuất và cấu trúc hóa thông tin cốt lõi từ PDF/HWP/tệp đính kèm của thông báo tuyển chọn.

Thay vì chỉ tóm tắt đơn thuần, chúng tôi tập trung vào việc chuyển nó thành “dữ liệu có thể tìm kiếm/lọc/so sánh”.

Ví dụ, AI sẽ trích xuất các mục như sau.

  • Điều kiện đăng ký
  • Tiêu chí thu nhập
  • Tiêu chí tài sản
  • Điều kiện nơi cư trú/nơi làm việc
  • Điều kiện tài khoản tiết kiệm đăng ký nhà ở
  • Lịch tuyển chọn
  • Tiền đặt cọc thuê nhà/tiền thuê hàng tháng
  • Danh sách nhà ở được cung cấp
  • Các điều kiện cần lưu ý
  • Vị trí căn cứ trong văn bản gốc

Người dùng có thể nhanh chóng đánh giá trước xem “đây có phải là thông báo đáng để mình xem hay không” trước khi đọc toàn bộ tài liệu dài từ đầu.

2. Lịch sự kiện

Các mốc như ngày đăng thông báo, ngày bắt đầu nhận hồ sơ, ngày kết thúc nhận hồ sơ, ngày nộp tài liệu, ngày công bố kết quả... đều có thể xem dưới dạng lịch.

Thông báo nhà ở cho thuê công cộng không chỉ khó ở điều kiện, mà việc bỏ lỡ lịch cũng là vấn đề khá lớn, nên chúng tôi đặc biệt coi trọng UX của lịch.

3. Bộ lọc khu vực/loại hình

Bạn có thể chỉ xem khu vực và loại hình cho thuê mình muốn.

Ví dụ, có thể thu hẹp danh sách theo các tiêu chí như Seoul/Gyeonggi, thanh niên, vợ chồng mới cưới, Happy Housing, thuê quốc dân.

4. Ứng dụng di động và widget màn hình chính Android

Chúng tôi cũng cung cấp ứng dụng iOS/Android.

Bằng widget màn hình chính, người dùng có thể xem ngay các mốc quan trọng của thông báo quan tâm.
Mục đích là để kiểm tra những thông tin như hạn chót nộp hồ sơ mà không cần mở ứng dụng mỗi lần.

Đã triển khai AI phân tích như thế nào

Pipeline hiện tại đại khái như sau.

  1. Thu thập định kỳ bảng thông báo của từng cơ quan
  2. Tải xuống nội dung thông báo và các tệp đính kèm PDF/HWP/Excel
  3. Trích xuất văn bản và bảng từ tài liệu
  4. Chia tài liệu dài thành các chunk để phân tích
  5. Dùng LLM để trích xuất metadata, thông tin nhà ở, điều kiện đủ tiêu chuẩn, lịch trình và nhận định AI thành JSON có cấu trúc
  6. Xác thực kết quả trích xuất bằng schema
  7. Với một số thông báo, tạo golden set để so sánh/đánh giá chất lượng trích xuất

Ban đầu nó gần với việc “tạo ra một bản tóm tắt”, nhưng khi dùng thực tế, điều quan trọng hơn tóm tắt lại là dữ liệu đã được chuẩn hóa.

Ví dụ, thay vì chỉ tóm tắt một câu như “thu nhập bình quân tháng của lao động đô thị không vượt quá 100%”, thì việc tách và đưa tỷ lệ, số tiền theo từng quy mô hộ gia đình, và các điều kiện ngoại lệ vào trong trường điều kiện thu nhập sẽ hữu ích hơn rất nhiều.

Ngoài ra, các bảng trong thông báo thường khá khó xử lý. Có trường hợp cùng một loại nhà ở được chia thành nhiều điều kiện thuê khác nhau, hoặc hàng tiếp theo của bảng lại là phần tiếp nối của hàng trước đó, nên chúng tôi đặt riêng logic hậu xử lý và kiểm chứng để tránh tạo ra dữ liệu nhà ở trùng lặp.

Phần gọi mô hình được tách thành một lớp tương thích OpenAI/OpenRouter; nếu tài liệu ngắn thì phân tích một lần, còn nếu dài thì xử lý tách riêng metadata/thông tin nhà ở/nhận định AI.

Những điểm vẫn đang cân nhắc

Rất khó để nói rằng kết quả phân tích AI chính xác 100%. Vì vậy hiện tại chúng tôi vẫn hiển thị cùng với liên kết đến thông báo gốc và giữ định hướng để người dùng có thể tự kiểm tra văn bản gốc đối với những thông tin quan trọng.

Đặc biệt, chúng tôi đang suy nghĩ về những điểm sau.

  • Có thể cấu trúc hóa bảng trong thông báo ổn định đến mức nào
  • UX nào sẽ giúp người dùng đánh giá an toàn hơn rằng “mình có phù hợp điều kiện hay không”
  • Nên hiển thị câu căn cứ cho kết quả phân tích AI theo hình thức nào để tốt hơn
  • Khi thông báo được chỉnh sửa, nên cập nhật/so sánh kết quả phân tích cũ như thế nào
  • Trên di động, nên hiển thị các điều kiện đủ tiêu chuẩn phức tạp ra sao để không gây bí bách

Đây là một dự án bắt đầu từ chính những bất tiện mà tôi trực tiếp trải qua và đang được cải tiến liên tục.

Tôi sẽ rất cảm kích nếu nhận được phản hồi dưới bất kỳ góc nhìn nào, như bố cục dịch vụ, cách phân tích AI, màn hình chi tiết thông báo hay UX trên di động.

[ Housing Compass ]
Web: https://jugeo.co.kr
iOS: https://apps.apple.com/kr/app/…
Android: https://play.google.com/store/apps/details?id=kr.housingcompass.app

2 bình luận

 
bluekai17 2 giờ trước

Bạn đã triển khai chat hỏi đáp với AI như thế nào?

 
recast7838 3 giờ trước

Có vẻ phần sắp hết hạn và phần dự kiến đăng ký đang bị che khuất trong chế độ tối.