8 điểm bởi unohee 2026-03-31 | 3 bình luận | Chia sẻ qua WhatsApp

Giới thiệu VELA, mô hình ngôn ngữ chuyên biệt cho thị trường chứng khoán Hàn Quốc (KOSPI+KOSDAQ).

Mô hình được fine-tune dựa trên Qwen2.5-7B-Instruct với pipeline SFT + DPO.

Lý do tạo ra
Các LLM tài chính hiện có thường bị hallucination nặng với thuật ngữ của thị trường Hàn Quốc,
và còn có vấn đề language leak khi đang trả lời thì chuyển sang tiếng Trung/tiếng Anh giữa chừng.
VELA tập trung hiệu chỉnh hai vấn đề này bằng DPO.

Dữ liệu huấn luyện

  • SFT: 36.713 mẫu / 2.135 mã cổ phiếu (phân loại tin tức, tín hiệu tăng giảm mạnh, báo cáo công ty chứng khoán, tool calling, phân tích ngành/vĩ mô, v.v.)
  • DPO: 24.779 cặp (loại bỏ leak tiếng Trung/tiếng Anh, căn chỉnh định dạng Reasoning Trace)

Định dạng đầu ra

  1. Reasoning Trace – quy trình suy luận từng bước ở định dạng JSON (search → analyze → confidence)
  2. Synthesis Report – báo cáo nghiên cứu gồm 7 phần (tóm tắt, chỉ số, dòng tiền, tác động tin tức, rủi ro, quan điểm đầu tư)

Hiệu năng (dựa trên RTX 3060 12GB)

Định dạng Tốc độ Dung lượng Chinese Leak
Q4_K_M 36 tok/s 4.4GB 0/5 CLEAN
Q8_0 25 tok/s 7.6GB 0/5 CLEAN

Lưu ý: khi sử dụng thực tế, bạn cần cung cấp cho mô hình nguồn tin tức và dữ liệu phù hợp. Nếu không có nguồn chính xác, hiện tượng hallucination có thể xảy ra. Mô hình được thiết kế để dùng cùng với https://github.com/unohee/vela-framework .

Giao diện hỗ trợ
llama-cpp-python / Ollama / vLLM / Transformers / MLX

Giấy phép: Apache 2.0

🤗 https://huggingface.co/intrect/VELA

Dữ liệu giá thời gian thực được cung cấp qua API bên ngoài, còn VELA được thiết kế như lớp suy luận phía trên.
Mục đích là cung cấp thông tin, không phải tư vấn đầu tư.

3 bình luận

 
310writer 2026-04-06

Thật tuyệt vời ^^

 
ahiou 2026-04-01

Tuyệt quá! Với 7B cũng ổn định chứ?

 
unohee 2026-04-01

So với kích thước mô hình, các tác vụ cơ bản chắc chắn làm tốt hơn mô hình base. Có lẽ cũng nên đăng kèm benchmark nữa!