LLM tác tử 7B tham số chuyên biệt cho phân tích tin tức thị trường chứng khoán Hàn Quốc và nghiên cứu đầu tư
(huggingface.co)Giới thiệu VELA, mô hình ngôn ngữ chuyên biệt cho thị trường chứng khoán Hàn Quốc (KOSPI+KOSDAQ).
Mô hình được fine-tune dựa trên Qwen2.5-7B-Instruct với pipeline SFT + DPO.
Lý do tạo ra
Các LLM tài chính hiện có thường bị hallucination nặng với thuật ngữ của thị trường Hàn Quốc,
và còn có vấn đề language leak khi đang trả lời thì chuyển sang tiếng Trung/tiếng Anh giữa chừng.
VELA tập trung hiệu chỉnh hai vấn đề này bằng DPO.
Dữ liệu huấn luyện
- SFT: 36.713 mẫu / 2.135 mã cổ phiếu (phân loại tin tức, tín hiệu tăng giảm mạnh, báo cáo công ty chứng khoán, tool calling, phân tích ngành/vĩ mô, v.v.)
- DPO: 24.779 cặp (loại bỏ leak tiếng Trung/tiếng Anh, căn chỉnh định dạng Reasoning Trace)
Định dạng đầu ra
- Reasoning Trace – quy trình suy luận từng bước ở định dạng JSON (search → analyze → confidence)
- Synthesis Report – báo cáo nghiên cứu gồm 7 phần (tóm tắt, chỉ số, dòng tiền, tác động tin tức, rủi ro, quan điểm đầu tư)
Hiệu năng (dựa trên RTX 3060 12GB)
| Định dạng | Tốc độ | Dung lượng | Chinese Leak |
|---|---|---|---|
| Q4_K_M | 36 tok/s | 4.4GB | 0/5 CLEAN |
| Q8_0 | 25 tok/s | 7.6GB | 0/5 CLEAN |
Lưu ý: khi sử dụng thực tế, bạn cần cung cấp cho mô hình nguồn tin tức và dữ liệu phù hợp. Nếu không có nguồn chính xác, hiện tượng hallucination có thể xảy ra. Mô hình được thiết kế để dùng cùng với https://github.com/unohee/vela-framework .
Giao diện hỗ trợ
llama-cpp-python / Ollama / vLLM / Transformers / MLX
Giấy phép: Apache 2.0
🤗 https://huggingface.co/intrect/VELA
Dữ liệu giá thời gian thực được cung cấp qua API bên ngoài, còn VELA được thiết kế như lớp suy luận phía trên.
Mục đích là cung cấp thông tin, không phải tư vấn đầu tư.
3 bình luận
Thật tuyệt vời ^^
Tuyệt quá! Với 7B cũng ổn định chứ?
So với kích thước mô hình, các tác vụ cơ bản chắc chắn làm tốt hơn mô hình base. Có lẽ cũng nên đăng kèm benchmark nữa!