Hệ thống giao dịch cổ phiếu tự động 100% kết nối 31 LLM trong cơ chế kiểm chứng chéo

(t.me)

19 điểm bởi cjb9452 2026-03-28 | 8 bình luận | Chia sẻ qua WhatsApp

Xin chào. Tôi là một sinh viên phát triển phần mềm, ban đầu bắt đầu đây như một dự án nhỏ để quản lý danh mục cá nhân, nhưng dần dần quy mô mở rộng và tôi đã xây dựng một hệ thống gồm 31 tác nhân LLM.

Ban đầu, tôi lên kế hoạch đây là một dịch vụ web B2C gợi ý mã cổ phiếu để thu hút người dùng. Tuy nhiên, tôi đã vấp phải vấn đề chi phí giao tiếp API quá lớn và bài toán kiểm chứng hiệu quả. Vì vậy, tôi từ bỏ việc thu hút người dùng (marketing), loại bỏ toàn bộ UI/UX, rồi pivot sang một pipeline kết nối trực tiếp với tài khoản thật của tôi (10 triệu won) để AI tự thực hiện toàn bộ việc ra quyết định và giao dịch. Hiện hệ thống đang được vận hành theo hướng đó.

Tôi muốn chia sẻ với mọi người trên GeekNews về kiến trúc mình đã suy nghĩ và xây dựng, cùng những trải nghiệm vật lộn kỹ thuật trong suốt thời gian qua.

🧠 Kiến trúc hệ thống: 6 giai đoạn, 31 tác nhân kiểm chứng chéo

Hệ thống này (K-Agent Alpha) không hoạt động bằng một prompt đơn lẻ, mà vận hành như một pipeline relay Multi-Agent mô phỏng đầy đủ phương pháp đầu tư top-down (Top-Down). Hệ thống chạy tuần tự trong khoảng 1 giờ.

Phân tích danh mục & tâm lý (Phase 0~1):
- Gọi số dư thực tế qua API KIS (Korea Investment & Securities) và phân tích tỷ lệ thắng của các giao dịch trước đó để hỗ trợ vòng phản hồi.
- Xác định stance của thị trường dựa trên 5 chỉ báo gồm biến động (VIX), tỷ giá, mức tăng giảm KOSPI, v.v.
Nhóm kinh tế vĩ mô (Phase 2 - 7 tác nhân):
- Các tác nhân về lãi suất, tỷ giá, sản phẩm phái sinh phân tích thanh khoản toàn cầu thông qua FRED, API Ngân hàng Trung ương Hàn Quốc, v.v.
- Để ngăn tư duy một chiều, hệ thống được thiết kế để bắt buộc tạo ra 3 kịch bản Base/Bull/Bear.
Nhóm ngành/lĩnh vực (Phase 3 - 10 tác nhân):
- Đây là pipeline tinh vi nhất trong toàn hệ thống. Dựa trên dòng tiền mua bán thời gian thực của khối ngoại/tổ chức, PER theo ngành và tin tức tìm kiếm để sàng lọc các ngành triển vọng.
- Để bắt hiện tượng hallucination đặc trưng của LLM (gợi ý những cổ phiếu không tồn tại), tôi bố trí một tác nhân Validator để lọc cơ học các trường hợp như đã bị hủy niêm yết hoặc không đủ vốn hóa thị trường.
Nhóm phân tích doanh nghiệp và rủi ro (Phase 4 - 8 tác nhân):
- Mổ xẻ báo cáo tài chính DART, biểu đồ (chỉ báo kỹ thuật) và tin tức để đưa ra các ứng viên. Risk manager kiểm tra áp lực bán khống và MDD.
CIO có quyền ra quyết định cuối cùng (Phase 5 - 1 tác nhân):
- Kết quả đầu ra của 30 tác nhân (Gemini Flash) được tổng hợp bởi mô hình đầu bảng thông minh nhất gemini-3.1-pro-preview.
- Để ngăn các lỗi như ngụy biện chi phí chìm (Sunk Cost Fallacy), tôi áp dụng prompt 'Bounded Autonomy' buộc hệ thống phải luôn ghi rõ "kịch bản Bear Case khi tôi sai" và "điều kiện vô hiệu hóa khoản đầu tư". JSON được tạo ở đây sẽ được gửi tới API của Korea Investment & Securities.

💡 Xử lý sự cố: thiên kiến nhận thức của LLM và bùng nổ lưu lượng

Trong quá trình vận hành hệ thống, tôi đã gặp và giải quyết hai vấn đề đau đớn.

LLM không biết cắt lỗ (disposition effect):
- AI tái hiện y hệt thiên kiến nhận thức của con người: cổ phiếu có lãi thì chỉ cần tăng chút là muốn bán, còn cổ phiếu đang lỗ thì lại để đó với suy nghĩ "rồi sẽ tăng lại thôi". Để ngăn điều này, tôi sửa logic để nếu quyết định của hôm nay mâu thuẫn với hôm qua thì hệ thống phải nêu rõ vì sao stance đã thay đổi, đồng thời tự đánh giá tỷ lệ thắng trong quá khứ của chính mình và tự phản biện (Red-Teaming).
Giới hạn lưu lượng API của 31 tác nhân (Rate Limit & Context Limits):
- Khi phân tích sâu 20~30 mã cổ phiếu, tình trạng vỡ token hoặc chạm giới hạn API bên ngoài liên tục xảy ra. Cuối cùng, tôi cải tổ sang kiến trúc xử lý Batch trong đó dữ liệu khối lượng lớn như tài chính, chỉ báo biểu đồ được gom và đẩy vào từ backend trong một lượt như get_fundamental_batch_all, qua đó ổn định thời gian chạy xuống dưới 1 giờ.

📊 Ví dụ log mà AI thực sự xuất ra

Khi quá trình trên kết thúc, AI sẽ xuất ra một báo cáo chiến lược (log) ở mức độ rất sâu như dưới đây.

(Trích một phần log chẩn đoán kinh tế vĩ mô thực tế do AI viết ngày hôm qua)
"Biên độ phục hồi của PPI (giá sản xuất) ở mức (2.43%) đã vượt CPI (2.0%), cho thấy tình trạng Margin Squeeze của doanh nghiệp đang trở thành hiện thực...
Thị trường futures đang ghi nhận trạng thái backwardation sâu ở mức -1112.61.
Giá dầu vượt 100 USD và tỷ giá vượt 1.520 won, cho thấy ngày càng rõ khả năng bước vào giai đoạn 'Sudden Stop'.
→ Nâng mạnh tỷ trọng tiền mặt lên khoảng 34%. Bổ sung nhóm thiết bị đóng tàu vốn có sức hấp dẫn định giá thấp trên diện rộng."

💻 Xem kết quả chạy và log

Hiện tại toàn bộ mã nguồn vẫn đang đan xen với các khóa bảo mật và logic tài khoản thật của tôi, nên tôi chưa thể đưa lên theo kiểu open source để mọi người git clone và chạy ngay được (sau này tôi dự định sẽ整理 các prompt cốt lõi và pipeline rồi đưa lên GitHub).

Thay vào đó, tôi đã kết nối một kênh Telegram riêng để mọi người có thể đánh giá 31 pipeline prompt này thực sự thảo luận trong 1 giờ mỗi ngày và xuất ra loại log ra quyết định (kết quả) như thế nào.

Hoàn toàn không nhằm mục đích landing page, thu thập email hay marketing.
Báo cáo đầu tư cấp tổ chức do 100% LLM tự động tạo ra, cùng lịch sử giao dịch thời gian thực phát sinh từ đó (kết nối tài khoản thật, không có con người can thiệp) sẽ được stream lên mỗi ngày lúc 3 giờ 5 phút chiều.

👉 Kênh log phán đoán AI theo thời gian thực (báo cáo): t.me/K_Agent_Alpha

Nếu bạn quan tâm đến hệ thống multi-agent hoặc prompt engineering, rất mong bạn xem qua và cho những lời góp ý thẳng thắn hay phản hồi kỹ thuật về kiến trúc cũng như cách sửa lỗi phán đoán của AI!

8 bình luận

github88 2026-03-29

Trời ơi..

dydwls140 2026-03-30

Trời ơi...

woonsa 2026-03-30

LLM có thời gian suy luận nên phản ứng chậm với giao dịch thời gian thực hoặc giao dịch tần suất cao như HFT. Chỉ khả thi tối thiểu ở khung nến 5 phút. Hơn nữa, dù có ghép nhiều mô hình LLM lại với nhau thì năng lực cũng không hẳn vượt trội hơn. Thay vào đó, nên dùng khoảng 5 LLM để đảm nhiệm phân tích cảm xúc như nhận diện tâm lý thị trường hay cộng đồng là hưng phấn hay sợ hãi, những thứ mà logic thông thường hoặc mô hình LSTM không bắt được; rồi kết hợp theo kiểu ensemble với các mô hình deep learning như advanced PPO, CNN, LSTM (phân tích dữ liệu biểu đồ quá khứ) cùng phương pháp giao dịch dựa trên logic phân tích riêng của người dùng. Với giao dịch siêu ngắn hạn, các mô hình deep learning như LSTM, CNN sẽ phù hợp hơn.

cjb9452 2026-03-30

Chúng tôi đã cân nhắc đầy đủ phần đó. Vì vậy, chúng tôi đang cố tránh giao dịch tần suất cao bằng cách đặt cược vào giá đóng cửa khi thị trường kết phiên.

woonsa 2026-03-31

Xin góp thêm một chút mẹo: hãy tinh chỉnh các mô hình LLM cỡ nhỏ bằng SFT (NTR) để chuyên biệt cho một domain cụ thể, rồi chạy chúng ở local; còn API thì chỉ dùng một mô hình ngôn ngữ lớn là được! Nếu chuyên biệt hóa các mô hình cỡ khoảng 7B hoặc 3B cho từng tác vụ phân tích cụ thể thì sẽ cho kết quả tốt hơn. À, khi làm SFT (NTR), nếu tận dụng tích cực AI Hub thì sẽ tiện hơn nhiều cho việc tạo dataset. (Vì tôi cũng từng làm thử thứ gì đó tương tự rồi ^^;)

woonsa 2026-03-30

À mà nhất định phải backtest ít nhất một đến hai tháng. Nếu không, bạn có thể sẽ chứng kiến LLM làm những trò kỳ quặc và thổi bay tài sản của mình. (mua ở đáy, bán ở đỉnh)

galaxy11111 2026-03-30

Bạn đúng là đã tạo ra một khối ảo giác cực kỳ tinh vi nhỉ... Thị trường thì không thể dự đoán được. Nếu với thứ bạn làm ra mà tài sản tăng hơn gấp đôi, tôi sẽ thừa nhận là mình đã sai.