FoldAlpha – Kiểm chứng chiến lược đầu tư bằng AI và cả cảnh báo tự động, chỉ với ngôn ngữ tự nhiên
(app.foldalpha.com)Đầu tư bằng AI, chắc hẳn ai cũng quan tâm đúng không
Nếu nhìn trên X hay Threads, có thật sự rất nhiều bài viết chia sẻ trải nghiệm đầu tư bằng AI. Chỉ cần giao cho coding agent, nó có thể tạo chiến lược đầu tư trong chớp mắt, rồi còn chạy thử được nữa. Có lẽ lúc đầu, đa số mọi người sẽ bắt đầu từ việc nhờ AI chọn mã cổ phiếu.
Nhưng cách này có một giới hạn mang tính cấu trúc. Đầu tư dựa trên phán đoán của AI rất khó kiểm chứng một cách khoa học. Vì AI đã học dữ liệu quá khứ từ trước, nên dù bạn yêu cầu kiểu như "hãy xem tin tức ở thời điểm tháng 3/2020 và chọn cổ phiếu", điều đó cũng không có nhiều ý nghĩa — vì nó đã biết kết quả rồi. Cuối cùng, chỉ còn cách chạy live và theo dõi lợi nhuận thực tế, chứ không có cách nào ước lượng trước hiệu quả sinh lời.
Khi nhận ra điều này, sự quan tâm sẽ tự nhiên chuyển sang phương pháp định lượng (quant) — sàng lọc theo factor, backtest dựa trên dữ liệu. Nếu muốn hệ thống hóa đầu tư một cách nghiêm túc, tôi nghĩ đây là hướng đi bài bản nhất.
Nhưng dữ liệu lại khó hơn tưởng tượng
Muốn đầu tư quant thì cần dữ liệu. Để backtest có ý nghĩa, bạn phải có hơn 10 năm dữ liệu của thị trường Hàn Quốc như giá ngày, báo cáo tài chính và dữ liệu dòng tiền. Tất nhiên, nếu giao cho coding agent thì nó cũng có thể thu thập. Nhưng việc lấy dữ liệu miễn phí theo kiểu dùng một lần có giới hạn nhiều hơn tưởng tượng. Nếu tính cả giới hạn gọi API, tính nhất quán của dữ liệu, xử lý các mã bị hủy niêm yết v.v., thì khối lượng công việc khá lớn.
Ngoài ra, nếu muốn nối tiếp sang engine backtest, schedule job chạy hằng ngày, cảnh báo, rồi sau này cả giao dịch tự động, thì vẫn còn rất nhiều việc phải làm.
Vì vậy, FoldAlpha là thứ tôi tạo ra bằng cách dựng sẵn môi trường này, rồi làm cho nó có thể dùng dễ dàng bằng ngôn ngữ tự nhiên.
Có thể làm được những gì
- Backtest bằng ngôn ngữ tự nhiên: Nếu định nghĩa chiến lược bằng ngôn ngữ tự nhiên như "tái cân bằng theo quý với các cổ phiếu có PBR dưới 0.5 và biên lợi nhuận hoạt động trên 10%", agent sẽ chuyển nó thành SQL và chạy backtest 10 năm. CAGR, MDD, Sharpe Ratio, thậm chí cả mức lợi nhuận vượt trội so với KOSPI cũng được tính tự động.
- Schedule job + cảnh báo Telegram: Nếu đăng ký điều kiện như "mỗi sáng 9 giờ hãy phân tích các cổ phiếu có khả năng tăng mạnh", hệ thống sẽ tự động chạy hằng ngày và gửi kết quả qua Telegram.
- Hỏi đáp về dữ liệu tài chính: Có thể truy vấn và phân tích báo cáo tài chính, giá cổ phiếu và dữ liệu dòng tiền bằng ngôn ngữ tự nhiên.
Bản thân tôi cũng đang đầu tư thực tế bằng chính bộ dữ liệu này, lựa chọn cổ phiếu và tái cân bằng theo tháng hoặc theo quý ở cả thị trường Hàn Quốc và Mỹ. Không thể nói lợi nhuận là quá vượt trội, nhưng tôi nghĩ đây là phương pháp hợp lý và khách quan nhất mà nhà đầu tư cá nhân có thể áp dụng.
Đầu tư theo gợi ý của AI tất nhiên cũng làm được
Tin tức, báo cáo kết quả kinh doanh, "cổ phiếu hưởng lợi từ chuỗi giá trị HBM", "cổ phiếu hưởng lợi từ thuế quan của Trump" — xung quanh tôi hầu như ai cũng đầu tư theo kiểu này.
Điều đó tất nhiên cũng làm được. Nếu đăng ký schedule job kiểu "mỗi ngày hãy phân tích cổ phiếu có khả năng tăng mạnh hôm nay dựa trên tin tức", agent sẽ tìm kiếm và phân tích tin tức theo thời gian thực để đưa ra khuyến nghị mỗi ngày, đồng thời có thể theo dõi xem ngày hôm sau giá có thực sự tăng hay không. Hiện tôi đang chạy live kịch bản này và tích lũy kết quả.
Lúc này, sau khi quan sát thêm một thời gian kết quả khuyến nghị live, bước tiếp theo tôi đang nghĩ tới là kết nối cả giao dịch tự động. Với API của Korea Investment & Securities, phần thiết lập ban đầu hơi phức tạp, nhưng nếu chỉ là đăng ký key thì bản thân việc đặt lệnh có lẽ không quá khó.
Nếu muốn tiếp cận đầu tư chiến lược dựa trên tin tức một cách khoa học, cần phải xây dựng cả kho lưu trữ tin tức, nhưng việc thu thập ngược các tin tức quá khứ có lẽ là bài toán không dễ ngay cả với Bloomberg. Tôi định sẽ giải quyết dần về lâu dài.
Được làm như thế nào
Đương nhiên tôi làm nó bằng vibe coding. Tôi đang dùng đa dạng Claude Code, Codex, Cursor. Tuy vậy, xây mọi thứ bằng vibe coding không có nghĩa là chỉ cần "bấm một cái là xong". Đặc biệt, phần LLM agent runtime — tức phần tạo harness — buộc phải đi khá sâu.
Lúc đầu, agent mà vibe coding tạo ra là một pipeline phức tạp gồm intent classifier và 9 công cụ, nhưng vừa chậm về latency vừa không mở rộng được. Sau khi phân tích kiến trúc của các coding agent mới được công bố gần đây như Claude Code hay Codex CLI, tôi đã thiết kế lại thành cấu trúc lightweight single-loop, nơi LLM tự ra quyết định trực tiếp ở mỗi bước, và kết quả là latency giảm hơn 2 lần. Tôi đã viết lại quá trình này thành technical report, đồng thời cũng công khai mã runtime dưới dạng mã nguồn mở.
Tech stack:
- Frontend: Next.js (Vercel)
- Backend: Fastify (Node.js)
- LLM agent runtime: Python, tự triển khai — mô hình agent single-loop
- DB dữ liệu cổ phiếu: Oracle Autonomous DB (10 năm dữ liệu giá ngày, tài chính, dòng tiền của thị trường Hàn Quốc)
- Dữ liệu người dùng: Supabase (PostgreSQL)
- Tìm kiếm tin tức: Brave Search API
- LLM: Gemini / GPT / Claude (BYOK — người dùng tự dùng API key của mình)
Hạ tầng: toàn bộ là free tier
- Vercel: hosting frontend
- Supabase: DB người dùng + xác thực
- Oracle ADB: DB dữ liệu cổ phiếu (Always Free)
- Oracle Cloud: 1 VM instance — cả server production và development đều đang chạy ở đây
- Cloudflare: domain + CDN
Chi phí duy nhất là tiền mua domain. Tôi đang chạy cả môi trường production và development trên cùng một instance, chỉ tách theo port.
Liên kết
- Dịch vụ: https://app.foldalpha.com/about
- Agent runtime (mã nguồn mở): https://github.com/sbyoun/finllm-agent
- Technical report về agent runtime: https://github.com/sbyoun/finllm-agent/…
Rất hoan nghênh phản hồi.
Chưa có bình luận nào.