Xin chào, tôi là một kỹ sư AI đã có 10 năm kinh nghiệm và tranh thủ đầu tư chứng khoán lúc rảnh.
Mỗi khi tự nghiên cứu một mã cổ phiếu, cá nhân tôi luôn thấy rất bất tiện vì phải đi qua lại giữa nhiều ứng dụng của công ty chứng khoán và tin tức trên các cổng thông tin để thu thập thông tin rời rạc. Sau này khi AI xuất hiện thì mọi thứ trở nên tiện hơn rất nhiều, nhưng do vấn đề hallucination và độ mới của dữ liệu nên tôi lại phải hỏi nhiều AI khác nhau rồi tự tổng hợp, và đó cũng là một quá trình rất tốn công.
Để giải quyết sự bất tiện cá nhân đó, tôi đã cùng một người quen làm ra một dịch vụ cho phép xem thông tin về cổ phiếu và kết quả phân tích từ nhiều AI (GPT, Gemini, Claude, DeepSeek) trong cùng một màn hình.
Truy cập dịch vụ ngay
• Stock AI: https://jusikai.com.
Những thời điểm phải cân nhắc
Khi xây dựng dịch vụ này, chúng tôi buộc phải suy nghĩ và đưa ra rất nhiều lựa chọn mang tính chính sách hơn là vấn đề kỹ thuật.
• Lựa chọn model và prompt: Thực tế đã có nhiều nghiên cứu về model nào phân tích cổ phiếu tốt, nhưng trong thời điểm các model mới liên tục xuất hiện như hiện nay thì việc chọn được model và prompt phù hợp là điều không hề dễ. Tôi đã cùng các thành viên trong nhóm xây dựng dữ liệu backtesting theo từng mã và tích cực tận dụng nó để chọn ra model có kết quả tốt nhất. Điều thú vị là không phải lúc nào model tốt cũng đưa ra dự đoán tốt.
• Tiêu chí gợi ý cổ phiếu: Một cổ phiếu tốt không có nghĩa là hôm nay nó sẽ tăng. Có lẽ đó cũng là lý do Warren Buffett nhấn mạnh đầu tư dài hạn. Nhưng điều này lại không phù hợp với điều kiện của chúng tôi là phải đưa ra gợi ý hằng ngày, nên chúng tôi đã thiết kế các điều kiện ngắn hạn (1 tuần) và trung dài hạn (từ 1 tháng trở lên). Đây là một phương pháp gợi ý rất trực quan và hiệu quả cho người dùng thực tế.
• Công khai dashboard: Chúng tôi luôn minh bạch công khai lợi suất của kết quả gợi ý dưới dạng dashboard theo từng model. (May mắn là trong tháng 4~5 đang cho thấy mức lợi suất tốt.)
• Nâng cấp kỹ năng cho agent: Chúng tôi định kỳ cho các model tự đánh giá phân tích của chính mình để nâng cao kỹ năng theo từng thị trường/từng mã. Việc này giúp LLM hiểu được đặc trưng của từng thị trường và từng mã để cải thiện hiệu năng tốt hơn.
• Giới hạn mã cổ phiếu và chi phí duy trì LLM: Hiện tại do vấn đề tối ưu pipeline nên dịch vụ mới chỉ hỗ trợ một số mã giới hạn. Ngoài ra, dù đã tối ưu prompt và áp dụng Context Caching tối đa để giảm lượng token sử dụng, chi phí duy trì mỗi tháng vẫn phát sinh đến hàng trăm nghìn won, nên chúng tôi cũng đang băn khoăn về tính bền vững T_T
Rất mong nhận được những phản hồi sắc bén.
• Tôi muốn lắng nghe lời khuyên từ góc nhìn của những kỹ sư và maker xuất sắc đang có mặt trên GeekNews.
• Về mặt usability: Tôi muốn biết liệu cách gợi ý và UI của chúng tôi có khiến người dùng thực tế cảm thấy quá khó dùng hoặc thiếu thân thiện hay không.
• Ngoài ra, chúng tôi sẵn sàng tiếp nhận cả bug report lẫn những lời phê bình gay gắt. Trong suốt cuối tuần tôi sẽ liên tục theo dõi, và những lỗi có thể sửa được sẽ được khắc phục và phản ánh ngay. Cảm ơn mọi người đã đọc bài viết dài này!
8 bình luận
Không biết cơ sở cho các dự đoán ngắn hạn và trung - dài hạn có phải là các báo cáo của các nhà phân tích không?
Vâng, đúng vậy! Đây là kết quả được phản ánh sau khi tính riêng điểm khuyến nghị ngắn hạn, trung hạn và dài hạn khi viết báo cáo. Với ngắn hạn, các tín hiệu như chỉ báo kỹ thuật và tin tức được phản ánh mạnh hơn, còn với trung và dài hạn, mức cải thiện về yếu tố cơ bản được phản ánh nhiều hơn.
Tôi đã xem qua dịch vụ một lần. Có thể thấy công sức bạn bỏ ra, nhưng vì bạn nói cũng sẽ chấp nhận những lời phê bình gay gắt nên tôi xin viết thẳng.
Bản thân tiền đề rằng sự đồng thuận của 4 mô hình sẽ làm tăng độ tin cậy có vẻ khá rủi ro. GPT, Gemini, Claude, DeepSeek rốt cuộc đều là những mô hình được huấn luyện trên dữ liệu Internet khá giống nhau, nên khi nhìn cùng một mã cổ phiếu thì chúng sẽ nói những điều tương tự. Có sự đồng thuận = không phải độ tin cậy tăng gấp bốn, mà khả năng cao hơn là cùng một thiên lệch bị lặp lại bốn lần. Hiệu quả của ensemble chỉ xuất hiện khi các mô hình độc lập với nhau, nhưng giữa các LLM đa dụng thì điều đó không được đảm bảo.
Cảm ơn bạn đã góp ý! Đúng như bạn nói, việc có 4 mô hình không có nghĩa là độ tin cậy tăng gấp 4, điều đó chắc chắn không đúng. Tuy vậy, bạn có thể hiểu là chúng có thể phần nào bắt lỗi cho nhau. Điều thú vị là, ngay cả khi đưa cùng một prompt và cùng một dữ liệu, cách mỗi mô hình phân tích và góc nhìn của chúng thực sự khác nhau khá nhiều so với mong đợi. Với 4 persona cũng vậy, chúng tôi đã phân tích kỹ điểm này và thử nghiệm rất nhiều để không ép buộc đưa chúng vào một cách gượng gạo. Dù vẫn còn nhiều thiếu sót, chúng tôi sẽ tiếp tục cải thiện để trở thành một dịch vụ đáng tin cậy hơn nữa! Cũng xin chân thành cảm ơn bạn đã ghé xem dịch vụ và để lại ý kiến.
Cảm ơn bạn đã phản hồi! Nếu nói ngắn gọn thêm về ý “bắt lỗi cho nhau”, thì dù các mô hình có khác nhau ở góc nhìn bề mặt, vì chúng được huấn luyện trong cùng thời kỳ và trên cùng corpus nên thường mắc những loại lỗi tương tự. Khi đó, ngay cả khi đạt được đồng thuận theo đa số, lỗi đó không những không bị lọc bỏ mà còn có thể bị củng cố mạnh hơn.
Nếu có thể, mình khuyến nghị bạn thử đo lường một lần. Nếu trên dữ liệu backtest, bạn so sánh phân phối lợi nhuận hậu nghiệm giữa lúc ý kiến của 4 mô hình (a) trùng khớp và (b) bất đồng, thì nếu (a) cho kết quả tốt hơn (b) một cách có ý nghĩa, đó sẽ là bằng chứng thực nghiệm cho hiệu ứng đa số; còn nếu không có khác biệt, hoặc thậm chí (b) tốt hơn, thì đó có thể là tín hiệu cho thấy mức đồng thuận đó gần với nhiễu đã được đồng thuận. Đây là một giả thuyết có thể chạy thử ngay trên bộ dữ liệu bạn đã xây dựng, nên mình nghĩ nếu xem thử thì sẽ khá thú vị!
Cảm ơn bạn vì đề xuất hay. Thực tế thì không phải cứ mọi mô hình đều khuyến nghị là đó sẽ là mã có tỷ suất sinh lời cao. Tôi từng nghĩ phần này có liên quan đến đặc tính của cổ phiếu là rủi ro càng cao thì tỷ suất sinh lời càng lớn, nhưng đây đúng là một đề xuất thú vị, cảm ơn bạn :)
Ồ.. nghe nói là all-in nên ngón tay cứ ngứa ngáy quá~
Tôi sẽ dùng thử thật tốt hehe
Vâng, cảm ơn nhé haha