musn129: Dịch vụ tóm tắt tin tức chứng khoán Mỹ
(musn129.com)Đây là dịch vụ tổng hợp tin tức chứng khoán Mỹ và tóm tắt lý do vì sao giá tăng hoặc giảm.
Ví dụ, với Netflix vào ngày gần đây nhất là 2022-10-21, dịch vụ cung cấp phần tóm tắt the company is reinvesting a huge chunk of its profits at a high rate of return đồng thời cho phép truy cập liên kết tới bài báo gốc tương ứng.
Vì tôi rất quan tâm đến chứng khoán Mỹ, nhưng mỗi sáng thức dậy lại phải tự tìm kiếm từng cái để xem vì sao giá tăng hay giảm thì khá bất tiện, nên tôi đã phát triển dịch vụ này và chia sẻ ở đây với hy vọng có thể hữu ích cho ai đó.
Về mặt kỹ thuật, nó như sau.
- Được xây dựng theo kiến trúc Fully Serverless (AWS Lambda + Cloudfront Lambda@Edge)
- Sau khi crawl các tin tức liên quan đến chứng khoán Mỹ, dùng mô hình machine learning tên là SQuAD để suy luận kết quả (ví dụ:
Why Nvidia stock goes up?)- Mô hình sử dụng là loại đã được tối ưu nhẹ để có thể chạy đầy đủ trên Lambda (dòng Distillation BERT)
- Tất cả Lambda tạo dữ liệu đều được xử lý trong phạm vi AWS Free Tier, và chi phí phát sinh thêm chỉ là chi phí domain của S3 và Route 53 (hiện khoảng $2 mỗi tháng)
- Tất cả dữ liệu được lưu trên S3 và không sử dụng DB riêng
- SSR (NextJs) + Cloudfront Lambda@Edge (us-east-1)
Tôi luôn theo dõi rất kỹ và xin cảm ơn mọi người. Tôi viết bài này với hy vọng có thể giúp ích dù chỉ một chút cho những ai quan tâm. Xin cảm ơn.
16 bình luận
Xin chào. Mình muốn chia sẻ rằng dự án phụ musn129 đã làm trước đây đã có một thay đổi lớn.
Trước hết, mình muốn gửi lời cảm ơn chân thành vì đã có rất nhiều sự quan tâm và những người vẫn đều đặn sử dụng dịch vụ.
Trước đây, để tối ưu chi phí, toàn bộ xử lý đều được thực hiện trên AWS Lambda, còn suy luận mô hình thì dùng Distillation BERT để giải bài toán SQuAD (ví dụ: đưa ra câu hỏi như “vì sao cổ phiếu này tăng trong bài viết?” rồi để mô hình tìm ra câu trả lời nằm ở "vị trí nào" trong bài báo), nhưng nay đã chuyển sang sử dụng API trả phí của OpenAI. Dữ liệu được xử lý bằng mô hình mới đã được áp dụng từ năm 2023. (Dữ liệu năm 2022 vẫn là dữ liệu cũ)
Vì không thể đính kèm hình ảnh nên cuối cùng mình để lại luôn kết quả của LUCID, mã có biến động lớn nhất tính đến hôm nay. (Có thể xem tại https://musn129.com/nasdaq/2023-01-27 !)
Cảm ơn!
Sẽ rất tuyệt nếu có thể tạo một phiên bản crypto. Thị trường crypto có tương quan rất tích cực với tin tức.
Wow.. cảm ơn vì dịch vụ thật sự rất tuyệt vời này
Trong số các chương trình tương tự, mình thấy giao diện người dùng cũng tiện và đây có vẻ là cái ổn nhất. Mình đã dùng Yahoo Finance, Dow Jones, Bloomberg, v.v. (không phải người trong nghề nên chưa dùng tới mức phần mềm chuyên dụng, chỉ là nhà đầu tư cá nhân thôi), và thấy việc xem các bài viết liên quan khá thuận tiện. Tuy vậy, vì mỗi người đều có mã quan tâm riêng, nên sẽ tốt hơn nếu dù không cần tạo hẳn tài khoản thì vẫn có thể đánh dấu sao và theo dõi liên tục một số mã cụ thể. Mình sẽ dùng tốt. Cảm ơn nhé ^-^
Tôi đang làm tại một công ty chứng khoán. Tôi muốn phát triển cái này thành một dịch vụ..??
Có một điều tôi tò mò là, nếu tôi gửi email thì bạn có thể trả lời giúp tôi không?? haha
Xin chào! Cảm ơn bạn đã quan tâm. Nếu có điều gì thắc mắc, hãy để lại và tôi sẽ trả lời! Tuy nhiên, nếu nội dung không mang tính cá nhân, sẽ tốt hơn nếu bạn để lại tại đây để có thể chia sẻ cùng mọi người! Cảm ơn bạn.
Vâng. Tôi có quá nhiều điều muốn hỏi. :) Tôi không rành lắm về mặt kỹ thuật nên xin phép hỏi một cách thoải mái nhé.
Liệu có thể nâng độ chính xác của dự án này lên hơn nữa không?
Có vẻ sẽ theo hướng tăng lượng tin tức, nâng chất lượng tin tức, hoặc cải thiện độ chính xác của mô hình.
Nếu投入 thêm nhiều tài nguyên hơn, tôi tò mò không biết có thể nâng độ chính xác của dịch vụ bạn đã đăng lên đến mức nào. haha
Quá tuyệt vời. run run;;
Nếu có thể nâng độ chính xác lên đủ cao, có lẽ có thể cân nhắc triển khai ngay thành một sản phẩm thực tế.
(Chỉ nhìn phản ứng trong phần bình luận của những người đã xem dịch vụ này thôi cũng đủ thấy việc kiểm chứng theo kiểu Preto-Type (proto x, preto o) gần như đã xong rồi haha)
Với tư cách là người làm sản phẩm, có hai điểm cải thiện lớn mà tôi đã luôn trăn trở trong mảng cổ phiếu nước ngoài.
Một là các pain point mang tính vật lý hoặc kỹ thuật
-Ví dụ như phải giao dịch vào buổi tối / phải đổi ngoại tệ / chỉ hiển thị giá chậm 15 phút / không thấy bảng giá chào mua bán / không có nhiều quốc gia được hỗ trợ giao dịch, tức là làm thế nào để giải quyết những bất tiện phát sinh từ khoảng cách vật lý giữa thị trường sở tại và thị trường nội địa.
Nhưng hiện tại phần này đã được cải thiện khá nhiều rồi. Nhờ sức mạnh của vốn... haha
Gần đây, lĩnh vực tôi quan tâm là vấn đề thông tin và nội dung.
Trước hết là phải giỏi tiếng Anh, mà kể cả có giỏi tiếng Anh thì việc tìm kiếm thông tin ở nước ngoài vẫn khó, lại còn quá nhiều nên cũng không biết phải tìm gì và tìm như thế nào. Không có thời gian, thứ để xem thì nhiều, đầu tư thì khó, mà cũng chẳng có ai chỉ cho,,,
Vì thế những việc mà các công ty chứng khoán thường làm là lập đội ngũ content, mua content từ bên ngoài, hoặc mở rộng phạm vi research coverage sang cả cổ phiếu nước ngoài, nhưng vẫn còn rất nhiều việc phải làm. Lại còn cần bàn tay con người can thiệp vào từng khâu. Thành ra tính thời sự cũng giảm đi..
Đó là lý do tôi thực sự rất ấn tượng với dịch vụ mà bạn đã xây dựng.
Có vẻ như dịch vụ này có thể nâng trải nghiệm người dùng hằng ngày lên rất nhiều. Rốt cuộc thứ người ta muốn chẳng phải là vì sao nó tăng, vì sao nó giảm... hay sao haha
Cảm ơn bạn đã phản hồi chi tiết! Có lẽ nó sẽ rất hữu ích. Đặc biệt, vì bạn đã chia sẻ góc nhìn từ người đang làm trong ngành, nên không chỉ với riêng tôi mà còn sẽ là sự giúp đỡ rất lớn cho những người khác nữa. Xin cảm ơn!! hihihi
Cảm ơn cả dự án lẫn bình luận. Có vẻ sẽ giúp ích rất nhiều cho những người khác!
Đây đúng là một dịch vụ rất tuyệt vời!
Nhiều khi dù cổ phiếu tăng trần nhưng lại không nói rõ lý do, chỉ toàn có tin là cổ phiếu đã tăng trần thôi.. Mình cũng tò mò không biết có thể lọc tốt những tin như vậy bằng cách nào nhỉ
Xin chào! Cảm ơn bạn đã quan tâm. Mình nghĩ có hai lý do lớn khiến chất lượng bị giảm. Một là bản thân nội dung của bài gốc không chứa đủ thông tin mà người dùng mong muốn, và hai là kết quả suy luận của mô hình machine learning chưa tốt. (Hiện tại vẫn đang dùng một cách khá ngây thơ haha..)
Hiện tại, khi có nhiều bài viết thì bên mình sắp xếp theo
model output score, nhưng nếu bổ sung thêm một số heuristic khác cho các câu quá ngắn (ví dụ như hoàn toàn trống như đang thấy hiện tại, hoặc quá ngắn) thì có vẻ có thể cải thiện khá nhanh. Cảm ơn bạn đã góp ý rất hữu ích!Wow! Dịch vụ này thú vị thật. Tự nhiên mình nghĩ liệu có thể dùng cách này để phân tích khi một bài hát của nghệ sĩ nào đó bất ngờ leo ngược trên bảng xếp hạng âm nhạc không nhỉ.
Cảm ơn ý kiến hay! Với cách tiếp cận tương tự, nếu có đủ dữ liệu thì quả thật sẽ có rất nhiều thứ có thể tận dụng được nhỉ!
Cổ phiếu... cũng có lúc tăng à....? Lạ nhỉ... sao của tôi thì chỉ thấy rớt thôi...
Trước khi mua cổ phiếu mới, mong bạn chia sẻ lên GeekNews.