MCP YouTube Intelligence — máy chủ MCP phân tích video YouTube hiệu quả về token
(github.com/JangHyuckYun)Đây là máy chủ MCP xử lý phụ đề YouTube trên máy chủ (tóm tắt/thực thể/chủ đề/phân tích cảm xúc)
rồi chỉ truyền kết quả đã nén cho client LLM.
Lý do tạo ra:
Tôi đã khảo sát khoảng 80 máy chủ YouTube MCP hiện có, và tất cả đều ném nguyên văn phụ đề
vào LLM. Với một video dài 20 phút, mức tiêu thụ khoảng ~15.000 token
được giảm xuống còn bản tóm tắt ~200-500 token, và ngay cả báo cáo đầy đủ cũng chỉ còn ~3.000 token.
Tôi cũng đã làm cho nó có thể dùng qua CLI vì có tính đến việc sử dụng như Claude skills.
Tính năng chính:
- Báo cáo có cấu trúc (tóm tắt + chủ đề + thực thể + bình luận trong một lần)
- 9 công cụ MCP + CLI (
mcp-yt) - Tóm tắt LLM miễn phí thông qua tích hợp Ollama/vLLM
- Giám sát RSS của kênh
- Từ điển hơn 200 thực thể Hàn/Anh
- Bộ nhớ đệm SQLite
pip install mcp-youtube-intelligence
Có thể kết nối ngay trong Claude Desktop, Cursor và Claude Code.
GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/
4 bình luận
Chắc hẳn đã có trade-off khi giảm số lượng token, nhưng mình không tìm thấy phần nói về điều đó trong README!
Dạo này context mặc định là 200k, nên mình khá tò mò về mức độ suy giảm chất lượng do mất mát khi nén.
Xin chào!
Tóm tắt trích xuất (không dùng LLM) theo cảm nhận thì chỉ đạt khoảng 6/10 so với bản gốc. Nó có rút ra các câu cốt lõi, nhưng khả năng kết nối ngữ cảnh còn yếu.
Tóm tắt bằng LLM (Ollama v.v.) tốt hơn nhiều, và khi mình thử với vài video giới thiệu hoặc video liên quan đến phát triển, có vẻ là đủ để nắm bắt nội dung. Tuy vậy, đôi khi các con số chi tiết hoặc sắc thái tinh tế vẫn có thể bị mất.
Nếu là context 200k thì với một video đơn lẻ, dạng video ngắn hơn như 30 phút đến 1 tiếng, bản gốc vẫn tốt hơn,
còn khi xử lý hàng loạt hàng trăm video hoặc phân tích lặp lại, mình nghĩ có thể tiêu tốn ít token hơn mà vẫn rút ra được các nội dung chính.
(Ví dụ: phân tích toàn bộ kênh của đối thủ, phân tích 100 video của các YouTuber kinh tế, v.v.)
Mình sẽ thử thêm với nhiều loại video đa dạng hơn trong README và bổ sung rõ ràng hơn về kết quả benchmark cũng như các trade-off!
Cảm ơn bạn rất nhiều vì câu trả lời đầy tâm huyết!! Chúc dự án gặt hái được thành quả!!
Haha, vâng cảm ơn bạn!