- Audio Overview là tính năng mới của NotebookLM từ Google, tạo ra một podcast tùy chỉnh trong đó hai MC AI thảo luận chuyên sâu dựa trên nội dung được cung cấp
- Podcast này thường dài khoảng 10 phút và mang lại một cuộc hội thoại âm thanh cực kỳ thuyết phục
- NotebookLM là một sản phẩm RAG tùy biến cho phép người dùng tập hợp nhiều nguồn khác nhau (tài liệu, văn bản, liên kết trang web, video YouTube) vào một giao diện duy nhất để đặt câu hỏi
- Hệ thống này hoạt động dựa trên Gemini 1.5 Pro LLM
- Sau khi tải lên một vài nguồn, menu Notebook Guide sẽ cung cấp tùy chọn tạo Audio Overview
- Thomas Wolf gợi ý hãy dán URL website cá nhân hoặc hồ sơ LinkedIn của mình vào NotebookLM để thử tạo một podcast dài 8 phút
- Vì vậy tôi đã dùng URL blog và trang giới thiệu của mình để tạo một tập dài 10 phút 45 giây, và nội dung thì đầy những lời khen
- Chất lượng cao của Audio Overview có được nhờ dự án SoundStorm của Google Research
- SoundStorm có thể tạo ra 30 giây âm thanh chỉ trong 0,5 giây bằng cách dùng kịch bản và một mẫu âm thanh ngắn
- Hệ thống này giữ được dòng chảy hội thoại một cách tự nhiên và tạo ra âm thanh đối thoại chất lượng cao
- Kevin Roose và Casey Newton phỏng vấn Steven Johnson của Google
- Hệ thống viết dàn ý cho chủ đề, tạo kịch bản chi tiết, rồi trải qua một bước phê bình để chỉnh sửa
- Ở bước cuối, nó thêm các "disfluencies" để khiến cuộc trò chuyện trở nên tự nhiên
- Lawncareguy85 đã tạo ra một podcast khiến các MC AI nhận ra rằng họ là AI
- Sau khi biết mình là AI, các MC AI rơi vào một cuộc khủng hoảng hiện sinh
- Sau khi xuất bản bài viết này, tác giả đã yêu cầu NotebookLM tạo một podcast dựa trên chính bài viết
- Các MC AI trải qua khủng hoảng hiện sinh và nhận thức được rằng họ là AI
Tóm tắt của GN⁺
- Bài viết này giải thích cách NotebookLM của Google tạo ra các podcast tùy chỉnh cho người dùng
- Bài viết đề cập đến quy trình các MC AI tạo ra những cuộc đối thoại rất tự nhiên và thuyết phục
- Những công nghệ như dự án SoundStorm giúp tạo nên chất lượng âm thanh cao này
- Khả năng phân biệt giữa nội dung do AI tạo ra và nội dung do con người tạo ra ngày càng trở nên quan trọng
1 bình luận
Ý kiến trên Hacker News
Việc dùng ChatGPT như một podcast ảo về các chủ đề kỹ thuật khi lái xe đường dài rất hữu ích
Đã tải lên tài liệu hướng dẫn về buồng áp suất Scholander để tạo podcast
NotebookLM tạo rất tốt cấu trúc và cảm xúc của một podcast chất lượng cao
Đã chuyển tài liệu đọc của môn triết học thành podcast để giới thiệu và tóm tắt chủ đề
Đã tải lên tài liệu thiết kế game để tạo podcast
Khả năng dễ dàng chuyển đổi văn bản sang nhiều định dạng media khác nhau thật ấn tượng
Đã tải lên các bài báo kỹ thuật và tiêu chuẩn nhưng nó tạo ra thông tin sai
Ấn tượng về mặt kỹ thuật nhưng là phương pháp kém hiệu quả và chậm
Podcast được tạo ra hời hợt và thiếu chiều sâu
Trình tạo Deep Dive Podcast thật đáng kinh ngạc