3 điểm bởi GN⁺ 2024-08-02 | 1 bình luận | Chia sẻ qua WhatsApp
  • Dự án triển khai thuật toán nhận diện bài hát của Shazam
  • Tích hợp API của Spotify và YouTube để tìm và tải bài hát
  • Go + FFMpeg + MongoDB
  • Giấy phép MIT

Tổng hợp của GN⁺

  • NotShazam là một dự án mã nguồn mở triển khai thuật toán nhận diện bài hát của Shazam
  • Có thể dùng API của Spotify và YouTube để tìm và tải bài hát
  • Dự án này cần các công nghệ như Golang, FFmpeg, MongoDB, NPM
  • Các dự án khác có chức năng tương tự gồm AudD và ACRCloud

1 bình luận

 
GN⁺ 2024-08-02
Ý kiến trên Hacker News
  • Apple vẫn nắm giữ bằng sáng chế của Shazam đến tháng 3 năm 2025
  • Bài nói chuyện của Avery Wang, đồng sáng lập Shazam, tại hội nghị DAFx17 rất hữu ích
    • Đề cập đến lý thuyết thuật toán và các vấn đề thực tế như tiếng ồn nền
  • Gần đây nhận thấy độ chính xác của Shazam đã giảm
    • Soundhound cho kết quả tốt hơn
    • Shazam trả về nhiều kết quả cho âm nhạc truyền thống châu Á, nhưng lại là bài hát sai
    • Có thể cần cải thiện thuật toán
    • Xung đột bảng băm đã tăng lên
  • Dự án này tốt để sử dụng và chỉnh sửa, nhưng có lẽ chưa nên công bố
    • Hướng dẫn cài đặt chưa tối ưu
    • Cần MongoDB nhưng không có cách kết nối
    • Nếu không thể thay MongoDB thì nên cung cấp Dockerfile và Docker Compose
    • Phần cài đặt npm cho client có 8 lỗ hổng nghiêm trọng
    • Nên đổi tên để tránh vấn đề bằng sáng chế hoặc bản quyền
    • Cần bổ sung cách thêm bài hát từ file wav
    • Dự án cần được trau chuốt thêm một chút
    • Có kế hoạch tạo PR để thử nghiệm audio matching
  • Nếu không có toàn bộ bài hát thì nó vô dụng
    • Dữ liệu quan trọng hơn thuật toán
  • Nếu nhập bài hát từ Spotify thì hợp lý hơn là trả ra bài hát trên Spotify
  • Dự án này rất thú vị
    • Từng muốn xây dựng thứ gì đó như thế này như một phần trong bucket list
  • Cốt lõi của Shazam là tìm bài hát mình không biết
    • Thắc mắc làm sao có thể cung cấp bài hát không biết đó dưới dạng liên kết Spotify
  • Tò mò không biết sẽ mất bao lâu cho đến khi ai đó gộp hàng chục tỷ bài hát vào một "mô hình bài hát lớn" khiến toàn bộ kiến thức xử lý tín hiệu trở nên vô nghĩa
  • Có thể chạy như một daemon hiển thị mọi bài hát trong thông báo UI