- Hệ thống tìm kiếm nhạc gồm hai giai đoạn: đăng ký và tìm kiếm
- Đăng ký: chuyển đổi nguồn âm thanh hiện có thành dấu vân tay âm thanh (Audio Fingerprint) rồi lưu vào cơ sở dữ liệu
- Tìm kiếm: chuyển đổi nguồn âm thanh đầu vào thành dấu vân tay âm thanh rồi so sánh với cơ sở dữ liệu để tìm nguồn âm thanh tương tự
- Kiến thức nền
- Tệp WAV: định dạng PCM không nén, giữ nguyên dữ liệu gốc mà không bị biến đổi
- Lấy mẫu (Sampling): chuyển đổi tín hiệu analog sang kỹ thuật số, tốc độ lấy mẫu càng cao thì độ chính xác càng tăng
- Phổ âm (Spectrogram): đồ thị trực quan hóa sự thay đổi của tần số và biên độ
- Biến đổi Fourier: chuyển tín hiệu sang miền tần số để phân tích âm thanh
- Đỉnh (Peak): dữ liệu biểu thị các thành phần tần số chính, có thể loại bỏ nhiễu và nén
- Dấu vân tay âm thanh (Audio Fingerprint): được tạo bằng cách băm dữ liệu đỉnh, dùng để lưu trữ và tìm kiếm trong cơ sở dữ liệu
- Quy trình triển khai
- Đọc tệp WAV và tạo dữ liệu lấy mẫu
- Biến đổi Fourier dữ liệu lấy mẫu để tạo phổ âm
- Trích xuất các đỉnh từ phổ âm
- Băm dữ liệu đỉnh để tạo dấu vân tay âm thanh
- Lưu dấu vân tay âm thanh vào cơ sở dữ liệu hoặc tìm kiếm để xác định nguồn âm thanh tương tự
1 bình luận
Umi