1 điểm bởi GN⁺ 2024-05-30 | 1 bình luận | Chia sẻ qua WhatsApp

Tai nghe AI: Chỉ nghe giọng nói của một người giữa đám đông

Nội dung chính

  • Bối cảnh nghiên cứu

    • Tai nghe khử tiếng ồn rất giỏi trong việc chặn các âm thanh cụ thể.
    • Nhưng khi người dùng chỉ muốn nghe một âm thanh cụ thể thì vẫn có giới hạn.
  • Phát triển hệ thống mới

    • Nhóm nghiên cứu tại Đại học Washington đã phát triển một hệ thống AI có tên "Target Speech Hearing".
    • Khi người dùng đeo tai nghe và nhìn vào một người cụ thể trong 3~5 giây, họ có thể chỉ nghe giọng nói của người đó.
    • Hệ thống này vẫn tiếp tục phát giọng nói mục tiêu ngay cả khi người dùng di chuyển hoặc nhìn sang hướng khác.
  • Cách sử dụng

    • Đeo tai nghe thông thường có gắn micro, nhìn vào người cụ thể và nhấn nút.
    • Tai nghe học mẫu giọng nói của người đó và chặn các âm thanh khác.
    • Hệ thống tiếp tục theo dõi giọng nói mục tiêu ngay cả khi người dùng di chuyển.
  • Kết quả nghiên cứu

    • Trong đánh giá của 21 người tham gia thử nghiệm về độ rõ của giọng nói, hệ thống được nhận xét là nghe rõ gấp đôi so với âm thanh hiện có.
    • Hiện tại chỉ có thể đăng ký một giọng nói tại một thời điểm, và nếu có âm thanh lớn phát ra từ cùng hướng thì việc đăng ký sẽ khó khăn.
  • Kế hoạch trong tương lai

    • Có kế hoạch mở rộng hệ thống sang tai nghe earbud và máy trợ thính.

Ý kiến của GN⁺

  • Tính hữu ích của công nghệ

    • Có thể hữu ích trong các môi trường nhiều tiếng ồn như họp hay bài giảng, vì giúp nghe rõ giọng nói của một người cụ thể.
  • Hạn chế của công nghệ

    • Hiện tại việc chỉ có thể đăng ký một giọng nói mỗi lần là một hạn chế khá rõ.
    • Việc khó đăng ký khi có âm thanh lớn từ cùng hướng cũng là điểm cần được cải thiện.
  • Khả năng mở rộng của công nghệ

    • Nếu được mở rộng sang earbud và máy trợ thính, công nghệ này có thể giúp ích cho nhiều người dùng hơn.
  • Công nghệ cạnh tranh

    • Cần có sự so sánh với các công nghệ khử tiếng ồn khác cung cấp tính năng tương tự.
  • Tính thực tiễn

    • Trước khi được thương mại hóa thực sự, cần xem xét chênh lệch giữa hiệu năng trong giai đoạn nghiên cứu và hiệu năng trong đời sống thực.

1 bình luận

 
GN⁺ 2024-05-30
Ý kiến trên Hacker News
  • Nếu nó có thể thu nhỏ xuống cỡ nút tai nhỏ, tôi là người không bị khiếm thính cũng muốn dùng. Có vẻ nó có thể giải quyết tình huống khó chịu khi khó nghe cuộc trò chuyện trong nhà hàng hoặc quán bar đông đúc.

  • Vấn đề giá cao và chất lượng của thiết bị hỗ trợ thính giác. Ngay cả thiết bị chỉ có chức năng khuếch đại âm thanh cơ bản cũng rất đắt. Ngoài ra, chúng còn can thiệp vào tai, khiến người dùng mất khả năng lọc các âm thanh khác.

  • Nghiên cứu AR của Facebook cung cấp một nền tảng thử nghiệm giá rẻ. Có theo dõi mắt, mảng micro và camera trước nên có thể dễ dàng biến thành một micro điều chỉnh được.

  • Với người khiếm thính, tính năng này đúng là món quà từ trời. Mong nó được tích hợp vào thiết bị trợ thính càng sớm càng tốt.

  • Tính năng này có thể giúp điều trị ù tai. Khi chỉ có một người nói thì vẫn nghe rõ, nhưng khi nhiều người cùng nói hoặc có nhạc thì không nghe được gì cả.

  • Có cung cấp liên kết mã nguồn mở và bài báo nghiên cứu. Tôi tò mò không biết có thể cho nó chạy độc lập hay không.

  • Khả năng thành công về mặt thương mại. Hãy tưởng tượng một tính năng có thể tắt tiếng giọng của người quá ồn ào.

  • Từng nghiên cứu tính năng tương tự khi làm việc tại Sonos. Họ đã cố phát triển tính năng chỉ cho nghe giọng của một người cụ thể thông qua chipset ANC.

  • Cung cấp liên kết mã nguồn. (https://github.com/vb000/LookOnceToHear)

  • Do ADHD nên rất khó trò chuyện trong căn phòng đông người. Tính năng chỉ cho nghe giọng của người đang nói chuyện cùng có vẻ sẽ cực kỳ hữu ích.

  • Tai nghe có ANC có thể hữu ích khi ở nhà. Sẽ rất tuyệt nếu có tính năng tự động cho giọng của bạn đời đi qua.