2 điểm bởi GN⁺ 2024-12-21 | 1 bình luận | Chia sẻ qua WhatsApp
  • Cần một trợ lý giọng nói không thu thập dữ liệu và không tùy tiện giới hạn tính năng
  • Cũng như Home Assistant đã biến tự động hóa nhà ở cục bộ, riêng tư thành hiện thực, sự thay đổi tương tự cũng khả thi và cần thiết đối với trợ lý giọng nói
  • Mục tiêu:
    • Hướng đến việc vượt qua khả năng của các trợ lý giọng nói hiện có
    • Khác với các công ty hiện tại đang tìm cách kiếm tiền từ dữ liệu, tập trung vào việc cải thiện công nghệ giọng nói mở và mang tính cá nhân
    • Hỗ trợ cả những ngôn ngữ mà các công ty công nghệ lớn đã bỏ qua, đồng thời cho phép người dùng tự lựa chọn cách triển khai giọng nói
  • Ngay từ khi bắt đầu phát triển trợ lý giọng nói mã nguồn mở cho Home Assistant, đã thiếu một yếu tố cốt lõi: phần cứng tốt, dễ thiết lập và dễ sử dụng
    • Cần phần cứng chất lượng cao, có thể thiết lập đơn giản và sử dụng dễ dàng
    • Cung cấp phản hồi rõ ràng
    • Hài hòa tự nhiên với môi trường gia đình
    • Cung cấp phần cứng giọng nói giá phải chăng nhưng chất lượng cao để nhiều người hơn có thể tham gia phát triển

Home Assistant Voice (Preview Edition)

  • Mục tiêu: cung cấp phần cứng tối ưu để bắt đầu với Assist, trợ lý giọng nói tích hợp của Home Assistant
  • Mang lại hiệu năng và khả năng sử dụng được nâng cấp so với phần cứng bên thứ ba hiện có
  • Đặc điểm:
    • Micro képbộ xử lý âm thanh chuyên dụng giúp thu nhận lệnh với độ chính xác vượt trội
    • Thiết kế tinh tế, tối giản, hòa hợp với không gian gia đình
    • Vòng LED, núm xoay, nút đa chức năng và công tắc tắt tiếng vật lý cho phép thao tác trực quan, thân thiện với người dùng
  • Giá: MSRP $59, mức giá cạnh tranh, có thể mua ngay

Bối cảnh ra mắt Preview Edition

  • Nhận thức rằng không phải mọi người dùng đều sử dụng trợ lý giọng nói theo cùng một cách
  • Phản ánh nhiều nhu cầu khác nhau, từ người chỉ cần lệnh đơn giản và điều khiển thiết bị đến người muốn các tính năng phức tạp hơn
  • Preview Edition mang đến cơ hội trải nghiệm trước hướng đi của công nghệ trợ lý giọng nói trong tương lai

Tích hợp hoàn hảo với Home Assistant

  • Phần cứng chuyên dụng được thiết kế cho Home Assistant
  • Quy trình thiết lập:
    • Chỉ cần cắm điện là Home Assistant sẽ tự động phát hiện thiết bị
    • Có thể thiết lập nhanh chóng và đơn giản thông qua wizard
  • Được thiết kế để có thể sử dụng ngay mà không cần DIY

Công nghệ xử lý âm thanh tiên tiến

  • Nhận diện giọng nói vượt trội nhờ micro kép và bộ xử lý âm thanh XMOS
    • Bao gồm khử tiếng vọng, khử nhiễu tĩnh và điều khiển độ lợi tự động
  • ESP32-S3 và 8MB PSRAM mang lại hiệu năng nhanh, phản hồi tốt
  • Phần cứng tốt nhất sẵn sàng tận dụng các khả năng mở rộng của phần mềm Assist

Cung cấp lựa chọn cục bộ và dựa trên đám mây

  • Xử lý giọng nói cục bộ:
    • Có thể xử lý lệnh giọng nói ngay cả khi không có Internet
    • Cần ngôn ngữ được hỗ trợ và phần cứng hiệu năng cao (khuyến nghị Intel N100 trở lên)
  • Home Assistant Cloud:
    • Cung cấp xử lý qua Internet để cả người dùng phần cứng cấu hình thấp cũng có thể sử dụng
    • Vẫn coi trọng quyền riêng tư đồng thời cải thiện độ phản hồi và độ chính xác

Mã nguồn mở hoàn toàn và khả năng tùy biến

  • Mã nguồn mở:
    • Cả phần cứng lẫn phần mềm đều được công khai
    • Người dùng có thể sửa đổi phần cứng và phần mềm theo nhu cầu của mình
  • Khả năng mở rộng phần cứng:
    • Có thể kết nối loa ngoài qua jack tai nghe 3.5mm
    • Có thể bổ sung nhiều cảm biến và phụ kiện qua cổng Grove
    • Dễ chỉnh sửa nhờ khả năng mở phần trong đơn giản và các pad trên bo mạch
    • Cung cấp tệp thiết kế 3D để tùy biến ngoại hình

Phát triển lấy cộng đồng làm trung tâm

  • Có thể liên tục cải thiện thông qua sự hợp tác của cộng đồng Home Assistant và ESPHome
  • Có thể đóng góp cho dự án bằng cách mua phần cứng chính thức hoặc hỗ trợ Home Assistant Cloud
  • Cộng đồng dẫn dắt sự phát triển của công nghệ trợ lý giọng nói

Kết luận

  • Home Assistant coi trọng tự do lựa chọn, và Voice Preview Edition mang đến một trong những phần cứng giọng nói tốt nhất, hoàn toàn mở nhưng vẫn bảo vệ quyền riêng tư
  • Nhờ đóng góp của nhóm phát triển và cộng đồng, phần cứng và phần mềm cùng tiến hóa một cách đổi mới
  • Sản phẩm này sẽ trở thành tiêu chuẩn phần cứng cho các dự án giọng nói mở trong nhiều năm tới
  • Có thể xem nội dung kỹ thuật mới nhất liên quan đến Assist trong blog Voice Chapter 8 của Mike Hansen

1 bình luận

 
GN⁺ 2024-12-21
Ý kiến trên Hacker News
  • Một người dùng bày tỏ sự kỳ vọng đối với các dự án phần cứng mã nguồn mở, đặc biệt quan tâm đến các dự án trợ lý giọng nói chú trọng quyền riêng tư

    • Đề xuất mô hình bán phần cứng theo hình thức "mua chung"
    • Nhắc đến ý tưởng về một trang web mua chung dành cho phần cứng mã nguồn mở
  • Một người dùng khác nhấn mạnh tính hữu ích của dự án Home Assistant và khen ngợi việc nó có thể chạy trên nhiều loại phần cứng khác nhau

    • Giải thích rằng tính năng trợ lý giọng nói của Home Assistant cũng hoạt động linh hoạt tương tự
    • Cảm ơn cộng đồng đã phá bỏ các rào cản do những tập đoàn lớn tạo ra
  • Một người dùng khác nữa cảnh báo rằng phần cứng có thể xâm phạm quyền riêng tư, đồng thời chỉ ra rằng ý đồ của doanh nghiệp không phải lúc nào cũng hoàn toàn thiện chí

    • Nêu cách Apple xử lý dữ liệu cá nhân làm ví dụ và bày tỏ lo ngại về việc bình thường hóa thu thập dữ liệu
    • Cảnh báo rằng dữ liệu âm thanh thu từ micro có thể nằm ngoài tầm kiểm soát của người dùng
  • Một người dùng cho biết họ ấn tượng với hiệu năng trợ lý giọng nói của các dự án ESP32, nhưng đang tìm phần cứng tốt hơn

    • Kỳ vọng vào một sản phẩm có thể thay thế Alexa
  • Đề cập rằng đây là thời điểm phù hợp để ra mắt sản phẩm mới, khi đà tăng trưởng của các thiết bị Alexa và Google Assistant đang chững lại hoặc suy giảm

  • Bật cười trước lời cảnh báo về phần cứng mạnh mẽ và nhắc đến N100

  • Chỉ ra sự thiếu hụt trong khả năng điều khiển bằng giọng nói của Home Assistant và hoan nghênh sự xuất hiện của giải pháp mới

    • Đề xuất N100, nhưng cũng có kế hoạch thử với phần cứng hiện có
  • Nói rằng họ không hoàn toàn hiểu mô hình upsell đám mây và muốn chạy các mô hình cao cấp hơn ngay trên máy cục bộ

    • Nhấn mạnh sự cần thiết của README và hướng dẫn bắt đầu
  • Thắc mắc về sự khác biệt so với Respeaker 2

    • Nhắc rằng Respeaker có thể dễ dàng khử nhiễu nhờ 4 micro
  • Đề cập đến nhu cầu về một trợ lý giọng nói hoạt động hoàn toàn cục bộ

    • Chỉ ra rằng việc sử dụng trong nhà có thể trở nên nhàm chán và giải thích sự cần thiết của kết nối bên ngoài
  • Một người dùng than phiền về hệ thống điều khiển phức tạp của chiếc máy tạo ẩm họ mới mua gần đây

    • Nhắc đến khả năng giao tiếp với trợ lý giọng nói và nhấn mạnh rằng cần có trí thông minh ở cả hai phía