1 điểm bởi GN⁺ 2023-12-18 | 1 bình luận | Chia sẻ qua WhatsApp

Bước đột phá mới trong công nghệ đọc suy nghĩ

  • Nhóm nghiên cứu tại Trung tâm AI lấy con người làm trung tâm GrapheneX-UTS của Đại học Công nghệ Sydney đã công bố một bước đột phá mới liên quan đến công nghệ 'đọc suy nghĩ'.
  • Nghiên cứu này đã thành công trong việc chuyển đổi suy nghĩ thành các từ hiển thị trên màn hình, và được đánh giá là nỗ lực tiên phong trong việc dịch trực tiếp các sóng EEG thô thành ngôn ngữ.
  • Trong quá trình dịch sóng não thành văn bản, nghiên cứu đã đưa vào kỹ thuật mã hóa rời rạc và, thông qua việc tích hợp với mô hình ngôn ngữ lớn, mở ra triển vọng mới cho lĩnh vực khoa học thần kinh và AI.

Công nghệ dịch ngôn ngữ bằng sóng não

  • Trong khi những người tham gia đọc văn bản trong im lặng, mô hình AI mang tên DeWave chỉ sử dụng sóng não của họ làm đầu vào để chiếu các từ lên màn hình.
  • Đây là công nghệ duy nhất có thể dịch tín hiệu não thành ngôn ngữ mà không cần cấy ghép não hoặc truy cập vào máy MRI cỡ lớn.
  • So với các công nghệ trước đây cần thêm đầu vào, chẳng hạn như phần mềm theo dõi chuyển động mắt, công nghệ mới này có thể sử dụng mà không cần các tính năng bổ sung đó.

Tính thực tiễn và sự tiện lợi

  • Người dùng chỉ cần đội một chiếc mũ ghi lại hoạt động não qua EEG, nên thực tế và tiện lợi hơn nhiều so với thiết bị theo dõi mắt hay máy MRI.
  • Nhóm nghiên cứu thừa nhận tín hiệu có phần nhiễu hơn thông tin thu được từ thiết bị cấy ghép, nhưng cho biết công nghệ đã hoạt động khá tốt trong các bài thử nghiệm.
  • Trong phép đo độ chính xác bằng thuật toán BLEU, công nghệ này đạt khoảng 0,4 điểm.

Khả năng cải thiện độ chính xác

  • Mô hình có năng lực tốt hơn trong việc khớp động từ, nhưng với danh từ thì có xu hướng ưu tiên các cặp từ đồng nghĩa như 'người đàn ông' thay cho 'tác giả'.
  • Nhóm nghiên cứu cho rằng khi não xử lý các từ này, những từ có nghĩa tương tự có thể tạo ra các mẫu sóng não tương tự nhau.
  • Nhóm nghiên cứu tin rằng có thể nâng độ chính xác lên tới 0,9, tương đương với các chương trình dịch ngôn ngữ truyền thống.
  • Nhóm nghiên cứu đã tiến hành thí nghiệm trên 29 người tham gia, con số cao hơn rất nhiều so với các thử nghiệm của những công nghệ giải mã khác.

Ý kiến của GN⁺

  • Công nghệ này thể hiện một bước tiến đáng kinh ngạc trong việc dịch trực tiếp suy nghĩ của con người thành ngôn ngữ thông qua sóng não.
  • Khả năng tiếp cận khi chỉ cần một chiếc mũ EEG, không cần cấy ghép não hay máy móc phức tạp, khiến công nghệ này trở nên cực kỳ đột phá.
  • Trong tương lai, công nghệ này có thể giúp ích rất lớn cho những người gặp khó khăn trong giao tiếp và có tiềm năng đưa tương tác giữa con người và máy móc lên một tầm cao mới.

1 bình luận

 
GN⁺ 2023-12-18
Ý kiến trên Hacker News
  • Nghiên cứu giao diện não-máy tính (BCI) chủ yếu tập trung vào việc giúp bệnh nhân bị liệt khôi phục khả năng giao tiếp.

    • EEG không thể cung cấp tỷ lệ tín hiệu trên nhiễu đủ tốt để hỗ trợ tốc độ giao tiếp cao, do giới hạn vật lý khi điện trường của não suy yếu ở bên ngoài hộp sọ.
    • Các món đồ chơi thương mại kiểu "đọc suy nghĩ" thực tế hoạt động dựa trên tín hiệu cơ đầu và cơ mắt.
    • Điện cực cấy ghép cho tín hiệu tốt hơn, nhưng cần nhiều lần cải tiến nữa mới có thể thương mại hóa một cách thực tế. Tín hiệu suy giảm sau vài tháng khi não hình thành mô sẹo quanh điện cực, và phẫu thuật não rõ ràng là có rủi ro.
    • Cần có sự phê duyệt của chính phủ đối với các thử nghiệm trên người, nên chu kỳ lặp lại diễn ra rất chậm.
    • Nếu muốn giúp một người bạn bị liệt, tôi sẽ tập trung vào công nghệ theo dõi mắt trong trường hợp họ chỉ còn có thể cử động mắt.
  • Đây không phải là công nghệ đầu tiên có thể dịch tín hiệu não thành ngôn ngữ, nhưng là công nghệ duy nhất không cần đến cấy ghép não hoặc quyền tiếp cận một máy MRI cỡ lớn.

    • Tôi tự hỏi liệu sẽ có một thời đại mà, khi công nghệ cảm biến đủ tốt đến mức thậm chí không cần đội mũ, người ta sẽ bị bảo rằng đừng kỳ vọng hợp lý vào việc suy nghĩ của mình không bị đọc ở nơi công cộng.
  • Công nghệ này cũng có thể hữu ích cho việc tự phản tư.

    • Có thể phân tích các mẫu suy nghĩ của bản thân từ bên ngoài để tìm ra hiệu quả của các phương pháp giáo dục, xác định một cách khách quan thời điểm mức độ tập trung cao nhất và thấp nhất, đồng thời biết chính xác khi nào những suy nghĩ lo âu bắt đầu và nguyên nhân của chúng.
    • fMRI có thể được dùng như máy phát hiện nói dối bằng quét não, nhưng có rất nhiều nghi vấn về tính chính đáng của việc đó.
  • Dự án "Silent Talk" của DARPA bắt đầu từ 14 năm trước, với mục tiêu cho phép người dùng giao tiếp với nhau trong chiến đấu mà không cần giao tiếp bằng lời nói thông qua phân tích tín hiệu thần kinh.

  • Công nghệ này có thể giúp bệnh nhân đột quỵ, nhưng cũng có thể phát ra những suy nghĩ chưa qua lọc nên có thể gây vấn đề.

  • Dùng EEG để dự đoán suy nghĩ giống như cố dự đoán mây ở Austin bằng cách nhìn mây ở Mumbai. Tín hiệu điện của từng neuron riêng lẻ biến mất trong các dao động quy mô lớn, và còn bị làm mờ thêm bởi các lớp xương, cơ và mô giữa não với thiết bị. Tốc độ bit là 1 bit mỗi giây, hoàn toàn không đủ cho hầu hết các trường hợp sử dụng.

  • Phiên bản cơ bản của mô hình này có lỗi trong mã khiến kết quả benchmark bị thổi phồng, và hiện vấn đề đang được điều tra.

  • Tôi tự hỏi liệu những suy nghĩ không mang tính ngôn ngữ cũng có thể hoạt động hay không. Ví dụ, có thể giải mã suy nghĩ hoặc giấc mơ của chó dựa trên bộ dữ liệu tín hiệu liên quan đến các hoạt động thường ngày.

  • Bỏ qua mọi hàm ý đáng sợ, công nghệ này có thể mở ra một điều rất tuyệt: giao tiếp tinh thần hai chiều.

    • Bạn nghĩ ra một thông điệp và nghĩ "gửi đi", rồi có thể nghe phản hồi qua tai nghe earbud. Dùng công nghệ sao chép giọng nói thì có thể nhận tin nhắn bằng chính giọng của người gửi. Với người ngoài quan sát, mọi thứ hoàn toàn im lặng và vô hình.