Bước đột phá mới trong công nghệ đọc suy nghĩ
- Nhóm nghiên cứu tại Trung tâm AI lấy con người làm trung tâm GrapheneX-UTS của Đại học Công nghệ Sydney đã công bố một bước đột phá mới liên quan đến công nghệ 'đọc suy nghĩ'.
- Nghiên cứu này đã thành công trong việc chuyển đổi suy nghĩ thành các từ hiển thị trên màn hình, và được đánh giá là nỗ lực tiên phong trong việc dịch trực tiếp các sóng EEG thô thành ngôn ngữ.
- Trong quá trình dịch sóng não thành văn bản, nghiên cứu đã đưa vào kỹ thuật mã hóa rời rạc và, thông qua việc tích hợp với mô hình ngôn ngữ lớn, mở ra triển vọng mới cho lĩnh vực khoa học thần kinh và AI.
Công nghệ dịch ngôn ngữ bằng sóng não
- Trong khi những người tham gia đọc văn bản trong im lặng, mô hình AI mang tên DeWave chỉ sử dụng sóng não của họ làm đầu vào để chiếu các từ lên màn hình.
- Đây là công nghệ duy nhất có thể dịch tín hiệu não thành ngôn ngữ mà không cần cấy ghép não hoặc truy cập vào máy MRI cỡ lớn.
- So với các công nghệ trước đây cần thêm đầu vào, chẳng hạn như phần mềm theo dõi chuyển động mắt, công nghệ mới này có thể sử dụng mà không cần các tính năng bổ sung đó.
Tính thực tiễn và sự tiện lợi
- Người dùng chỉ cần đội một chiếc mũ ghi lại hoạt động não qua EEG, nên thực tế và tiện lợi hơn nhiều so với thiết bị theo dõi mắt hay máy MRI.
- Nhóm nghiên cứu thừa nhận tín hiệu có phần nhiễu hơn thông tin thu được từ thiết bị cấy ghép, nhưng cho biết công nghệ đã hoạt động khá tốt trong các bài thử nghiệm.
- Trong phép đo độ chính xác bằng thuật toán BLEU, công nghệ này đạt khoảng 0,4 điểm.
Khả năng cải thiện độ chính xác
- Mô hình có năng lực tốt hơn trong việc khớp động từ, nhưng với danh từ thì có xu hướng ưu tiên các cặp từ đồng nghĩa như 'người đàn ông' thay cho 'tác giả'.
- Nhóm nghiên cứu cho rằng khi não xử lý các từ này, những từ có nghĩa tương tự có thể tạo ra các mẫu sóng não tương tự nhau.
- Nhóm nghiên cứu tin rằng có thể nâng độ chính xác lên tới 0,9, tương đương với các chương trình dịch ngôn ngữ truyền thống.
- Nhóm nghiên cứu đã tiến hành thí nghiệm trên 29 người tham gia, con số cao hơn rất nhiều so với các thử nghiệm của những công nghệ giải mã khác.
Ý kiến của GN⁺
- Công nghệ này thể hiện một bước tiến đáng kinh ngạc trong việc dịch trực tiếp suy nghĩ của con người thành ngôn ngữ thông qua sóng não.
- Khả năng tiếp cận khi chỉ cần một chiếc mũ EEG, không cần cấy ghép não hay máy móc phức tạp, khiến công nghệ này trở nên cực kỳ đột phá.
- Trong tương lai, công nghệ này có thể giúp ích rất lớn cho những người gặp khó khăn trong giao tiếp và có tiềm năng đưa tương tác giữa con người và máy móc lên một tầm cao mới.
1 bình luận
Ý kiến trên Hacker News
Nghiên cứu giao diện não-máy tính (BCI) chủ yếu tập trung vào việc giúp bệnh nhân bị liệt khôi phục khả năng giao tiếp.
Đây không phải là công nghệ đầu tiên có thể dịch tín hiệu não thành ngôn ngữ, nhưng là công nghệ duy nhất không cần đến cấy ghép não hoặc quyền tiếp cận một máy MRI cỡ lớn.
Công nghệ này cũng có thể hữu ích cho việc tự phản tư.
Dự án "Silent Talk" của DARPA bắt đầu từ 14 năm trước, với mục tiêu cho phép người dùng giao tiếp với nhau trong chiến đấu mà không cần giao tiếp bằng lời nói thông qua phân tích tín hiệu thần kinh.
Công nghệ này có thể giúp bệnh nhân đột quỵ, nhưng cũng có thể phát ra những suy nghĩ chưa qua lọc nên có thể gây vấn đề.
Dùng EEG để dự đoán suy nghĩ giống như cố dự đoán mây ở Austin bằng cách nhìn mây ở Mumbai. Tín hiệu điện của từng neuron riêng lẻ biến mất trong các dao động quy mô lớn, và còn bị làm mờ thêm bởi các lớp xương, cơ và mô giữa não với thiết bị. Tốc độ bit là 1 bit mỗi giây, hoàn toàn không đủ cho hầu hết các trường hợp sử dụng.
Phiên bản cơ bản của mô hình này có lỗi trong mã khiến kết quả benchmark bị thổi phồng, và hiện vấn đề đang được điều tra.
Tôi tự hỏi liệu những suy nghĩ không mang tính ngôn ngữ cũng có thể hoạt động hay không. Ví dụ, có thể giải mã suy nghĩ hoặc giấc mơ của chó dựa trên bộ dữ liệu tín hiệu liên quan đến các hoạt động thường ngày.
Bỏ qua mọi hàm ý đáng sợ, công nghệ này có thể mở ra một điều rất tuyệt: giao tiếp tinh thần hai chiều.