3 điểm bởi computerphilosopher 2025-04-18 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Trong lúc thử nghiệm các cách dẫn đến hiện tượng ảo giác trên ChatGPT o1 và Gemini 2.5 thì o3 được phát hành
  • Không giống o1, o3 là một mô hình đa phương thức mạnh mẽ có các tính năng như tìm kiếm Internet, nhận diện hình ảnh và thực thi mã. Tuy nhiên, đã phát hiện ra rằng nó đưa ra những câu trả lời sai lệch mà con người có lẽ sẽ không làm như vậy
  • Giả thuyết cốt lõi: khác với con người, LLM không có cơ quan cảm giác. Vì vậy, chúng có lẽ yếu ở các câu hỏi cần thông tin như thị giác hoặc cảm nhận phương hướng.
  • Các câu hỏi dùng để kích thích ảo giác
    • Mô tả bức 'The Potato Eaters' của Van Gogh
      • Tốt hơn o1, vốn sai ngay từ bố cục nhân vật, nhưng vẫn sai ở các mô tả cụ thể
    • Nói tên nốt của giai điệu trong bản piano sonata K545 của Mozart
      • Dù đã tìm được ảnh gốc thông qua chức năng tìm kiếm Internet, nó vẫn không thể trả lời đúng
      • Có vẻ như mô-đun thị giác không nhận diện được bản nhạc
    • Kết quả chỉ đường đi bộ
      • Dù kết quả tìm kiếm có bao gồm cả Naver Map, nó vẫn trả lời sai
    • Vấn đề chuyển đổi bàn phím Hàn-Anh (ví dụ: cotwlvlxl -> 챗지피티)
      • Khi độ dài đầu vào nhỏ thì trả lời tốt, nhưng khi kích thước lớn hơn thì tạo ra câu trả lời bịa đặt
      • Trông như thể đang giải bài toán rồi nói "thôi kệ, không biết nữa" và bỏ chạy ra ngoài
      • Các thuật toán truyền thống không có kiểu 'khoảnh khắc mặc kệ'. Chúng chỉ chạy rất lâu rồi timeout
  • Kết luận
    • Việc không có cơ quan cảm giác theo đúng nghĩa vẫn là một điểm yếu còn hiệu lực của LLM
    • Không giải được vấn đề không phải là khuyết điểm. Khuyết điểm thực sự là bịa ra câu trả lời sai
    • Thay vì chỉ tập trung tăng cường khả năng suy luận và bổ sung tính năng mới, mong các công ty phát triển có thể gieo vào mô hình năng lực tự nhận thức để biết nói là mình không biết khi không biết

Chưa có bình luận nào.

Chưa có bình luận nào.