- Tôi đã có cơ hội được truy cập sớm để dùng thử hệ thống suy luận tăng cường của OpenAI mang tên "Strawberry", và giờ nó đã được công khai nên tôi có thể chia sẻ suy nghĩ của mình
- Mô hình AI mới o1-preview cho phép AI có thể "nghĩ" trước khi giải quyết vấn đề
- Nhờ đó, nó có thể xử lý những bài toán rất khó đòi hỏi lập kế hoạch và lặp lại, và trên thực tế có thể vượt qua các chuyên gia tiến sĩ là con người trong việc giải các bài toán vật lý cực khó
- Hệ thống này rất đáng kinh ngạc nhưng vẫn còn hạn chế, đồng thời gợi mở hướng phát triển trong tương lai
- Tuy nhiên, o1-preview không vượt trội hơn ở mọi mặt; ví dụ, nó không viết tốt hơn GPT-4o
- Trò chơi ô chữ đặc biệt khó với LLM
- Vì nó đòi hỏi một quá trình giải lặp đi lặp lại, trong đó phải thử và loại bỏ nhiều đáp án có ảnh hưởng lẫn nhau
- LLM không thể làm điều đó vì chúng chỉ có thể thêm vào câu trả lời từng token/từng từ một
- Các LLM thông thường như Claude không thể giải ô chữ đúng cách
- Nhưng Strawberry sau khi "nghĩ" trong 108 giây đã giải được gần như hoàn hảo một ô chữ
- o1-preview làm được những việc mà nếu không có Strawberry thì là bất khả thi, nhưng vẫn chưa hoàn hảo
- Lỗi và hiện tượng ảo giác vẫn xảy ra, và nó bị giới hạn bởi "trí thông minh" của mô hình nền tảng GPT-4o
- Ngay cả sau khi nhận được mô hình mới, tôi vẫn tiếp tục dùng Claude để phê bình phong cách viết, và Claude vẫn vượt trội về mặt phong cách
- Tuy nhiên, tôi đã ngừng dùng Claude cho các tác vụ liên quan đến lập kế hoạch phức tạp hoặc giải quyết vấn đề, cho thấy đây là một bước nhảy vọt lớn
Trong Co-Intelligence..
- Khi sử dụng o1-preview, chúng ta phải đối mặt với một sự thay đổi mô hình trong AI
- Lập kế hoạch là một dạng hành vi trong đó AI tự mình rút ra phương án giải quyết vấn đề
- Việc AI đưa ra kết quả hoàn chỉnh thông qua rất nhiều suy nghĩ và công việc khiến người ta cảm thấy vai trò của đối tác con người bị thu hẹp
- AI tự đưa ra câu trả lời, và người dùng có thể xem lại quá trình suy luận của AI để tìm lỗi, nhưng cảm giác gắn kết với thành phẩm hay mức độ đóng góp vào hướng giải quyết đều giảm đi
- Sự thay đổi này không nhất thiết là xấu, nhưng nó khác với trước đây
- Khi các hệ thống phát triển thành những tác tử tự chủ thực sự, chúng ta cần suy nghĩ về cách mình sẽ can dự để bắt lỗi và nắm được mạch của vấn đề mà ta đang cố giải quyết
- Dù còn những giới hạn hiện tại, o1-preview vẫn đang cho thấy những năng lực của AI mà chúng ta chưa từng dự đoán
- Câu hỏi quan trọng là khi AI phát triển, chúng ta sẽ phát triển cách hợp tác với AI như thế nào
- Đây vẫn là phần mà o1-preview hiện chưa thể giải quyết
2 bình luận
"Câu hỏi quan trọng là khi AI tiếp tục phát triển, chúng ta sẽ phát triển cách hợp tác với AI như thế nào"
Khó thật
Tác giả là Ethan Mollick, giáo sư tại Trường Wharton của Đại học Pennsylvania. Ông nghiên cứu về tinh thần khởi nghiệp, đổi mới và AI.
Nội dung trên được đăng trên Substack của ông có tên One Useful Thing, và bản tin này có khoảng 190.000 người đăng ký.