Về Strawberry của OpenAI và suy luận

xguru · 2024-09-14T10:02:02+09:00

Tôi đã có cơ hội được truy cập sớm để dùng thử hệ thống suy luận tăng cường của OpenAI mang tên "Strawberry", và giờ nó đã được công khai nên tôi có thể chia sẻ suy nghĩ của mình Mô hình AI mới o1-preview cho phép AI có thể "nghĩ" trước khi giải quyết vấn đề Nhờ đó, nó có thể xử lý những bài toán rất khó đòi hỏi lập kế hoạch và lặp lại, và trên thực tế có thể vượt qua các chuyên gia tiến sĩ là con người trong việc giải các bài toán vật lý cực khó Hệ thống này rất đáng kinh ngạc nhưng vẫn còn hạn chế, đồng thời gợi mở hướng phát triển trong tương lai Tuy nhiên, o1-preview không vượt trội hơn ở mọi mặt; ví dụ, nó không viết tốt hơn GPT-4o Trò chơi ô chữ đặc biệt khó với LLM Vì nó đòi hỏi một quá trình giải lặp đi lặp lại, trong đó phải thử và loại bỏ nhiều đáp án có ảnh hưởng lẫn nhau LLM không thể làm điều đó vì chúng chỉ có thể thêm vào câu trả lời từng token/từng từ một Các LLM thông thường như Claude không thể giải ô chữ đúng cách Nhưng Strawberry sau khi "nghĩ" trong 108 giây đã giải được gần như hoàn hảo một ô chữ o1-preview làm được những việc mà nếu không có Strawberry thì là bất khả thi, nhưng vẫn chưa hoàn hảo Lỗi và hiện tượng ảo giác vẫn xảy ra, và nó bị giới hạn bởi "trí thông minh" của mô hình nền tảng GPT-4o Ngay cả sau khi nhận được mô hình mới, tôi vẫn tiếp tục dùng Claude để phê bình phong cách viết, và Claude vẫn vượt trội về mặt phong cách Tuy nhiên, tôi đã ngừng dùng Claude cho các tác vụ liên quan đến lập kế hoạch phức tạp hoặc giải quyết vấn đề, cho thấy đây là một bước nhảy vọt lớn Trong Co-Intelligence.. Khi sử dụng o1-preview, chúng ta phải đối mặt với một sự thay đổi mô hình trong AI Lập kế hoạch là một dạng hành vi trong đó AI tự mình rút ra phương án giải quyết vấn đề Việc AI đưa ra kết quả hoàn chỉnh thông qua rất nhiều suy nghĩ và công việc khiến người ta cảm thấy vai trò của đối tác con người bị thu hẹp AI tự đưa ra câu trả lời, và người dùng có thể xem lại quá trình suy luận của AI để tìm lỗi, nhưng cảm giác gắn kết với thành phẩm hay mức độ đóng góp vào hướng giải quyết đều giảm đi Sự thay đổi này không nhất thiết là xấu, nhưng nó khác với trước đây Khi các hệ thống phát triển thành những tác tử tự chủ thực sự, chúng ta cần suy nghĩ về cách mình sẽ can dự để bắt lỗi và nắm được mạch của vấn đề mà ta đang cố giải quyết Dù còn những giới hạn hiện tại, o1-preview vẫn đang cho thấy những năng lực của AI mà chúng ta chưa từng dự đoán Câu hỏi quan trọng là khi AI phát triển, chúng ta sẽ phát triển cách hợp tác với AI như thế nào Đây vẫn là phần mà o1-preview hiện chưa thể giải quyết

(oneusefulthing.org)

6 điểm bởi xguru 2024-09-14 | 2 bình luận | Chia sẻ qua WhatsApp

Tôi đã có cơ hội được truy cập sớm để dùng thử hệ thống suy luận tăng cường của OpenAI mang tên "Strawberry", và giờ nó đã được công khai nên tôi có thể chia sẻ suy nghĩ của mình
Mô hình AI mới o1-preview cho phép AI có thể "nghĩ" trước khi giải quyết vấn đề
Nhờ đó, nó có thể xử lý những bài toán rất khó đòi hỏi lập kế hoạch và lặp lại, và trên thực tế có thể vượt qua các chuyên gia tiến sĩ là con người trong việc giải các bài toán vật lý cực khó
Hệ thống này rất đáng kinh ngạc nhưng vẫn còn hạn chế, đồng thời gợi mở hướng phát triển trong tương lai
Tuy nhiên, o1-preview không vượt trội hơn ở mọi mặt; ví dụ, nó không viết tốt hơn GPT-4o
Trò chơi ô chữ đặc biệt khó với LLM
- Vì nó đòi hỏi một quá trình giải lặp đi lặp lại, trong đó phải thử và loại bỏ nhiều đáp án có ảnh hưởng lẫn nhau
- LLM không thể làm điều đó vì chúng chỉ có thể thêm vào câu trả lời từng token/từng từ một
- Các LLM thông thường như Claude không thể giải ô chữ đúng cách
- Nhưng Strawberry sau khi "nghĩ" trong 108 giây đã giải được gần như hoàn hảo một ô chữ
o1-preview làm được những việc mà nếu không có Strawberry thì là bất khả thi, nhưng vẫn chưa hoàn hảo
- Lỗi và hiện tượng ảo giác vẫn xảy ra, và nó bị giới hạn bởi "trí thông minh" của mô hình nền tảng GPT-4o
- Ngay cả sau khi nhận được mô hình mới, tôi vẫn tiếp tục dùng Claude để phê bình phong cách viết, và Claude vẫn vượt trội về mặt phong cách
- Tuy nhiên, tôi đã ngừng dùng Claude cho các tác vụ liên quan đến lập kế hoạch phức tạp hoặc giải quyết vấn đề, cho thấy đây là một bước nhảy vọt lớn
Quảng cáo

Trong Co-Intelligence..

Khi sử dụng o1-preview, chúng ta phải đối mặt với một sự thay đổi mô hình trong AI
Lập kế hoạch là một dạng hành vi trong đó AI tự mình rút ra phương án giải quyết vấn đề
Việc AI đưa ra kết quả hoàn chỉnh thông qua rất nhiều suy nghĩ và công việc khiến người ta cảm thấy vai trò của đối tác con người bị thu hẹp
AI tự đưa ra câu trả lời, và người dùng có thể xem lại quá trình suy luận của AI để tìm lỗi, nhưng cảm giác gắn kết với thành phẩm hay mức độ đóng góp vào hướng giải quyết đều giảm đi
Sự thay đổi này không nhất thiết là xấu, nhưng nó khác với trước đây
Khi các hệ thống phát triển thành những tác tử tự chủ thực sự, chúng ta cần suy nghĩ về cách mình sẽ can dự để bắt lỗi và nắm được mạch của vấn đề mà ta đang cố giải quyết
Dù còn những giới hạn hiện tại, o1-preview vẫn đang cho thấy những năng lực của AI mà chúng ta chưa từng dự đoán
Câu hỏi quan trọng là khi AI phát triển, chúng ta sẽ phát triển cách hợp tác với AI như thế nào
Đây vẫn là phần mà o1-preview hiện chưa thể giải quyết

2 bình luận

bluekai17 2024-09-19

"Câu hỏi quan trọng là khi AI tiếp tục phát triển, chúng ta sẽ phát triển cách hợp tác với AI như thế nào"

Khó thật

xguru 2024-09-14

Tác giả là Ethan Mollick, giáo sư tại Trường Wharton của Đại học Pennsylvania. Ông nghiên cứu về tinh thần khởi nghiệp, đổi mới và AI.
Nội dung trên được đăng trên Substack của ông có tên One Useful Thing, và bản tin này có khoảng 190.000 người đăng ký.

Về Strawberry của OpenAI và suy luận

Trong Co-Intelligence..

Bài viết liên quan

2 bình luận