- CoRT là một thuật toán cho phép mô hình AI lặp đi lặp lại việc xem xét phản hồi của chính mình và tạo ra các phương án thay thế để chọn câu trả lời tối ưu
- Khi áp dụng cho mô hình Mistral 3.1 24B, hiệu năng được cải thiện đáng kể, đặc biệt trong các tác vụ lập trình
- AI tạo phản hồi ban đầu, sau đó đánh giá các phương án thay thế qua nhiều "vòng suy nghĩ" để chọn phản hồi cuối cùng
- Quá trình này bao gồm tự đánh giá, tạo phương án thay thế mang tính cạnh tranh, cải tiến lặp lại, độ sâu tư duy động
- CoRT được cung cấp theo giấy phép MIT và hoan nghênh các đóng góp để cải thiện
CoRT (Chain of Recursive Thoughts) 🧠🔄
Tóm tắt
- Giới thiệu CoRT, một thuật toán giúp AI tranh luận với chính mình để tìm ra câu trả lời tốt hơn
- Mô hình AI lặp đi lặp lại việc xem xét phản hồi và tạo ra các phương án thay thế để chọn câu trả lời tối ưu
- Khi áp dụng cho mô hình Mistral 3.1 24B, hiệu năng được cải thiện đáng kể, đặc biệt trong các tác vụ lập trình
Cách CoRT hoạt động
- AI tạo phản hồi ban đầu
- AI quyết định số lượng "vòng suy nghĩ" cần thiết
- Trong mỗi vòng:
- Tạo ra 3 phản hồi thay thế
- Đánh giá tất cả các phản hồi
- Chọn phản hồi tối ưu
- Phản hồi cuối cùng trở thành người sống sót của trận battle royale AI này
Thành phần bí mật
- Tự đánh giá
- Tạo phương án thay thế mang tính cạnh tranh
- Cải tiến lặp lại
- Độ sâu tư duy động
Đóng góp
- Nếu bạn tìm ra cách cải thiện, rất hoan nghênh PR
Giấy phép
- Có thể tự do sử dụng theo giấy phép MIT
1 bình luận
Ý kiến trên Hacker News
Cho mô hình chat AI đưa ra câu trả lời cho một vấn đề, rồi yêu cầu nó viết một báo cáo giải thích vì sao câu trả lời đó đúng
Muốn thử một cuộc tranh luận kiểu “thượng viện” ở quy mô lớn hơn trong chế độ luôn bật
Với một chiến lược đơn giản, khi kết thúc lời nhắn thì yêu cầu: "hãy suy nghĩ một lần bằng thẻ suy nghĩ, tự phê bình một lần bằng thẻ phê bình, rồi suy nghĩ thêm một lần nữa bằng thẻ suy nghĩ trước khi trả lời"
Khác với điều đã hình dung khi đọc tiêu đề
Đang thiết kế một trình chỉnh sửa đồ thị theo phong cách blueprint của Unreal Engine để nhiều tác tử thực hiện công việc bắt đầu từ đầu vào của người dùng
Tò mò liệu một nhóm tác tử AI có vận hành một nhóm scrum và tổ chức họp đứng mỗi vài giờ hay không
Một cách để khiến mô hình ML nảy ra ý tưởng mới là tiếp cận chéo với những ý tưởng đã từng thử rồi loại bỏ, trong khi vẫn giữ các ràng buộc nhất quán nhất định
Nếu không nhanh chóng chuyển toàn bộ GPU sang năng lượng xanh, Trái Đất sẽ nóng lên trong lúc AI tranh luận để tự tìm ra lời giải tối ưu
Có ví dụ dùng CoRT và ví dụ không dùng CoRT, mà ví dụ không dùng lại tốt hơn nhiều
Cách tiếp cận này gợi nhớ đến các nhà sáng tạo nội dung trên YT