TOP 3 mô hình ngôn ngữ được người dùng Cursor ưa chuộng và lý do

(reddit.com)

32 điểm bởi GN⁺ 2025-05-01 | 5 bình luận | Chia sẻ qua WhatsApp

gpt-4.1 là một trợ lý cẩn trọng và đáng tin cậy, có thế mạnh ở việc hiểu mã chính xác và cách tiếp cận thận trọng
gemini 2.5 pro xuất sắc trong xử lý ngữ cảnh rộng và cả phân tích hình ảnh, nhưng cũng có rủi ro gây chỉnh sửa quá tay
sonnet 3.5/3.7 sáng tạo và thông minh, nhưng thiếu khả năng duy trì ngữ cảnh và tính nhất quán nên dễ chệch hướng trong hội thoại dài
grok-3-beta chậm nhưng cho thấy tiềm năng vượt trội trong trực quan hóa thiết kế và giải quyết vấn đề phức tạp
Người dùng tách riêng các mô hình theo từng luồng công việc, và khi debug thất bại, họ ưu tiên chiến lược khôi phục checkpoint và chuyển đổi mô hình

gpt-4.1

Hoạt động như một trợ lý thông minh và có độ tin cậy cao
Không vội đưa ra kết luận, làm theo yêu cầu nhưng không chỉnh sửa quá mức
Là mô hình mang lại cảm giác như phần mở rộng của chính lập trình viên, đặc biệt phù hợp với các nhà phát triển giàu kinh nghiệm

gemini 2.5 pro

Mạnh khi tận dụng ngữ cảnh rộng như log console dài hoặc toàn bộ file mã nguồn
Khả năng phân tích hình ảnh rất tốt, có thể phát hiện lỗi trực quan
Nhược điểm là hoạt động quá tự chủ, có thể gây xóa mã không cần thiết hoặc chỉnh sửa quá tay
Cần kiểm soát cẩn thận

sonnet 3.5 / 3.7

3.7 sáng tạo và thông minh, nhưng trong hội thoại dài đôi khi bị mất ngữ cảnh hoặc bỏ qua chỉ dẫn
3.5 mạnh trong việc hiểu và chỉnh sửa mã dựa trên một file đơn
Do các vấn đề chuyển tiếp trong tích hợp với Cursor nên chưa thể hiện hiệu năng ổn định và nhất quán

Các ý kiến và chiến lược khác

grok-3-beta chậm nhưng hữu ích trong việc giải quyết những vấn đề mà các mô hình khác thất bại
Một người dùng đang áp dụng chiến lược phân công mô hình như sau:
- o3/4-mini: sắp xếp kế hoạch và tổ chức suy luận dựa trên Markdown
- gemini 2.5 pro: phân tích vấn đề dựa trên toàn bộ file và dùng để gọi tính năng
- sonnet 3.5: dùng để chỉnh sửa một file đơn dựa trên cmd+k

5 bình luận

bungker 2025-05-02

Có thể khẳng định rằng Gemini 2.5 Pro là mạnh nhất, ít nhất là xét riêng với ngôn ngữ Go.

daddy 2025-05-02

Janimai có tốc độ nhanh nhất nên tôi khuyến nghị dùng cho mục đích hỏi đáp.

jk34011 2025-05-02

Tôi chủ yếu chỉ dùng Sonnet
rất đồng cảm với nhiều điều trong bài viết
Chắc tôi cũng nên thử 4.1

gnoopy 2025-05-01

Tôi thấy khá giống với cảm nhận của mình. Càng dùng sonnet thì tôi càng thấy bất an, còn chatgpt 4.1 thì dù có đưa yêu cầu xong, trước hết vẫn là kiểu khiến tôi yên tâm hơn.

Tôi cũng đồng cảm với ý kiến về Grok, nhưng tôi thường dùng nó nhiều hơn khi bình tĩnh kiểm tra trong cửa sổ chat thay vì ở bên trong IDE.

GN⁺ 2025-05-01

Phản ứng của cộng đồng Reddit

Cách sử dụng model

o3/4-mini: dùng để lên kế hoạch và sắp xếp dựa trên Markdown, cho thấy khả năng reasoning và độ phù hợp cho hội thoại tốt hơn (Masony817, scragz, Princekid1878)
gemini 2.5 pro:
- hữu ích cho agent mode hoặc function calling dựa trên ngữ cảnh dài (Masony817, computerlegs)
- mạnh trong việc nhìn toàn cảnh và đưa ra đánh giá về toàn bộ mã trong các dự án phức tạp (WorryBubbly3438)
- phù hợp cho vai trò tìm kiếm, đối chiếu chéo và tiền xử lý (computerlegs)
sonnet 3.5: mạnh về hiểu và chỉnh sửa một file đơn, phù hợp để dùng với phím tắt cmd+k (Masony817)
sonnet 3.7:
- sáng tạo hơn và vượt trội hơn 3.5, nhưng có vấn đề mất mạch trong các cuộc trò chuyện dài (Sea_Cardiologist_212)
- nổi bật ở dữ liệu cutoff mới hơn và năng lực suy luận (yairEO)
- ổn định nếu xử lý tốt context window (computerlegs)
Claude 3.7: ổn định và nhất quán trong môi trường Cursor (cmndr_spanky)
gpt-4.1:
- phù hợp cho các tác vụ lặp lại đơn giản hoặc tác vụ có cấu trúc (Princekid1878, ILikeBubblyWater)
- có xu hướng thay đổi quá mức mà không giải thích (ILikeBubblyWater)
Deepseek R1: với một số vấn đề cụ thể, hoạt động tốt bất ngờ hơn các model khác (Leather_Science_7911)

Chiến lược sử dụng và workflow

Phân chia vai trò theo từng model rồi chuyển đổi tùy tình huống (nhiều ý kiến)
cmd+k: xử lý file đơn bằng sonnet 3.5 (Masony817)
Agent mode: sau khi thiết lập ban đầu thì không còn dùng nhiều, thay vào đó sử dụng tính năng checkpoint và prompt rõ ràng (WorryBubbly3438)
Ưu tiên Auto mode: có thể chạy nhanh và chi phí thấp (Funny-Anything-791, d0RSI)
Cách tiếp cận mang tính cơ khí: chỉ dẫn rõ ràng và chính xác như máy CNC là điều quan trọng (Funny-Anything-791)
Các model chuyên cho kiểm thử UI và thiết kế vẫn còn chưa tốt (Princekid1878)

Các ý kiến khác

Có phàn nàn rằng Sonnet 3.7 kém tập trung và giữ ngữ cảnh tệ hơn trước (Sea_Cardiologist_212)
Gemini hay Claude có thể trông tốt trong video demo, nhưng khác khi dùng trong môi trường thực tế (cmndr_spanky)
Với đa số model, prompt rõ ràng là yếu tố then chốt (ý kiến chung)
Một số người dùng kỳ vọng vào tích hợp crypto hoặc nền tảng Web (được nhắc đến gián tiếp)