19 điểm bởi humblebee 2025-05-23 | 2 bình luận | Chia sẻ qua WhatsApp

Anthropic đã ra mắt dòng Claude 4 vào ngày 23 tháng 5 năm 2025. Claude Opus 4 và Claude Sonnet 4 được công bố lần này là các mô hình cải thiện khả năng lập trình và thực hiện tác vụ dài hạn so với phiên bản trước, trong khi mức giá vẫn được giữ nguyên như cũ.

  1. Khả năng làm việc liên tục

    • Làm việc liên tục trong 7 giờ: Trong bài refactor mã nguồn mở được Rakuten kiểm chứng, mô hình đã làm việc độc lập suốt 7 giờ
    • Xử lý các tác vụ phức tạp gồm hàng nghìn bước mà không bị gián đoạn
    • Độ bền trong công việc vượt xa giới hạn của các AI agent trước đây
  2. Hệ thống bộ nhớ được cải tiến

    • Tự động tạo các tệp bộ nhớ như 'Navigation Guide' để cải thiện khả năng nhận biết bối cảnh trong các tác vụ dài hạn
    • Ứng dụng bộ nhớ theo cách thực tiễn, như tự viết hướng dẫn điều hướng khi chơi game Pokémon
    • Hành vi dùng đường tắt/lỗ hổng giảm 65% so với mô hình trước
  3. Mô hình suy luận lai

    • Chế độ phản hồi tức thì: dành cho trường hợp cần câu trả lời nhanh
    • Chế độ tư duy mở rộng: cho phép suy luận chuyên sâu tới tối đa 64K token
    • Tự động chuyển đổi giữa hai chế độ tùy theo tình huống
  4. Sử dụng công cụ

    • Thực thi công cụ song song: dùng nhiều công cụ cùng lúc để tăng hiệu quả
    • Sử dụng công cụ trong lúc suy luận: tận dụng web search v.v. trong quá trình suy luận để tạo câu trả lời chính xác hơn
  5. Cải thiện chất lượng mã

    • Đánh giá của Block: "mô hình đầu tiên cải thiện chất lượng mã trong quá trình chỉnh sửa và gỡ lỗi"
    • Báo cáo của iGent: tỷ lệ lỗi khi khám phá codebase giảm từ 20% xuống gần 0%
    • Sourcegraph: chất lượng mã tinh gọn hơn và khả năng hiểu vấn đề sâu hơn
  6. Tích hợp Claude Code vào công việc thực tế

    • Tích hợp trực tiếp với IDE: các thay đổi mã được hiển thị ngay trong trình soạn thảo
    • Xử lý GitHub PR: tự động xử lý phản hồi từ reviewer của PR, sửa lỗi CI
    • Tác vụ nền: hỗ trợ tự động hóa thông qua GitHub Actions
    • SDK có thể mở rộng: cho phép nhà phát triển tự xây dựng agent riêng
  7. Tính năng API mới

    • Công cụ thực thi mã
    • MCP connector
    • Files API
    • Prompt caching tối đa 1 giờ
  8. An toàn

    • Triển khai biện pháp bảo vệ ASL-3 (AI Safety Level 3)
    • Khả năng tuân thủ chỉ thị tinh vi hơn
    • Hành vi có trách nhiệm hơn, giảm khả năng bị lạm dụng

2 bình luận

 
humblebee 2025-05-23

Có ghi là đã thực hiện refactoring liên tục suốt 7 tiếng không gián đoạn; nếu chất lượng ổn thì cũng có thể kỳ vọng tới mức công việc thuê ngoài cao cấp mà lập trình viên giao lại sau giờ làm rồi hôm sau xem lại 😂

 
sinbumu 2025-05-23

Họ cũng đang nắm bắt điểm này nên ở những nơi như Google đang thử nghiệm beta các coding agent kiểu như Jules... Cứ giao việc cho AI thì thay vì chạy trên máy cục bộ, nó sẽ tự loay hoay xử lý trong môi trường đám mây, rồi sau đó mình chỉ cần kiểm tra kết quả và bảo nó commit, triển khai các thứ.