2 điểm bởi minodevs 7 ngày trước | 1 bình luận | Chia sẻ qua WhatsApp

Anthropic đã ra mắt mẫu flagship Claude Opus 4.7.

  • Đạt 87,6% trên SWE-bench Verified (+6,8 điểm phần trăm) và 64,3% trên SWE-bench Pro, vượt GPT-5.4 (57,7%) để đứng số 1
  • Đạt GPQA Diamond 94,2%, Terminal-Bench 2.0 69,4%, Finance Agent 64,4%
  • Cải thiện 13% trên các benchmark lập trình so với Opus 4.6, tỷ lệ giải quyết tác vụ production tăng gấp 3 lần
  • Tính năng Self-Verification mới: tự thiết kế và thực thi các bước xác minh trước khi hoàn thành công việc
  • Thị giác độ phân giải cao gấp 3,3 lần (tối đa 2.576px), áp dụng tokenizer mới
  • Bổ sung mức effort xhigh, cải thiện 14% suy luận tác tử, giảm lỗi công cụ xuống còn 1/3
  • Giá giữ nguyên như Opus 4.6 ($5/$25 mỗi MTok)
  • Anthropic cũng trực tiếp thừa nhận hiệu năng vẫn thấp hơn mẫu riêng tư Mythos

Hiện cũng có thể sử dụng trên Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry.

1 bình luận

 

OPUS 4.7 > GPT 5.4 > OPUS 4.6