Anthropic ra mắt Claude Opus 4.7 - tự xác minh, thị giác độ phân giải cao gấp 3,3 lần, cải thiện 13% về lập trình

(anthropic.com)

2 điểm bởi minodevs 2026-04-17 | 1 bình luận | Chia sẻ qua WhatsApp

Anthropic đã ra mắt mẫu flagship Claude Opus 4.7.

Đạt 87,6% trên SWE-bench Verified (+6,8 điểm phần trăm) và 64,3% trên SWE-bench Pro, vượt GPT-5.4 (57,7%) để đứng số 1
Đạt GPQA Diamond 94,2%, Terminal-Bench 2.0 69,4%, Finance Agent 64,4%
Cải thiện 13% trên các benchmark lập trình so với Opus 4.6, tỷ lệ giải quyết tác vụ production tăng gấp 3 lần
Tính năng Self-Verification mới: tự thiết kế và thực thi các bước xác minh trước khi hoàn thành công việc
Thị giác độ phân giải cao gấp 3,3 lần (tối đa 2.576px), áp dụng tokenizer mới
Bổ sung mức effort xhigh, cải thiện 14% suy luận tác tử, giảm lỗi công cụ xuống còn 1/3
Giá giữ nguyên như Opus 4.6 ($5/$25 mỗi MTok)
Anthropic cũng trực tiếp thừa nhận hiệu năng vẫn thấp hơn mẫu riêng tư Mythos

Hiện cũng có thể sử dụng trên Amazon Bedrock, Google Cloud Vertex AI và Microsoft Foundry.

1 bình luận

runai 2026-04-17

OPUS 4.7 > GPT 5.4 > OPUS 4.6