◀ Năm trước | ◁ Tháng trước | << Tuần trước | < Ngày trước | 2026-03-27 | Ngày sau > | Tuần sau >> 21 ARC-AGI-3 - benchmark suy luận tương tác đầu tiên (arcprize.org) ARC-AGI-3 là benchmark suy luận tương tác đầu tiên để đo lường trí tuệ mức con người của AI agent trong môi trường có thể khám phá, học hỏi và lập kế hoạch dài hạn. 1 điểm bởi GN⁺ 28 ngày trước | 1 bình luận