- Để các AI agent có thể tự chủ thực hiện mua hàng, thanh toán và đối soát, nhiều giao thức thanh toán đang xuất hiện song song
- ACP, UCP, AP2, x402... đều xử lý thanh toán, nhưng mỗi giao thức lại nhắm tới những miền bài toán khác nhau như thương mại, B2B, thanh toán giữa các agent
- Internet vốn được thiết kế cho mục đích truyền tải thông tin nên không có lớp thanh toán, và mã trạng thái HTTP 402 tuy đã được định nghĩa từ năm 1997 nhưng chưa từng được triển khai thực tế
- Trong giao dịch của agent, lớp niềm tin trở thành điều kiện tiên quyết trước cả thanh toán, và các giao thức như ERC-8004 hay Visa TAP đảm nhiệm vai trò này
- Trong mảng thương mại, ACP của OpenAI·Stripe và UCP của Google·Shopify là hai trục chính, hiện đang được dùng tương ứng trong môi trường ChatGPT và Gemini
- Thanh toán giữa các agent mở ra khả năng micropayment quy mô lớn cho việc dùng tài nguyên tính toán, dữ liệu và API, báo hiệu một cấu trúc giao dịch tài nguyên tự động
- Trong tương lai, nền kinh tế agent nhiều khả năng sẽ không đi theo một tiêu chuẩn duy nhất, mà tiến hóa thành một cấu trúc stack nơi các giao thức với vai trò khác nhau được kết hợp theo lớp
Bối cảnh đằng sau sự bùng nổ giao thức thanh toán agentic
- Các chữ viết tắt như ACP, UCP, A2P, AXTP, x402... xuất hiện dày đặc khiến lĩnh vực thanh toán agentic rơi vào trạng thái khá hỗn loạn
- Lý do có quá nhiều giao thức là vì chúng không cùng giải một bài toán
- Thương mại, thanh toán B2B và thanh toán giữa các agent có các yêu cầu và ràng buộc rất khác nhau
- Nếu coi chúng là một vấn đề duy nhất thì ngược lại sẽ càng khó hiểu cấu trúc tổng thể
Cấu trúc của các giao thức Internet và sự vắng mặt của lớp thanh toán
- Internet vận hành nhờ nhiều giao thức như TCP/IP, DNS, HTTP/S cùng phối hợp để tạo nên một trải nghiệm người dùng liền mạch
- TCP/IP: đảm nhiệm địa chỉ hóa, định tuyến và truyền dữ liệu tin cậy
- DNS: chuyển tên miền mà con người có thể đọc thành địa chỉ IP
- HTTP/S: đảm nhiệm yêu cầu và truyền trang web cùng phương tiện truyền thông; HTTPS tăng cường bảo mật thông qua mã hóa
- Các giao thức mới như gRPC, WebSocket tiếp tục được bổ sung, cho thấy Internet là một hệ thống tiến hóa chứ không phải cấu trúc tĩnh
- Mã trạng thái HTTP 402(Payment Required) được định nghĩa từ năm 1997 nhưng chưa từng được sử dụng thực tế
- Ngay từ đầu, Internet được thiết kế cho mục tiêu truyền tải thông tin, còn thanh toán được nối vào về sau thông qua các hệ thống tài chính riêng biệt
- Yêu cầu bắt đầu từ trình duyệt được chuyển tuần tự tới người bán, cổng thanh toán và các mạng tài chính như Visa·ACH
- Không tồn tại một giao thức thanh toán duy nhất bao phủ toàn bộ quy trình từ ‘thêm vào giỏ hàng’ đến ‘đối soát thanh toán’
Khoảng trống của lớp thanh toán được agent phơi bày
- Hạ tầng hiện có vốn được thiết kế với giả định có bàn phím và màn hình không phù hợp với các software agent có thể ra quyết định và hành động ở tốc độ máy
- Khi agent mua hàng thay con người, nhiều vấn đề mới bắt đầu lộ rõ
- Loại khách hàng mới: agent phải tự quyết định chọn cửa hàng và sản phẩm nào, còn người bán cần tối ưu hóa cho đối tượng là agent chứ không phải con người
→ Khái niệm Agent Engine Optimization(AEO) nổi lên
- Kênh thanh toán mới: giao diện chat trở thành cửa sổ thanh toán, khiến các conversion funnel, A/B test hay email nhắc bỏ giỏ hàng truyền thống mất dần ý nghĩa
- Rủi ro gian lận mới: cần xác minh ngay lập tức liệu agent có đang dùng người dùng đã được phê duyệt và phương thức thanh toán hợp pháp hay đang tự động lạm dụng thông tin xác thực bị đánh cắp
Lớp niềm tin: xác minh đối tác giao dịch
- MCP và A2A phụ trách giao tiếp giữa các agent, nhưng đặc tả ERC-8004 nêu rõ rằng chúng về bản chất không xử lý được bài toán khám phá agent và niềm tin
- Trước khi có giao dịch giữa các agent, việc xác minh tính chính danh phải diễn ra trước; người bán cần chỉ cho phép các agent đáng tin thay vì bot vô tội vạ
- Hai cách tiếp cận đang nổi lên để giải quyết bài toán này
- ERC-8004(Trustless Agents): một registry on-chain về danh tính, uy tín và xác minh đang ở giai đoạn Draft EIP với sự tham gia của MetaMask, Google, Coinbase, Ethereum Foundation
- Trong thông tin đăng ký agent có thể khai báo cùng lúc MCP endpoint, A2A agent card, tên ENS, DID...
- Cấu trúc này không thay thế các giao thức giao tiếp agent hiện có mà bổ sung thông tin về niềm tin và danh tính
- Visa Trusted Agent Protocol(TAP): giao thức đang được Visa phát triển, cung cấp chữ ký có thể xác minh để người bán phân biệt agent đáng tin với bot thông thường
- Chứng minh đó là Visa trusted agent phục vụ mục đích thương mại
- Xác nhận rằng agent đang đại diện cho một người tiêu dùng cụ thể thông qua tài khoản loyalty hoặc định danh thiết bị
- Cho phép người bán xác minh cả thông tin xác thực thanh toán hợp lệ
- Điểm cốt lõi: niềm tin là điểm khởi đầu của thanh toán; trước câu hỏi “thanh toán như thế nào” thì phải giải quyết câu hỏi “có thể tin agent này hay không”
Giao thức thương mại: lĩnh vực đang mở rộng nhanh nhất
- Agentic commerce là mô hình giao toàn bộ thời điểm mua hàng — từ khám phá sản phẩm, lựa chọn đến thanh toán — cho agent
- Để chuẩn hóa việc này, hai giao thức trọng yếu đang nổi lên
- Agentic Commerce Protocol(ACP): giao thức do OpenAI và Stripe đồng phát triển, định nghĩa cách tạo giỏ hàng và phát sinh payment token để chuyển tới PSP
- Đã vận hành thực tế cùng Walmart, Etsy, Instacart trong môi trường ChatGPT
- Là một tiêu chuẩn thiên về giao dịch, quy định rõ cấu trúc giỏ hàng, cách sinh payment token và quy trình hoàn tất checkout
- Universal Commerce Protocol(UCP): giao thức do Google và Shopify dẫn dắt, cho phép người bán tự cấu hình server sẽ được lộ diện cho agent
- Dự kiến được triển khai lần lượt trên Google Search và Gemini
- Là một framework điều phối nơi người bán công bố capability manifest, còn agent sẽ khám phá và thương lượng
- Đóng vai trò tương tự DNS trong lĩnh vực thương mại
- Khác biệt về cấu trúc: UCP đòi hỏi chi phí triển khai ban đầu cao hơn nhưng mang lại độ linh hoạt lớn trong toàn bộ quy trình; ACP thì tương đối dễ tích hợp hơn với hệ thống thanh toán hiện hữu
- Muốn xuất hiện trên cả ChatGPT lẫn Gemini thì thực tế cần hỗ trợ cả ACP và UCP
Giao thức ở cấp độ mạng thanh toán
- Visa Intelligent Commerce(VIC): giao thức do Visa phát triển, tạo security token tương tự thẻ để agent có thể hoàn tất thanh toán trên mạng Visa
- Hiện ở giai đoạn thử nghiệm và dự kiến ra mắt nửa cuối năm 2026
- Mastercard Agent Pay(MAP): giao thức do Mastercard phát triển, tạo security token có thể dùng trên mạng Mastercard
- Cũng đang thử nghiệm và dự kiến ra mắt nửa cuối năm 2026
- Hai tiêu chuẩn này gần như giống hệt nhau về cấu trúc và mục tiêu; khác biệt cốt lõi là mỗi tiêu chuẩn chỉ hoạt động trên mạng thanh toán của chính mình
- Nhờ token được cấp ở cấp mạng, bảo vệ người tiêu dùng, xử lý chargeback và phản ứng với gian lận vẫn được duy trì theo cách tương tự thanh toán thẻ hiện nay
Những yêu cầu khác biệt của luồng thanh toán B2B
- Dù thương mại tiêu dùng thu hút nhiều chú ý, quy mô giao dịch thực tế của thanh toán B2B còn lớn hơn nhiều
- Phần lớn là đối soát giữa doanh nghiệp với doanh nghiệp như thanh toán hóa đơn, chi trả nhà cung cấp, trả lương...
- Luồng thanh toán B2B có các đặc tính riêng
- Giá trị thanh toán lớn và khó đảo ngược sau khi thực hiện
- Cần các kiểm soát nội bộ như đối chiếu hóa đơn, quy trình phê duyệt và audit trail
- Dùng các rail như ACH hay wire transfer, chậm hơn nhưng linh hoạt hơn về mặt cấu trúc
- Trong mảng này, agent thường giao tiếp trực tiếp với payment rail thay vì đi qua tầng trung gian
- Các payment rail được sử dụng gồm
- Stablecoin(USDC, USDT): thanh toán diễn ra trực tiếp on-chain và có thể nhúng quy tắc cùng logic vào trong giao dịch
- Đã được các công ty như Catena Labs, Payman sử dụng thực tế
- Rail truyền thống(ACH, Wire): agent chuẩn bị thông tin thanh toán rồi chuyển qua hạ tầng tài chính hiện có
- Stablecoin đem lại mức đảm bảo thành công gần với thanh toán thẻ cùng khả năng lập trình cao, nhưng vẫn chưa hình thành một tiêu chuẩn rõ ràng được dùng rộng rãi trong toàn ngành
Thanh toán giữa các agent: tiềm năng lớn nhất
- Phần lớn tài nguyên có giá trị trên Internet hiện bị khóa sau API key và mô hình thuê bao
- Cách tiếp cận cũ yêu cầu phải tạo tài khoản, nạp trước và phát hành key rồi mới có thể dùng dịch vụ
- Trong môi trường có hàng tỷ agent cùng viết code, giao dịch với nhau và dùng tài nguyên đúng thời điểm cần, mô hình này không thể mở rộng
- Hiện có hai điểm ma sát lớn nổi bật
- Vấn đề cạn token: khi agent chạm hạn mức giữa chừng, con người phải tự tay nạp thêm thì công việc mới tiếp tục được
- Vấn đề API key: mỗi khi agent cần một dịch vụ mới, người dùng lại phải tự đăng ký, tạo thông tin xác thực rồi chuyển cho agent
- Vì những ràng buộc này, agent chưa thể có tính tự chủ hoàn toàn và vẫn giống như một lập trình viên junior chưa được giao thẻ công ty hay thông tin xác thực cốt lõi
Giao thức native cho agent
- Google Agent to Pay(AP2): một phần của framework A2A, định nghĩa cấu trúc mandate để con người ủy quyền thanh toán cho agent
- Là giao thức ở lớp trừu tượng được thiết kế để hoạt động cùng x402, UCP... nên không có quan hệ loại trừ lẫn nhau
- Dựa trên thông tin xác thực có thể kiểm chứng để phân biệt các loại mandate sau
- cart mandate: phạm vi những gì agent được phép mua
- intent mandate: mục đích mà con người thực sự mong muốn
- payment mandate: thông tin xác thực thanh toán đã lưu
- HTTP x402: cách tiếp cận do Coinbase và Cloudflare phát triển; khi yêu cầu một tài nguyên bị giới hạn truy cập, server trả về HTTP 402 và dẫn người dùng đến thanh toán bằng stablecoin
- Đang được thử nghiệm trên mạng Base và trong môi trường Cloudflare
- Agent Transaction Protocol(AXTP): giao thức do Circuit và Chisel phát triển, cho phép agent trả phí để dùng MCP server hoặc thu doanh thu từ việc đó
- Việc micropayment quy mô lớn được chia nhỏ tức thời theo đơn vị tài nguyên tính toán, dữ liệu hay lệnh gọi API sẽ trở nên khả thi, từ đó có thể tạo ra khối lượng giao dịch mới khổng lồ ở những mảng trước đây chưa thể monetization hiệu quả
Cấu trúc giao thức tổng thể và triển vọng
- Ở thời điểm hiện tại, hệ sinh thái thanh toán agentic vẫn ở trạng thái pha trộn, chưa được sắp xếp rõ ràng
- Stack lấy Google làm trung tâm đang hình thành: cấu trúc A2A → AP2 → UCP xuất hiện, bao phủ cả thanh toán thương mại lẫn phi thương mại
- Mỗi giao thức đảm nhận vai trò ở một lớp trừu tượng khác nhau
- Lớp giao tiếp agent: chuẩn hóa cách agent trao đổi thông điệp với nhau (MCP, A2A)
- Lớp niềm tin: đánh giá danh tính và độ tin cậy của agent, quản lý danh tính·uy tín (ERC-8004, Visa TAP)
- Lớp ủy quyền: xác minh quyền thanh toán và việc nắm giữ thông tin xác thực (AP2 mandates, token VIC/MAP)
- Lớp luồng giao dịch: quản lý việc khám phá, thương lượng và checkout liên quan đến mua gì và thanh toán ra sao (ACP, UCP)
- Lớp xác thực: xác minh tính chính danh của giao dịch, duy trì bảo mật, ngăn gian lận, xử lý hủy bỏ
- Lớp payment rail: thực thi thanh toán thực tế, sử dụng thẻ, ACH hoặc stablecoin
Những hàm ý chính
- Các tiêu chuẩn hiện tại vẫn đang ở giai đoạn hình thành, chưa hoàn thiện và mức độ chấp nhận còn hạn chế
- Không thể loại trừ khả năng chúng sẽ biến mất như WAP hay Betamax trong tương lai
- Tuy vậy, điều đó chỉ đúng nếu bản thân AI agent biến mất, mà khả năng này khá thấp
- Những điểm mà người bán, doanh nghiệp thanh toán và tổ chức tài chính cần chú ý
- Ảnh hưởng của Google: Google từng dẫn dắt các tiêu chuẩn Internet trước đây, nên A2A·AP2 và stack liên quan có khả năng tồn tại lâu dài
- Chiến lược ưu tiên thương mại: hỗ trợ ACP và UCP giúp xuất hiện trên cả hai môi trường LLM tiêu dùng lớn là ChatGPT và Gemini
- Tầm quan trọng của hạ tầng niềm tin: khi lưu lượng agent tăng lên, vấn đề danh tính và uy tín sẽ càng phức tạp hơn; ERC-8004 và Visa TAP đang nhắm đúng điểm này
- Cơ hội trong thanh toán B2B: đây là mảng có quy mô giao dịch lớn nhưng tiêu chuẩn còn chưa ổn định; stablecoin đang được chấp nhận dần nhưng vẫn thiếu chuẩn mực rõ ràng
- Tiềm năng của thanh toán native cho agent: stablecoin nhanh, rẻ, luôn hoạt động và có thể lập trình là lời giải nhiều triển vọng; x402 là điểm khởi đầu nhưng chưa trưởng thành
- Giai đoạn tiếp theo của môi trường thanh toán agentic nhiều khả năng sẽ được định hình thông qua sự kết hợp giữa các giao thức và việc kế thừa chức năng giữa các lớp
- Sự chuyển dịch sang phần mềm có thể tự khám phá tài nguyên, thương lượng điều kiện và tự trả tiền đã bắt đầu rồi, bất kể tiêu chuẩn nào cuối cùng sẽ sống sót
Chưa có bình luận nào.