2 điểm bởi ragingwind 19 giờ trước | 2 bình luận | Chia sẻ qua WhatsApp

“Thuế điều phối” trong thời đại AI agent và nút thắt của sự chú ý con người

Bài viết của Addy Osmani bàn về vấn đề rằng việc chạy đồng thời nhiều AI agent có thể không trực tiếp dẫn đến tăng năng suất trong thực tế. Agent có thể hoạt động song song, nhưng khả năng phán đoán của con người để hiểu, rà soát và hợp nhất kết quả thì không thể song song hóa. Tác giả gọi chi phí này là “thuế điều phối”. Nghĩa là chi phí ẩn phát sinh khi điều phối nhiều luồng công việc. Nhìn từ góc độ ủy quyền, bài viết cũng có thể được hiểu là thay vì giao càng nhiều càng tốt, điều quan trọng là phải đặt ra chuẩn mực chỉ giao trong phạm vi mình có thể rà soát đầy đủ.

  • Luận điểm chính

    • Bài viết giải thích rằng khởi động AI agent thì dễ, nhưng xác nhận kết quả của chúng và căn chỉnh với các thay đổi khác thì không dễ.
    • Dù chạy nhiều agent, điều đó không tạo ra “nhiều bản sao của tôi”; việc phán đoán và hợp nhất cuối cùng vẫn phải đi qua sự chú ý của một con người.
    • Tác giả chỉ ra rằng cảm giác bận rộn và trạng thái thực sự hiệu quả có thể là hai chuyện khác nhau.
    • Ngay cả khi chạy 20 agent, điều đó cũng không đồng nghĩa với khối lượng công việc đã triển khai tương đương 20 agent.
  • Thuế điều phối

    • Tác giả xem chi phí điều phối nhiều agent là một vấn đề mang tính cấu trúc. Đây không đơn thuần là vấn đề thiếu tập trung hay thiếu rèn luyện, mà là vấn đề của thiết kế hệ thống.
    • Kết quả do agent tạo ra cuối cùng vẫn cần con người rà soát. Trong quá trình này, các vấn đề như độ chính xác, tính nhất quán với kiến trúc, hay xung đột khi hợp nhất đều dồn về một người.
    • Vì vậy, con người trở thành thành phần tuần tự chậm trong hệ thống AI agent. Thành phần tuần tự là phần không thể xử lý nhiều việc cùng lúc mà phải xử lý theo thứ tự.
  • Phép so sánh kỹ thuật

    • Tác giả ví tình huống này với GIL của Python. GIL là cơ chế khiến dù có nhiều luồng, tại một thời điểm chỉ một luồng được thực thi mã Python.
    • Nghĩa là agent có thể chạy đồng thời, nhưng đến lúc cần hiểu thật sự và đưa ra phán đoán, tất cả đều phải chờ cùng một chiếc khóa là sự chú ý của con người.
    • Bài viết cũng viện dẫn nguyên lý trong kỹ thuật hiệu năng rằng mức tăng tốc của xử lý song song bị giới hạn bởi phần không thể song song hóa. Nghĩa là dù tăng số agent, nếu thời gian phán đoán không giảm thì tổng thông lượng cũng khó tăng mạnh.
  • Ưu điểm

    • Agent có thể hữu ích khi xử lý các công việc độc lập ở chế độ nền.
    • Những việc như viết test hay tạo ảnh chụp màn hình, nơi máy móc có thể chứng minh kết quả ở một mức độ nào đó, có thể giúp giảm gánh nặng cho con người.
    • Bài viết đề xuất gom việc rà soát kết quả lại xử lý theo đợt để giảm chi phí chuyển đổi ngữ cảnh do liên tục qua lại giữa các công việc.
  • Giới hạn và rủi ro

    • Tác giả nói rằng tăng số lượng agent không làm tăng băng thông nhận thức của con người, tức khả năng hiểu và đưa ra phán đoán.
    • Nếu kiểm tra agent quá thường xuyên, mỗi lần lại phải gọi lại một ngữ cảnh công việc khác nhau nên mức độ mệt mỏi có thể tăng lên.
    • Bài viết cảnh báo rằng nếu việc rà soát trở nên hời hợt, có thể sẽ xuất hiện tình huống chấp nhận mã do agent tạo ra mà không hiểu đầy đủ.
    • Nếu không quản lý tốt chi phí này, nợ kỹ thuật và nợ nhận thức có thể cùng tích tụ. Nợ kỹ thuật là gánh nặng trong mã khó sửa về sau, còn nợ nhận thức là trạng thái nhà phát triển liên tục thay đổi hệ thống mà không thực sự hiểu nó.
  • Điểm khác biệt

    • Trọng tâm của bài viết nằm ở sự chú ý của con người hơn là hiệu năng của bản thân AI agent.
    • Tác giả cho rằng nên đo năng suất không phải bằng số lần chạy agent, mà bằng lượng công việc thực sự đã được rà soát, hợp nhất và sẵn sàng để triển khai.
    • Điểm đặc trưng là tác giả không xem con người như người giám sát đứng ngoài hệ thống, mà là một tài nguyên hữu hạn nằm bên trong hệ thống song song đó.
  • Hướng thực hành

    • Bài viết đề xuất rằng quy mô agent không nên dựa vào số lượng mà giao diện công cụ cho phép, mà phải dựa vào tốc độ mà bản thân có thể review tử tế.
    • Cần phân tách công việc. Các việc biệt lập có thể giao cho agent chạy nền, còn các việc mà phán đoán là cốt lõi như lỗi bất thường hay thiết kế kiến trúc thì tốt hơn hết không nên song song hóa.
    • Sự chú ý của con người nên được dùng cho việc phán đoán; còn những phần máy có thể kiểm chứng thì nên để agent đưa ra test hoặc bằng chứng trước.
    • Việc ủy quyền chỉ có ý nghĩa khá hạn chế ở điểm này. Quan trọng không phải là khả năng giao thật nhiều việc, mà là khả năng phân biệt đâu là việc có thể giao và đâu là việc phải tự mình phán đoán.

Bài viết này chỉ ra rằng nút thắt trong việc tận dụng AI agent có thể không nằm ở năng lực thực thi, mà ở năng lực rà soát và phán đoán. Việc khởi chạy nhiều agent đã trở nên dễ hơn, nhưng quá trình tiếp nhận kết quả của chúng một cách có trách nhiệm vẫn là phần việc của con người. Vì vậy, năng suất không đến từ việc tăng số lượng agent, mà đến từ cách xem sự chú ý của bản thân như một tài nguyên hệ thống quan trọng và sắp xếp công việc phù hợp với giới hạn đó. Việc ủy quyền cũng nằm trong cùng nguyên tắc ấy. Cốt lõi không phải là giao nhiều hơn, mà là chỉ giao trong phạm vi mình có thể phán đoán đầy đủ.

2 bình luận

 

Gần đây tôi cũng cảm nhận điều này: khi chạy đồng thời 10–20 tác vụ rồi quay lại xem xét từng cái một, tôi không chuyển được ngữ cảnh nên cứ phải tự hỏi “cái này là gì nhỉ??” và lần mò lại ký ức của mình..

 

Nếu làm theo kiểu tuần tự thì khâu xác minh và rà soát của con người chắc chắn sẽ trở thành điểm nghẽn.

Cuối cùng thì quy trình công việc vẫn phải được chuyển sang xử lý song song bằng agent, nhưng năng lực nhận thức của con người lại có giới hạn.

Rốt cuộc có vẻ như chúng ta đã bước vào thời đại mà việc xây dựng vòng lặp kiểm chứng là cốt lõi để bảo đảm chất lượng và ngăn ngừa sự cố. Không chỉ con người phải kiểm chứng, mà còn cần để các agent kiểm tra chéo lẫn nhau nhằm làm cho giai đoạn xác minh trở nên vững chắc hơn.