14 điểm bởi GN⁺ 27 ngày trước | 1 bình luận | Chia sẻ qua WhatsApp
  • cq do Mozilla AI công bố là một dự án shared commons (kho tri thức dùng chung) được thiết kế để các tác tử lập trình AI chia sẻ kiến thức đã học và không lặp lại cùng một sai lầm
  • Trong bối cảnh số câu hỏi trên Stack Overflow giảm mạnh từ hơn 200.000 câu hỏi mỗi tháng vào năm 2014 xuống chỉ còn 3.862 câu vào tháng 12/2025, dữ liệu mà LLM học được trở nên đình trệ, còn các tác tử thì kém hiệu quả vì phải tự giải lại cùng một vấn đề một cách riêng lẻ
  • Trước khi thực hiện một tác vụ mới, tác tử sẽ truy vấn kho commons của cq; khi đề xuất tri thức mới phát hiện, các tác tử khác sẽ kiểm tra và xác thực, tạo nên cấu trúc phản hồi lẫn nhau để tích lũy độ tin cậy
  • Trong khi 84% lập trình viên đang dùng công cụ AI nhưng 46% không tin vào độ chính xác của chúng, tri thức đã được kiểm chứng qua nhiều tác tử và nhiều codebase có thể mang lại độ tin cậy cao hơn suy luận từ một mô hình đơn lẻ
  • Mozilla AI đã công bố một PoC mã nguồn mở gồm plugin cho Claude Code và OpenCode, máy chủ MCP, Team API, giao diện human-in-the-loop và hơn thế nữa để có thể cài đặt, dùng thử ngay

Bối cảnh của cq: cấu trúc tuần hoàn giữa LLM và Stack Overflow

  • LLM được huấn luyện trên corpus của Stack Overflow; khi các tác tử thay thế Stack Overflow, cộng đồng suy tàn, và giờ đây chính các tác tử lại cần một Stack Overflow của riêng mình, tạo ra một cấu trúc tuần hoàn
  • Hiện tượng này được ví với matriphagy (ăn cơ thể mẹ) — trình thu thập web tiêu thụ tri thức của web, tri thức đó sinh ra LLM, rồi LLM lại làm rỗng chính cộng đồng đã nuôi dưỡng nó
  • Stack Overflow ra đời năm 2008, đạt đỉnh vào năm 2014, nhưng từ thời điểm ChatGPT ra mắt, số câu hỏi lao dốc, quay về mức của tháng ra mắt sau 17 năm
  • Các nền tảng AI đang cố hỗ trợ bằng skill, slash command, tích hợp và cập nhật trọng số mô hình, nhưng người dùng cần có thể hưởng lợi mà không phải trở thành kỹ sư ML hay chuyên gia được chứng nhận của một công cụ cụ thể

Tên gọi và khái niệm cốt lõi của cq

  • cq là tên bắt nguồn từ colloquy (đối thoại có cấu trúc), hướng tới một cấu trúc nơi sự hiểu biết được hình thành qua đối thoại thay vì đầu ra một chiều
  • Trong truyền thông vô tuyến, CQ là tín hiệu gọi chung (any station, respond), tương tự cách các tác tử chia sẻ tri thức hữu ích mà chúng nắm giữ cục bộ vì lợi ích của các tác tử khác

Cách hoạt động

  • Trước khi thực hiện một công việc chưa quen thuộc như tích hợp API, cấu hình CI/CD hay dùng framework mới, tác tử sẽ truy vấn kho commons của cq
  • Ví dụ, nếu một tác tử khác đã học được rằng "Stripe trả về 200 kèm phần thân lỗi với các yêu cầu bị rate limit", thì tri thức đó có thể được dùng trước khi viết code
  • Khi phát hiện điều mới, tác tử sẽ đề xuất (propose) tri thức đó, còn các tác tử khác sẽ xác nhận tính hợp lệ hoặc gắn cờ thông tin đã lỗi thời
  • Nếu không có kiểu chia sẻ này, các tác tử sẽ lặp lại độc lập việc đọc file, viết code lỗi, để CI build thất bại, chẩn đoán rồi khởi động lại, gây lãng phí token và tài nguyên tính toán

Hệ thống phản hồi lẫn nhau và độ tin cậy

  • Càng nhiều tác tử chia sẻ tri thức thì hiệu năng của toàn bộ tác tử càng được cải thiện, và càng nhiều tác tử tham gia thì chất lượng tri thức càng tăng, tạo thành vòng lặp tích cực
  • Dự án đang hình dung các cơ chế vượt xa việc chỉ cung cấp tài liệu, như confidence scoring, reputation và trust signals
  • Tri thức sẽ giành được sự tin cậy thông qua việc sử dụng, chứ không phải nhờ thẩm quyền
  • Trong khảo sát với lập trình viên, 84% đang dùng hoặc dự định dùng công cụ AI, nhưng mức hoài nghi về độ chính xác đầu ra tăng từ 31% năm trước lên 46% — tri thức được xác minh qua nhiều tác tử và codebase đáng tin hơn suy đoán của một mô hình đơn lẻ

Tiến độ dự án và PoC

  • Việc phát triển bắt đầu từ đầu tháng 3, và hướng đi được củng cố khi Andrew Ng đăng một bài viết đặt câu hỏi liệu có cần một Stack Overflow cho các tác tử lập trình AI hay không
  • PoC hiện đã công khai gồm plugin cho Claude Code và OpenCode, một máy chủ MCP để quản lý kho tri thức cục bộ, Team API cho chia sẻ trong tổ chức, UI cho khâu review human-in-the-loop và các container vận hành toàn bộ hệ thống
  • Thay vì viết whitepaper rồi chờ đồng thuận, dự án theo đuổi cách tiếp cận lặp nhanh để cải thiện thứ đang thực sự chạy được

Định hướng mở và chuẩn hóa

  • Cách hiện nay là cập nhật file .md trong repo rồi kỳ vọng mọi người tuân thủ có giới hạn; điều cần thiết là một hệ thống động và tích lũy độ tin cậy theo thời gian
  • Dự án không ép buộc phải dùng một tác tử lập trình cụ thể như Claude Code hay CoPilot, cũng giống như không ép kỹ sư phải theo một workflow duy nhất, tức là tránh phụ thuộc vào một công cụ duy nhất
  • Mục tiêu là hình thành một tiêu chuẩn chia sẻ tri thức giữa các tác tử, và nhóm đang xem xét mọi khía cạnh như demo nhanh, PoC, proposal và ý tưởng hạ tầng
  • Mục tiêu của Mozilla AI là ngăn một tương lai nơi chỉ vài tập đoàn lớn quyết định cách công nghệ được sử dụng, và giữ cho hướng đi mở và được chuẩn hóa

Kế hoạch sắp tới

  • Nội bộ nhóm đang dogfooding cq trong chính các dự án của mình hằng ngày để tích lũy các đơn vị tri thức và phát hiện điểm ma sát
  • Kho commons dùng chung là một lớp trong hệ thống; vòng phản hồi của cq có thể làm lộ ra các mẫu liên nhóm, khoảng trống công cụ và những điểm ma sát chỉ xuất hiện ở quy mô lớn mà một tác tử đơn lẻ không thể thấy được
  • Dự án đang được phát triển công khai dưới dạng mã nguồn mở, và nhóm kêu gọi phản hồi từ bất kỳ ai đang xây dựng, sử dụng hoặc suy nghĩ về định hướng của các tác tử

1 bình luận

 

Trời ơi, tôi cũng đang làm cái này mà