94 điểm bởi xguru 2026-03-23 | 4 bình luận | Chia sẻ qua WhatsApp
  • Nhà máy phần mềm mã nguồn mở gồm các AI do CEO YC Garry Tan tạo ra và trực tiếp sử dụng, được thiết kế để một người có thể làm việc như một đội 20 người
  • Được tổ chức thành các slash command bao phủ toàn bộ sprint theo trình tự Think → Plan → Build → Review → Test → Ship → Reflect, và mỗi kỹ năng tự động փոխանց ngữ cảnh sang kỹ năng tiếp theo
  • Bắt đầu với /office-hours để kiểm chứng các giả định sản phẩm, chốt kiến trúc bằng /plan-ceo-review · /plan-eng-review, rồi tự động hóa từ sửa lỗi đến tạo PR bằng /review · /qa · /ship
  • Mỗi lệnh hoạt động như một chuyên gia theo vai trò: review của CEO, thiết kế của quản lý kỹ thuật, giám định của designer, QA lead, release engineer, v.v.
  • Người dùng mục tiêu
    • Founder·CEO — nhà sáng lập công nghệ vẫn muốn tự tay triển khai code
    • Người mới với Claude Code — người cần workflow có cấu trúc theo vai trò thay vì prompt trống
    • Tech Lead·Staff Engineer — kỹ sư cấp cao cần review nghiêm ngặt, QA và tự động hóa phát hành cho từng PR
  • Các skill cốt lõi của sprint
    • /office-hours — kiểm chứng giả định sản phẩm bằng 6 câu hỏi bắt buộc theo kiểu office hours của YC, tạo tài liệu thiết kế và tự động chuyển cho các skill bên dưới
    • /plan-ceo-review — tái định nghĩa vấn đề và khám phá “sản phẩm 10 sao”; gồm 4 chế độ: Expansion·Selective Expansion·Hold Scope·Reduction
    • /plan-eng-review — xác định kiến trúc, luồng dữ liệu, sơ đồ ASCII, edge case, ma trận kiểm thử và các mối lo về bảo mật
    • /plan-design-review — chấm từng chiều thiết kế theo thang 0~10 và giải thích tiêu chuẩn 10 điểm, có tính năng phát hiện AI Slop, đồng thời thực hiện tương tác AskUserQuestion 1 lần cho mỗi quyết định thiết kế
    • /design-consultation — xây dựng một hệ thống thiết kế hoàn chỉnh từ đầu, tạo mockup sản phẩm sát thực tế
    • /review — phát hiện lỗi vượt qua CI nhưng phát nổ trên production, tự động sửa các vấn đề hiển nhiên, gắn cờ khoảng cách về độ hoàn thiện
    • /investigate — nguyên tắc sắt đá: không điều tra thì không sửa; truy vết luồng dữ liệu, xác minh giả thuyết, dừng sau 3 lần thất bại
    • /design-review — sau khi audit giống /plan-design-review, trực tiếp sửa các vấn đề đã phát hiện và đính kèm ảnh chụp màn hình trước/sau khi sửa
    • /qa — kiểm thử ứng dụng bằng trình duyệt thật, phát hiện và sửa lỗi, tự động tạo kiểm thử hồi quy cho mỗi lần sửa
    • /qa-only — cùng phương pháp như /qa nhưng chỉ tạo báo cáo lỗi, không thay đổi code
    • /cso — audit mô hình đe dọa theo OWASP Top 10 + STRIDE; có 17 quy tắc loại trừ false positive, cổng tin cậy từ 8/10 trở lên, và kèm kịch bản exploit cụ thể cho từng phát hiện
    • /ship — đồng bộ với main, chạy test, audit độ bao phủ, push, tạo PR; nếu chưa có framework test thì tự động bootstrap
    • /land-and-deploy — hoàn tất merge PR → chờ CI·triển khai → xác minh trạng thái production chỉ với một lệnh
    • /canary — vòng lặp giám sát lỗi console, hồi quy hiệu năng và sự cố trang sau khi triển khai
    • /benchmark — đo baseline cho thời gian tải trang, Core Web Vitals, kích thước tài nguyên và so sánh trước/sau theo từng PR
    • /document-release — cập nhật mọi tài liệu dự án theo đúng nội dung đã triển khai, tự động phát hiện README lỗi thời
    • /retro — retrospective hằng tuần; phân tích theo cá nhân, chuỗi triển khai liên tục, xu hướng sức khỏe kiểm thử, và với /retro global thì retrospective tổng hợp cho toàn dự án cùng các công cụ AI (Claude Code, Codex, Gemini)
    • /browse — trình duyệt Chromium thật, click thật, screenshot thật, khoảng 100ms cho mỗi lệnh
    • /setup-browser-cookies — nhập cookie từ Chrome·Arc·Brave·Edge vào phiên headless để kiểm thử các trang đã xác thực
    • /autoplan — tự động chạy tuần tự review của CEO → thiết kế → kỹ thuật, chỉ hiển thị cho người dùng các quyết định mang tính sở thích
  • Công cụ mạnh
    • /codex — review code độc lập bằng OpenAI Codex CLI; có 3 chế độ review (cổng pass/fail)·thử thách đối kháng·tư vấn mở, và khi chạy cả /review lẫn /codex thì có phân tích chéo giữa các mô hình
    • /careful — cảnh báo trước khi chạy các lệnh phá hủy như rm -rf, DROP TABLE, force push, kích hoạt bằng cách nhập “be careful”
    • /freeze — giới hạn chỉnh sửa file trong một thư mục cụ thể, ngăn thay đổi ngoài phạm vi khi debug
    • /guard — tích hợp /careful + /freeze, thiết lập an toàn cao nhất cho công việc production
    • /unfreeze — gỡ bỏ ranh giới của /freeze
    • /setup-deploy — thiết lập một lần cho /land-and-deploy, tự động phát hiện nền tảng·URL production·lệnh triển khai
    • /gstack-upgrade — nâng cấp gstack lên phiên bản mới nhất, phát hiện cả cài đặt global lẫn vendored để đồng bộ
  • Sprint song song: có thể chạy đồng thời nhiều phiên Claude Code trong workspace tách biệt thông qua Conductor
    • Ví dụ: một phiên chạy /office-hours, phiên khác chạy /review, phiên thứ ba triển khai tính năng, phiên thứ tư chạy /qa cùng lúc
      — Founder·lead engineer·PM có thể fork nhà máy phát triển AI này để trực tiếp thử nghiệm và mở rộng
  • Ngoài Claude Code, còn hoạt động trên mọi agent hỗ trợ chuẩn SKILL.md như Codex, Gemini CLI, Cursor
  • Giấy phép MIT

4 bình luận

 
kgcrom 2026-03-23

Wow!! Garry Tan đã retweet GeekNews rồi nhé.
https://x.com/garrytan/status/2035898375934300353

 

Vì Office Hour mất khá nhiều thời gian nên tôi thử tìm xem, thì ngay cả chỉ riêng skill này thôi mà độ dài của markdown cũng đã không hề nhỏ rồi.

 
angrybird0 2026-03-23

Có vẻ như nó đang dần phát triển để những người làm doanh nghiệp một người có thể tận dụng tốt hơn.

 
ragingwind 2026-03-23

office-hours khá thú vị, còn tôi thì có phần hands-on.