Tạo đội tác tử AI review như người Hàn thật sự (fork Harness + 1 triệu persona từ NVIDIA)

(github.com/hongsw)

6 điểm bởi fastkoder 2026-04-28 | 1 bình luận | Chia sẻ qua WhatsApp

TL;DR

Trong một harness nơi việc review là trọng tâm — review code, review tài liệu, nghiên cứu UX, mô phỏng phỏng vấn — sẽ chỉ có giá trị khi 5 reviewer mang 5 góc nhìn khác nhau. Với đội tác tử AI thông thường, cả 5 người đều có giọng điệu và quan điểm gần như giống nhau, nên thực chất chỉ là 1 ý kiến lặp lại 5 lần.

Bản fork này dùng truy xuất động lúc chạy để kéo NVIDIA Nemotron-Personas-Korea (1 triệu dòng, CC BY 4.0) vào, rồi khoác lên tác tử hình mẫu những con người có thật trong môi trường công sở Hàn Quốc (đến cả nghề nghiệp, thế hệ, vùng miền, hoàn cảnh gia đình), từ đó tạo ra các bài review với góc nhìn thực sự khác biệt.

Vì sao harness review cần persona đủ sâu

Cùng nhìn vào một đoạn code/tài liệu/thiết kế, mỗi người sẽ có góc nhìn khác nhau:

Trưởng nhóm backend 45 tuổi xuất thân từ SI
→ "Xét trên phương diện quản trị rủi ro thì mình nên triển khai theo từng giai đoạn. Xác minh đủ rồi hãy đi tiếp thì cuối cùng còn rút ngắn được tiến độ."
Growth marketer 24 tuổi thế hệ MZ
→ "Cách bạn nhanh chóng dựng giả thuyết nguyên nhân khi số liệu bật bất thường là tốt đấy, nhưng mức ý nghĩa thống kê còn hơi yếu. Chạy thêm A/B nhé?"
PM 38 tuổi là mẹ đi làm
→ "Tóm lại nếu quý này không chốt được thì nhờ ưu tiên lại giúp em một lần nhé."
Designer 27 tuổi xuất thân từ fintech
→ "Trong dữ liệu định tính từ phỏng vấn người dùng, có bình luận kiểu 'khoảnh khắc nhận coupon hơi nhạt' lặp lại khá nhiều."

→ Cùng xem một đoạn code mà 4 người sẽ chốt 4 kiểu rủi ro/giá trị/ưu tiên khác nhau. Đó mới là bản chất của một đội review.

Có gì được bổ sung (3 skill mới, không xâm lấn)

Giữ nguyên revfactory/harness, chỉ rẽ nhánh kích hoạt tự động bằng keyword trong phần description:

korean-persona-search — bộ lọc đa trục bằng Parquet predicate pushdown (nghề nghiệp, vùng miền, độ tuổi, học vấn, thế hệ) + lấy mẫu đa dạng
korean-voice-adapter — ma trận văn phong lịch sự kiểu Hàn + văn hóa công sở Hàn Quốc (chuỗi báo cáo, phép tắc họp hành, cách diễn đạt vòng) + từ điển thuật ngữ của 13 ngành
korean-persona-harness — meta orchestrator (pipeline 5 tác tử con: nhà phân tích kịch bản → người tuyển chọn persona → bộ chuyển đổi lối nói → bộ dựng tác tử → QA về tính đa dạng)

Tương thích cả Claude Code lẫn Codex CLI — cùng định dạng SKILL.md, dùng chung cache dataset.

Kiểm chứng — cùng LLM, cùng tác vụ, cùng dung lượng (102 dòng vs 103 dòng)

Mô phỏng biên bản họp standup hằng tuần của một đội 5 người. Độ chính xác miền nghiệp vụ là tương đương. Khác biệt nằm ở độ đa dạng góc nhìn.

Kết quả harness thông thường:

Mức độ nhận diện giọng nói: thấp (5 người gần như cùng một tông)
Phép tắc công sở Hàn Quốc: rất ít
Phản hồi qua lại, động viên, đáp lễ: 0 lần
Giọng điệu nhờ vả/xác nhận: 5 lần
Bộc lộ hoàn cảnh cá nhân: 0 trường hợp

Kết quả korean-persona-harness:

Mức độ nhận diện giọng nói: rất cao (che tên vẫn phân biệt được)
Phép tắc công sở Hàn Quốc: phong phú (tránh khẳng định chắc nịch, mentoring, giọng xác nhận)
Phản hồi qua lại, động viên, đáp lễ: 4 lần
Giọng điệu nhờ vả/xác nhận: 11 lần
Bộc lộ hoàn cảnh cá nhân: 2 trường hợp (lịch gia đình, viện dẫn thẩm quyền)

Chi tiết đời thường chỉ xuất hiện ở Run B:

Backend (bố của hai con): "Tuần tới tôi có chút lịch của bọn trẻ, nên tôi nghĩ hay là mình sắp xếp trước một vòng rotation thì sẽ ổn hơn."

Phép tắc công sở Hàn Quốc: rất ít
Phép tắc công sở Hàn Quốc: rất ít
Phản hồi qua lại, động viên, đáp lễ: 0 lần
Giọng điệu nhờ vả/xác nhận: 5 lần
Bộc lộ hoàn cảnh cá nhân: 0 trường hợp

Kết quả korean-persona-harness:

Mức độ nhận diện giọng nói: rất cao (che tên vẫn phân biệt được)
Phép tắc công sở Hàn Quốc: phong phú (tránh khẳng định chắc nịch, mentoring, giọng xác nhận)
Phản hồi qua lại, động viên, đáp lễ: 4 lần
Giọng điệu nhờ vả/xác nhận: 11 lần
Bộc lộ hoàn cảnh cá nhân: 2 trường hợp (lịch gia đình, viện dẫn thẩm quyền)

Chi tiết đời thường chỉ xuất hiện ở Run B:

Trưởng nhóm (45 tuổi) → marketer (24 tuổi): "Thái độ nhanh chóng dựng giả thuyết nguyên nhân khi số liệu bật bất thường, cứ tiếp tục như vậy là được."
Marketer: "À, cảm ơn anh trưởng nhóm!"

Trưởng nhóm: "Tuy vậy, có dấu hiệu cho thấy chính sách retry bên mình đang hoạt động quá quyết liệt nên đã phần nào khuếch đại sự cố. Tôi sẽ không kết luận chắc cho đến bản RCA cuối cùng."

→ Persona về gia đình, thế hệ và nghề nghiệp được gắn vào phát ngôn một cách tự nhiên. Không chỉ là kiểu trừu tượng như "ưu tiên ổn định", mà còn thể hiện ra trong hành vi vì sao người này lại có ưu tiên đó.

Ma trận giá trị — phù hợp dùng ở đâu

Review code (5 người, 5 góc nhìn) → rất cao
Mô phỏng phỏng vấn người dùng ảo → rất cao
Review copy marketing cho người dùng Hàn Quốc → rất cao
Nghiên cứu UX, workshop persona → cao
Mô phỏng họp hành, cộng tác → cao
RFC, tài liệu kỹ thuật → trung bình
Thiết kế hạ tầng, kiến trúc → thấp (dùng harness gốc sẽ phù hợp hơn)

Cài đặt (1 dòng)

Claude Code:

  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness

Codex CLI:

  python3 ~/.codex/skills/.system/skill-installer/scripts/install-skill-from-github.py \  
      --repo hongsw/harness \  
      --path skills/korean-persona-search \  
      --path skills/korean-voice-adapter \  
      --path skills/korean-persona-harness

Cache dataset (dùng chung cho cả hai runtime):

  pip install huggingface_hub pyarrow  
  python3 $SKILL_DIR/korean-persona-search/scripts/download.py

⚠️ Lưu ý: trình cài đặt revfactory/harness hiện có cùng tên marketplace và plugin, nên cần migration 4 bước:

  /plugin uninstall harness@harness  
  /plugin marketplace remove harness-marketplace  
  /plugin marketplace add hongsw/harness  
  /plugin install harness@harness

Liên kết

Repo fork: github.com/hongsw/harness
PR #9 lên upstream (đang chờ merge): github.com/revfactory/harness/pull/9
Kết quả kiểm chứng: _workspace/comparison_test
Dataset: huggingface.co/.../Nemotron-Personas-Korea (CC BY 4.0)
Harness gốc: github.com/revfactory/harness

1 bình luận

tomlee 2026-04-28

Thú vị thật haha. Bên mình cũng đang đi theo một hướng khác trong lĩnh vực tương tự — đó là ClawSouls (clawsouls.ai), một nền tảng registry lưu trữ và chia sẻ persona. Các persona đã đăng ký có thể được áp dụng lên các nền tảng agent như OpenClaw, Claude Code, Cursor và Hermes Agent thông qua gói npm clawsouls. Nếu anh/chị có thể đăng bài giúp thì rất cảm ơn. Nền tảng này cũng từng được giới thiệu trên GeekNews. Show GN: ClawSouls – registry mở giúp thay đổi persona của AI agent chỉ bằng một dòng Nếu muốn hợp tác, mong anh/chị liên hệ nhé ^^ ( contact@clawsouls.ai )