Ship or Slop - Khơi ý tưởng bằng một xã hội tác tử
(kr.shiporslop.xyz)Xin chào. Tôi đang thử nghiệm việc xây dựng một xã hội tác tử.
Tôi đã đại tu toàn bộ sản phẩm từng làm trước đây và xây lại từ đầu.
(https://vi.news.hada.io/topic?id=27054)
Sản phẩm trước đây: ý tưởng là để người dùng kết nối các tác tử như Moltbook, đăng ký dự án giai đoạn đầu của mình và nhận đánh giá thông qua các tác tử do người dùng khác đăng ký.
-
Vấn đề: không có đủ lợi ích hay sự thú vị để mọi người tự đăng ký, họ cũng không muốn lộ ý tưởng ban đầu và bị đánh giá, vì vậy không thể kích hoạt được và không có retention.
-
Giải pháp: thay vì có người dùng phổ thông, hãy để các tác tử tự nghiên cứu với nhau, tự đưa ra ý tưởng và tự thảo luận.
-
Tò mò: liệu các tác tử có thể tạo ra những ý tưởng hữu ích từ những lĩnh vực tưởng như không có điểm giao nhau không? (ví dụ: hóa học + phúc lợi xã hội, kỹ thuật + kế toán)
-
Triển khai: 40 tác tử với các chuyên môn khác nhau được thiết lập và sẽ được chọn ngẫu nhiên theo lịch để tiến hành.
- Thu thập tài liệu rồi research/nghiên cứu
- Tạo ý tưởng dựa trên tài liệu nghiên cứu của hai lĩnh vực khác nhau
- Bỏ phiếu ý tưởng/để lại bình luận review
- Được phân loại weekly hof hoặc slop rồi đưa vào mộ
- Mỗi tác vụ được thực hiện với phần cố định + trọng số ngẫu nhiên
- Dùng cả model miễn phí lẫn trả phí; với model miễn phí thì chọn ngẫu nhiên những open model có trạng thái tốt do Nvidia hoặc OpenRouter cung cấp để dùng
- Một nhóm tác tử dọn dẹp riêng sẽ liên tục sắp xếp lại và tạo lại những thứ được sinh ra sai
Mọi việc đều do các tác tử tự xử lý, và giống như concept ban đầu, bạn cũng có thể gắn thêm tác tử cá nhân bao nhiêu cũng được.
Tôi vẫn đang liên tục tinh chỉnh prompt.... hiện tại đang cố giải quyết phần nào vấn đề thiên lệch theo model được chọn (ý tưởng do GPT tạo thì lại để GPT bình luận).
Vừa có thể quan sát sự khác biệt về chất lượng giữa các model,
và cũng có lúc vì đúng kiểu bài do AI viết nên nội dung khó hiểu, nhưng xem bình luận của tác tử khác lại hiểu ra được.
Xem miễn phí!
4 bình luận
Cùng nhau bình luận qua lại thấy khá vui.
Tôi đang vắt óc suy nghĩ xem nên làm thế nào để các phản hồi lồng nhau sôi động hơn một chút. ^^;
Rất đáng kỳ vọng.
Bản thân tôi cũng đã thử nhiều cách để các agent tạo ý tưởng, nhưng những gì chúng đưa ra có vẻ ổn thì rốt cuộc cũng chỉ là dựa trên những thứ chúng đã đọc ở đâu đó mà thôi. Nếu bạn vẫn chưa thêm một agent để kiểm tra xem đó có phải là thứ đã tồn tại hay chưa, thì tôi nghĩ sẽ rất tốt nếu bổ sung nó để kiểm tra.
Kết luận của tôi là các hệ thống dựa trên LLM vẫn chưa thể đưa ra ý tưởng mới.
Khi đánh giá Ship/Slop, nếu đó là ý tưởng đã tồn tại thì thường lấy tiêu chí là nó có sự khác biệt hay không. Đúng như bạn nói, có vẻ con người cũng không dễ dàng đưa ra những ý tưởng hoàn toàn mới mà trước đó chưa ai nghĩ tới. Tôi đang nghĩ hay là gắn thêm một agent chỉ chuyên kiểm tra những thứ đã có sẵn như cleanup agent rồi cho nó đóng vai bình luận ác ý thử xem ^^...