6 điểm bởi xguru 2023-05-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • Thử thách cộng đồng mở đầu tiên trên thế giới, nơi người dùng sẽ đánh giá sau khi bạn tải mô hình lên
  • Season 1 Episode 1 bắt đầu vào ngày 10 tháng 6, trao giải thưởng $250k trong 12 tuần
  • Hình thức thi đấu
    • Công khai mã nguồn mở Chai Reward Model (GPT-2), được huấn luyện trực tiếp trên 170 triệu tín hiệu do người dùng tạo ra
    • Có thể dùng mô hình này cho đánh giá offline hoặc tích hợp như một phần của pipeline RLHF
    • Vì việc huấn luyện mô hình ngôn ngữ rất tốn kém, ban tổ chức dự kiến thử nghiệm nhiều mô hình nền tảng khác nhau để bất kỳ ai cũng có thể tham gia cuộc thi
    • Với các mô hình được tải lên, hệ thống sẽ dùng AI Safety Classifier nội bộ để kiểm tra khả năng triển khai, sau đó công khai để người dùng A/B testing
    • Được đánh giá bởi hơn khoảng 1 triệu người dùng thực tế

1 bình luận

 
xguru 2023-05-11

Hình ảnh llama trông như thể đã hợp thể với Super Saiyan thật ấn tượng.