32 điểm bởi ninebow 2023-11-24 | 3 bình luận | Chia sẻ qua WhatsApp
  • Bài viết này được dịch với sự cho phép từ bài do Tal Peretz, nhà phát triển sản phẩm AI tại Zapier, chấp bút.

  • Bạn có thể xem bản gốc tại đây, và các nội dung chính như sau.


  • Prompt engineering - giai đoạn khởi đầu

  • Vai trò của đánh giá: sao Bắc Cực (chuẩn định hướng)

    • Tiếp cận đánh giá AI một cách có hệ thống / Systematic Approach to AI Evaluations
    • Tận dụng dataset để kiểm thử chuyên sâu / Dataset Utilization for In-depth Testing
    • Cải thiện đánh giá bằng các đánh giá từ AI / Refining Evaluations with AI Assessments
    • Các chỉ số dùng để đánh giá / Metrics to evaluate
    • Lấy đánh giá của con người làm chuẩn vàng / Human Evaluation as the Gold Standard
  • RAG: thông tin chuyên sâu theo ngữ cảnh khi cần

    • Các kỹ thuật đáng để thử nghiệm / Techniques to Experiment With
  • Fine-tuning: nghệ thuật chuyên biệt hóa

    • Thiếu dữ liệu huấn luyện: bài toán cân bằng giữa số lượng và chất lượng / Insufficient Training Data: The Quantity-Quality Equilibrium
    • Tập dữ liệu huấn luyện mất cân bằng: tiến thoái lưỡng nan về thiên lệch / Unbalanced Training Sets: The Bias Dilemma
    • Tái sử dụng dữ liệu công khai: tín hiệu mới là điều bắt buộc / Reusing Public Data: The New Signal Imperative
    • Prompt engineering kém: mệnh lệnh về sự rõ ràng / Poor Prompt Engineering: The Clarity Commandment
    • Không đánh giá theo từng bước: những sai sót kéo dài liên tục / Not Evaluating Incrementally: The Continuous Oversight
  • Khi mọi thứ đều cần thiết

  • Lời kết

3 bình luận

 
cosine20 2023-11-27

Cảm ơn bạn đã chia sẻ.

 
apkas 2023-11-24

Có vẻ như nội dung gần như giống với A Survey of Techniques for Maximizing LLM Performance do OpenAI công bố nhỉ?

 
ninebow 2023-11-25

Trước giờ tôi chưa xem video OpenAI DevDay nên đến bây giờ mới biết là có phiên mà bạn đã nhắc đến. :)
Cảm ơn bạn đã cho tôi biết!

(+ Chia sẻ luôn liên kết YouTube mà tôi đã tìm được cho mọi người khác!)
https://www.youtube.com/watch?v=ahnGLM-RC1Y