34 điểm bởi xguru 2023-06-01 | 2 bình luận | Chia sẻ qua WhatsApp
  • Nội dung do Andrej Karpathy trình bày tại Build 2023
  • Gồm 2 phần
    • Cách huấn luyện trợ lý (Chat)GPT
    • Cách áp dụng trợ lý này vào ứng dụng của riêng bạn
  • Giải thích một cách bao quát về Tokenization, Pretraining, Supervised Finetuning, Reinforcement Learning from Human Feedback, v.v.,
    đồng thời giới thiệu các chiến lược prompt, nhiều công cụ trong hệ sinh thái và cả những mở rộng trong tương lai

2 bình luận

 
kuroneko 2023-06-01

Tóm tắt lại thì ra như thế này.

  • Các mô hình ngôn ngữ lớn như GPT được huấn luyện thông qua giai đoạn tiền huấn luyện trên lượng lớn dữ liệu văn bản và tinh chỉnh để phù hợp với tác vụ cụ thể.
  • Tiền huấn luyện bao gồm việc dự đoán từ tiếp theo trong chuỗi để học các biểu đạt ngôn ngữ tổng quát. Tinh chỉnh giúp mô hình thích nghi với tác vụ cụ thể.
  • Prompting cũng có thể được dùng để áp dụng mô hình ngôn ngữ vào tác vụ mà không cần tinh chỉnh, bằng cách cung cấp prompt để mô hình tạo ra phản hồi.
  • Supervised fine-tuning dùng dữ liệu đã được gắn nhãn gồm prompt và phản hồi lý tưởng để huấn luyện mô hình assistant.
  • Hiệu năng còn có thể được cải thiện hơn nữa bằng cách thực hiện reinforcement learning from human feedback để huấn luyện mô hình assistant tạo ra các phản hồi được con người đánh giá cao.
  • Các kỹ thuật prompt engineering như cho mô hình thấy quy trình làm việc từng bước hoặc cung cấp ví dụ có thể cải thiện hiệu năng của mô hình ngôn ngữ.
  • Vì mô hình ngôn ngữ thiếu độc thoại nội tâm và khả năng suy luận như con người, prompting cần bù đắp cho điều đó.
  • Việc cấp cho mô hình ngôn ngữ quyền truy cập vào công cụ bên ngoài, máy tính và knowledge base có thể cải thiện hiệu năng.
  • Tinh chỉnh một phần của mô hình ngôn ngữ cho tác vụ cụ thể có thể tăng hiệu năng, nhưng phức tạp hơn.
  • Vẫn còn tồn tại nhiều hạn chế của mô hình ngôn ngữ, như thiên kiến, lỗi suy luận và dễ bị tấn công.
 
xguru 2023-06-01

https://www.youtube.com/watch?v=bZQun8Y4L2A
Video này cũng có trên YouTube, nhưng trên trang Microsoft có hỗ trợ phụ đề tiếng Hàn được dịch bằng AI nên mình đăng bản đó.