3 điểm bởi GN⁺ 2025-01-26 | 1 bình luận | Chia sẻ qua WhatsApp
  • DeepSeek-R1: Tăng cường năng lực suy luận của LLM

    • Giới thiệu các mô hình suy luận thế hệ đầu tiên là DeepSeek-R1-Zero và DeepSeek-R1
    • DeepSeek-R1-Zero được huấn luyện thông qua học tăng cường quy mô lớn và cho thấy năng lực suy luận vượt trội ngay cả khi không có tinh chỉnh có giám sát
    • Tuy nhiên, mô hình này gặp phải những thách thức như vấn đề về tính dễ đọc và hiện tượng trộn lẫn ngôn ngữ
    • Để giải quyết các vấn đề này và cải thiện hiệu năng suy luận, DeepSeek-R1 được giới thiệu với quy trình huấn luyện nhiều giai đoạn và việc sử dụng dữ liệu ban đầu trước khi học tăng cường
    • DeepSeek-R1 đạt hiệu năng tương đương với OpenAI-o1-1217
    • Để hỗ trợ cộng đồng nghiên cứu, DeepSeek-R1-Zero, DeepSeek-R1 và 6 mô hình dense được chưng cất dựa trên Qwen và Llama (1.5B, 7B, 8B, 14B, 32B, 70B) được cung cấp dưới dạng mã nguồn mở
  • Chủ đề và trích dẫn

    • Chủ đề: Tính toán và ngôn ngữ (cs.CL); Trí tuệ nhân tạo (cs.AI); Học máy (cs.LG)
    • Trích dẫn: arXiv:2501.12948 [cs.CL]
  • Lịch sử gửi bài

    • Người gửi: Wenfeng Liang
    • Ngày gửi: 22 tháng 1 năm 2025
  • Cách truy cập

    • Có thể truy cập bài báo dưới nhiều định dạng khác nhau như PDF, HTML, mã nguồn TeX
  • Tài liệu tham khảo và công cụ trích dẫn

    • Cung cấp nhiều tài liệu tham khảo và công cụ trích dẫn khác nhau
  • Mã, dữ liệu, phương tiện

    • Cung cấp mã và dữ liệu liên quan
  • Thông tin về arXivLabs

    • Cung cấp phần giải thích và thông tin hỗ trợ về arXivLabs

1 bình luận

 
GN⁺ 2025-01-26
Ý kiến trên Hacker News
  • Bài báo DeepSeek V3 được xem là tài liệu bắt buộc nên đọc trước

    • Tổ hợp R1 + Sonnet vượt trội hơn các tổ hợp khác
    • Nhiều nghiên cứu tái hiện độc lập đang được tiến hành ở nhiều nơi
    • Việc chưng cất R1 rất dễ nên sẽ xảy ra thường xuyên
    • DeepSeek-R1 đã tạo ra tiếng vang lớn ở Thung lũng Silicon
  • Sau khi dùng thử mô hình r1-14b của Ollama, cảm giác như mô hình đang thử nhiều cách tiếp cận khác nhau theo thời gian thực và chọn phương án thay thế, gợi nhớ đến hành vi của con người

  • DeepSeek V3 xuất hiện đúng lúc khi Claude Sonnet gặp vấn đề

    • Giá của DeepSeek rất rẻ, tạo thành một lợi thế lớn
    • Đã chuyển hoàn toàn từ Aider và Cursor sang DeepSeek
  • Tính năng chat của DeepSeek dễ dùng hơn ChatGPT Pro

    • Có thể đọc được quá trình suy nghĩ của mô hình nên việc debug trở nên dễ dàng
  • Ngạc nhiên khi quá trình suy nghĩ của mô hình GPT-O1 diễn ra bên trong mô hình

    • Tò mò liệu OpenAI có công khai quá trình suy nghĩ của O1 hay không
  • Không chỉ hiệu năng của DeepSeek R1 mà cả các mô hình chưng cất nhỏ cũng rất ấn tượng

    • Mô hình chưng cất 7b dựa trên Qwen cũng rất xuất sắc
    • Mô hình chưng cất 32b được dùng làm mô hình mặc định trên máy chủ gia đình
  • Larry Ellison và Masayoshi Son nhắm tới sự bất tử thông qua ASI

    • Họ đang thực hiện các khoản đầu tư khổng lồ để phát triển ASI
  • Trên Arxiv, hơn 100 tác giả đã công bố bài báo dưới tên nhóm

    • Điều này góp phần nâng cao tinh thần đồng đội và sĩ khí