2 điểm bởi GN⁺ 2024-12-07 | 1 bình luận | Chia sẻ qua WhatsApp
  • Bộ sưu tập Llama 3.3
    • Bộ sưu tập này bao gồm các bộ chuyển đổi và kho lưu trữ gốc của Llama 3.3
    • Được cập nhật lần gần nhất cách đây 8 giờ
    • Bao gồm tổng cộng 1 mục

1 bình luận

 
GN⁺ 2024-12-07
Ý kiến trên Hacker News
  • So với Llama 3.2 405B, hiệu năng có vẻ tương đương hoặc nhỉnh hơn một chút

    • Theo Zuck, đây là bản phát hành cuối cùng của dòng Llama 3, và Llama 4 dự kiến ra mắt vào năm 2025
    • Gợi nhớ đến câu nói nổi tiếng của Steve Jobs về Dropbox: "đó là một tính năng chứ không phải một sản phẩm"
    • Meta đang thương mại hóa AI bằng cách cung cấp các mô hình mạnh dưới dạng mã nguồn mở, qua đó có thể tăng cường các dịch vụ của Facebook và Instagram
    • Không phải bán AI, mà là dùng AI để củng cố hoạt động kinh doanh cốt lõi
    • Việc cung cấp dưới dạng mã nguồn mở giúp họ hưởng lợi từ sự chấp nhận rộng rãi và quá trình phát triển từ cộng đồng
  • Trong các benchmark của chúng tôi, mô hình này hoạt động tốt hơn dự kiến

    • Sẽ xem xét sâu hơn, nhưng hiện tại rất ấn tượng
  • Hiện vẫn đang có thảo luận về một ứng dụng khách desktop Mac "đa dụng" tốt

    • Muốn dùng Ollama, ChatGPT, Claude, Perplexity, v.v.
    • Muốn dùng AI chat trong nhiều ứng dụng khác nhau, và không nhất thiết phải là ứng dụng desktop
    • MacMind khá hay nhưng làm frontend cho các API khác thì tốn kém
    • Câu trả lời kiểu "đừng quá keo kiệt" cũng có lý
  • Cho thấy hiệu năng tương tự GPT-4o trên nhiều benchmark

  • Đã tải lên Hugging Face các bản 4bit bitsandbytes, GGUF và trọng số 16bit gốc

    • Có thể fine-tune Llama 3.3 70B nhanh gấp 2 lần với dưới 48GB VRAM, đồng thời giảm 70% mức sử dụng bộ nhớ
  • Đang theo dõi giá 1M token trên OpenRouter, và giá đang giảm sau mỗi lần làm mới

  • Việc mã nguồn mở Llama là một ví dụ tuyệt vời cho chiến lược "Commoditize Your Complement"

    • Với những ai chưa từng nghe về chiến lược này, có cung cấp liên kết tới bài "Laws of Tech: Commoditize Your Complement" của Gwern
  • Câu hỏi về mô hình trên Hugging Face

    • Có thể chạy qua JupyterLab trên laptop hay không
    • Có những lợi ích gì
    • Có thể cập nhật định kỳ hay không
    • Có thể fine-tune cho mục đích cụ thể hay không
    • Việc fine-tune mô hình cần bao nhiêu thời gian và công sức
    • Yêu cầu URL về việc liệu Hugging Face có cung cấp câu trả lời cho những câu hỏi này hay không
  • Meta liên tục vượt kỳ vọng khi phát hành các mô hình mở mạnh mẽ để nhắm tới OpenAI/Anthropic

    • Những người hưởng lợi lớn nhất là các developer