1 điểm bởi princox 2 giờ trước | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Elon Musk đã trực tiếp công khai tình hình huấn luyện mô hình Grok mới trên X (Twitter) từ ngày 15 đến 17/5
  • Phiên bản công khai hiện tại (v4.3) dựa trên mô hình nền tảng V8 với 0.5T tham số và đang được cải thiện sau mỗi vài ngày
  • V9 đang được phát triển nội bộ có 1.5T tham số và ông cho biết là “vừa mới hoàn tất huấn luyện”
    • Musk gọi giai đoạn này là "pre-training" theo cách gọi phổ biến, nhưng chỉ ra rằng đây là "một thuật ngữ sai"
    • So với V8, cả khâu tuyển chọn dữ liệu, công thức huấn luyện và quy mô mô hình đều được nâng cấp mạnh
    • Khác với V8 được huấn luyện trên Hopper, V9 được tối ưu cho kiến trúc Blackwell
  • Ở bước tiếp theo, dữ liệu của Cursor sẽ được bổ sung vào giai đoạn huấn luyện tăng cường (supplemental training, giai đoạn thường được gọi là "mid-training")
  • Musk cũng nhắc rằng “V9 đã cho thấy hiệu năng rất ấn tượng ngay cả trước khi đưa dữ liệu Cursor vào”

▍Bối cảnh: thương vụ SpaceX-Cursor

  • Tháng 4/2026, SpaceX (đã sáp nhập với xAI vào tháng 2 năm ngoái) ký hợp đồng quyền chọn mua lại Cursor trong năm với giá 60 tỷ USD, hoặc trả 10 tỷ USD như khoản đối ứng cho hợp tác
  • Ngay trước thỏa thuận này, các kỹ sư cấp cao của Cursor là Andrew Milich và Jason Ginsberg đã chuyển sang xAI và tham gia với cơ cấu báo cáo trực tiếp cho Musk
  • Cấu trúc hợp tác là kết hợp siêu máy tính xAI Colossus (năng lực tính toán tương đương 1 triệu H100) với sản phẩm dành cho lập trình viên và mạng lưới phân phối của Cursor
  • Việc Cursor thuê hàng chục nghìn chip xAI để huấn luyện mô hình riêng (Composer) nay đã được chính thức hóa qua hợp đồng này
  • Nói cách khác, phát biểu lần này về việc “huấn luyện tăng cường bằng dữ liệu Cursor” cho Grok V9 cho thấy không còn là hợp tác đơn thuần, mà là sự cộng hưởng dữ liệu trong hợp đồng quyền chọn mua lại đã bắt đầu đi vào pipeline huấn luyện mô hình thực tế

▍Đáng chú ý

  • Việc Musk công khai phủ nhận thuật ngữ chuẩn trong ngành là "pre-training" và nhấn mạnh cách phân chia các giai đoạn thành "supplemental training" / "mid-training" là một điểm đáng chú ý
  • Thứ Cursor nắm giữ không chỉ là mã nguồn, mà là “dữ liệu hành vi lập trình” như hành vi chỉnh sửa theo thời gian thực, kết quả kiểm thử, log, ảnh chụp màn hình của hàng triệu lập trình viên → tài sản đắt giá nhất để huấn luyện coding agent
  • Trong bối cảnh Anthropic Claude và OpenAI Codex đang thống trị thị trường lập trình, đây được xem là lá bài trực diện nhất để xAI thu hẹp khoảng cách

Nguồn:

Chưa có bình luận nào.

Chưa có bình luận nào.