10 điểm bởi xguru 2025-02-19 | 1 bình luận | Chia sẻ qua WhatsApp
  • Sứ mệnh của xAI là hiểu bản chất của vũ trụ, và để làm được điều đó, hãng phát triển Grok như một AI đặt việc theo đuổi sự thật lên hàng đầu
  • Grok 3 cho thấy hiệu năng cao hơn hơn 10 lần so với Grok 2, nhờ nỗ lực của một đội ngũ xuất sắc và nguồn tài nguyên tính toán quy mô lớn
    • Grok là từ được một nhân vật lớn lên trên sao Hỏa sử dụng trong tiểu thuyết Stranger in a Strange Land của Heinlein, mang nghĩa "hiểu điều gì đó một cách hoàn toàn và sâu sắc"
    • Sự đồng cảm (Empathy) cũng là một yếu tố quan trọng
  • xAI bắt đầu với mô hình đầu tiên cách đây 17 tháng, và Grok 1 là mô hình có 314B (314 tỷ) tham số
    • Sau đó lần lượt phát triển qua Grok 1.5, Grok 2 và tiến tới Grok 3, với hiệu năng được cải thiện vượt bậc
  • Trung tâm dữ liệu: xAI đã xây dựng trung tâm dữ liệu riêng để đẩy nhanh quá trình phát triển Grok
    • Mất 122 ngày để đưa cụm 100.000 GPU đầu tiên vào vận hành, và sau đó chỉ trong 92 ngày đã tăng gấp đôi quy mô lên 200K
    • Đây là cụm H100 kết nối đầy đủ lớn nhất thế giới, và toàn bộ số GPU cùng sức mạnh tính toán này đã được dùng để cải thiện Grok
  • Grok 3: hiệu năng cải thiện hơn 10 lần so với Grok 2 (trên thực tế là hơn 15 lần)
    • Đã hoàn tất pre-training vào đầu tháng 1 và hiện vẫn đang tiếp tục được huấn luyện
  • Benchmark: Grok 3 cho thấy hiệu năng nổi bật trong suy luận toán học tổng quát, khoa học và lập trình
    • Phiên bản nhỏ hơn là Grok 3 Mini cũng đạt mức tương đương các đối thủ cạnh tranh
    • Đặc biệt ghi nhận kết quả hàng đầu ở các bài toán AIME (kỳ thi toán trung học phổ thông)
    • Trên bảng đánh giá chatbot mới nhất (Chatbot Arena), mô hình đạt điểm ELO trên 1.400xếp hạng số 1 trong tất cả các mô hình

Tính năng mới của Grok 3

  • Suy luận nâng cao (Advanced Reasoning)
    • Grok 3 không chỉ đưa ra câu trả lời đơn thuần mà còn có khả năng tìm đáp án thông qua quá trình suy nghĩ chuyên sâu
    • Tăng cường khả năng phân tích vấn đề, tìm lỗi và khám phá nhiều khả năng khác nhau
    • Ví dụ thực tế:
      • Tính toán quỹ đạo du hành sao Hỏa: mô phỏng quỹ đạo khứ hồi Trái Đất - Sao Hỏa và hiển thị trực quan
      • Phát triển game mới: tạo ngay tại chỗ một game mới kết hợp Tetris và Zuma
  • Khả năng học theo thời gian thực của Grok 3
    • Mỗi ngày đều có cải tiến mới, và hiệu năng có thể khác biệt chỉ sau một ngày
    • Ngay cả trong quá trình thử nghiệm, mô hình vẫn tiếp tục tiến bộ
  • Cải tiến kỹ thuật nhờ sử dụng Grok 3
    • Bản thân Grok 3 cũng giúp rút ngắn hàng trăm giờ làm việc trong lập trình và giải quyết vấn đề
    • Thông qua việc giải các bài toán và bài tập competitive programming, mô hình học được khả năng tự phát hiện và sửa lỗi

Tính năng thế hệ tiếp theo: agent dựa trên Grok 3

  • Deep Search
    • Công cụ tìm kiếm AI mới, có thể tìm thông tin chuyên sâu hơn so với công cụ tìm kiếm thông thường
    • Phân tích thông tin từ nhiều website và so sánh dữ liệu mới nhất để đưa ra câu trả lời đáng tin cậy nhất
    • Ví dụ:
      • Tra cứu lịch phóng Starship tiếp theo
      • Phân tích build phổ biến của Path of Exile
      • Dự đoán đội vô địch giải bóng rổ March Madness
  • Trợ lý giọng nói AI (Voice Assistant)
    • Sắp được bổ sung tính năng để người dùng giao tiếp với Grok như trong một cuộc trò chuyện thực sự
    • Grok không chỉ chuyển đổi văn bản đơn thuần mà còn có thể trò chuyện tự nhiên có xét đến tông giọng, cảm xúc và ngữ điệu

Phát hành Grok 3 và kế hoạch tương lai

  • Lịch phát hành
    • Từ hôm nay, bản beta của Grok 3 sẽ được cung cấp cho người đăng ký Premium+
    • Có thể sử dụng các tính năng mới bằng cách cập nhật ứng dụng X (trước đây là Twitter)
    • Ra mắt website độc lập grok.comứng dụng Grok riêng cho iOS/Android
  • Tùy chọn đăng ký mới: Super Grok
    • Ra mắt gói đăng ký Super Grok dành cho người dùng muốn trải nghiệm nhanh các tính năng mới nhất
  • Kế hoạch sắp tới
    • Dự kiến ra mắt API Grok 3 (trong vài tuần tới)
    • Dự kiến công bố mã nguồn mở của Grok 3 (trong vài tháng tới)
    • Đang xây dựng cụm thế hệ tiếp theo mạnh hơn (hiệu năng gấp 5 lần hiện tại)
    • Dự kiến thành lập studio game AI để tăng tốc phát triển game dựa trên AI

Kết luận

  • Grok 3 đang mở ra một chiều kích mới cho các mô hình AI, và xAI đang nỗ lực để tiếp tục phát triển nó
  • Với khả năng suy luận mạnh mẽ, công cụ tìm kiếm AI và tính năng trợ lý giọng nói, Grok đang dần trở thành một trợ lý AI thực thụ
  • Elon Musk dự đoán rằng trong tương lai AI sẽ đạt được những thành tựu học thuật như Fields Medal ("Nobel của toán học")

1 bình luận

 
GN⁺ 2025-02-19
Ý kiến trên Hacker News
  • Karpathy mô tả ấn tượng ban đầu về Grok là ở mức o1-pro của OpenAI
  • Grok đã đạt đẳng cấp hàng đầu trong một bài benchmark
  • Cạnh tranh trong lĩnh vực LLM đang trở nên khốc liệt, đây là tin tốt cho người tiêu dùng
    • Hy vọng không có một công ty độc quyền nào hấp thụ toàn bộ giá trị
  • Có bằng chứng cho thấy có thể xây dựng LLM tiên tiến với chi phí thấp hơn
  • Nội dung được ghi hình không truyền cảm hứng
    • Không có gì mới và đều là những điều đã biết
  • Nhiều người cho rằng họ đang bắt chước OpenAI
    • OpenAI vẫn đang cho thấy họ có thể làm được gì
  • Phải công nhận rằng xAI đã bắt kịp rất nhanh
    • Không chỉ ở mô hình mà còn đang đi trước cả về sản phẩm
  • Kết quả tốt nhất của Grok với tính cạnh tranh có thể là phá vỡ nhận thức đại chúng về ChatGPT
  • Karpathy tin rằng đây là mức o1-pro
  • OpenAI một lần nữa chứng minh rằng không có hào lũy kỹ thuật nào
    • Cho rằng đề nghị thâu tóm OpenAI của Elon là hợp lý
  • Elon rất được ưa chuộng ở Trung Quốc nên có thể dễ dàng thu hút kỹ sư AI
    • Có thể cung cấp cổ phần xAI/XSpace/Neurallink
  • Chúc may mắn tới các nhà đầu tư đang định giá OpenAI ở mức hơn 100 tỷ USD
  • Có kế hoạch công bố trọng số của Grok 2
  • Hình dung về một tương lai nơi LLM chèn quảng cáo được cá nhân hóa