2 điểm bởi xguru 2024-08-16 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Đã phát hành các mô hình Grok-2 và Grok-2 mini cho người dùng Grok trên nền tảng X
  • Grok-2 có năng lực trò chuyện, lập trình và suy luận được cải thiện đáng kể so với mô hình trước đó là Grok-1.5
  • Phiên bản đầu của Grok-2, được thử nghiệm trên bảng xếp hạng LMSYS với tên sus-column-r, cho thấy hiệu năng vượt trội hơn Claude 3.5 Sonnet và GPT-4-Turbo

Mô hình ngôn ngữ và tính năng trò chuyện của Grok-2

  • Đã gửi phiên bản đầu của Grok-2 lên LMSYS Chatbot Arena (công cụ benchmark cạnh tranh LLM nổi tiếng) dưới tên sus-column-r
  • Vượt qua Claude và GPT-4 về điểm Elo tổng thể của mô hình

Benchmark

  • Đã đánh giá mô hình Grok-2 trên một loạt benchmark học thuật như suy luận, đọc hiểu, toán học, khoa học và lập trình
  • Grok-2 và Grok-2 mini cho thấy cải thiện đáng kể so với mô hình Grok-1.5 trước đó
  • Đạt hiệu năng cạnh tranh với các mô hình tiên tiến khác trong các lĩnh vực như kiến thức khoa học cấp sau đại học (GPQA), kiến thức tổng quát (MMLU, MMLU-Pro), và bài toán thi đấu toán học (MATH)
  • Grok-2 cho thấy hiệu năng hàng đầu trên suy luận toán học thị giác (MathVista) và hỏi đáp dựa trên tài liệu (DocVQA)

Trải nghiệm Grok với thông tin thời gian thực trên X

  • Đã liên tục cải thiện Grok trên nền tảng X
  • Người dùng X Premium và Premium+ có thể truy cập hai mô hình mới là Grok-2 và Grok-2 mini
  • Grok-2 có thể được truy cập qua tab Grok trong ứng dụng X, là trợ lý AI tiên tiến với năng lực cao cấp trong cả văn bản và hiểu thị giác
  • Grok-2 mini là một mô hình nhỏ nhưng có năng lực, cung cấp sự cân bằng giữa tốc độ và chất lượng câu trả lời
  • Đang thử nghiệm mô hình FLUX.1 với Black Forest Labs và mở rộng khả năng của Grok trên X

Xây dựng với Grok bằng Enterprise API

  • Dự kiến sẽ phát hành Grok-2 và Grok-2 mini cho nhà phát triển thông qua nền tảng Enterprise API mới vào cuối tháng này
  • API mới được xây dựng trên một tech stack tùy chỉnh mới, cho phép triển khai suy luận đa khu vực với độ trễ thấp có thể truy cập trên toàn cầu
  • Cung cấp các tính năng bảo mật nâng cao như xác thực đa yếu tố bắt buộc, thống kê lưu lượng chi tiết và phân tích thanh toán nâng cao
  • Cung cấp API quản trị để tích hợp quản lý nhóm, người dùng và thanh toán vào các công cụ và dịch vụ nội bộ hiện có

Tiếp theo là gì?

  • Grok-2 và Grok-2 mini đang được phát hành trên X
    • Rất kỳ vọng vào nhiều tính năng dựa trên AI mà Grok mang lại, như khả năng tìm kiếm nâng cao, insight chuyên sâu về các bài đăng trên X và tính năng trả lời được cải thiện
  • Sắp công bố bản xem trước về hiểu đa phương thức như một phần cốt lõi của trải nghiệm Grok trên X và API
  • Kể từ khi công bố Grok-1 vào tháng 11 năm 2023, X.AI đã tiến rất nhanh dưới sự dẫn dắt của một đội ngũ nhỏ nhưng có mật độ nhân tài hàng đầu
  • Với việc ra mắt Grok-2, công ty đứng ở tuyến đầu của phát triển AI
  • Đang tập trung vào việc nâng cao năng lực suy luận cốt lõi với cụm tính toán mới
  • Sẽ chia sẻ nhiều cập nhật hơn nữa trong vài tháng tới
  • "Đang tìm kiếm những cá nhân muốn gia nhập một đội ngũ nhỏ, tập trung, tận tâm xây dựng những đổi mới có tác động lớn nhất cho tương lai của nhân loại"

Chưa có bình luận nào.

Chưa có bình luận nào.