2 điểm bởi GN⁺ 2025-02-07 | 1 bình luận | Chia sẻ qua WhatsApp
  • Phát hành rộng rãi Gemini 2.0

    • Dòng mô hình Flash, lần đầu được giới thiệu tại I/O 2024, là những mô hình mạnh mẽ được tối ưu cho các tác vụ tần suất cao với quy mô lớn và đang được các nhà phát triển ưa chuộng
    • 2.0 Flash hiện đã được phát hành rộng rãi cho nhiều người dùng hơn, với hiệu năng được cải thiện trên các bài benchmark chính
    • Tính năng tạo ảnh và chuyển đổi giọng nói cũng sẽ sớm được bổ sung
  • Mô hình thử nghiệm 2.0 Pro: hiệu năng lập trình tốt nhất và xử lý prompt phức tạp

    • Gemini 2.0 Pro là mô hình có hiệu năng lập trình và khả năng xử lý prompt phức tạp tốt nhất, với năng lực hiểu biết tri thức thế giới và suy luận được cải thiện
    • Cung cấp cửa sổ ngữ cảnh lớn nhất với 2 triệu token, cho phép phân tích và hiểu toàn diện lượng thông tin khổng lồ
    • Được cung cấp cho nhà phát triển dưới dạng mô hình thử nghiệm trên Google AI Studio và Vertex AI, đồng thời người dùng Gemini Advanced cũng có thể sử dụng
  • 2.0 Flash-Lite: mô hình có hiệu quả chi phí tốt nhất

    • Dựa trên những phản hồi tích cực về giá và tốc độ của 1.5 Flash, 2.0 Flash-Lite mang lại chất lượng tốt hơn với cùng tốc độ và chi phí
    • Vượt 1.5 Flash trong phần lớn các benchmark, đồng thời hỗ trợ cửa sổ ngữ cảnh 1 triệu token và đầu vào đa phương thức
    • Được cung cấp dưới dạng bản xem trước công khai trên Google AI Studio và Vertex AI
  • Công tác trách nhiệm và an toàn

    • Khi họ mô hình Gemini trở nên mạnh mẽ hơn, Google tiếp tục đầu tư vào các biện pháp mạnh mẽ để đảm bảo việc sử dụng an toàn và bảo mật
    • Sử dụng kỹ thuật học tăng cường mới để chính Gemini tự phê bình phản hồi của mình, từ đó cung cấp phản hồi chính xác hơn và bám mục tiêu hơn
    • Đang sử dụng red team tự động hóa để đánh giá rủi ro của các cuộc tấn công an ninh mạng như indirect prompt injection

1 bình luận

 
GN⁺ 2025-02-07
Ý kiến Hacker News
  • Thiếu thông tin rõ ràng về các mô hình Gemini nên khá rối. Cũng thiếu thông tin về Gemini Advanced đi kèm gói đăng ký Google Workspace.

    • Chỉ có tên "Gemini Advanced", không có tùy chọn chọn mô hình.
    • Google AI Studio tập trung vào việc xây dựng ứng dụng wrapper cho LLM, nhưng không phù hợp với người dùng chỉ đơn giản muốn đặt câu hỏi và nhận câu trả lời.
    • Thông tin tìm được qua tìm kiếm khá không chắc chắn, trong đó có thông tin nói rằng Gemini Advanced được bao gồm trong gói đăng ký Workspace.
    • Trang gemini.google.com hoàn toàn không có thông tin về mô hình, và tùy chọn cài đặt duy nhất là chuyển đổi dark mode.
  • Có thể truy cập Gemini API qua Google AI Studio và Vertex AI.

    • Có nhiều mô hình như Gemini 2.0, 2.0 Pro, 2.0 Pro Experimental, Gemini 2.0 Flash, Gemini 2.0 Flash Lite, v.v.
    • Benchmark chỉ được so sánh với các mô hình nội bộ của chính họ.
  • Có giới hạn với các chủ đề chính trị khi trò chuyện bằng giọng nói.

    • Khi người dùng nói về kế hoạch nấu ăn, hệ thống lại hiểu nhầm là chủ đề chính trị và hạn chế cuộc trò chuyện.
  • Tên gọi của các mô hình AI khá khó hiểu.

    • Quy ước đặt tên như Flash, Flash-Lite, v.v. rất khó nắm bắt.
    • Có ý kiến cho rằng chất lượng mô hình của Google thấp hơn các nhà cung cấp lớn khác.
  • Hiệu năng trên giá thành rất tốt trong việc parse PDF.

    • Gemini Flash-Lite có hiệu quả chi phí tốt, và có người mong chờ benchmark của bản Lite.
  • Có thể thử nghiệm các mô hình mới trong AI Studio.

    • Có thể trò chuyện thời gian thực qua live mode, và mô hình cũng có thể nhìn thế giới qua camera.
  • Giá của Gemini 2.0 Flash-Lite rẻ hơn GPT-4o mini của OpenAI.

    • Mức giá cho đầu vào văn bản/hình ảnh và đầu vào âm thanh tương đối rẻ hơn.
  • Mô hình Gemini Pro 2.0 gây ấn tượng.

    • Phù hợp cho các tác vụ nhận thức phổ thông như nghiên cứu, phân tích, viết lách.
    • Có khuyến nghị nên dùng qua AI Studio; còn ứng dụng Gemini có nhiều bộ lọc nên có thể hạn chế trả lời với các chủ đề gây tranh cãi.
  • Mô hình Gemini 2.0 Flash rất mạnh cho các tác vụ đa phương thức.

    • Phù hợp cho xử lý tài liệu và phát hiện đối tượng, với hiệu năng/giá thành rất tốt.
    • Các mô hình Qwen2.5 VL 72B và 7B cho hiệu năng tốt hơn trên tác vụ hình ảnh tài liệu.
  • Mô hình Gemini 2.0 Pro Experimental đang thu hút chú ý.

    • Xử lý prompt phức tạp và coding rất tốt, đồng thời cung cấp context window 2 triệu token.