3 điểm bởi GN⁺ 2025-12-11 | 1 bình luận | Chia sẻ qua WhatsApp
  • Quy trình cấp khóa API Google Gemini 3 Pro quá phức tạp, khiến nhà phát triển cá nhân khó tiếp cận
  • Tên Gemini được dùng trùng cho nhiều dòng sản phẩm, nên khó phân biệt rõ dịch vụ nào cung cấp chức năng gì
  • Việc tạo khóa API trong Google AI Studio thì đơn giản, nhưng quá trình thiết lập thanh toán lại chuyển sang Google Cloud Console, đòi hỏi thủ tục xác thực phức tạp và nộp giấy tờ
  • Ngay cả sau khi xác minh tài khoản thanh toán, lỗi 403 Forbidden vẫn lặp lại nhiều lần, khiến phải mất hàng giờ mới đạt đến trạng thái có thể sử dụng thực tế
  • Toàn bộ trải nghiệm cho thấy quy trình kém hiệu quả thiên về doanh nghiệp lớn, đối lập với cách tiếp cận gọn gàng của OpenAI hay Anthropic

Sự rối rắm của hệ sản phẩm Gemini

  • Tên “Gemini” được dùng cho nhiều sản phẩm khác nhau như chatbot, ứng dụng di động, trợ lý giọng nói, tính năng AI trong Workspace, công cụ CLI, tiện ích mở rộng IDE, mô hình LLM
    • Ví dụ: chatbot tại gemini.google.com, ứng dụng Android/iPhone, Gemini CLI, Gemini Code Assist, Vertex AI Platform, v.v.
  • Cùng một cái tên được dùng trên nhiều dịch vụ, dẫn tới tình huống khó tìm ra đường truy cập API dành cho nhà phát triển
  • Anthropic và OpenAI thì mỗi bên chỉ cung cấp hai lối tiếp cận: dịch vụ web cho người dùng và console cho nhà phát triển, nên cấu trúc đơn giản hơn nhiều

Quy trình tạo khóa API

  • Trong Google AI Studio, việc tạo khóa API khá đơn giản, chỉ mất vài giây để phát hành khóa mới
  • Khóa đã cấp được Gemini CLI nhận diện bình thường, nhưng vẫn cần thiết lập thanh toán cho tín dụng API trả phí
  • Khi nhấp vào liên kết “Set up billing”, hệ thống sẽ chuyển sang Google Cloud Console, và từ đó quy trình phức tạp bắt đầu

Độ phức tạp của việc thiết lập tài khoản thanh toán

  • Không thể thanh toán đơn giản một bước, mà phải đi qua các bước tạo Billing Account → liên kết dự án → thêm phương thức thanh toán → xác minh phương thức thanh toán
  • Với thẻ tín dụng tại Ấn Độ, ngay cả sau xác thực OTP hai lớp vẫn tiếp tục bị yêu cầu nộp giấy tờ tùy thân do chính phủ cấp và ảnh chụp thẻ
    • Số thẻ phải tự che bằng trình chỉnh sửa ảnh, và việc tải lên chỉ chấp nhận định dạng PNG
  • Việc tải lên liên tục lỗi, và còn nhận được email thông báo rằng quá trình xác minh có thể mất vài ngày

Lỗi 403 và khôi phục tài khoản

  • Ngay cả sau khi xác minh hoàn tất, khi dùng Gemini CLI và gọi API vẫn tiếp tục xuất hiện lỗi 403 Forbidden
    • Đã thử bằng mã ví dụ JavaScript trong tài liệu của Google nhưng vẫn gặp cùng lỗi
    • Trong AI Studio Playground cũng hiển thị thông báo “Failed to generate content”
  • Chỉ sau khi nhận được email từ Google với nội dung “Your account is in good standing” thì hệ thống mới hoạt động bình thường
    • Sau đó Playground, API và CLI đều chuyển sang trạng thái có thể dùng Gemini 3 Pro

Đánh giá về quy trình

  • Toàn bộ quá trình là một trải nghiệm kém hiệu quả kéo dài hơn 3 tiếng, phức tạp không cần thiết đối với nhà phát triển cá nhân
  • Hệ thống của Google được thiết kế xoay quanh tuân thủ quy định cho các tổ chức quy mô lớn, làm giảm năng suất của người dùng cá nhân
  • Trong khi đó, OpenAI và Anthropic cung cấp quy trình thanh toán và truy cập API đơn giản, thân thiện hơn với nhà phát triển
  • Dù dự định sẽ dùng thử Gemini 3 Pro trong một tháng để đánh giá hiệu năng, nền tảng này vẫn bị nhìn nhận là thiếu tính lấy khách hàng làm trung tâm

1 bình luận

 
GN⁺ 2025-12-11
Ý kiến trên Hacker News
  • Trên Microsoft Azure, tôi còn có trải nghiệm tệ hại hơn nhiều
    Trong lúc làm, một đội ngũ bán hàng bên thứ ba tự nhận là “hỗ trợ Microsoft chính thức” đã tiếp cận, rồi tôi nhận ra thực chất họ đang cố bán một gói tính phí quá mức

  • Tôi làm game cùng con và thử nghiệm tính năng chuyển văn bản thành giọng nói (TTS)
    Tôi đã thử model Google Gemini trên trình duyệt và nó hoạt động tốt. Nhưng khi tích hợp qua API thì gặp đủ kiểu trục trặc

    1. Gemini API dùng để tạo prototype nên tỷ lệ lỗi khoảng 30%, còn Vertex API thì ổn định nhưng lại thiếu tính năng. TTS API dù dùng cùng model nhưng hiệu năng rất kém
    2. Tham số mà từng API hỗ trợ khác nhau nên không thể tạo ra tổ hợp tôi muốn
    3. Tôi phải tự đọc tài liệu hoặc dùng Claude Code để tóm tắt tài liệu rồi thử nghiệm. Tuy vậy vẫn có nguy cơ lẫn thông tin ảo giác
    • Hiệu năng model khi gọi bằng API và khi dùng trong Gemini UI cho ra khác nhau
      Gemini API có xác suất khoảng 1% bị lỗi ngẫu nhiên nên logic retry là bắt buộc
      Ngoài ra tốc độ phản hồi API dao động từ 30 giây đến 4 phút tùy trạng thái nội bộ của Google
  • Thời kỳ đầu của Google AdWords, chỉ cần có thẻ tín dụng là ai cũng có thể chạy quảng cáo
    Nhờ khả năng truy cập tức thì này mà họ xây được niềm tin, và người dùng phổ thông cũng có cảm giác được đối xử ngang hàng với các tập đoàn lớn
    Nhưng sau thương vụ mua lại DoubleClick năm 2008, tôi nghĩ định hướng của Google đã chuyển từ người dùng sang doanh nghiệp làm trung tâm

    • Tôi luôn nhấn mạnh với đội sản phẩm và bán hàng về tầm quan trọng của đăng ký ngay lập tức (self-signup)
      Tôi muốn có thể thanh toán và dùng ngay, không cần phải nói chuyện với ai hay chờ đợi
      Nhưng đội bán hàng lại muốn giữ cấu trúc này vì họ muốn phân biệt giá hoặc có cơ hội thuyết phục khách hàng
    • Google AdWords hiện nay là một trong những dịch vụ có trải nghiệm onboarding kém thân thiện nhất
      Đăng ký thì dễ, nhưng vừa thiết lập quảng cáo đầu tiên là tài khoản bị khóa và kháng nghị cũng vô ích
      Mức độ phức tạp đến mức phải thuê chuyên gia mới dùng cho ra hồn
  • Tôi luôn thắc mắc làm sao Cloud Console UI của AWS hay GCP lại có thể được phát hành trong tình trạng như vậy
    Thật khó hiểu khi người ta vẫn có thể hài lòng hoặc được thăng chức sau khi đưa ra những sản phẩm như thế

    • Tôi nghi ngờ liệu ban lãnh đạo Google có thực sự từng tự dùng giao diện GCP ngoài các buổi demo hay chưa
    • Tôi có cảm giác ở Google không tồn tại lãnh đạo mà chỉ có cổ đông
    • Cấu trúc phức tạp của AWS console là ví dụ hoàn hảo cho định luật Conway
      Xem thêm wiki về Conway’s Law và video của Molly Rocket “The Only Unbreakable Rule”
  • Tìm gemini API key thì tài liệu chính thức hiện ra ngay
    Ngay phần đầu tài liệu đã có link, lại gọn gàng chứ không mang kiểu thiết kế marketing nên tôi thấy khá ổn
    Có lẽ vấn đề nằm ở phần thanh toán

    • Tạo key thì dễ, nhưng vấn đề là thanh toán và lập hóa đơn
    • Tôi đã thử nhiều lần nhưng vẫn không thanh toán được cho Gemini API. Có hỏi Logan cũng không giải quyết được gì mấy
    • Phần lớn lời phàn nàn có vẻ là do nhầm trải nghiệm tệ của gemini-cli với khả năng tiếp cận của toàn bộ Gemini
    • Trong môi trường production thực tế, dùng không phải AI Studio mà là Vertex AI
      Trước đây việc thiết lập service account rất phức tạp, và tài liệu cũng tập trung vào xác thực CLI
      Gần đây Express Mode đã cho phép dùng API Key, nhưng việc có người bức xúc là điều dễ hiểu
      Trước kia chênh lệch tính năng giữa Vertex và AI Studio cũng rất lớn
      Thảo luận liên quan: diễn đàn Google AI Studio
    • Mọi thứ đều hỏng từng phần nhiều lần mỗi ngày
      Tôi dùng AI Studio bằng tài khoản Workspace cá nhân, và từ một ngày nào đó Gemini CLI bắt đầu từ chối API key của tôi
      Không có lý do, cũng chẳng có giải thích. Tôi vẫn trả tiền nhưng quyền truy cập bị chặn
      Tôi định chuyển sang tài khoản công ty, nhưng tài liệu na ná nhau nên lại đăng ký nhầm dịch vụ
      Cuối cùng tôi hỏi Gemini Pro thì nó đưa ra quy trình 27 bước. Chỉ cần vướng một bước là phải quay lại từ đầu
      Azure cũng tương tự hoặc còn tệ hơn. Thậm chí tôi còn không có quyền truy cập GPT-5
  • Tôi bấm vào link “Set up billing” thì bị chuyển từ Google AI Studio sang Cloud Console
    Ngay khoảnh khắc đó, cảm giác tuyệt vọng ập đến. Mỗi lần vào AWS hay GCP console là tôi lại lãng phí thời gian với tài liệu cũ kỹ và dashboard rối rắm

    • Mọi người còn đùa kiểu “Cái tài liệu AWS cũ kỹ đó có đang ở ngay trong căn phòng này không?”
  • Tôi cũng đã bỏ cuộc với Gemini vì đúng lý do đó
    Tôi không có thời gian để lãng phí vào quy trình phức tạp của Google

  • Tôi thấy “nano banana pro” nên định lấy API key, nhưng bỏ cuộc sau 5 phút
    Tôi cứ tưởng chỉ mình mình gặp vậy, hóa ra những người thông minh khác cũng đều bị mắc kẹt
    Kiosk của McDonald’s còn cho phép cả người không biết chữ đặt hamburger, vậy mà Google lại không làm nổi UX cơ bản như thế thì thật khó hiểu

    • AI cloud của IBM cũng từng như vậy. Tài liệu cũ kỹ, và trong số nhiều loại API key thì chỉ có một loại là dùng thật
      Nó giống như màn lâu đài trong Mario, chỉ có thể thoát ra nếu đi đúng thứ tự chính xác
      Nếu là IBM thì còn hiểu được, nhưng có vẻ Google giờ cũng đã đến mức đó
    • Tôi nghĩ kết quả này xuất phát từ văn hóa nội bộ của Google bị mắc kẹt trong một bong bóng thiếu thân thiện với người dùng
  • Nếu đội Gemini API có đọc được, tôi muốn đề nghị họ giải thích minh bạch hơn về lỗi xảy ra khi dùng Structured Outputs:
    'The specified schema produces a constraint that has too many states for serving'
    Có lẽ đây là vấn đề ngữ pháp ràng buộc hoặc token mask trở nên quá lớn
    OpenAI cung cấp tài liệu rõ ràng và giới hạn rộng rãi
    Issue liên quan trên GitHub cũng bị đóng mà không có lý do
    Dù vậy, tốc độ của các model Gemini vẫn rất ấn tượng, và chất lượng API đã cải thiện nhiều so với năm ngoái

  • Trước đây tôi từng đăng bài phàn nàn trên HN thì Logan đã trực tiếp hỏi xin phản hồi
    Anh ấy cũng hoạt động tích cực trên tài khoản X, và từng báo trước rằng AI Studio sẽ được cải thiện UX/UI vào tháng tới
    Giữa một tổ chức khổng lồ như vậy mà vẫn cho thấy sự tập trung vào sản phẩm nên tôi rất kỳ vọng

    • Nhưng việc báo trước “bản cập nhật vibe coding” trên Bluesky có vẻ là quá sớm
      Hướng đi của đội ngũ vẫn chưa rõ ràng, và tôi có cảm giác các PM của Google không còn sát thực tế như trước
    • Đội developer relations của Google thường xuyên nhận phản hồi, nhưng hiếm khi thấy nó thực sự dẫn tới hành động
      Có vẻ họ cứ chờ đến khi nó trở nên quan trọng về mặt chiến lược
      Tôi không hiểu vì sao “làm cho quy trình thanh toán trở nên dễ dàng hơn” lại không quan trọng về mặt chiến lược