Việc xin cấp khóa API Gemini là một chuỗi thất vọng liên tiếp

(ankursethi.com)

3 điểm bởi GN⁺ 2025-12-11 | 1 bình luận | Chia sẻ qua WhatsApp

Quy trình cấp khóa API Google Gemini 3 Pro quá phức tạp, khiến nhà phát triển cá nhân khó tiếp cận
Tên Gemini được dùng trùng cho nhiều dòng sản phẩm, nên khó phân biệt rõ dịch vụ nào cung cấp chức năng gì
Việc tạo khóa API trong Google AI Studio thì đơn giản, nhưng quá trình thiết lập thanh toán lại chuyển sang Google Cloud Console, đòi hỏi thủ tục xác thực phức tạp và nộp giấy tờ
Ngay cả sau khi xác minh tài khoản thanh toán, lỗi 403 Forbidden vẫn lặp lại nhiều lần, khiến phải mất hàng giờ mới đạt đến trạng thái có thể sử dụng thực tế
Toàn bộ trải nghiệm cho thấy quy trình kém hiệu quả thiên về doanh nghiệp lớn, đối lập với cách tiếp cận gọn gàng của OpenAI hay Anthropic

Sự rối rắm của hệ sản phẩm Gemini

Tên “Gemini” được dùng cho nhiều sản phẩm khác nhau như chatbot, ứng dụng di động, trợ lý giọng nói, tính năng AI trong Workspace, công cụ CLI, tiện ích mở rộng IDE, mô hình LLM
- Ví dụ: chatbot tại gemini.google.com, ứng dụng Android/iPhone, Gemini CLI, Gemini Code Assist, Vertex AI Platform, v.v.
Cùng một cái tên được dùng trên nhiều dịch vụ, dẫn tới tình huống khó tìm ra đường truy cập API dành cho nhà phát triển
Anthropic và OpenAI thì mỗi bên chỉ cung cấp hai lối tiếp cận: dịch vụ web cho người dùng và console cho nhà phát triển, nên cấu trúc đơn giản hơn nhiều

Quy trình tạo khóa API

Trong Google AI Studio, việc tạo khóa API khá đơn giản, chỉ mất vài giây để phát hành khóa mới
Khóa đã cấp được Gemini CLI nhận diện bình thường, nhưng vẫn cần thiết lập thanh toán cho tín dụng API trả phí
Khi nhấp vào liên kết “Set up billing”, hệ thống sẽ chuyển sang Google Cloud Console, và từ đó quy trình phức tạp bắt đầu

Độ phức tạp của việc thiết lập tài khoản thanh toán

Không thể thanh toán đơn giản một bước, mà phải đi qua các bước tạo Billing Account → liên kết dự án → thêm phương thức thanh toán → xác minh phương thức thanh toán
Với thẻ tín dụng tại Ấn Độ, ngay cả sau xác thực OTP hai lớp vẫn tiếp tục bị yêu cầu nộp giấy tờ tùy thân do chính phủ cấp và ảnh chụp thẻ
- Số thẻ phải tự che bằng trình chỉnh sửa ảnh, và việc tải lên chỉ chấp nhận định dạng PNG
Việc tải lên liên tục lỗi, và còn nhận được email thông báo rằng quá trình xác minh có thể mất vài ngày

Lỗi 403 và khôi phục tài khoản

Ngay cả sau khi xác minh hoàn tất, khi dùng Gemini CLI và gọi API vẫn tiếp tục xuất hiện lỗi 403 Forbidden
- Đã thử bằng mã ví dụ JavaScript trong tài liệu của Google nhưng vẫn gặp cùng lỗi
- Trong AI Studio Playground cũng hiển thị thông báo “Failed to generate content”
Quảng cáo
Chỉ sau khi nhận được email từ Google với nội dung “Your account is in good standing” thì hệ thống mới hoạt động bình thường
- Sau đó Playground, API và CLI đều chuyển sang trạng thái có thể dùng Gemini 3 Pro

Đánh giá về quy trình

Toàn bộ quá trình là một trải nghiệm kém hiệu quả kéo dài hơn 3 tiếng, phức tạp không cần thiết đối với nhà phát triển cá nhân
Hệ thống của Google được thiết kế xoay quanh tuân thủ quy định cho các tổ chức quy mô lớn, làm giảm năng suất của người dùng cá nhân
Trong khi đó, OpenAI và Anthropic cung cấp quy trình thanh toán và truy cập API đơn giản, thân thiện hơn với nhà phát triển
Dù dự định sẽ dùng thử Gemini 3 Pro trong một tháng để đánh giá hiệu năng, nền tảng này vẫn bị nhìn nhận là thiếu tính lấy khách hàng làm trung tâm

1 bình luận

GN⁺ 2025-12-11

Ý kiến trên Hacker News

Trên Microsoft Azure, tôi còn có trải nghiệm tệ hại hơn nhiều
Trong lúc làm, một đội ngũ bán hàng bên thứ ba tự nhận là “hỗ trợ Microsoft chính thức” đã tiếp cận, rồi tôi nhận ra thực chất họ đang cố bán một gói tính phí quá mức
Tôi làm game cùng con và thử nghiệm tính năng chuyển văn bản thành giọng nói (TTS)
Tôi đã thử model Google Gemini trên trình duyệt và nó hoạt động tốt. Nhưng khi tích hợp qua API thì gặp đủ kiểu trục trặc
1. Gemini API dùng để tạo prototype nên tỷ lệ lỗi khoảng 30%, còn Vertex API thì ổn định nhưng lại thiếu tính năng. TTS API dù dùng cùng model nhưng hiệu năng rất kém
2. Tham số mà từng API hỗ trợ khác nhau nên không thể tạo ra tổ hợp tôi muốn
3. Tôi phải tự đọc tài liệu hoặc dùng Claude Code để tóm tắt tài liệu rồi thử nghiệm. Tuy vậy vẫn có nguy cơ lẫn thông tin ảo giác
- Hiệu năng model khi gọi bằng API và khi dùng trong Gemini UI cho ra khác nhau
  Gemini API có xác suất khoảng 1% bị lỗi ngẫu nhiên nên logic retry là bắt buộc
  Ngoài ra tốc độ phản hồi API dao động từ 30 giây đến 4 phút tùy trạng thái nội bộ của Google
Thời kỳ đầu của Google AdWords, chỉ cần có thẻ tín dụng là ai cũng có thể chạy quảng cáo
Nhờ khả năng truy cập tức thì này mà họ xây được niềm tin, và người dùng phổ thông cũng có cảm giác được đối xử ngang hàng với các tập đoàn lớn
Nhưng sau thương vụ mua lại DoubleClick năm 2008, tôi nghĩ định hướng của Google đã chuyển từ người dùng sang doanh nghiệp làm trung tâm
- Tôi luôn nhấn mạnh với đội sản phẩm và bán hàng về tầm quan trọng của đăng ký ngay lập tức (self-signup)
  Tôi muốn có thể thanh toán và dùng ngay, không cần phải nói chuyện với ai hay chờ đợi
  Nhưng đội bán hàng lại muốn giữ cấu trúc này vì họ muốn phân biệt giá hoặc có cơ hội thuyết phục khách hàng
- Google AdWords hiện nay là một trong những dịch vụ có trải nghiệm onboarding kém thân thiện nhất
  Đăng ký thì dễ, nhưng vừa thiết lập quảng cáo đầu tiên là tài khoản bị khóa và kháng nghị cũng vô ích
  Mức độ phức tạp đến mức phải thuê chuyên gia mới dùng cho ra hồn
Tôi luôn thắc mắc làm sao Cloud Console UI của AWS hay GCP lại có thể được phát hành trong tình trạng như vậy
Thật khó hiểu khi người ta vẫn có thể hài lòng hoặc được thăng chức sau khi đưa ra những sản phẩm như thế
- Tôi nghi ngờ liệu ban lãnh đạo Google có thực sự từng tự dùng giao diện GCP ngoài các buổi demo hay chưa
- Tôi có cảm giác ở Google không tồn tại lãnh đạo mà chỉ có cổ đông
- Cấu trúc phức tạp của AWS console là ví dụ hoàn hảo cho định luật Conway
  Xem thêm wiki về Conway’s Law và video của Molly Rocket “The Only Unbreakable Rule”
Tìm gemini API key thì tài liệu chính thức hiện ra ngay
Ngay phần đầu tài liệu đã có link, lại gọn gàng chứ không mang kiểu thiết kế marketing nên tôi thấy khá ổn
Có lẽ vấn đề nằm ở phần thanh toán
- Tạo key thì dễ, nhưng vấn đề là thanh toán và lập hóa đơn
- Tôi đã thử nhiều lần nhưng vẫn không thanh toán được cho Gemini API. Có hỏi Logan cũng không giải quyết được gì mấy
- Phần lớn lời phàn nàn có vẻ là do nhầm trải nghiệm tệ của gemini-cli với khả năng tiếp cận của toàn bộ Gemini
- Trong môi trường production thực tế, dùng không phải AI Studio mà là Vertex AI
  Trước đây việc thiết lập service account rất phức tạp, và tài liệu cũng tập trung vào xác thực CLI
  Gần đây Express Mode đã cho phép dùng API Key, nhưng việc có người bức xúc là điều dễ hiểu
  Trước kia chênh lệch tính năng giữa Vertex và AI Studio cũng rất lớn
  Thảo luận liên quan: diễn đàn Google AI Studio
- Mọi thứ đều hỏng từng phần nhiều lần mỗi ngày
  Tôi dùng AI Studio bằng tài khoản Workspace cá nhân, và từ một ngày nào đó Gemini CLI bắt đầu từ chối API key của tôi
  Không có lý do, cũng chẳng có giải thích. Tôi vẫn trả tiền nhưng quyền truy cập bị chặn
  Tôi định chuyển sang tài khoản công ty, nhưng tài liệu na ná nhau nên lại đăng ký nhầm dịch vụ
  Cuối cùng tôi hỏi Gemini Pro thì nó đưa ra quy trình 27 bước. Chỉ cần vướng một bước là phải quay lại từ đầu
  Azure cũng tương tự hoặc còn tệ hơn. Thậm chí tôi còn không có quyền truy cập GPT-5
Tôi bấm vào link “Set up billing” thì bị chuyển từ Google AI Studio sang Cloud Console
Ngay khoảnh khắc đó, cảm giác tuyệt vọng ập đến. Mỗi lần vào AWS hay GCP console là tôi lại lãng phí thời gian với tài liệu cũ kỹ và dashboard rối rắm
- Mọi người còn đùa kiểu “Cái tài liệu AWS cũ kỹ đó có đang ở ngay trong căn phòng này không?”
Tôi cũng đã bỏ cuộc với Gemini vì đúng lý do đó
Tôi không có thời gian để lãng phí vào quy trình phức tạp của Google
Tôi thấy “nano banana pro” nên định lấy API key, nhưng bỏ cuộc sau 5 phút
Tôi cứ tưởng chỉ mình mình gặp vậy, hóa ra những người thông minh khác cũng đều bị mắc kẹt
Kiosk của McDonald’s còn cho phép cả người không biết chữ đặt hamburger, vậy mà Google lại không làm nổi UX cơ bản như thế thì thật khó hiểu
- AI cloud của IBM cũng từng như vậy. Tài liệu cũ kỹ, và trong số nhiều loại API key thì chỉ có một loại là dùng thật
  Nó giống như màn lâu đài trong Mario, chỉ có thể thoát ra nếu đi đúng thứ tự chính xác
  Nếu là IBM thì còn hiểu được, nhưng có vẻ Google giờ cũng đã đến mức đó
- Tôi nghĩ kết quả này xuất phát từ văn hóa nội bộ của Google bị mắc kẹt trong một bong bóng thiếu thân thiện với người dùng
Nếu đội Gemini API có đọc được, tôi muốn đề nghị họ giải thích minh bạch hơn về lỗi xảy ra khi dùng Structured Outputs:
'The specified schema produces a constraint that has too many states for serving'
Có lẽ đây là vấn đề ngữ pháp ràng buộc hoặc token mask trở nên quá lớn
OpenAI cung cấp tài liệu rõ ràng và giới hạn rộng rãi
Issue liên quan trên GitHub cũng bị đóng mà không có lý do
Dù vậy, tốc độ của các model Gemini vẫn rất ấn tượng, và chất lượng API đã cải thiện nhiều so với năm ngoái
Trước đây tôi từng đăng bài phàn nàn trên HN thì Logan đã trực tiếp hỏi xin phản hồi
Anh ấy cũng hoạt động tích cực trên tài khoản X, và từng báo trước rằng AI Studio sẽ được cải thiện UX/UI vào tháng tới
Giữa một tổ chức khổng lồ như vậy mà vẫn cho thấy sự tập trung vào sản phẩm nên tôi rất kỳ vọng
- Nhưng việc báo trước “bản cập nhật vibe coding” trên Bluesky có vẻ là quá sớm
  Hướng đi của đội ngũ vẫn chưa rõ ràng, và tôi có cảm giác các PM của Google không còn sát thực tế như trước
- Đội developer relations của Google thường xuyên nhận phản hồi, nhưng hiếm khi thấy nó thực sự dẫn tới hành động
  Có vẻ họ cứ chờ đến khi nó trở nên quan trọng về mặt chiến lược
  Tôi không hiểu vì sao “làm cho quy trình thanh toán trở nên dễ dàng hơn” lại không quan trọng về mặt chiến lược

Việc xin cấp khóa API Gemini là một chuỗi thất vọng liên tiếp

Sự rối rắm của hệ sản phẩm Gemini

Quy trình tạo khóa API

Độ phức tạp của việc thiết lập tài khoản thanh toán

Lỗi 403 và khôi phục tài khoản

Đánh giá về quy trình

Bài viết liên quan

1 bình luận

Ý kiến trên Hacker News