- Quy trình cấp khóa API Google Gemini 3 Pro quá phức tạp, khiến nhà phát triển cá nhân khó tiếp cận
- Tên Gemini được dùng trùng cho nhiều dòng sản phẩm, nên khó phân biệt rõ dịch vụ nào cung cấp chức năng gì
- Việc tạo khóa API trong Google AI Studio thì đơn giản, nhưng quá trình thiết lập thanh toán lại chuyển sang Google Cloud Console, đòi hỏi thủ tục xác thực phức tạp và nộp giấy tờ
- Ngay cả sau khi xác minh tài khoản thanh toán, lỗi 403 Forbidden vẫn lặp lại nhiều lần, khiến phải mất hàng giờ mới đạt đến trạng thái có thể sử dụng thực tế
- Toàn bộ trải nghiệm cho thấy quy trình kém hiệu quả thiên về doanh nghiệp lớn, đối lập với cách tiếp cận gọn gàng của OpenAI hay Anthropic
Sự rối rắm của hệ sản phẩm Gemini
- Tên “Gemini” được dùng cho nhiều sản phẩm khác nhau như chatbot, ứng dụng di động, trợ lý giọng nói, tính năng AI trong Workspace, công cụ CLI, tiện ích mở rộng IDE, mô hình LLM
- Ví dụ: chatbot tại gemini.google.com, ứng dụng Android/iPhone, Gemini CLI, Gemini Code Assist, Vertex AI Platform, v.v.
- Cùng một cái tên được dùng trên nhiều dịch vụ, dẫn tới tình huống khó tìm ra đường truy cập API dành cho nhà phát triển
- Anthropic và OpenAI thì mỗi bên chỉ cung cấp hai lối tiếp cận: dịch vụ web cho người dùng và console cho nhà phát triển, nên cấu trúc đơn giản hơn nhiều
Quy trình tạo khóa API
- Trong Google AI Studio, việc tạo khóa API khá đơn giản, chỉ mất vài giây để phát hành khóa mới
- Khóa đã cấp được Gemini CLI nhận diện bình thường, nhưng vẫn cần thiết lập thanh toán cho tín dụng API trả phí
- Khi nhấp vào liên kết “Set up billing”, hệ thống sẽ chuyển sang Google Cloud Console, và từ đó quy trình phức tạp bắt đầu
Độ phức tạp của việc thiết lập tài khoản thanh toán
- Không thể thanh toán đơn giản một bước, mà phải đi qua các bước tạo Billing Account → liên kết dự án → thêm phương thức thanh toán → xác minh phương thức thanh toán
- Với thẻ tín dụng tại Ấn Độ, ngay cả sau xác thực OTP hai lớp vẫn tiếp tục bị yêu cầu nộp giấy tờ tùy thân do chính phủ cấp và ảnh chụp thẻ
- Số thẻ phải tự che bằng trình chỉnh sửa ảnh, và việc tải lên chỉ chấp nhận định dạng PNG
- Việc tải lên liên tục lỗi, và còn nhận được email thông báo rằng quá trình xác minh có thể mất vài ngày
Lỗi 403 và khôi phục tài khoản
- Ngay cả sau khi xác minh hoàn tất, khi dùng Gemini CLI và gọi API vẫn tiếp tục xuất hiện lỗi 403 Forbidden
- Đã thử bằng mã ví dụ JavaScript trong tài liệu của Google nhưng vẫn gặp cùng lỗi
- Trong AI Studio Playground cũng hiển thị thông báo “Failed to generate content”
- Chỉ sau khi nhận được email từ Google với nội dung “Your account is in good standing” thì hệ thống mới hoạt động bình thường
- Sau đó Playground, API và CLI đều chuyển sang trạng thái có thể dùng Gemini 3 Pro
Đánh giá về quy trình
- Toàn bộ quá trình là một trải nghiệm kém hiệu quả kéo dài hơn 3 tiếng, phức tạp không cần thiết đối với nhà phát triển cá nhân
- Hệ thống của Google được thiết kế xoay quanh tuân thủ quy định cho các tổ chức quy mô lớn, làm giảm năng suất của người dùng cá nhân
- Trong khi đó, OpenAI và Anthropic cung cấp quy trình thanh toán và truy cập API đơn giản, thân thiện hơn với nhà phát triển
- Dù dự định sẽ dùng thử Gemini 3 Pro trong một tháng để đánh giá hiệu năng, nền tảng này vẫn bị nhìn nhận là thiếu tính lấy khách hàng làm trung tâm
1 bình luận
Ý kiến trên Hacker News
Trên Microsoft Azure, tôi còn có trải nghiệm tệ hại hơn nhiều
Trong lúc làm, một đội ngũ bán hàng bên thứ ba tự nhận là “hỗ trợ Microsoft chính thức” đã tiếp cận, rồi tôi nhận ra thực chất họ đang cố bán một gói tính phí quá mức
Tôi làm game cùng con và thử nghiệm tính năng chuyển văn bản thành giọng nói (TTS)
Tôi đã thử model Google Gemini trên trình duyệt và nó hoạt động tốt. Nhưng khi tích hợp qua API thì gặp đủ kiểu trục trặc
Gemini API có xác suất khoảng 1% bị lỗi ngẫu nhiên nên logic retry là bắt buộc
Ngoài ra tốc độ phản hồi API dao động từ 30 giây đến 4 phút tùy trạng thái nội bộ của Google
Thời kỳ đầu của Google AdWords, chỉ cần có thẻ tín dụng là ai cũng có thể chạy quảng cáo
Nhờ khả năng truy cập tức thì này mà họ xây được niềm tin, và người dùng phổ thông cũng có cảm giác được đối xử ngang hàng với các tập đoàn lớn
Nhưng sau thương vụ mua lại DoubleClick năm 2008, tôi nghĩ định hướng của Google đã chuyển từ người dùng sang doanh nghiệp làm trung tâm
Tôi muốn có thể thanh toán và dùng ngay, không cần phải nói chuyện với ai hay chờ đợi
Nhưng đội bán hàng lại muốn giữ cấu trúc này vì họ muốn phân biệt giá hoặc có cơ hội thuyết phục khách hàng
Đăng ký thì dễ, nhưng vừa thiết lập quảng cáo đầu tiên là tài khoản bị khóa và kháng nghị cũng vô ích
Mức độ phức tạp đến mức phải thuê chuyên gia mới dùng cho ra hồn
Tôi luôn thắc mắc làm sao Cloud Console UI của AWS hay GCP lại có thể được phát hành trong tình trạng như vậy
Thật khó hiểu khi người ta vẫn có thể hài lòng hoặc được thăng chức sau khi đưa ra những sản phẩm như thế
Xem thêm wiki về Conway’s Law và video của Molly Rocket “The Only Unbreakable Rule”
Tìm
gemini API keythì tài liệu chính thức hiện ra ngayNgay phần đầu tài liệu đã có link, lại gọn gàng chứ không mang kiểu thiết kế marketing nên tôi thấy khá ổn
Có lẽ vấn đề nằm ở phần thanh toán
Trước đây việc thiết lập service account rất phức tạp, và tài liệu cũng tập trung vào xác thực CLI
Gần đây Express Mode đã cho phép dùng API Key, nhưng việc có người bức xúc là điều dễ hiểu
Trước kia chênh lệch tính năng giữa Vertex và AI Studio cũng rất lớn
Thảo luận liên quan: diễn đàn Google AI Studio
Tôi dùng AI Studio bằng tài khoản Workspace cá nhân, và từ một ngày nào đó Gemini CLI bắt đầu từ chối API key của tôi
Không có lý do, cũng chẳng có giải thích. Tôi vẫn trả tiền nhưng quyền truy cập bị chặn
Tôi định chuyển sang tài khoản công ty, nhưng tài liệu na ná nhau nên lại đăng ký nhầm dịch vụ
Cuối cùng tôi hỏi Gemini Pro thì nó đưa ra quy trình 27 bước. Chỉ cần vướng một bước là phải quay lại từ đầu
Azure cũng tương tự hoặc còn tệ hơn. Thậm chí tôi còn không có quyền truy cập GPT-5
Tôi bấm vào link “Set up billing” thì bị chuyển từ Google AI Studio sang Cloud Console
Ngay khoảnh khắc đó, cảm giác tuyệt vọng ập đến. Mỗi lần vào AWS hay GCP console là tôi lại lãng phí thời gian với tài liệu cũ kỹ và dashboard rối rắm
Tôi cũng đã bỏ cuộc với Gemini vì đúng lý do đó
Tôi không có thời gian để lãng phí vào quy trình phức tạp của Google
Tôi thấy “nano banana pro” nên định lấy API key, nhưng bỏ cuộc sau 5 phút
Tôi cứ tưởng chỉ mình mình gặp vậy, hóa ra những người thông minh khác cũng đều bị mắc kẹt
Kiosk của McDonald’s còn cho phép cả người không biết chữ đặt hamburger, vậy mà Google lại không làm nổi UX cơ bản như thế thì thật khó hiểu
Nó giống như màn lâu đài trong Mario, chỉ có thể thoát ra nếu đi đúng thứ tự chính xác
Nếu là IBM thì còn hiểu được, nhưng có vẻ Google giờ cũng đã đến mức đó
Nếu đội Gemini API có đọc được, tôi muốn đề nghị họ giải thích minh bạch hơn về lỗi xảy ra khi dùng Structured Outputs:
'The specified schema produces a constraint that has too many states for serving'Có lẽ đây là vấn đề ngữ pháp ràng buộc hoặc token mask trở nên quá lớn
OpenAI cung cấp tài liệu rõ ràng và giới hạn rộng rãi
Issue liên quan trên GitHub cũng bị đóng mà không có lý do
Dù vậy, tốc độ của các model Gemini vẫn rất ấn tượng, và chất lượng API đã cải thiện nhiều so với năm ngoái
Trước đây tôi từng đăng bài phàn nàn trên HN thì Logan đã trực tiếp hỏi xin phản hồi
Anh ấy cũng hoạt động tích cực trên tài khoản X, và từng báo trước rằng AI Studio sẽ được cải thiện UX/UI vào tháng tới
Giữa một tổ chức khổng lồ như vậy mà vẫn cho thấy sự tập trung vào sản phẩm nên tôi rất kỳ vọng
Hướng đi của đội ngũ vẫn chưa rõ ràng, và tôi có cảm giác các PM của Google không còn sát thực tế như trước
Có vẻ họ cứ chờ đến khi nó trở nên quan trọng về mặt chiến lược
Tôi không hiểu vì sao “làm cho quy trình thanh toán trở nên dễ dàng hơn” lại không quan trọng về mặt chiến lược