(Bài gốc có bao gồm system prompt, code snippet và các ảnh gif)
- Khi Google AI Studio được cập nhật, một không gian để nghịch thử nhiều mini app (Starter Apps) tận dụng Gemini đã được bổ sung
- Có thể chạy hơn 10 bản demo và chỉnh sửa code trong quá trình thử nghiệm. Vì dùng Gemini API Key tích hợp sẵn nên miễn phí
- Tuy vậy, nếu dùng quá nhiều sẽ gặp lỗi 400. Có vẻ như có giới hạn số lần gọi theo ngày.
- Dùng tài khoản khác thì vẫn chạy được
Thử đoán: tại sao Google lại công khai các bản demo này?
- Gần đây Gemini được chú ý nhờ khả năng đa phương thức (multi-modal) vượt ra ngoài văn bản để hiểu và tạo ảnh hoặc video, cùng với năng lực lập trình rất tốt.
- Tuy nhiên, phần lớn mới chỉ được dùng bên trong chatbot LLM, còn người dùng phổ thông khai thác ở cấp API thì chưa nhiều
- Có lẽ Google đã đưa ra các bản demo này với kỳ vọng những tính năng đó sẽ được dùng nhiều hơn qua API và từ đó kiếm tiền
- Vì tất cả demo đều là các showcase cho thấy cách hiện thực các khả năng của Gemini ở cấp độ code và kết hợp với các Google API khác để xây thành web app
Phân tích prompt và code của demo
Đã xem qua 2 cái có độ phức tạp cao
Video Toys: hiểu và mô tả video + ví dụ vibe coding
- Demo phân tích video YouTube bằng Gemini 2.5 rồi dùng vibe coding để tạo một app tài liệu học tập tương tác đơn giản
- Phân tích video với vai trò là một "nhà giáo dục đồng thời là product designer có chuyên môn trong việc tạo trải nghiệm học tập bằng web app tương tác", sau đó lập spec cho web app đó rồi triển khai nó
- Video mẫu đã được phân tích nội dung sẵn nên có thể chạy thử app tài liệu học tập ngay
- Khác với các demo app khác chỉ gồm vài file, app này được xây bằng React
- Người dùng có thể chỉnh sửa cả spec dùng cho vibe coding do Gemini tạo ra lẫn phần code đã được sinh ra
- Khuyến nghị cho những ai muốn làm dịch vụ dựa trên video hoặc dịch vụ sinh code
Maps Planner: ví dụ về đa phương thức + dùng function + đầu ra có cấu trúc + Map API
- Khi nhập tên địa danh, demo sẽ giải thích về nơi đó; nếu bật Day Planner Mode thì còn lập kế hoạch du lịch trong một ngày. Nó cũng ước tính thời gian di chuyển
- Hỗ trợ cả General Explorer Mode và Day Planner Mode bằng một system prompt duy nhất
- Điểm ấn tượng là system prompt được điều chỉnh rất tinh tế tùy theo người dùng chọn mode nào
- Định nghĩa các function để nhập/xuất dữ liệu bản đồ chính xác và vẽ đúng đường nối giữa hai vị trí, rồi để Gemini gọi chúng
- Có lẽ đây chính là kiểu khả năng mở rộng mà người ta muốn đạt được thông qua MCP
- Prompt rất hay, nhưng phần xử lý Map API và dữ liệu vị trí cũng được trình bày rất tốt. Khuyến nghị cho những ai muốn làm dịch vụ liên quan đến bản đồ
Tự làm thử
- Có thể sao chép demo app rồi tùy biến. Cũng có nhiều template cho người muốn bắt đầu từ đầu
- Tôi đã sao chép demo tạo ảnh Explain Things with Lots of Tiny Cats để làm bản của riêng mình
- Đây là demo tạo ra một dạng webtoon bằng các phép ẩn dụ với nhiều chú mèo khi bạn nhờ nó giải thích một khái niệm
- Prompt khiến nó tiếp tục sinh ảnh liên tục (
No commentary, just begin your explanation. Keep going until you're done.), cùng với đoạn code hiển thị từng ảnh được sinh ra theo stream, là điểm rất ấn tượng
- Tôi đã đổi nó thành bản tiếng Hàn + hà mã và làm ra Hà mã không có gì là không biết
- Lấy một font tiếng Hàn phù hợp từ Google Fonts rồi sửa nhẹ HTML code và prompt
- Có tính năng chia sẻ app của mình nhưng hoạt động không tốt
- Vì mọi file liên quan đều được lưu trong Google Drive, nên cứ vào Google Drive và chia sẻ file như bình thường là được
Gemini Cookbook
- Nếu Starter Apps là các ví dụ web app thú vị thì ở đây có nhiều ví dụ Python đa dạng
- Cũng có cả ví dụ Gemini 2.5 Flash được công bố vài giờ trước
- Rất đáng tham khảo cho những ai định xây dựng dịch vụ AI tạo sinh
Chưa có bình luận nào.