2 điểm bởi xguru 1 giờ trước | 1 bình luận | Chia sẻ qua WhatsApp
  • Các trụ cột chính là Gemini 3.5 Flash, Gemini Omni Flash, Antigravity 2.0, Google AI Studio, Gemma 4, Android 17, Chrome/Web, Firebase, Google Play, năng lực của nhà phát triển trong kỷ nguyên AI
  • Google không chỉ công bố mô hình, mà còn đặt luồng phát triển nơi agent thực sự truy cập sản phẩm, trình duyệt, đám mây, ứng dụng di động, dữ liệu, tài liệu và môi trường kiểm thử lên vị trí trung tâm
  • Công cụ phát triển đã vượt xa mức chỉ viết code thay lập trình viên để mở rộng sang lập kế hoạch, thực thi, xác minh, gỡ lỗi, triển khai, đánh giá và điều phối nhiều agent
  • Android, Flutter, Chrome, Firebase và Google Play đều được mở rộng theo hướng đưa Gemini và công cụ agent vào ngay trong luồng phát triển hiện có
  • Thay vì viết code, các nút thắt lớn hơn đang nổi lên là chi phí xác minh, cung cấp ngữ cảnh, quyền truy cập công cụ, quan sát runtime, hạ tầng kiểm thử, tài liệu hóa và thiết kế hệ thống của tổ chức

Phiên 1 - Google keynote

  • Mỗi tháng có hơn 8,5 triệu người đang xây dựng ứng dụng và trải nghiệm bằng các mô hình của Google
  • API mô hình của Google xử lý khoảng 19 tỷ token mỗi phút
  • Mức sử dụng AI Search:
    • AI Overviews được hơn 2,5 tỷ người sử dụng mỗi tháng
    • AI Mode được hơn 1 tỷ người sử dụng mỗi tháng
  • Người dùng hoạt động hàng tháng của ứng dụng Gemini đã tăng từ 400 triệu tại I/O năm ngoái lên hơn 900 triệu
  • Số ảnh được tạo bằng mô hình Nano Banana đã vượt 50 tỷ ảnh
  • Gemini 3.5 Flash có mặt trên toàn bộ sản phẩm và API, với đặc điểm cốt lõi là chạy nhanh và hiệu quả chi phí
  • Gemini Omni Flash là mô hình đầu tiên trong dòng Omni, theo hướng xử lý rộng hơn cả đầu vào và đầu ra đa phương thức
  • Antigravity 2.0 là ứng dụng desktop độc lập có thể dùng trên toàn cầu, xử lý hội thoại agent, dự án và quản lý công việc trong một màn hình
  • Demo quy mô lớn của Antigravity:
    • Với 93 sub-agent, hơn 15.000 lần gọi mô hình2,6 tỷ token, hệ thống đã tạo ra lõi hệ điều hành hoạt động được từ một dự án trống
    • Chạy với dưới 1.000 USD tín dụng API nhờ tận dụng hiệu năng và hiệu quả chi phí của Gemini 3.5 Flash

Phiên 2 - Developer keynote

  • Google đưa ra một luồng thống nhất cho nhà phát triển, kết hợp mô hình, công cụ agent, nền tảng người dùng và hạ tầng
  • Managed agents được đưa vào Gemini API, cho phép sử dụng agent harness như Antigravity dưới dạng API
  • Google Antigravity 2.0 là ứng dụng desktop lấy agent làm trung tâm, với cấu trúc để nhiều agent đảm nhận và xử lý công việc phát triển
  • Có thể trực tiếp tùy biến và triển khai luồng agent bằng Antigravity SDK
  • Trong Google AI Studio, người dùng mới có thể triển khai thẳng lên Cloud Run mà không cần thẻ tín dụng
  • Tích hợp Google Workspace cho phép AI Studio sử dụng dữ liệu Workspace ngay trong luồng tạo ứng dụng
  • Google AI Studio nay hỗ trợ luồng biến ý tưởng thành ứng dụng Android ngay lập tức
  • Gemma 4:
    • Được cung cấp theo giấy phép Apache 2
    • Đạt 100 triệu lượt tải xuống trong tháng đầu tiên
    • Tổng lượt tải của toàn bộ dòng Gemma đã tăng lên hơn 500 triệu
  • Chrome DevTools for Agents có thể dùng trong Antigravity và hơn 20 coding agent
  • Tinh chỉnh Gemma 4 bằng LoRA để tạo phản hồi lệnh bash có thể dùng ngay trong pipeline CI, rồi triển khai lên laptop cục bộ

Phiên 3 - Agent-first workflows from prompt to production

  • Sau khi triển khai ứng dụng tạo trong AI Studio bằng Cloud RunFirebase, luồng agent còn nối tiếp sang cả gỡ lỗi và phân tích ở giai đoạn vận hành
  • Agent truy cập công cụ và dữ liệu Google Cloud thông qua hơn 50 máy chủ MCP được quản lý
  • Developer Knowledge MCP đưa thông tin mới nhất từ tài liệu Google vào công cụ agent để giảm vấn đề tài liệu lỗi thời
  • Snapshot tài liệu mới nhất được đưa vào công cụ agent theo chu kỳ khoảng 8-12 giờ
  • Dùng Data Agent KitBigQuery MCP để phân tích dữ liệu Firestore, BigQuery và log, đồng thời tạo dashboard
  • Antigravity có thể điều tra lỗi ứng dụng, tìm file liên quan, sửa chúng và tiếp tục tới cả commit GitHub
  • Remediation agent và CI agent được triển khai trên Cloud Run sẽ kết nối với Eventarc, Pub/Sub và Gemini để điều tra và sửa lỗi
  • Nhiều agent trao đổi công việc cho nhau theo kiểu A2A(agent-to-agent)
  • Phát triển agent không dừng ở tạo prototype mà còn mở rộng tới triển khai, giám sát, phân tích dữ liệu và tự động khôi phục

Phiên 4 - What’s new in Android

  • Android 17 bổ sung giới hạn bộ nhớ và các công cụ liên quan để việc ứng dụng dùng quá nhiều bộ nhớ không làm hỏng trải nghiệm người dùng
  • Android 17 coi các điều kiện như excessive memory, cold start và excessive CPU là đối tượng phân tích tự động
  • Ứng dụng nhắm mục tiêu Android 17 cần quyền ACCESS_LOCAL_NETWORK để tìm và kết nối thiết bị trong mạng cục bộ
  • Google tiếp tục đẩy mạnh hướng xây dựng UI Android bằng Jetpack Compose
  • Compose 1.10Compose 1.11 bao gồm cải tiến về hiệu năng, hybrid UI và API mới
  • Tích hợp AppFunctions với Gemini đang ở giai đoạn private preview, cho phép ứng dụng trở thành đối tượng điều phối của Gemini
  • Có thể thử nghiệm một số tính năng mới thông qua bản developer preview của ML Kit Prompt API
  • Android 17 cung cấp Eclipsa Video, cải thiện chất lượng giọng nói HE-AAC và các nâng cấp camera/media dựa trên CameraX và Media3
  • Ứng dụng màn hình lớn đang chuyển theo hướng ít bị ràng buộc bởi giới hạn di động truyền thống hơn, bằng cách dùng Navigation 3 và thư viện Compose Adaptive
  • Compose 1.6 cho Wear OS hỗ trợ Navigation 3 và mode manager giúp quản lý nội dung ở trạng thái tiết kiệm pin

Phiên 5 - What’s new in Chrome

  • Chrome tập trung vào việc giúp website hoạt động tốt với người dùng sử dụng agent và công cụ kiểu agent
  • Thay vì chỉ dựa vào kiến thức nền của mô hình, Google muốn kết nối Baseline và các tính năng web mới nhất với công cụ phát triển
  • Kể từ năm ngoái, 55 tính năng đã đạt trạng thái Baseline Widely Available
  • Tại thời điểm công bố, 52 tính năng đang ở trạng thái Baseline Newly Available
  • Vì Chrome cập nhật mỗi 4 tuần, coding agent rất dễ tạo ra triển khai lỗi thời nếu không biết các tính năng web mới nhất
  • Prompt API của Chrome có mặt từ Chrome 148
  • Navigation API, View Transitions, HTML-in-Canvas và declarative partial updates được đưa vào ngay trong luồng phát triển
  • Nhà phát triển tiện ích mở rộng Chrome giờ có thể tự động kiểm tra và gỡ lỗi việc cài đặt, service worker, side panel và popup
  • Chrome đang mở rộng theo hướng cung cấp cho agent các skill cấp cao như hiệu năng web, identity, security cùng hơn 100 hướng dẫn cho các trường hợp sử dụng phổ biến
  • Cần đưa thông tin về tính năng web mới nhất và hỗ trợ trình duyệt vào cho agent để giảm việc lặp lại các mẫu tương thích đã lỗi thời

Phiên 6 - What’s new in Google AI

  • Dòng mô hình Gemini là một họ mô hình đa phương thức xử lý đầu vào văn bản, hình ảnh, âm thanh, video, mã nguồn và nhiều dạng đầu ra
  • Vai trò của Gemini 3.5 Pro và Flash:
    • Gemini 3.5 Pro tập trung vào giải quyết các bài toán phức tạp
    • Gemini 3.5 Flash đảm nhiệm sự cân bằng giữa hiệu năng, tốc độ và chi phí
  • Tính năng Build của AI Studio dùng 3.5 Flash làm mô hình mặc định
  • Nano Banana 2 có thể dùng thử trực tiếp trong AI Studio
  • Gemini Omni Flash là mô hình có thể tạo đầu ra bao gồm cả video từ dữ liệu đầu vào
  • Gemini LiveLive API hỗ trợ tương tác bằng giọng nói
  • Interactions API là tính năng để tương tác với agent bên trong AI Studio
  • Khả năng tiếp cận Gemma 4:
    • Có thể thử nghiệm trong playground của AI Studio
    • Cũng có hỗ trợ một số lượt gọi miễn phí trong Gemini API
    • cửa sổ ngữ cảnh 256.000 token và có thể tìm thấy trên Hugging Face
  • Gemini Robotics 1.6, Genie 3, Antigravity 2.0, cùng chiến lược giảm chi phí bằng cách kết hợp mô hình mở và mô hình độc quyền cũng được giới thiệu

Phiên 7 - Build next-gen AI experiences with Google AI Studio and Google Antigravity

  • Google AI Studio được mở rộng vượt khỏi playground cho mô hình, trở thành không gian để biến ý tưởng thành ứng dụng và triển khai chúng
  • Mô hình, agent, tạo ứng dụng, tích hợp Workspace và triển khai Cloud Run được đưa vào cùng một luồng
  • Mục ứng dụng của AI Studio sẽ sớm ra mắt, xử lý trực tiếp hơn việc tạo và triển khai ứng dụng
  • Đã bổ sung tính năng xuất mã tạo trong AI Studio sang Antigravity chỉ trong một bước
  • Antigravity 2.0 không chỉ viết mã mà còn đóng vai trò mission control để điều phối nhiều tác vụ bằng agent
  • Antigravity 2.0 lấy task list, implementation plan và rà soát các tệp đã thay đổi làm luồng cốt lõi
  • Có thể xử lý trực tiếp code review và rà soát thay đổi ngay bên trong Antigravity 2.0
  • Đây là cấu trúc giao cho agent các tác vụ nặng như kiểm thử trình duyệt, lập kế hoạch, viết tính năng nhiều tệp và xác minh end-to-end
  • Có thể tạo một ứng dụng kinh doanh mới trong khoảng 20 phút bằng Google AI Studio rồi tiếp tục phát triển nó bằng Antigravity
  • Google AI Studio là điểm khởi đầu nhanh cho “prompt to app”, còn Antigravity là công cụ để phát triển ứng dụng thành công việc phát triển thực tế

Phiên 8 - Unlock modern web capabilities in your AI coding workflows

  • Nếu agent lập trình không biết các tính năng web hiện đại, rất dễ tạo mã theo tiêu chuẩn tương thích trình duyệt cũ
  • Chrome đã ra mắt 50 tính năng mới trong năm qua, nhưng do knowledge cutoff của mô hình nên nhiều tính năng không tới được với mô hình
  • Trong ví dụ về Interest Invokers API, xuất hiện vấn đề agent dùng tên thuộc tính cũ là interesttarget
  • Modern Web Guidance là gói tri thức giúp agent tìm các tính năng web mới nhất và cách triển khai được khuyến nghị
  • Agent sẽ thực hiện tìm kiếm ngữ nghĩa trong gói cục bộ trước khi trả lời
  • Quy mô và cấu trúc của bộ hướng dẫn:
    • Hiện có hơn 100 hướng dẫn
    • Cấu trúc này không phơi bày toàn bộ skill theo từng tính năng lên công cụ cấp cao, mà sẽ tìm và dùng khi cần
  • Bộ hướng dẫn cung cấp đồng thời cách triển khai hiện đại lý tưởng và các khuyến nghị fallback
  • Nếu không có yêu cầu về hỗ trợ trình duyệt, agent sẽ mặc định giả định Baseline Widely Available
  • Nếu ghi các điều kiện như “chỉ hỗ trợ Chrome 144 trở lên” trong AGENTS.md, agent có thể tránh các fallback không cần thiết
  • Nhóm Chrome chạy đánh giá hằng ngày với các mô hình như Gemini 3.1, Claude Opus 4.7 và GPT 5.5

Phiên 9 - What’s new in Firebase

  • Firebase đang chuyển sang agent-native platform, nơi cả con người và agent đều có thể tạo và mở rộng ứng dụng
  • Firebase Data Connect phát triển thành Firebase SQL Connect, hỗ trợ phát triển ứng dụng dựa trên SQL
  • Với custom resolver của Firebase SQL Connect, có thể kết nối các dịch vụ Google Cloud như Cloud Functions và BigQuery
  • Firestore hỗ trợ geo search, native full text search và semantic match
  • Firebase AI Logic hỗ trợ các mô hình mới nhất và có thể tạo tính năng AI nhận biết vị trí bằng Maps grounding
  • Tính năng điều khiển tạo ảnh của Nano Banana cũng có thể dùng trong Firebase AI Logic
  • Firebase AI Logic hỗ trợ suy luận cục bộ và lai trên iOS, Chrome và Android, đồng thời fallback sang cloud-hosted model khi không có mô hình cục bộ
  • Dart support for Cloud Functions in Firebase được cung cấp dưới dạng experimental preview
  • AI Studio được kết nối với Google Workspace để có thể dùng dữ liệu từ Sheets, Docs, Gmail và Calendar trong ứng dụng
  • Firebase agent skills có thể dùng trên Android, iOS, web và Flutter, đồng thời hỗ trợ Crashlytics cũng được mở rộng

Phiên 10 - What’s new in Google Play

  • Play Billing hỗ trợ hơn 300 phương thức thanh toán địa phương tại hơn 65 thị trường
  • Google Play có hơn 890 triệu người dùng sẵn sàng mua hàng
  • Các lựa chọn cung cấp đồng thời Google Play Billing và thanh toán thay thế được mở rộng, đồng thời mức phí dịch vụ thấp hơn cũng được báo trước
  • Khả năng khám phá ứng dụng được mở rộng sang ứng dụng Gemini, Android và web, cho phép người dùng tìm ứng dụng và game ngay trong Gemini
  • Thay vì danh sách liên kết tĩnh, Gemini đề xuất ứng dụng dựa trên tính năng thực tế của ứng dụng và thông tin store listing
  • Ở một số chủ đề, người dùng Gemini và Play có thể khám phá hơn 450.000 nội dung phim và TV
  • Trong Play Console, nếu tải lên các tệp có cấu trúc như Eclipsa Video hoặc Google Sheets, Gemini sẽ điền trước listing
  • Gemini sẽ hỗ trợ các tác vụ trong Play Console như bulk price changes, import skills và metadata configuration
  • Với in-app subscription management API, người dùng có thể dễ dàng đổi gói đăng ký ngay trong ứng dụng
  • Năm ngoái, Google Play Billing đã ngăn chặn 3,4 tỷ USD gian lận bị cố gắng thực hiện và 130 triệu USD abusive refunds

Phiên 11 - Defining the agentic AI era

  • Gemini, Search, ứng dụng Gemini và Google DeepMind đều tiếp cận AI tác tử theo cùng một định hướng
  • Gemini 3.5 Flash cũng có thể được dùng ngay trong Search
  • Search phải tìm được sự cân bằng giữa câu trả lời nhanh và các tác vụ mang tính tác tử dài hơn
  • Gemini Spark đóng vai trò một always-on agent xử lý các việc mà người dùng giao phó ở hậu trường
  • Mô hình phải vượt ra ngoài việc chỉ trả lời chat đơn thuần, để vận hành trên toàn bộ sản phẩm của Google và cả hệ sinh thái bên ngoài
  • Công cụ nội bộ được dịch từ Python sang Go:
    • Việc chuyển một chương trình sẵn có bài kiểm thử sang ngôn ngữ khác là một bài toán rõ ràng hơn đối với mô hình
    • Một số công cụ nội bộ đã nhanh hơn 10-20 lần chỉ sau một đêm
  • Hạ tầng phần mềm nội bộ của Google cũng có thể thay đổi nhanh hơn để phù hợp với thế giới agentic mới
  • Phần cứng, quy mô mô hình, việc áp dụng vào sản phẩm và vòng lặp phản hồi phải cùng ăn khớp để Gemini có thể đi vào toàn bộ sản phẩm của Google
  • Trọng tâm của câu hỏi đang chuyển từ “mô hình có thể làm gì” sang “triển khai mô hình vào sản phẩm và quy trình công việc như thế nào”

Phiên 12 - What’s new in Android development tools

  • Công cụ phát triển Android được thiết kế không chỉ cho lập trình viên con người mà còn tính đến cả AI agent được triển khai vào codebase
  • Android Studio Otter hỗ trợ tài khoản Gemini Enterprise và Google One
  • Android Studio có thể nhập và sử dụng cả mô hình cục bộ lẫn mô hình từ xa
  • Android Bench đóng vai trò tiêu chuẩn để đánh giá nên dùng mô hình nào cho các tác vụ phát triển Android
  • Có thể yêu cầu chuyển đổi UI ngay trong Compose Preview để agent làm việc với ngữ cảnh tốt hơn
  • Có thể dùng agent-based new project wizard để tạo ứng dụng Android thích ứng chỉ bằng prompt
  • Android Studio tích hợp khoảng 10 skill hỗ trợ các tác vụ như tích hợp adaptive API hay chuyển từ XML sang Compose
  • Android CLI mới hỗ trợ quy trình LLM, và trong việc tạo dự án mới giúp giảm hơn 70% lượng token sử dụng so với các công cụ Gradle LLM khác
  • Có thể kết hợp Antigravity CLI, Android CLI và Android skill để bắt đầu phát triển ứng dụng Android ngay trong Antigravity
  • Trên Android Studio Quail và thiết bị Android 17, kết nối thiết bị vẫn được duy trì ngay cả khi đổi mạng hoặc khởi động lại laptop

Phiên 13 - What’s new in Flutter

  • Flutter 3.44Dart 3.12 được phát hành cùng nhau
  • Dự án Flutter năm nay có sự tham gia của hơn 1.700 contributor
  • Mỗi tháng có hơn 1,5 triệu nhà phát triển build bằng Flutter
  • Trong Flutter 3.44, có thể thử chế độ rendering mới trên các thiết bị hỗ trợ Vulkan từ Android API 34 trở lên
  • Flutter được dùng trong infotainment system của Toyota 2026 RAV4
  • Cloud Functions for Firebase dựa trên Dart có trường hợp giảm cold start xuống tới 10ms nhờ biên dịch AOT
  • Firebase AI Logic được bổ sung server prompt template, nên không cần nhúng prompt trực tiếp vào ứng dụng
  • Firebase Agent Skills for Flutter cung cấp cho agent hướng dẫn xây dựng ứng dụng full-stack với Flutter và Firebase
  • Hỗ trợ LiteRT-LM sẽ sớm có trong gói flutter_gemma
  • Với Flutter desktop, Canonical tham gia với vai trò lead maintainer và strategic steward

Phiên 14 - What’s new in the Gemma open model family

  • Gemma 4 trở thành mô hình công khai mạnh nhất trong dòng Gemma
  • Có nhiều kích thước từ 2B đến 31B, có thể dùng trên di động, laptop và cloud
  • Gemma bắt đầu vào năm 2024 như một dòng mô hình trải từ 1B đến 27B
  • Gemma 4 là mô hình open weight và tương thích với hệ sinh thái mã nguồn mở
  • Nhờ MTP và speculative decoding, tốc độ decode có thể tăng tối đa 3 lần
  • Hệ sinh thái Android đã có day-zero implementation cho Gemma 4
  • Thông qua Android API, có thể chạy trực tiếp các mô hình Gemma nhỏ trên điện thoại, hoặc code ứng dụng Android bằng mô hình Gemma cục bộ trong môi trường khó truy cập Gemini API
  • Dùng ADK (agent development kit) trên Cloud Run cùng Gemma 31B để tạo agent hiểu cơ sở dữ liệu và tìm câu trả lời
  • Gemma 4 có thể chạy trên trình duyệt hoặc môi trường cục bộ thông qua giao diện tương thích OpenAI của Transformers.js, Ollama và LM Studio
  • Cloud doanh nghiệp, máy cục bộ, trình duyệt và di động đều trở thành môi trường chạy Gemma

Phiên 15 - What’s new in Web UI

  • Bản cập nhật Web UI năm 2026 đề cập các tính năng chính cùng trạng thái Baseline
  • Mọi tính năng đều có nhãn tương thích như Baseline Widely Available, Newly Available hoặc Limited Available
  • Với contrast-color API, việc chọn màu có độ tương phản phù hợp trong CSS trở nên dễ hơn
  • Tính năng meta name="text-scale" trong Chrome 146 phản hồi theo thiết lập cỡ chữ hệ thống
  • Hơn 30% người dùng trên cả Android và iOS thay đổi cỡ chữ mặc định
  • Từ Chrome 134, phần tử dialog tiếp nhận các tính năng như declarative light dismiss của popover
  • two-phase View Transitions có thể được thử nghiệm trong Chrome Canary
  • scroll-driven animations đã vào Chrome từ năm 2023 và được tăng khả năng tương thích liên trình duyệt thông qua Interop 2026
  • HTML-in-Canvas API cho phép đặt nội dung DOM thực vào bên trong Canvas
  • Trong Chrome 149, các cách sử dụng mới của gap decorations và shape outside được bổ sung

Phiên 16 - Adaptive development for the expanding Android ecosystem

  • Android không còn là một hệ sinh thái chỉ dành cho điện thoại, và hơn 580 triệu thiết bị màn hình lớn đang hoạt động được hưởng lợi từ các khoản đầu tư vào adaptive app
  • Người dùng foldable được phân loại là nhóm người dùng có giá trị cao hơn trong adaptive app
  • Trong Android 17, định hướng đang thay đổi theo hướng loại bỏ opt-out cho orientation và resizability đối với target SDK 37
  • Desktop emulator của Android Studio Quail Canary hỗ trợ kiểm thử ứng dụng Android theo dạng desktop
  • Với Continue On API của Android 17, người dùng có thể tiếp tục công việc đang làm trên một thiết bị sang thiết bị thứ hai
  • Google đang củng cố xu hướng xây dựng ứng dụng Android theo hướng Compose-first
  • Compose 1.11 cải thiện hỗ trợ trackpad lên mức mouse và pointer, đồng thời bổ sung API kiểm thử non-touch input
  • Compose được bổ sung API thử nghiệm cho state-based styling
  • Connected Displays được phát hành rộng rãi thông qua Android Feature Drop
  • Compose, Navigation 3 và thư viện Compose Adaptive hỗ trợ nhiều loại màn hình như foldable, desktop, car, TV và XR

Phiên 17 - Building the quantum-AI future with Hartmut Neven and James Manyika

  • Chủ đề trọng tâm là xu hướng điện toán lượng tử và AI đang tăng tốc lẫn nhau
  • Hartmut Neven đã khởi động nhóm Quantum AI của Google vào năm 2012
  • superpositionqubit là nền tảng của điện toán lượng tử
  • Số lượng bit string có thể có trên chip 105 qubit là 2 mũ 105
  • Cộng đồng hiện đã xác định được hơn 70 thuật toán và bài toán mà máy tính lượng tử có thể giải quyết một cách hữu ích
  • Trong tương lai, con số đó có thể tăng hơn 10 lần
  • quantum error correction là công nghệ cốt lõi cần thiết để duy trì trạng thái superposition
  • Google đã thành công trong việc giảm lỗi của máy thực bằng quantum error correction vào năm 2022
  • Quantum Echoes được liên hệ với cách học từ dữ liệu tạo ra bởi NMR hoặc MRI
  • Google đưa ra quan điểm rằng việc chuyển đổi sang post-quantum cryptography cần được thúc đẩy mạnh hơn đến năm 2029

Phiên 18 - Scale AI with Google’s TPU software stack

  • Nội dung xoay quanh stack phần mềm mã nguồn mở để huấn luyện, tinh chỉnh và suy luận mô hình trên TPU
  • Quy trình phát triển mô hình được chia thành pre-training, post-training và serving/inference
  • Có thể thử post-training và inference bằng TPU miễn phí trên Kaggle và Colab
  • Demo vLLM on TPU chạy mô hình Gemma 4 31B trên TPU và xem ảnh món ăn để tóm tắt thông tin dinh dưỡng
  • Gemma 4 là mô hình đa phương thức phù hợp cho các tác vụ nhận ảnh, hiểu nội dung và tóm tắt
  • Việc đưa MTP vào vLLM TPU inference mang lại cải thiện tốc độ khoảng 3 lần trong nhiều tác vụ
  • Tunix là framework nhẹ cho post-training
  • Thay vì mô hình lớn, họ tinh chỉnh mô hình 4B để thực hiện cùng tác vụ và chạy nó trên một chip Trillium đơn lẻ
  • MaxText, Tunix, vLLM, JAX, PyTorch và TPU được bố trí làm công cụ cho từng giai đoạn của vòng đời mô hình

Phiên 19 - Supercharge your AI coding workflow with Chrome DevTools for agents

  • Chrome DevTools for agents là công cụ cho phép coding agent quan sát trực tiếp runtime của trình duyệt thông qua DevTools
  • Cũng như lập trình viên học hỏi và debug bằng DevTools, coding agent cũng cần có cùng một vòng phản hồi khép kín
  • Agent có thể mở một phiên bản Chrome thực, điều hướng trang, điền form và thu thập console log cùng network request
  • Thông qua truy cập source map, có thể đi từ vấn đề ở runtime đến tệp mã nguồn liên quan
  • Công cụ được cung cấp dưới dạng NPM package, kèm theo MCP serverCLI
  • 6 skill được cung cấp:
    • troubleshooting, Chrome DevTools và Chrome DevTools CLI skill hỗ trợ cách dùng và khái niệm chung
    • accessibility debugging, memory leak debugging và optimized LCP skill đưa kiến thức chuyên môn vào agent
  • Nền tảng triển khai là Puppeteer, và agent sử dụng wrapper của công cụ thay vì dùng trực tiếp Puppeteer
  • Mặc định công cụ sử dụng một hồ sơ trình duyệt ẩn danh riêng biệt và không truy cập Chrome password manager
  • CyberAgent đã dùng DevTools for agents để kiểm toán 236 Storybook story của 32 component trong vòng 1 giờ

Phiên 20 - A new era of discovery: AI and the frontiers of science with Demis Hassabis

  • Demis Hassabis đặt mục tiêu ban đầu của DeepMind là “solve intelligence”
  • Chủ đề trọng tâm là xu hướng AI đang thay đổi khám phá khoa học, sản phẩm và công cụ nghiên cứu
  • AlphaFold một lần nữa được nhắc đến như ví dụ giải được bài toán nan giải suốt 50 năm về cấu trúc protein
  • Gemini for Science được kết nối với hướng mô hình khoa học đã công bố trong keynote
  • Demis Hassabis mô tả hiện tại là giai đoạn đang đứng ở “foothills of the singularity”, và cho rằng thời điểm giải được intelligence sẽ rơi vào khoảng quanh năm 2030, xê dịch 1 năm
  • Dòng mô hình Genie được Waymo dùng để kiểm thử những tình huống 1 in a billion rất khó gặp ngoài đời thực
  • Tiến triển trong drug discovery của Isomorphic Labs được dùng như ví dụ về việc AI đang tăng tốc khoa học
  • Ứng dụng Gemini có 900 triệu người dùng mỗi tháng, và AI Mode in Search cũng trở thành một bề mặt sản phẩm quan trọng
  • AI được dùng không chỉ cho tính năng sản phẩm mà còn như công cụ giải quyết các vấn đề khoa học và nghiên cứu

Phiên 21 - A fireside chat on the evolution of the developer craft

  • Công việc của lập trình viên trong kỷ nguyên AI đang dịch chuyển từ viết mã sang thiết kế hệ thống, tài liệu hóa và điều phối
  • Dù các công cụ và mô hình mới liên tục xuất hiện, không cần phải chạy theo mọi xu hướng ngay lập tức mà nên chủ động chọn công cụ để học
  • Việc đưa agent vào đội ngũ giống như bổ sung nhiều kỹ sư junior, nên tài liệu nội bộ và hồ sơ ghi lại quyết định thiết kế trở nên quan trọng hơn
  • Để tạo workflow agentic tốt, cần xác định trách nhiệm của từng agent, cách nhiều agent trao đổi với nhau và vị trí giám sát của con người
  • UX của nhiều công cụ lập trình đang trở nên giống nhau hơn, nên các mẫu đã học ở một công cụ có thể chuyển sang công cụ khác
  • Khi làm việc với agent, cần bớt kiểm soát từng bước đi và thay vào đó điều phối kết quả cùng ý đồ thiết kế
  • technical debt, cognitive debt và intent debt có thể được AI cải thiện nhanh hơn hoặc làm xấu đi nhanh hơn
  • Việc chạy đồng thời 20 agent có thể vượt quá năng lực nhận thức của con người, nên cần được quản lý có chủ đích
  • Thói quen prompt tốt đang chuyển từ các mảnh từ khóa tìm kiếm sang cách viết chứa mục tiêu đầy đủ và ngữ cảnh
  • Điều quan trọng hơn việc “có tự tay viết toàn bộ mã hay không” là “có chuẩn bị được ngữ cảnh và hệ thống kiểm chứng để agent làm việc hay không”

Phiên 22 - Build core skills to thrive as an AI-era developer

  • Ngay cả trong thời đại AI, năng lực kỹ thuật phần mềm nền tảng càng trở nên quan trọng hơn
  • AI có thể trở thành force multiplier, nhưng để đánh giá, tích hợp và duy trì đầu ra thì vẫn cần chuyên môn sâu
  • Agent càng làm việc tự chủ thì càng cần shift-left để làm rõ intent sớm hơn
  • System Design được mở rộng thành khái niệm bao gồm cả môi trường, con người, agent, công cụ và văn hóa
  • Thay vì dùng agent theo kiểu out-of-box, các nhóm cần tự tạo và duy trì agent role, profile, recipe, rule, skill
  • Specs, agent rules và skills trở thành source of truth truyền đạt what và why của hệ thống cho agent
  • Để tạo realistic eval, cần kết hợp năng lực về AI, kỹ thuật phần mềm, người dùng và kinh doanh
  • Cần tạo vòng lặp phản hồi bằng cách phân tích agent trace để cải thiện khả năng sử dụng công cụ, agent skill và thiết kế hệ thống
  • Kỹ sư con người chuyển từ vai trò conductor của từng agent riêng lẻ sang orchestrator của nhiều nhóm agent bất đồng bộ
  • Có thể đặt rõ ràng red team agent để nhìn hệ thống từ góc độ của tác nhân độc hại

Phiên 23 - Software engineering at the tipping point

  • Khi AI tăng tốc độ viết mã, toàn bộ hệ sinh thái phát triển sẽ chịu áp lực ở cấp độ software ecology
  • Google có cấu trúc trong đó toàn bộ mã, bao gồm Android và Chrome, nằm trong một monorepo dùng chung và được commit vào trunk
  • Từ lâu Google đã dùng các công cụ nội bộ cho phép một lập trình viên thay đổi hàng triệu dòng mã
  • Khả năng cao hệ sinh thái phát triển hiện tại sẽ không chịu nổi tốc độ nhanh gấp 10 lần
  • Nếu agent tạo ra nhiều lần biên dịch, kiểm thử, commit và sử dụng token hơn, chi phí hạ tầng và các điểm nghẽn sẽ tăng lên
  • Agent có thể tạo ra mã dễ viết, nhưng chưa chắc tạo ra mã dễ bảo trì đối với con người
  • Cần các agentic skill về component reusecomponent isolation để buộc tái sử dụng và cô lập thành phần
  • API và quyền truy cập dữ liệu phải được bảo vệ chặt chẽ như thể chúng thực chất đang mở công khai với agent
  • Câu “agents will find things you probably didn't want them to” cho thấy rõ rủi ro trong thiết kế quyền hạn
  • Trong hệ sinh thái phát triển của năm 2030, cách làm hiện nay có thể trông lỗi thời như thời kỳ CD-ROM năm 2001

Phiên 24 - Vibe once, run anywhere with Google Antigravity and Flutter

  • Dùng Antigravity cùng với Flutter có thể mở rộng một ý tưởng tạo ra một lần sang nhiều nền tảng
  • Từ thời điểm Gemini 3 ra mắt, năng lực mô hình đã tăng mạnh và Antigravity hỗ trợ năng lực đó ngay từ sớm
  • Antigravity lấy feedback loop với sự gắn kết chặt chẽ giữa lập kế hoạch, thực thi và kiểm chứng làm cốt lõi
  • Antigravity tạo task list và implementation plan, để lại screenshot và video trong quá trình thực thi, rồi sau khi hoàn tất sẽ viết báo cáo chứa phần triển khai và lý do
  • Ở giai đoạn kiểm chứng sẽ lần lượt chạy ứng dụng, chụp screenshot, nhấp nút trên Chrome và chạy test
  • Trong Flutter, kiểu tĩnh mạnh của Dart và analysis server cung cấp cho LLM các tín hiệu lỗi khách quan như function signature hay hình dạng class
  • Flutter là cross-platform UI toolkit cung cấp cùng một pixel và tính năng trên nhiều màn hình
  • Stateful hot reload của Flutter mang lại trải nghiệm phát triển có thể build lại ứng dụng khi đang chạy trong dưới 1 giây
  • Agent càng tạo ra nhiều mã, con người càng cần xác định mục tiêu thiết kế và hướng sản phẩm, đồng thời rà soát đầu ra của agent
  • Antigravity cung cấp vòng lặp thực thi cho agent, còn Flutter mang lại kết quả nhất quán trên nhiều nền tảng, từ đó tạo nên luồng “vibe once, run anywhere”

1 bình luận

 
hmmhmmhm 1 giờ trước

Flash quá đắt, giờ tôi sẽ sống mãi ở dịch vụ lưu trữ gemma của OpenRouter