- Máy chủ Chrome DevTools MCP đã được cải tiến để cho phép agent lập trình kết nối trực tiếp với phiên trình duyệt đang hoạt động
- Nhờ tính năng này, agent có thể tái sử dụng phiên đã đăng nhập hoặc truy cập phiên gỡ lỗi đang hoạt động của DevTools
- Trên Chrome M144 (beta), khi dùng tùy chọn
--autoConnect, máy chủ MCP sẽ tự động kết nối với phiên bản Chrome đang chạy
- Mỗi lần kết nối sẽ hiện hộp thoại phê duyệt của người dùng, và trong khi gỡ lỗi sẽ hiển thị banner “đang bị phần mềm kiểm thử tự động điều khiển”
- Có thể chuyển đổi linh hoạt giữa gỡ lỗi thủ công và gỡ lỗi có AI hỗ trợ, giúp nâng cao hiệu suất phát triển
Tổng quan về các cải tiến của máy chủ Chrome DevTools MCP
- Chrome DevTools MCP server đã được cập nhật để agent lập trình có thể kết nối trực tiếp với phiên trình duyệt đang hoạt động
- Người dùng có thể tái sử dụng phiên đã đăng nhập, nhờ đó có thể gỡ lỗi mà không cần đăng nhập lại
- Có thể yêu cầu agent điều tra mục đã chọn trong bảng điều khiển Network hoặc bảng điều khiển Elements của DevTools UI
- Phương thức kết nối hiện có vẫn được giữ nguyên, bao gồm dùng hồ sơ dành riêng cho MCP server, kết nối qua cổng remote debug, và chạy nhiều instance dựa trên hồ sơ tạm thời
Cách hoạt động (How it works)
- Chrome M144 (hiện đang ở bản beta) được bổ sung tính năng yêu cầu kết nối remote debugging
- Khi MCP server được chạy với tùy chọn
--autoConnect, nó sẽ tự động kết nối tới instance Chrome đang hoạt động để yêu cầu một phiên remote debugging
- Để tăng cường bảo mật, Chrome sẽ hiển thị hộp thoại phê duyệt của người dùng cho mỗi yêu cầu, và chỉ cho phép kết nối sau khi được chấp thuận
- Khi phiên gỡ lỗi được kích hoạt, phía trên trình duyệt sẽ hiển thị banner “Chrome is being controlled by automated test software”
Bắt đầu (Get started)
- Để dùng tính năng remote debugging mới, cần bật remote debugging trong Chrome và cấu hình MCP server
Bước 1: Thiết lập remote debugging trong Chrome
- Truy cập
chrome://inspect/#remote-debugging để bật remote debugging
- Qua hộp thoại, chọn có cho phép kết nối gỡ lỗi hay không
Bước 2: Thiết lập tự động kết nối cho MCP server
- Khi chạy server
chrome-devtools-mcp, thêm tham số --autoConnect
- Cấu hình ví dụ (gemini-cli):
{
"mcpServers": {
"chrome-devtools": {
"command": "npx",
"args": [
"chrome-devtools-mcp@latest",
"--autoConnect",
"--channel=beta"
]
}
}
}
- Cần chỉ định
--channel=beta cho đến khi Chrome M144 đạt tới kênh stable
Bước 3: Kiểm tra cấu hình
Gỡ lỗi tích hợp với agent lập trình
- Thông qua kết nối với instance Chrome đang hoạt động, có thể kết hợp tự động hóa và điều khiển thủ công
- Sau khi người dùng tìm ra phần tử có vấn đề trong DevTools, có thể chuyển phần tử đó cho agent lập trình và yêu cầu sửa
- Tương tự trong bảng điều khiển Network, cũng có thể chọn yêu cầu rồi chỉ thị agent phân tích
- Thông qua Chrome DevTools MCP server, dự kiến sẽ từng bước mở rộng khả năng truy cập dữ liệu từ các bảng điều khiển bổ sung
1 bình luận
Ý kiến trên Hacker News
Tôi dùng Playwright để chặn mọi request và response, rồi ghi lại lưu lượng liên quan trong lúc Claude Code duyệt các website như YouTube, thực hiện click và nhập liệu
Dựa trên dữ liệu thu thập được như vậy, tôi tự động tạo ra API strongly typed để có thể tương tác với bất kỳ website nào thông qua API nội bộ
Tất nhiên có thể là vi phạm điều khoản dịch vụ, nhưng ưu điểm là không cần tải toàn bộ quảng cáo, hình ảnh hay markup
Nếu có ai quan tâm thì tôi dự định sẽ công khai trong tuần này
Thực ra đây là cách mà các hãng làm LLM như Anthropic hay OpenAI đã làm từ lâu
Thật mỉa mai khi lúc họ vượt quảng cáo hay tải tác phẩm có bản quyền thì được gọi là ‘món quà của Chúa’, còn nếu Zuck làm điều tương tự thì lại là ‘lời nguyền của quỷ dữ’
Chủ yếu để tái tạo layout và style của trang ở những điểm cụ thể trong cây DOM, hoặc tự động ghi lại hành vi responsive
Tôi dùng Playwright để điều chỉnh độ rộng màn hình, theo dõi thay đổi style, rồi lưu cả ảnh chụp màn hình và dữ liệu phân cấp style cùng nhau
Có công cụ kiểm tra thủ công, nhưng quá chậm và kém hiệu quả
Cá nhân tôi thấy tự làm CLI tùy chỉnh còn hiệu quả hơn nhiều so với MCP
Điều thực sự mạnh là để AI truy cập trực tiếp và tận dụng nó qua các skill
Có vẻ như chỉ cần cho Claude có agent-browser là nó có thể tạo ra mã có tính quyết định ngay lập tức
Dự án DevTools MCP gần đây đã ra mắt một CLI độc lập
Xem tài liệu chrome-devtools-cli thì nó đã được đưa vào từ phiên bản v0.20.0
Đây là tin vui cho những người để ý đến bài toán chi phí token của MCP
(Tham khảo thêm thì tôi từng làm trong team DevTools và hiện giờ vẫn đang làm)
Tôi đã dùng TideWave trong vài tháng gần đây
tidewave.ai ban đầu dựa trên Elixir/LiveView nhưng giờ đã hỗ trợ cả framework JS và RoR
Công cụ này không chỉ truy cập được trình duyệt mà còn cả runtime của ứng dụng
Nghĩa là agent có thể truy cập trực tiếp vào database và endpoint, nên rất mạnh
Google đang tụt lại rất xa trong mảng coding CLI kiểu agentic
Gemini CLI tệ đến mức rõ ràng là ngay cả nội bộ họ cũng không dùng
Tôi nghĩ MCP đã là công nghệ chết. Công cụ CLI nhanh hơn, linh hoạt hơn, và cũng đã có nhiều môi trường được huấn luyện sẵn
Với các dev nghiêm túc thì dùng Playwright và headless Chromium mới là bài bản
MCP chỉ hấp dẫn với người mới thôi
Chỉ dùng CLI thì độ phức tạp về bảo mật và vận hành quá cao
Tuy vậy tôi đồng ý rằng Gemini CLI rất tệ
Anthropic đã cố cải thiện nhưng vấn đề context phình to vẫn còn nguyên
MCP server vẫn chiếm context ngay cả khi không dùng đến
Giờ nên chuyển sang agent skill
Họ dùng dịch vụ MCP cho tìm kiếm mã, truy cập tài liệu, tra bug, kết nối cơ sở dữ liệu RAG, v.v.
(Đây là điều tôi nghe trực tiếp từ người bên trong Google)
Nếu MCP chiếm context, tôi cũng thắc mắc liệu skill kiểu CLI có miễn phí hay không
Đã có một agent skill triển khai sẵn tính năng này
Tôi dùng chrome-cdp-skill hằng ngày và nó thực sự rất hay
Ví dụ, tôi có thể dùng codex để quản lý thư viện nhạc local, mở tab YT Music, tìm album rồi chuyển URL cho yt-dlp
Tuy nhiên hiện tại nó chỉ dành cho Chrome, nên nếu dùng trình duyệt khác thì phải chỉnh lại đường dẫn binary
Mảng browser automation + agent vốn đã cạnh tranh rất khốc liệt
DevTools MCP và CLI mới do đội Chrome DevTools & Puppeteer duy trì nên có vẻ sẽ ổn định hơn
Dù vậy, tôi vẫn thích việc cạnh tranh mã nguồn mở tạo ra đổi mới
Tôi nghĩ thà dùng công cụ ổn định như playwriter.dev còn hơn
Tôi đã tạo một proxy WebSocket + extension Chrome để cho phép agent điều khiển DOM
Tôi cấu hình cho nó truy cập qua browserbox trong khi vẫn cho phép session cookie
Hiện tôi đang dùng nó như middleware phục vụ nghiên cứu nhằm tăng tỷ lệ thành công khi agent dùng công cụ
Tôi đã dùng MCP này khá lâu rồi, và thấy nó ổn định nhất khi dùng cùng codex on opencode
Đặc biệt khi dùng như một REPL chỉnh sửa SVG, nó khiến tôi bất ngờ vì tự động tạo ra các icon tùy chỉnh rất đẹp
Nó cũng hợp với việc reverse engineering hoặc mở rộng trong ứng dụng Electron
Tôi đã thử playwriter, và cách nó kết nối vào session hiện có hoạt động tốt đến mức đáng ngạc nhiên
Tôi cũng từng làm thứ tương tự với Playwright
Trước đây nó tốn token rất nhiều nên chi phí khá cao, nhưng tôi giải quyết bằng cách lưu kết quả xuống đĩa rồi tạo một wrapper để agent truy vấn
Có thể xem tại uisnap.dev
Tôi tò mò không biết dự án lần này đã giải quyết được vấn đề tiêu tốn token hay chưa
Có thể xem tại playwright-slim-mcp
Tôi đã thử firefox-devtools-mcp, và thấy nó nhanh và hiệu quả hơn MCP mặc định của Chrome rất nhiều