3 điểm bởi GN⁺ 2026-03-16 | 1 bình luận | Chia sẻ qua WhatsApp
  • Máy chủ Chrome DevTools MCP đã được cải tiến để cho phép agent lập trình kết nối trực tiếp với phiên trình duyệt đang hoạt động
  • Nhờ tính năng này, agent có thể tái sử dụng phiên đã đăng nhập hoặc truy cập phiên gỡ lỗi đang hoạt động của DevTools
  • Trên Chrome M144 (beta), khi dùng tùy chọn --autoConnect, máy chủ MCP sẽ tự động kết nối với phiên bản Chrome đang chạy
  • Mỗi lần kết nối sẽ hiện hộp thoại phê duyệt của người dùng, và trong khi gỡ lỗi sẽ hiển thị banner “đang bị phần mềm kiểm thử tự động điều khiển”
  • Có thể chuyển đổi linh hoạt giữa gỡ lỗi thủ công và gỡ lỗi có AI hỗ trợ, giúp nâng cao hiệu suất phát triển

Tổng quan về các cải tiến của máy chủ Chrome DevTools MCP

  • Chrome DevTools MCP server đã được cập nhật để agent lập trình có thể kết nối trực tiếp với phiên trình duyệt đang hoạt động
    • Người dùng có thể tái sử dụng phiên đã đăng nhập, nhờ đó có thể gỡ lỗi mà không cần đăng nhập lại
    • Có thể yêu cầu agent điều tra mục đã chọn trong bảng điều khiển Network hoặc bảng điều khiển Elements của DevTools UI
  • Phương thức kết nối hiện có vẫn được giữ nguyên, bao gồm dùng hồ sơ dành riêng cho MCP server, kết nối qua cổng remote debug, và chạy nhiều instance dựa trên hồ sơ tạm thời

Cách hoạt động (How it works)

  • Chrome M144 (hiện đang ở bản beta) được bổ sung tính năng yêu cầu kết nối remote debugging
    • Khi MCP server được chạy với tùy chọn --autoConnect, nó sẽ tự động kết nối tới instance Chrome đang hoạt động để yêu cầu một phiên remote debugging
  • Để tăng cường bảo mật, Chrome sẽ hiển thị hộp thoại phê duyệt của người dùng cho mỗi yêu cầu, và chỉ cho phép kết nối sau khi được chấp thuận
  • Khi phiên gỡ lỗi được kích hoạt, phía trên trình duyệt sẽ hiển thị banner “Chrome is being controlled by automated test software”

Bắt đầu (Get started)

  • Để dùng tính năng remote debugging mới, cần bật remote debugging trong Chrome và cấu hình MCP server

Bước 1: Thiết lập remote debugging trong Chrome

  • Truy cập chrome://inspect/#remote-debugging để bật remote debugging
  • Qua hộp thoại, chọn có cho phép kết nối gỡ lỗi hay không

Bước 2: Thiết lập tự động kết nối cho MCP server

  • Khi chạy server chrome-devtools-mcp, thêm tham số --autoConnect
  • Cấu hình ví dụ (gemini-cli):
    {
       "mcpServers": {
        "chrome-devtools": {
          "command": "npx",
          "args": [
            "chrome-devtools-mcp@latest",
            "--autoConnect",
            "--channel=beta"
          ]
        }
      }
    }
    
    • Cần chỉ định --channel=beta cho đến khi Chrome M144 đạt tới kênh stable

Bước 3: Kiểm tra cấu hình

  • Trong gemini-cli, chạy lệnh sau:
    Check the performance of https://developers.chrome.com
    
  • Chrome sẽ hiển thị hộp thoại hỏi người dùng có cho phép phiên remote debugging hay không
  • Khi nhấp Allow, MCP server sẽ mở trang web và thực hiện theo dõi hiệu năng

Gỡ lỗi tích hợp với agent lập trình

  • Thông qua kết nối với instance Chrome đang hoạt động, có thể kết hợp tự động hóa và điều khiển thủ công
    • Sau khi người dùng tìm ra phần tử có vấn đề trong DevTools, có thể chuyển phần tử đó cho agent lập trình và yêu cầu sửa
    • Tương tự trong bảng điều khiển Network, cũng có thể chọn yêu cầu rồi chỉ thị agent phân tích
  • Thông qua Chrome DevTools MCP server, dự kiến sẽ từng bước mở rộng khả năng truy cập dữ liệu từ các bảng điều khiển bổ sung

1 bình luận

 
GN⁺ 2026-03-16
Ý kiến trên Hacker News
  • Tôi dùng Playwright để chặn mọi request và response, rồi ghi lại lưu lượng liên quan trong lúc Claude Code duyệt các website như YouTube, thực hiện click và nhập liệu
    Dựa trên dữ liệu thu thập được như vậy, tôi tự động tạo ra API strongly typed để có thể tương tác với bất kỳ website nào thông qua API nội bộ
    Tất nhiên có thể là vi phạm điều khoản dịch vụ, nhưng ưu điểm là không cần tải toàn bộ quảng cáo, hình ảnh hay markup
    Nếu có ai quan tâm thì tôi dự định sẽ công khai trong tuần này

    • Thú vị là HN lại thích ý tưởng này
      Thực ra đây là cách mà các hãng làm LLM như Anthropic hay OpenAI đã làm từ lâu
      Thật mỉa mai khi lúc họ vượt quảng cáo hay tải tác phẩm có bản quyền thì được gọi là ‘món quà của Chúa’, còn nếu Zuck làm điều tương tự thì lại là ‘lời nguyền của quỷ dữ’
    • Tôi cũng đang dùng theo cách tương tự
      Chủ yếu để tái tạo layout và style của trang ở những điểm cụ thể trong cây DOM, hoặc tự động ghi lại hành vi responsive
      Tôi dùng Playwright để điều chỉnh độ rộng màn hình, theo dõi thay đổi style, rồi lưu cả ảnh chụp màn hình và dữ liệu phân cấp style cùng nhau
      Có công cụ kiểm tra thủ công, nhưng quá chậm và kém hiệu quả
      Cá nhân tôi thấy tự làm CLI tùy chỉnh còn hiệu quả hơn nhiều so với MCP
      Điều thực sự mạnh là để AI truy cập trực tiếp và tận dụng nó qua các skill
    • Tôi không hiểu vì sao nhất thiết phải dùng Playwright
      Có vẻ như chỉ cần cho Claude có agent-browser là nó có thể tạo ra mã có tính quyết định ngay lập tức
    • Mong là bạn sẽ công khai nó. Không biết cái này có được làm thành agent skill không
    • Tôi cũng tò mò liệu cách này có thể tải trực tiếp video YouTube mà không cần cập nhật liên tục như yt-dlp hay không
  • Dự án DevTools MCP gần đây đã ra mắt một CLI độc lập
    Xem tài liệu chrome-devtools-cli thì nó đã được đưa vào từ phiên bản v0.20.0
    Đây là tin vui cho những người để ý đến bài toán chi phí token của MCP
    (Tham khảo thêm thì tôi từng làm trong team DevTools và hiện giờ vẫn đang làm)

    • Giờ đây nhờ Tool Search, MCP không còn tốn chi phí trong CC nữa
  • Tôi đã dùng TideWave trong vài tháng gần đây
    tidewave.ai ban đầu dựa trên Elixir/LiveView nhưng giờ đã hỗ trợ cả framework JS và RoR
    Công cụ này không chỉ truy cập được trình duyệt mà còn cả runtime của ứng dụng
    Nghĩa là agent có thể truy cập trực tiếp vào database và endpoint, nên rất mạnh

  • Google đang tụt lại rất xa trong mảng coding CLI kiểu agentic
    Gemini CLI tệ đến mức rõ ràng là ngay cả nội bộ họ cũng không dùng
    Tôi nghĩ MCP đã là công nghệ chết. Công cụ CLI nhanh hơn, linh hoạt hơn, và cũng đã có nhiều môi trường được huấn luyện sẵn
    Với các dev nghiêm túc thì dùng Playwright và headless Chromium mới là bài bản
    MCP chỉ hấp dẫn với người mới thôi

    • Tôi làm trong môi trường enterprise quy mô lớn, nơi các yếu tố như xác thực, RBAC, giới hạn tốc độ và vận hành khiến MCP vẫn còn hữu ích
      Chỉ dùng CLI thì độ phức tạp về bảo mật và vận hành quá cao
      Tuy vậy tôi đồng ý rằng Gemini CLI rất tệ
    • Tôi đồng ý với nhận định MCP đã chết
      Anthropic đã cố cải thiện nhưng vấn đề context phình to vẫn còn nguyên
      MCP server vẫn chiếm context ngay cả khi không dùng đến
      Giờ nên chuyển sang agent skill
    • Nhân tiện thì Gemini CLI thực tế được dùng khá nhiều trong nội bộ Google
      Họ dùng dịch vụ MCP cho tìm kiếm mã, truy cập tài liệu, tra bug, kết nối cơ sở dữ liệu RAG, v.v.
      (Đây là điều tôi nghe trực tiếp từ người bên trong Google)
    • Nếu MCP chết thật, vậy phải dùng CLI nào để mở Chrome, bấm nút và đọc output từ console?
      Nếu MCP chiếm context, tôi cũng thắc mắc liệu skill kiểu CLI có miễn phí hay không
  • Đã có một agent skill triển khai sẵn tính năng này
    Tôi dùng chrome-cdp-skill hằng ngày và nó thực sự rất hay
    Ví dụ, tôi có thể dùng codex để quản lý thư viện nhạc local, mở tab YT Music, tìm album rồi chuyển URL cho yt-dlp
    Tuy nhiên hiện tại nó chỉ dành cho Chrome, nên nếu dùng trình duyệt khác thì phải chỉnh lại đường dẫn binary

    • Demo thì rất hay, nhưng tôi thấy đáng sợ ở chỗ chỉ cần một lần prompt injection là có thể truy cập toàn bộ dữ liệu
    • Đây không phải skill cho DevTools MCP mà là một dự án độc lập
      Mảng browser automation + agent vốn đã cạnh tranh rất khốc liệt
      DevTools MCP và CLI mới do đội Chrome DevTools & Puppeteer duy trì nên có vẻ sẽ ổn định hơn
      Dù vậy, tôi vẫn thích việc cạnh tranh mã nguồn mở tạo ra đổi mới
    • Tôi không rõ có ai thực sự dùng mấy skill chắp vá kiểu này không
      Tôi nghĩ thà dùng công cụ ổn định như playwriter.dev còn hơn
  • Tôi đã tạo một proxy WebSocket + extension Chrome để cho phép agent điều khiển DOM
    Tôi cấu hình cho nó truy cập qua browserbox trong khi vẫn cho phép session cookie
    Hiện tôi đang dùng nó như middleware phục vụ nghiên cứu nhằm tăng tỷ lệ thành công khi agent dùng công cụ

  • Tôi đã dùng MCP này khá lâu rồi, và thấy nó ổn định nhất khi dùng cùng codex on opencode
    Đặc biệt khi dùng như một REPL chỉnh sửa SVG, nó khiến tôi bất ngờ vì tự động tạo ra các icon tùy chỉnh rất đẹp
    Nó cũng hợp với việc reverse engineering hoặc mở rộng trong ứng dụng Electron

  • Tôi đã thử playwriter, và cách nó kết nối vào session hiện có hoạt động tốt đến mức đáng ngạc nhiên

  • Tôi cũng từng làm thứ tương tự với Playwright
    Trước đây nó tốn token rất nhiều nên chi phí khá cao, nhưng tôi giải quyết bằng cách lưu kết quả xuống đĩa rồi tạo một wrapper để agent truy vấn
    Có thể xem tại uisnap.dev
    Tôi tò mò không biết dự án lần này đã giải quyết được vấn đề tiêu tốn token hay chưa

    • Có vẻ là phần lớn đã được giải quyết. Tham khảo playwright-cli
    • Tôi đang dùng một wrapper MCP server tự tạo để tóm tắt snapshot của trang bằng Claude Haiku
      Có thể xem tại playwright-slim-mcp
  • Tôi đã thử firefox-devtools-mcp, và thấy nó nhanh và hiệu quả hơn MCP mặc định của Chrome rất nhiều