2 điểm bởi GN⁺ 2025-04-08 | 1 bình luận | Chia sẻ qua WhatsApp
  • Công cụ cho phép kết nối ứng dụng AI với trình duyệt thông qua MCP để tự động hóa công việc trên website
    • Ví dụ, có thể tự động hóa việc điền biểu mẫu lặp đi lặp lại trên website
  • Tự động hóa quy trình làm việc: tăng tốc độ xử lý và tự động hóa tác vụ để nâng cao hiệu quả
  • Kiểm thử tự động: sử dụng trình biên tập AI để tự động thực hiện kiểm thử end-to-end cho mã. Kiểm tra luồng người dùng, xác minh các thành phần UI và đảm bảo ứng dụng hoạt động đúng như mong đợi trong nhiều kịch bản khác nhau
  • Tự động hóa tác vụ: dễ dàng tự động hóa các công việc lặp lại trên nền web như thu thập dữ liệu, điền biểu mẫu, tự động hóa quy trình làm việc, từ đó tiết kiệm thời gian và giảm lỗi

Ưu điểm của Browser MCP

  • Tốc độ: tự động hóa được thực hiện cục bộ nên hiệu năng được cải thiện mà không có độ trễ mạng.
  • Quyền riêng tư: do tự động hóa diễn ra cục bộ, hoạt động trình duyệt được giữ lại trên thiết bị và không bị gửi đến máy chủ từ xa.
  • Duy trì đăng nhập: sử dụng hồ sơ trình duyệt hiện có để duy trì trạng thái đăng nhập trên mọi dịch vụ.
  • Kín đáo: sử dụng dấu vân tay trình duyệt thực để tránh phát hiện bot và CAPTCHA.

Cách sử dụng

  1. Cài đặt tiện ích mở rộng Browser MCP: thêm tiện ích mở rộng Browser MCP vào trình duyệt.
  2. Thiết lập máy chủ MCP: thêm máy chủ Browser MCP vào ứng dụng AI để kết nối với tiện ích mở rộng trình duyệt.
  3. Bắt đầu tự động hóa: tạo quy trình làm việc tự động và để trợ lý AI xử lý các tác vụ lặp lại trong trình duyệt.

Công cụ chức năng tự động hóa trình duyệt

  • Điều hướng: truy cập URL
  • Quay lại: chuyển đến trang trước
  • Tiến tới: chuyển đến trang tiếp theo
  • Chờ: chờ trong khoảng thời gian được chỉ định (giây)
  • Nhấn phím: nhấn phím trên bàn phím
  • Ảnh chụp nhanh: chụp snapshot khả năng truy cập của trang hiện tại
  • Nhấp: thực hiện thao tác nhấp trên trang web
  • Kéo và thả: thực hiện kéo và thả giữa hai phần tử
  • Di chuột: rê chuột lên một phần tử trên trang
  • Nhập văn bản: nhập văn bản vào phần tử có thể chỉnh sửa
  • Chọn tùy chọn: chọn một tùy chọn từ menu thả xuống
  • Lấy log console: lấy log console của trình duyệt

Ứng dụng AI MCP tương thích

  • Cursor
  • Claude
  • Windsurf
  • VSCode

1 bình luận

 
GN⁺ 2025-04-08
Ý kiến Hacker News
  • Trang web tuyên bố rằng họ "sử dụng dấu vân tay trình duyệt thực để tránh phát hiện bot và CAPTCHA"

    • Tôi đã thử các hệ thống tương tự, nhưng khi AI điều khiển trình duyệt thì CAPTCHA xuất hiện và tôi bị chặn trên nhiều trang web
    • Khi tôi ngừng dùng phiên trình duyệt, lệnh chặn được gỡ bỏ, nhưng cách này không phải là lời giải vạn năng
  • Hệ thống này trông giống như một bản sao lỗi thời của Playwright-MCP của Microsoft

  • Sẽ rất hữu ích nếu có một trình duyệt có thể lọc sản phẩm trên các trang web mua sắm theo các điều kiện cụ thể

  • Tôi không biết MCP là gì, và giờ thì thậm chí còn ngại hỏi

  • Việc tìm kiếm thông tin trên web và chèn kết quả vào Google Sheets lúc đầu hoạt động gần như hoàn hảo, nhưng ở các lần thử sau thì thất bại

    • Tôi tự hỏi có phải có vấn đề về độ trễ giữa trình duyệt và ứng dụng MCP hay không
    • Ở lần thử đầu tiên, tôi đã nhanh chóng bấm quyền "cho phép cuộc trò chuyện này", nhưng ở các lần thử sau thì LLM báo lỗi khi nhấp
    • Việc nhấp vào tiêu đề của Google Spreadsheet để nhập tên đã thành công ở lần đầu, nhưng thất bại ở các lần sau
    • Việc xác định các ô A1, B1, v.v. và chèn vào hàng cũng thành công ở lần đầu, nhưng thất bại ở các lần sau
    • Lần thử đầu tiên gần như hoàn hảo, nhưng các lần sau thì không thể tái hiện 100%
    • Trải nghiệm mượt mà và phần thiết lập cũng như chạy thử rất tốt
  • Khi thử trên Claude Desktop thì nó hoạt động mượt mà và đỡ rườm rà hơn Playwright

    • Sẽ tốt hơn nếu có tính năng phát hiện CAPTCHA trên trang, tạm dừng tự động hóa và thông báo cho người dùng
    • Playwright cứ tiếp tục thử với CAPTCHA
  • Sẽ tốt nếu có thể điều hướng trang bằng cây trợ năng của công cụ dành cho nhà phát triển Chrome

  • Điều này khiến tôi thấy háo hức với các công việc thủ công, đặc biệt là những việc như yêu cầu hoàn tiền

    • Mỗi tháng phải đăng nhập vào nhà cung cấp dịch vụ, tải xuống sao kê, soạn tài liệu Google, viết email và tải tệp lên thật phiền phức
    • Tự động hóa vốn đã khả thi, và các ứng dụng theo dõi chi phí thực tế có thể giảm một nửa khối lượng công việc này
    • Các công cụ AI có tiềm năng loại bỏ nhu cầu về các đặc tả quá chi tiết
    • Những quy trình làm việc như vậy thường bị ảnh hưởng bởi những thay đổi nhỏ
  • Tôi tự hỏi liệu MCP có phải là RPA (tự động hóa quy trình bằng robot) mới hay không

  • Tôi đang làm một công việc tương tự là điều khiển phần cứng synth để thiết kế âm thanh mà không cần chạm vào các núm vật lý