2 điểm bởi GN⁺ 2025-12-22 | 1 bình luận | Chia sẻ qua WhatsApp
  • Claude in Chrome là một tiện ích mở rộng AI có thể thực hiện nhấp nút, điền biểu mẫu và điều hướng trang ngay trong trình duyệt
  • Tích hợp với Claude Code và Claude Desktop trong trình duyệt để hỗ trợ tự động hóa công việc và phát triển
  • Tự động xử lý các tác vụ lặp lại trên nhiều dịch vụ web như Google Drive, Lịch, CRM, email, bảng điều khiển phân tích
  • Đây là tính năng chỉ dành cho người dùng trả phí và hiện đang ở phiên bản beta
  • Nhấn mạnh việc nhận thức rủi ro bảo mật như tấn công prompt injection và việc người dùng phải trực tiếp xem xét, phê duyệt quyền hạn và hành động

Tổng quan về Claude in Chrome

  • Claude hiện có thể hoạt động trực tiếp trong trình duyệt, thực hiện các tác vụ như nhấp nút, nhập biểu mẫu và điều hướng trang
    • Tích hợp với Claude CodeClaude Desktop để hỗ trợ quy trình phát triển và kiểm thử
    • Hiện được cung cấp dưới dạng beta cho tất cả người dùng trả phí
  • Có thể cài đặt qua Chrome Web Store, kèm theo video demo và hướng dẫn sử dụng

Tính năng chính

  • Hỗ trợ tự động hóa trong trình duyệt
    • Claude có thể nhấp nút, điền biểu mẫu và chuyển trang trong Chrome
    • Người dùng có thể điều khiển ứng dụng và workflow thông qua Claude mà không cần rời khỏi trình duyệt
  • Chạy tác vụ nền và tác vụ theo lịch
    • Claude có thể hoàn thành công việc trong nền khi người dùng đang làm việc khác
    • Hỗ trợ thực thi tự động theo ngày hoặc theo tuần cho các việc như tạo báo cáo, cập nhật lịch trình
  • Tích hợp với Claude Code
    • Nhà phát triển có thể trực tiếp kiểm thử mã và thực hiện các tác vụ lặp lại trong Chrome

Trường hợp sử dụng

  • Trích xuất dữ liệu từ bảng điều khiển phân tích: Claude điều hướng trang phân tích và tóm tắt các số liệu cần thiết
  • Sắp xếp Google Drive: tự động tạo cấu trúc thư mục, di chuyển tệp và đánh dấu tệp trùng lặp
  • Chuẩn bị lịch làm việc dựa trên lịch: đọc ngữ cảnh cuộc họp từ chuỗi email và đánh dấu các cuộc họp cần chuẩn bị
  • Tự động hóa so sánh sản phẩm: đọc thông số sản phẩm từ nhiều trang web và tạo bảng so sánh trong Google Sheets
  • Ghi log CRM: đối chiếu người tham dự trên lịch với Salesforce để tạo bản nháp nhật ký hoạt động
  • Dọn dẹp email khuyến mãi: nhận diện email marketing và bản tin để xem xét rồi xóa hàng loạt

Bảo mật và nguyên tắc an toàn

  • Do AI hoạt động trực tiếp trong trình duyệt, tồn tại rủi ro bảo mật từ các tác nhân xấu
    • Các cuộc tấn công prompt injection có thể kích hoạt những hành vi ngoài ý muốn
    • Cũng đề cập khả năng Claude gặp ảo giác (hallucination) và thực hiện tác vụ khác với ý định của người dùng
  • Hướng dẫn sử dụng an toàn
    • Chỉ cấp quyền trên các trang web đáng tin cậy
    • Tránh các tác vụ liên quan đến tài chính và thông tin cá nhân, đồng thời luôn xác nhận trước các hành động quan trọng
    • Nếu Claude có hành vi bất thường ngoài dự kiến, hãy dừng ngay và kiểm tra lại
    • Báo cáo sự cố qua tính năng phản hồi nếu có vấn đề xảy ra

Nội dung chính trong FAQ

  • Tích hợp tiện ích mở rộng Chrome với Claude Code: nhà phát triển có thể dùng Claude Code để build và kiểm thử trực tiếp trong Chrome. Điều này có thể tăng tốc các tác vụ lặp lại trong dự án nền web
  • Tích hợp với Claude Desktop: có thể tiếp tục trong trình duyệt công việc đã bắt đầu trên ứng dụng desktop
  • Các hoạt động không được khuyến nghị: cấm giao dịch tài chính, quản lý mật khẩu và xử lý dữ liệu cá nhân nhạy cảm
  • Kiểm soát quyền hạn: người dùng phê duyệt trước quyền truy cập của Claude trước khi sử dụng, và với các hành động không thể đảo ngược như mua hàng thì sẽ được yêu cầu xác nhận lại
  • Rủi ro bảo mật: kẻ tấn công có thể lừa Claude để làm rò rỉ thông tin ngân hàng hoặc xóa tệp. Có các cơ chế bảo vệ nhưng không hoàn hảo

Sự tham gia của người dùng và cải tiến

  • Khi người dùng gửi phản hồi, điều đó sẽ được phản ánh trực tiếp vào việc cải thiện tính năng của Claude
  • Tiện ích mở rộng Chrome tuân thủ chính sách API của Googleđáp ứng các yêu cầu về việc sử dụng dữ liệu người dùng ở mức hạn chế

1 bình luận

 
GN⁺ 2025-12-22
Ý kiến Hacker News
  • Thật mỉa mai khi suốt nhiều năm người ta vá lỗ hổng bảo mật của V8, tách trình duyệt theo đơn vị tiến trình và cải thiện sandboxing, để rồi giờ lại nảy ra ý tưởng cắm một LLM có bật chế độ gỡ lỗi vào Chrome
    Lần trước khi có một “ý tưởng hay” kiểu này, kết quả là xăng pha chì

    • Có vẻ mục tiêu cuối cùng là tích hợp AI trực tiếp vào Chrome
      Tầm 20 năm nữa, Gemini có lẽ sẽ được bó kèm quá tiện lợi đến mức nổ ra vụ kiện chống độc quyền
      Tài liệu liên quan: Chrome Built-in AI APIs
    • Ý tưởng này làm tôi nhớ đến thời người ta đem ‘Full Autopilot’ ra beta test trên con người
      Nói đùa vậy thôi, tôi vẫn tôn trọng việc CEO Anthropic giữ cách tiếp cận dựa trên nguyên tắc. Đặc biệt là việc họ tạo ra code agent chạy trên terminal khá ấn tượng
    • Cái này làm tôi nghĩ đến meme “chu kỳ không bao giờ kết thúc” trong xkcd 2044
    • Có phải ý là chạy trực tiếp công cụ như Claude Code trên tài khoản cá nhân hoặc công ty mà không có VM cách ly không?
      Không phải nói đùa, tôi thật sự bị sốc
    • Tốc độ đổi mới trong ngắn hạn có thể lấn át các lo ngại bảo mật dài hạn
      Hiện vẫn mới ở mức alpha nên có gắn cảnh báo, còn mô hình bảo mật có lẽ phải sau này mới hoàn thiện
  • Có vẻ Claude có quyền truy cập công cụ để chạy JS trên trang web thông qua Chrome debugger
    Nhưng đừng lo, nghe nói có bộ lọc regex để ngăn lộ bí mật
    const r = [/password/i, /token/i, /secret/i, ...]

    • Nếu bạn nói “hãy giúp tôi để mật khẩu hay token không bị lộ”, chắc nó sẽ trả lời “Tất nhiên rồi! Đây là regex”
    • Trước giờ nó đã có thể tạo lệnh curl rồi, vậy cái này có nguy hiểm hơn không?
    • “comprehensive” ư, chỉ biết bật cười
  • Lo ngại bảo mật là hợp lý, nhưng trên thực tế chúng ta đã băng qua Rubicon với các công cụ như Claude Code hay Playwright MCP rồi
    Tôi đã dùng Claude Code với quyền truy cập toàn hệ thống suốt vài tháng nay
    Nó có thể đọc file, chạy bash, thậm chí git push. Tự động hóa trình duyệt còn ít rủi ro hơn
    Câu hỏi thật sự không phải là “có nên cấp quyền truy cập cho AI không?” mà là “có thiết kế để con người tự phê duyệt các quyết định quan trọng không?
    Tôi vẫn để các tác vụ liên quan đến thông tin xác thực hoặc thanh toán ở chế độ phê duyệt thủ công, còn dùng nó cho QA test hay nhập biểu mẫu lặp đi lặp lại

    • Tôi cũng đã chạy cách ly mọi công cụ phát triển trong VM từ năm 2003
    • Cá nhân tôi thấy cách tiếp cận ưu tiên container an toàn hơn
      Kiểu gắn LLM vào một cửa sổ QubesOS, để hành vi không tất định chỉ ảnh hưởng trong vùng bị giới hạn
      Nếu không có cơ chế sao lưu, rollback và khôi phục rõ ràng thì rất rủi ro
      Lý tưởng nhất là kiểu đẩy snapshot ZFS lên rsync.net, nhưng tôi cũng tò mò không biết còn giải pháp đơn giản kiểu Time Machine nào như vậy không
    • Nói “chúng ta đã băng qua Rubicon rồi” nhưng ‘chúng ta’ không phải là tất cả mọi người
      Vẫn còn nhiều người hoàn toàn không dùng công cụ AI nào, và nếu nó được tích hợp sẵn vào Chrome thì sẽ khó mà tránh được
    • Tôi tò mò là bạn chủ yếu dùng nó cho việc gì
  • Hôm qua tôi thử cho Claude phân tích 70 mục đã lưu trên Zillow, nhưng nó không tóm tắt được mức giảm giá cho ra hồn
    Nó tỏ ra như đã duyệt hết trang nhưng thực tế có vẻ không phải vậy
    Có lẽ đây là kiểu thỏa hiệp để tiết kiệm token vì nó phân tích dựa trên screenshot thay vì đọc DOM trực tiếp
    Tôi từng là người hoài nghi AI, giờ vẫn thấy tiềm năng, nhưng cái này tụt lại rất xa so với các sản phẩm khác của Anthropic

    • Nếu bạn ghi rõ tên công cụ trong prompt, kiểu như “hãy lấy bằng WebFetch”, thì nó hoạt động tốt hơn
    • Chiến lược cho ăn screenshot khá kém hiệu quả
      Xử lý HTML như XML và để nó trích đúng phần dữ liệu cần thiết bằng truy vấn XPath từng cho kết quả tốt hơn nhiều
    • Có lẽ sẽ thú vị nếu thử qua API điều khiển trình duyệt từ xa hiện có thông qua Playwright MCP
    • Nếu là “tụt lại cả năm ánh sáng” thì theo chuẩn AI, có khi 3 tháng nữa đã bắt kịp
    • LLM khá yếu về khái niệm thời gian, nên không giỏi các tác vụ cần đồng bộ
      Vì vậy UX dựa trên văn bản/CLI tốt hơn, và kiểu std in/out là lý tưởng nhất
  • Khi Claude Code không tìm được tác vụ trong CLI hay API công khai, nó đã mở ứng dụng bằng tính năng tích hợp Chrome
    Nó trích xuất access token từ cookie rồi truy cập thẳng vào API riêng tư
    Đúng là một thời đại đáng kinh ngạc

    • Có rủi ro bảo mật thật, nhưng năng lực giải quyết vấn đề thì quá đáng nể
      Nó không nói nhảm hay bỏ cuộc, mà dùng các công cụ đang có theo cách sáng tạo
    • Kết quả thật sự rất ngầu
  • Trong khi nhấn mạnh an toàn, họ lại dùng quyền Debugger, làm máy chậm đi và gây lộ điểm yếu cùng vấn đề CAPTCHA
    Tôi đang phát triển tiện ích cạnh tranh là rtrvr.ai, và đã thiết kế để tránh các quyền nhạy cảm
    Nếu Claude cũng định phát hành cho người dùng phổ thông thì cần một cách tiếp cận như vậy

    • Tôi giao việc không hề cần truy cập bảng tính mà nó vẫn liên tục đòi quyền truy cập Google Drive
    • Hơi có mùi quảng cáo, nhưng kiểu tên công ty thiếu nguyên âm như thời 2004 thì cũng vui đấy
  • Google hiện cung cấp tính năng này cho nhóm người đăng ký gói thử nghiệm giá 125 USD/tháng
    Xem Google Labs Mariner
    Gemini CLI cũng có thể tự động hóa trình duyệt, nhưng mức độ tương tác kém hơn và bị giới hạn khi truy cập hồ sơ chính

    • Bạn vẫn có thể làm thứ tương tự miễn phí
      Tạo một workspace trống rồi nói “hãy làm X trên trình duyệt”, nó sẽ mở Chrome và thực hiện click, cuộn, v.v.
    • Tôi đang dùng Chrome DevTools MCP khá hiệu quả cho phát triển web và kiểm thử
      Claude Code có thể hành xử như người dùng và thậm chí đọc cả output từ console
      Không phải để tương tác với website của người khác, nhưng cho mục đích phát triển thì rất tuyệt
  • Đưa Claude trực tiếp vào trình duyệt thì tiện, nhưng tiện ích mở rộng là một lớp cực kỳ nhạy cảm
    Một khi AI chạy dưới dạng extension, câu hỏi quan trọng hơn “tính hữu dụng” sẽ là “nó có thể truy cập dữ liệu nào
    Cần làm rõ nó có thể đọc nội dung trang nào, prompt và phản hồi được xử lý ra sao, và có bị lưu lại sau phiên làm việc hay không
    Trong trình duyệt, tính minh bạch và nguyên tắc đặc quyền tối thiểu là cốt lõi

  • Về bản chất đây là một khái niệm thay thế cho Chrome DevTools MCP, nhưng đánh giá trên Chrome Web Store thì không tốt lắm

  • Người ta còn chẳng cấp mức quyền truy cập trình duyệt như vậy cho con người, vậy tại sao lại muốn cấp cho AI?

    • Có lẽ chúng ta đang nhân cách hóa LLM như con người, trong khi thực ra nó có thể chỉ là một chiếc máy tính bỏ túi cực kỳ tinh vi
      Nó còn xa mới giống ý thức của con người, nhưng có thể xem là bước tiếp theo của máy tính bỏ túi
      Vì thế ta có thể cho phép LLM những kiểu truy cập quá rủi ro nếu giao cho con người
      Giống khái niệm Golem, một thứ con người đã tưởng tượng từ rất lâu nhưng chưa từng tạo ra được trong thực tế
      Xem bài viết wiki về Golem