Project Mariner của Google DeepMind - Công cụ tự động hóa trình duyệt

xguru · 2024-12-18T11:07:01+09:00

Một cách mới để sử dụng trình duyệt Tự động hóa các tác vụ trên trình duyệt bằng khả năng suy luận và hiểu đa phương thức mạnh mẽ dựa trên Gemini 2.0 Hiểu và suy luận mọi thành phần trên màn hình trình duyệt như pixel, văn bản, mã, hình ảnh, biểu mẫu... Native Multimodality : Hiểu và suy luận mọi nội dung trên trình duyệt Phân tích các yếu tố phức hợp như văn bản, mã, hình ảnh trên website Phản hồi lệnh thoại và cung cấp phản hồi trực quan về tiến độ công việc Browser Interaction : Hiểu và điều hướng các website phức tạp theo thời gian thực Tương tác với website thay cho người dùng Tự động hóa các tác vụ lặp lại để tiết kiệm thời gian Yêu cầu giải thích rõ ràng nếu không hiểu lệnh Reasoning : Hiểu các chỉ dẫn phức tạp và chia chúng thành các bước có thể thực thi để thực hiện Nắm bắt mối quan hệ và chức năng giữa các thành phần web Hiển thị minh bạch quá trình lập kế hoạch và thực thi công việc để người dùng có thể hiểu quy trình ra quyết định Hiện chỉ khả dụng với một nhóm thử nghiệm đáng tin cậy quy mô nhỏ : nếu muốn tham gia thử nghiệm, cần đăng ký vào danh sách chờ

(deepmind.google)

8 điểm bởi xguru 2024-12-18 | 1 bình luận | Chia sẻ qua WhatsApp

Một cách mới để sử dụng trình duyệt
Tự động hóa các tác vụ trên trình duyệt bằng khả năng suy luận và hiểu đa phương thức mạnh mẽ dựa trên Gemini 2.0
Hiểu và suy luận mọi thành phần trên màn hình trình duyệt như pixel, văn bản, mã, hình ảnh, biểu mẫu...
Native Multimodality : Hiểu và suy luận mọi nội dung trên trình duyệt
- Phân tích các yếu tố phức hợp như văn bản, mã, hình ảnh trên website
- Phản hồi lệnh thoại và cung cấp phản hồi trực quan về tiến độ công việc
Browser Interaction : Hiểu và điều hướng các website phức tạp theo thời gian thực
- Tương tác với website thay cho người dùng
- Tự động hóa các tác vụ lặp lại để tiết kiệm thời gian
- Yêu cầu giải thích rõ ràng nếu không hiểu lệnh
Reasoning : Hiểu các chỉ dẫn phức tạp và chia chúng thành các bước có thể thực thi để thực hiện
- Nắm bắt mối quan hệ và chức năng giữa các thành phần web
- Hiển thị minh bạch quá trình lập kế hoạch và thực thi công việc để người dùng có thể hiểu quy trình ra quyết định
Hiện chỉ khả dụng với một nhóm thử nghiệm đáng tin cậy quy mô nhỏ : nếu muốn tham gia thử nghiệm, cần đăng ký vào danh sách chờ

1 bình luận

iolothebard 2024-12-18

Trình duyệt headless được tối ưu cho AI xuất hiện…
Máy chủ web lại trả về phản hồi được tối ưu cho chính trình duyệt đó…
Ngày mà chúng(?) trò chuyện với nhau có lẽ không còn xa…

Project Mariner của Google DeepMind - Công cụ tự động hóa trình duyệt

Bài viết liên quan

1 bình luận