- Chỉ cần thêm một dòng
<script src="page-agent.js"></script> là website có thể biến thành ứng dụng AI-native
- Hoạt động mà không cần tiện ích mở rộng trình duyệt, Python hay trình duyệt headless
- Chỉ cần ra lệnh bằng ngôn ngữ tự nhiên, phần còn lại do AI xử lý. Nhờ tính năng thao tác DOM dựa trên văn bản, không cần ảnh chụp màn hình, OCR hay LLM đa phương thức
- Mọi xử lý đều được thực hiện bên trong trang web theo mô hình thực thi in-page, cho phép điều khiển trực tiếp các phần tử DOM mà không cần yêu cầu quyền riêng biệt
- Có thể sử dụng nhiều mô hình như OpenAI, Claude, DeepSeek, Qwen, đồng thời cũng hỗ trợ chạy hoàn toàn offline với Ollama (tích hợp dựa trên API key)
- Cung cấp UI tương tác và giao diện human-in-the-loop
- Có thể dùng bookmarklet để thử trên bất kỳ trang web nào
- Khi cài tiện ích mở rộng Chrome, công cụ còn hỗ trợ các tác vụ nối qua nhiều trang, cũng như điều khiển ở cấp trình duyệt và tích hợp bên ngoài
- Các trường hợp sử dụng chính
- SaaS AI Copilot: triển khai AI Copilot ngay trong sản phẩm mà không cần sửa backend
- Tự động hóa form thông minh: rút gọn quy trình nhấp nhiều bước thành một câu lệnh duy nhất, giúp cải thiện ERP/CRM/công cụ quản trị
- Tăng cường khả năng truy cập: cải thiện khả năng truy cập web thông qua lệnh thoại và trình đọc màn hình
- Giấy phép MIT: Repo là alibaba/page-agent
11 bình luận
Wow, thú vị thật..!!
Wow, thật thú vị.
Có vẻ đây là cách khá hay để gắn LLM vào trang bằng bookmarklet một cách đơn giản. Nếu thấy không yên tâm vì bookmarklet mặc định đi tới Alibaba (Trung Quốc), bạn có thể nhập
baseURLvàapiKeyđể chỉ định endpoint LLM mà mình đang dùng. (như local LLM hoặc OpenAI)javascript:(function(){import('https://cdn.jsdelivr.net/npm/page-agent@1.5.5/+esm').then(module=>{window.agent=new module.PageAgent({model:'gpt-5.4',baseURL:'<your-api-url>',apiKey:'<your-api-key>'});if(window.agent.panel)window.agent.panel.show();}).catch(e=>console.error(e));})();
Lúc đầu tôi đã nghĩ “cái gì vậy, dùng thế nào đây?”, nhưng giờ thì đã hiểu rồi.
Cài extension xong, khi tôi nói trên Toss Securities rằng muốn biết giá cổ phiếu của SOXL cách đây 30 ngày, nó tự thao tác, vào xem giá rồi báo lại cho tôi.
Nó còn nhanh hơn rất nhiều so với việc kết nối Playwright với AI.
Cái này đang gây bão trên SNS đấy.. chắc phải thử mới được
Quá tuyệt vời, có vẻ như ngay lập tức sẽ có rất nhiều cách ứng dụng thực tế.
Có lẽ chỉ cần cải thiện thêm về mặt bảo mật rồi sử dụng là được.
Ồ, thú vị thật đấy
> Hãy thử trên các trang khác
> Bước 2: Kéo nút này vào thanh dấu trang
Trên trang có mục như thế này, mà kéo thật thì đúng là nó được thêm vào dấu trang luôn.
Lần đầu thấy kiểu này nên thấy hay quá, đúng là một cách rất hay khi chia sẻ bookmarklet.
Ôi.. bookmarklet của GeekNews cũng đã có từ giai đoạn đầu khi mở cửa. https://news.hada.io/bookmarklet
Ồ, hóa ra trên GeekNews cũng có bookmarklet hay thế này nữa à haha
Có vẻ ngay cả người dùng phổ thông cũng sẽ dễ sử dụng, đúng là rất tuyệt
Thú vị thật. Có vẻ Alibaba lại tung ra một thứ hay ho nữa.
Có khi đáng để thử đưa vào công cụ quản trị nội bộ của dịch vụ?
Có vẻ chỉ cần làm CRUD sơ bộ rồi ra lệnh tuần tự kiểu làm cái này rồi cái kia là sẽ tạo được workflow.
Bản demo hoạt động khá thú vị.
Cái này không cần nhúng trực tiếp vào code mà dùng bookmarklet,
nên có thể áp dụng cho gần như bất kỳ website nào.