16 điểm bởi GN⁺ 2025-01-10 | 1 bình luận | Chia sẻ qua WhatsApp
  • Stagehand là một framework duyệt web bằng AI đơn giản và có khả năng mở rộng, tương thích hoàn toàn với Playwright
    • Cung cấp ba API AI đơn giản là act, extract, observe, cho phép tự động hóa web thông qua ngôn ngữ tự nhiên
    • Giúp tăng khả năng tiếp cận ngay cả với người dùng không chuyên kỹ thuật và ít bị ảnh hưởng hơn bởi những thay đổi nhỏ trong UI/DOM
    • Ví dụ: trích xuất các tin hàng đầu từ Hacker News, tìm kiếm và mua AirPods trên Amazon, tra cứu thống kê 10 trận gần nhất của Steph Curry trên ESPN
  • Có thể dễ dàng viết mã tự động hóa trình duyệt bền vững và có hiệu năng tốt.
  • Khi dùng cùng Browserbase, cung cấp các công cụ gỡ lỗi nổi bật như phát lại phiên và gỡ lỗi từng bước.
  • Stagehand đang ở trạng thái phát hành ban đầu và đang tích cực thu thập phản hồi từ cộng đồng.
  • Giấy phép MIT

1 bình luận

 
GN⁺ 2025-01-10
Ý kiến trên Hacker News
  • Có ý kiến cho rằng khi dùng Stagehand để trích xuất dữ liệu từ trang, sẽ tốt hơn nếu nó trả về các phần tử xpath để có thể scrape lại trang mà không cần dùng LLM

    • Khi scrape trang mới thì có thể dùng công cụ LLM phi định tính, còn khi scrape lại để cập nhật nội dung thì có thể dùng phương pháp scraping truyền thống
    • Có thắc mắc rằng việc chuyển từ phiên bản LLM sang phiên bản xpath ổn định đến mức nào, và nếu script xpath thất bại thì có thể quay lại phiên bản LLM hay không
    • Có ý kiến cho rằng sau khi scrape bằng công cụ thông minh, sẽ hữu ích nếu theo thời gian có thể xây dựng được một thư viện script scraping đơn giản
  • Không đồng ý với ý tưởng rằng Stagehand phải thay thế Playwright hay các công cụ tương tự

    • Cá nhân muốn dùng nó như một workflow trung gian để tạo mã Playwright có tính quyết định, nhưng công cụ này có vẻ được thiết kế để chạy trực tiếp
    • Có ý kiến cho rằng sẽ khó thuyết phục việc dùng LLM ở runtime trong một test suite đang vận hành
  • Đã từng cố triển khai tự động hóa workflow bằng một framework tương tự, nhưng bị chặn bởi captcha vô hình

    • Cách một instance Playwright tương tác với DOM có thể khiến nó bị phát hiện
    • Có quan điểm rằng crawling và scraping đang dần vượt khỏi tầm kiểm soát, nên điều này có thể trở thành tiêu chuẩn
  • Có ý kiến rằng cái tên "create-browser-app" quá chung chung, và lẽ ra nên đặt tên là "stagehand"

  • Trước khi xây dựng nền tảng kiểm thử cho testdriver.ai, đã từng tạo một SDK tương tự tên là Goodlooks nhưng không nhận được nhiều phản hồi

    • Chia sẻ liên kết cho những ai quan tâm
  • Sau khi thử dùng Stagehand, có người nhận thấy đây là một lớp trừu tượng hữu ích

    • Việc tích hợp sẵn proxy và captcha giúp ích khi xây dựng scraper cho các website có tính đối kháng
    • Có người thắc mắc liệu có kế hoạch tạo lớp trừu tượng tương tự cho MCP và việc sử dụng máy tính hay không
  • Thích việc Stagehand tập trung làm cho tự động hóa trình duyệt bền vững hơn trước các thay đổi của DOM

    • Các phương thức act, extract, observe rất gọn gàng
    • Giới thiệu Lightpanda là một trình duyệt headless nhẹ mã nguồn mở
  • Có người thắc mắc liệu có khả năng tự động hóa các tab trình duyệt đang mở sẵn hay không

  • Đang theo dõi tốc độ phát triển sản phẩm ấn tượng của đội ngũ này trên Slack và mong chờ các bước tiến tiếp theo

  • Có người thắc mắc liệu nó hoạt động theo cách chuyển các phương thức AI thành các phương thức con của Playwright hay không, và liệu có thể debug các phương thức thực tế đã được chuyển đổi đó hay không

    • Có câu hỏi liệu mỗi lần chạy test có thể sinh ra lệnh khác nhau hay sẽ có hành vi mang tính quyết định