34 điểm bởi xguru 13 ngày trước | 5 bình luận | Chia sẻ qua WhatsApp
  • Công cụ trình duyệt headless chuyên cho web scraping và tự động hóa AI agent
  • Tích hợp sẵn engine V8 để chạy JavaScript thực tế, đồng thời triển khai Chrome DevTools Protocol (CDP) nên có thể tái sử dụng nguyên trạng mã Puppeteer·Playwright
  • Nhẹ hơn đáng kể so với headless Chrome với bộ nhớ chỉ 30MB (so với 200MB+), binary 70MB (so với 300MB+), thời gian tải trang 85ms (so với ~500ms)
  • Mức tải trang 85ms giúp rút ngắn thời gian chờ 5~10 lần so với Chrome khi crawling quy mô lớn
  • Phân phối dưới dạng binary đơn, không có phụ thuộc bên ngoài, không cần Chrome, Node.js, v.v.
  • Tích hợp --stealth chế độ stealth:
    • Tự động áp dụng thiết lập vượt anti-bot như ẩn navigator.webdriver, ngụy trang hàm native, v.v.
    • Ngẫu nhiên hóa fingerprint theo từng session (GPU, canvas, audio, v.v.)
  • Tự động chặn tracker quảng cáo, analytics, telemetry của 3.520 domain, giúp cải thiện cả tốc độ render trang
  • Trên CLI, dùng obscura fetch để render một trang đơn, obscura serve để khởi chạy máy chủ CDP WebSocket
  • Với obscura scrape url1 url2 ... --concurrency 25, có thể scraping song song dễ dàng
  • Có thể chạy trực tiếp biểu thức JS trên CLI như --eval "document.title" để chỉ lấy kết quả, hữu ích cho việc trích xuất dữ liệu đơn giản
  • Hỗ trợ các domain chính của CDP API như Target, Page, Runtime, DOM, Network, Fetch, Input, v.v., đồng thời bao gồm cả chuyển đổi DOM→Markdown (LP.getMarkdown)
  • Tự động xử lý POST khi gửi form/đăng nhập, chuyển hướng 302 và duy trì cookie, nên không cần tự triển khai luồng xác thực
  • Giấy phép Apache 2.0

5 bình luận

 

Đây là một trình duyệt headless đang rất được chú ý dạo gần đây.
Không chỉ nhẹ, mà còn nổi tiếng vì chế độ stealth hoạt động rất tốt.

 

GitHub mới được tạo tài khoản cách đây một tháng

Trước mắt thì khi chỉ tìm kiếm đơn giản trên Google, hầu như không thấy phản ứng hay đánh giá gì.
Cũng khó xác nhận trên Hacker News, Reddit, v.v..
Không biết là do tôi không tìm ra hay sao..
Nhưng số sao thì đã hơn 6 nghìn.

Có thể kiểm tra ở đâu để biết thứ gì đang thật sự nổi lên không?
Có vẻ là phần mềm cực kỳ nguy hiểm..

 

Tôi chủ yếu thấy nó khá nhiều trên Twitter. Nghe nói là tiện để tự động hóa.
Thực tế thì tôi chưa thử kiểm tra chế độ stealth nên cũng khó mà đánh giá chính xác.

 

Có vẻ không phải là chuyện phổ biến lắm. (Dạo này có khá nhiều dự án kiểu này nên cũng có cảm giác phải xem đó là phổ biến..)

Đây là chương trình có khả năng cao sẽ được dùng với thông tin nhạy cảm, nên có lẽ cần quan sát thêm một thời gian rồi mới dùng.

 

Có vẻ đây là công cụ do u/Total_Nectarine_3623 tạo ra.

https://www.reddit.com/r/ClaudeAI/s/9VO1vzO2zp

Xem các bài viết khác thì có vẻ người này quan tâm đến ONIST hoặc CTF, nên trông như có hứng thú với an toàn thông tin, và đã làm bản phát hành đầu tiên bằng một commit khổng lồ. Nhìn vậy thì cũng có vẻ sau khi đã “vibe coding” rất nhiều trong repository gốc rồi mới tách ra thành vô số commit, nên khó mà công khai nguyên trạng và đã gộp lại thành một commit; thêm nữa, thấy GitHub handle cũng là h4ckfOr0day, mà với những công cụ kiểu ONIST hoặc những cách tiếp cận không hẳn chính thống như vậy thì vốn cũng có một kiểu “truyền thống” là đăng bằng tài khoản phụ.

Niềm tin với mã nguồn mở thì vẫn cần thời gian để xây dựng, nhưng có vẻ cũng không có ý đồ gì đặc biệt.