- Tìm kiếm các cảnh cụ thể trong video bằng mạng nơ-ron CLIP của OpenAI
→ Tìm kiếm hình ảnh trong video như "Road Works", "People crossing the street", "Fire truck"
Cách hoạt động
-
Tải video YouTube xuống
-
Trích xuất từng khung hình
-
Mã hóa tất cả khung hình bằng CLIP
-
Mã hóa truy vấn tìm kiếm ngôn ngữ tự nhiên bằng CLIP
-
Tìm cảnh cụ thể bằng truy vấn ngôn ngữ tự nhiên
- Có thể chạy ngay dưới dạng notebook trên Google Colab
1 bình luận
Trong phần bình luận có một thứ khác do chính nhà phát triển đó làm: tìm kiếm ảnh trên Unsplash bằng CLIP; có vẻ cái này cũng sẽ rất hữu ích.
https://github.com/haltakov/natural-language-image-search
Google Colab: https://colab.research.google.com/github/haltakov/…
Nó sẽ tìm ra bức ảnh có nội dung bạn muốn trong số 2 triệu ảnh được đăng trên Unsplash.