Deep Daze - Tạo hình ảnh từ văn bản
(github.com)- Công cụ tạo hình ảnh bằng cách nhập một chuỗi văn bản đơn giản, sử dụng CLIP của OpenAI và Siren
$ imagine "a house in the forest"
-
Chế độ mặc định chỉ hỗ trợ tối đa 77 ký tự
-
Khi dùng tùy chọn create_story, có thể tạo toàn bộ câu chuyện/bài hát/bài thơ dưới dạng hình ảnh thay đổi liên tục
3 bình luận
Dự án này thú vị thật đấy
Khá thú vị~ nghĩ kỹ thì có vẻ cũng có thể được ứng dụng gắn với bảo mật.
Dall-E của OpenAI là mã nguồn đóng, nên đây là các nỗ lực nhằm triển khai nó theo hướng mở
DALL·E : tạo hình ảnh từ văn bản https://vi.news.hada.io/topic?id=3537
DALL-E in Pytorch https://github.com/lucidrains/dalle-pytorch
Big Sleep - text-to-image : CLIP + BigGAN, https://github.com/lucidrains/big-sleep
Các dự án khác sử dụng CLIP của OpenAI