- Mô hình văn bản-thành-hình ảnh mã nguồn mở SOTA lớn nhất do Black Forest Labs phát triển
- Đội ngũ gốc đã phát triển Stable Diffusion
- Với 12B tham số, mô hình mở rộng ranh giới về khả năng sáng tạo và hiệu năng, mang lại khả năng tạo ảnh tương tự Midjourney
Cung cấp dưới 3 mô hình
- FLUX.1 [dev]: Mô hình cơ bản được mã nguồn mở theo giấy phép phi thương mại. Cộng đồng có thể xây dựng dựa trên mô hình này
- FLUX.1 [schnell]: Phiên bản chưng cất của mô hình cơ bản, chạy nhanh hơn tới 10 lần. Giấy phép Apache 2.
- FLUX.1 [pro]: Phiên bản đóng, chỉ có thể sử dụng qua API
Tính năng chính
- Chất lượng hình ảnh được cải thiện: Có thể tạo ra hình ảnh độ phân giải cao với phần nhìn ấn tượng
- Giải phẫu người nâng cao và tính chân thực ảnh cao: Có thể tạo ra hình ảnh rất chân thực và chính xác về mặt giải phẫu
- Tuân thủ prompt tốt hơn: Có thể tạo ra hình ảnh chính xác và liên quan hơn dựa trên đầu vào
- Tốc độ vượt trội: Tốc độ và hiệu quả của Flux Schnell rất lý tưởng cho các ứng dụng nhu cầu cao
Tích hợp của fal
- Tích hợp engine suy luận tiên tiến của fal giúp chạy các mô hình Flux nhanh hơn tối đa 2 lần so với eager torch
- Thời gian xử lý nhanh trong khi vẫn duy trì chất lượng và chi tiết vượt trội
Tổng kết của GN⁺
- Flux là mô hình văn bản-thành-hình ảnh mới nhất do Black Forest Labs phát triển, đặt ra tiêu chuẩn mới về khả năng sáng tạo và hiệu năng
- Thông qua nhiều biến thể mô hình, Flux cung cấp các giải pháp tùy biến cho nhiều trường hợp sử dụng khác nhau
- Với chất lượng hình ảnh được cải thiện và khả năng biểu đạt chân thực, mô hình phù hợp với các ứng dụng có nhu cầu cao
- Nhờ engine suy luận của fal, mô hình có thể chạy nhanh hơn và hiệu quả hơn
- Các dự án khác có chức năng tương tự gồm có DALL-E và Midjourney
1 bình luận
Ý kiến trên Hacker News
burkay từ fal.ai: mô hình này không phải do fal tạo ra mà được phát triển bởi Black Forest Labs
Người dùng khác: phần lớn các so sánh đều không kiểm thử đúng cách mô hình mới
Người dùng khác: đã thử bằng prompt của ideogram và Flux tạo ra hình ảnh rất tốt
Người dùng khác: mỗi khi thấy mô hình mới đều kiểm tra xem nó có thể tạo sơ đồ kỹ thuật hay không
Người dùng khác: quy trình đăng ký khá phiền phức
Người dùng khác: các startup được tài trợ bằng vốn đầu tư mạo hiểm đang liên tục phát hành mô hình miễn phí mà không có mô hình kinh doanh
Người dùng khác: chất lượng rất ấn tượng
Người dùng khác: xử lý quan hệ không gian chưa tốt