10 điểm bởi xguru 2024-10-24 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp
  • Bao gồm nhiều phiên bản mô hình có thể chạy trên phần cứng tiêu dùng và có thể tùy biến linh hoạt, đồng thời miễn phí cho hầu hết các trường hợp sử dụng
  • Có thể tải các mô hình Stable Diffusion 3.5 Large và Stable Diffusion 3.5 Large Turbo từ Hugging Face, và tải mã suy luận từ GitHub
  • Các mô hình được phát hành
    • Stable Diffusion 3.5 Large: mô hình nền tảng với 8 tỷ tham số, mạnh nhất trong dòng Stable Diffusion. Lý tưởng cho các trường hợp sử dụng chuyên nghiệp ở độ phân giải 1 megapixel
    • Stable Diffusion 3.5 Large Turbo: phiên bản chưng cất của Stable Diffusion 3.5 Large, tạo ra hình ảnh chất lượng cao với khả năng bám sát prompt rất tốt chỉ trong 4 bước. Nhanh hơn đáng kể so với Stable Diffusion 3.5 Large
    • Stable Diffusion 3.5 Medium (dự kiến ra mắt ngày 29 tháng 10): có 2,5 tỷ tham số và được thiết kế để chạy trực tiếp trên phần cứng tiêu dùng nhờ kiến trúc MMDiT-X được cải tiến cùng phương pháp huấn luyện mới. Cân bằng giữa chất lượng và khả năng tùy biến dễ dàng. Có thể tạo ảnh ở độ phân giải từ 0,25 đến 2 megapixel

Quá trình phát triển mô hình

  • Khi phát triển mô hình, khả năng tùy biến được ưu tiên để cung cấp nền tảng linh hoạt
  • Để làm được điều này, Query-Key Normalization được tích hợp vào các khối transformer nhằm ổn định quá trình huấn luyện mô hình và đơn giản hóa việc fine-tuning cũng như phát triển bổ sung
  • Cần có một số đánh đổi để hỗ trợ tính linh hoạt ở downstream
  • Khi thay đổi seed với cùng một prompt, độ biến thiên của đầu ra có thể tăng lên. Đây là chủ đích nhằm giúp bảo toàn nền tảng tri thức rộng hơn và nhiều phong cách đa dạng hơn trong mô hình cơ sở
  • Tuy nhiên, các prompt thiếu tính cụ thể có thể làm tăng tính bất định của đầu ra, và mức độ thẩm mỹ có thể khác nhau
  • Với mô hình Medium, kiến trúc và giao thức huấn luyện đã được điều chỉnh nhiều lần để cải thiện chất lượng, tính nhất quán và khả năng tạo ảnh đa độ phân giải

Ưu điểm của Stable Diffusion 3.5

  • Dễ tùy biến: có thể dễ dàng fine-tuning mô hình theo nhu cầu sáng tạo cụ thể, hoặc xây dựng ứng dụng dựa trên workflow tùy chỉnh
  • Hiệu năng hiệu quả: đặc biệt là Stable Diffusion 3.5 Medium và Stable Diffusion 3.5 Large Turbo được tối ưu để chạy trên phần cứng tiêu dùng phổ thông mà không đòi hỏi cấu hình nặng
  • Đầu ra đa dạng: có thể tạo hình ảnh đại diện cho con người trên khắp thế giới với nhiều tông da và đặc điểm khác nhau mà không cần prompt quá phức tạp
  • Stable Diffusion 3.5 Large dẫn đầu thị trường về khả năng bám sát prompt và có chất lượng hình ảnh sánh ngang với các mô hình lớn hơn nhiều
  • Stable Diffusion 3.5 Large Turbo mang lại thời gian suy luận nhanh nhất so với kích thước của nó, đồng thời vẫn rất cạnh tranh về chất lượng hình ảnh và khả năng bám sát prompt
  • Stable Diffusion 3.5 Medium vượt qua các mô hình cỡ trung khác, cân bằng giữa khả năng bám sát prompt và chất lượng hình ảnh để mang lại hiệu năng hiệu quả và chất lượng cao

Tổng quan về Stability AI Community License

  • Miễn phí cho mục đích phi thương mại: cá nhân và tổ chức có thể sử dụng miễn phí cho mục đích phi thương mại, bao gồm cả nghiên cứu khoa học
  • Miễn phí cho mục đích thương mại nếu doanh thu hằng năm dưới 1 triệu USD: startup, doanh nghiệp vừa và nhỏ, nhà sáng tạo có thể sử dụng miễn phí cho mục đích thương mại nếu doanh thu hằng năm dưới 1 triệu USD
  • Quyền sở hữu đầu ra: có thể giữ quyền sở hữu đối với nội dung media được tạo ra mà không mang hàm ý cấp phép hạn chế
  • Các tổ chức có doanh thu hằng năm trên 1 triệu USD có thể liên hệ Stability AI để hỏi về giấy phép doanh nghiệp

Cách truy cập mô hình

  • Trọng số mô hình hiện đã có trên Hugging Face để self-hosting
  • Cũng có thể truy cập mô hình thông qua các nền tảng như Stability AI API, Replicate, ComfyUI, DeepInfra

Cam kết của Stability AI về an toàn

  • Stability AI tin vào các thực hành AI an toàn và có trách nhiệm, đồng thời thực hiện các biện pháp có chủ đích để bảo đảm tính chính trực ngay từ giai đoạn đầu phát triển
  • Công ty đang thực hiện các biện pháp hợp lý để ngăn chặn việc Stable Diffusion 3.5 bị lạm dụng bởi các tác nhân xấu

Kế hoạch sắp tới

  • Dự kiến phát hành công khai Stable Diffusion 3.5 Medium vào ngày 29 tháng 10
  • Tiếp đó sẽ ra mắt ControlNets, cung cấp các tính năng điều khiển nâng cao cho nhiều trường hợp sử dụng chuyên nghiệp

Chưa có bình luận nào.

Chưa có bình luận nào.