3 điểm bởi arxivgpt 2024-10-16 | 1 bình luận | Chia sẻ qua WhatsApp

Cùng với sự phát triển của trí tuệ nhân tạo, công nghệ tạo ảnh đang tiến hóa với tốc độ đáng kinh ngạc. Đặc biệt, các mô hình tạo ảnh từ văn bản, cho phép tạo ra hình ảnh mong muốn bằng cách nhập văn bản, đang nhận được nhiều sự chú ý lớn trong lĩnh vực sáng tạo nội dung và nghệ thuật. Gần đây, nhờ nỗ lực của nhiều cộng đồng mã nguồn mở và các nhà nghiên cứu, đã xuất hiện những mô hình tạo ảnh mà bất kỳ ai cũng có thể dễ dàng tiếp cận. Trong số đó, mô hình LoRA (Low-Rank Adaptation) là công nghệ đang thu hút sự chú ý khi mở ra một mô hình mới cho việc tạo ảnh.

Sự kết hợp giữa LoRA và MixGen3

Sự xuất hiện của mô hình LoRA: Mô hình LoRA là một mô hình gọn nhẹ được bổ sung vào các mô hình AI lớn đã được huấn luyện trước, giúp chúng thích nghi để tạo ra phong cách hoặc nội dung mới. LoRA có ưu điểm là cho phép tạo ảnh hiệu quả với dung lượng nhỏ và có thể thể hiện nhiều phong cách đa dạng. Nhiều mô hình LoRA đang được chia sẻ và nghiên cứu thông qua các nền tảng mã nguồn mở như Hugging Face, qua đó thúc đẩy sự phát triển của lĩnh vực tạo ảnh.

Giới thiệu dịch vụ MixGen3: MixGen3 được giới thiệu trong bài blog này là một dịch vụ đổi mới sử dụng chính các mô hình LoRA đó để tạo ảnh. Thông qua MixGen3, người dùng có thể chọn nhiều mô hình LoRA khác nhau và nhập prompt của riêng mình để tạo ra những hình ảnh độc đáo. Bây giờ, hãy cùng tìm hiểu chi tiết về các đặc điểm nổi bật và giá trị của dịch vụ MixGen3.

Điểm khác biệt so với các dịch vụ hiện có:

Tích hợp mô hình LoRA: MixGen3 tích hợp nhiều mô hình LoRA trong một dịch vụ duy nhất. Người dùng có thể khám phá nhiều mô hình LoRA khác nhau qua thư viện và chọn mô hình mong muốn. So với cách làm trước đây là phải tự đi tìm và dùng từng mô hình LoRA riêng lẻ, đây là một cách tiếp cận thuận tiện và hiệu quả hơn rất nhiều.

Kết hợp nhiều mô hình LoRA: Điểm khác biệt lớn nhất của MixGen3 là có thể kết hợp tối đa 3 mô hình LoRA để tạo ảnh. Bằng cách hòa trộn nhiều mô hình LoRA, người dùng có thể thể hiện những phong cách và nội dung độc đáo chưa từng có trước đây. Ví dụ, có thể kết hợp LoRA phong cảnh và LoRA động vật để tạo ra hình ảnh một chú chó đang chơi trên bãi biển tuyệt đẹp.

Chọn mô hình LoRA
Việc chọn mô hình LoRA là quá trình quan trọng nhất trong dịch vụ. Bởi vì mô hình LoRA là yếu tố cốt lõi quyết định phong cách và nội dung của hình ảnh! Giờ hãy thử chọn mô hình LoRA nhé.

Hãy tìm mô hình LoRA mà bạn muốn trong thư viện. Trong thư viện có hiển thị hình ảnh và tiêu đề của các mô hình LoRA. Mỗi mô hình LoRA đều có phong cách riêng, vì vậy hãy chọn mẫu bạn thích.

Khi nhấp vào mô hình LoRA bằng chuột, mô hình đã chọn sẽ được thêm vào danh sách LoRA đã chọn ở phía trên màn hình. Có thể chọn tối đa 3 mô hình LoRA.

Trong danh sách LoRA đã chọn, bạn có thể thay đổi thứ tự của các mô hình LoRA hoặc điều chỉnh scale. Scale dùng để điều chỉnh mức độ ảnh hưởng của mô hình LoRA, hãy di chuyển thanh trượt để đặt giá trị mong muốn.

Nhập nội dung bạn muốn thể hiện trong hình ảnh vào ô nhập prompt. Ví dụ như "Phong cảnh rừng đẹp", "Gia đình mèo dễ thương", "Thành phố siêu thực", hãy thử diễn đạt hình ảnh bạn tưởng tượng bằng lời.

Khi nhấp vào nút Generate, quá trình tạo ảnh sẽ bắt đầu. Thanh tiến trình (progress bar) sẽ xuất hiện và hiển thị quá trình mô hình LoRA tạo ảnh.

Sau khi chờ một lát, hình ảnh được tạo sẽ xuất hiện ở chính giữa màn hình.

Kiểm tra và lưu kết quả hình ảnh
Cách kiểm tra và lưu hình ảnh đã tạo như sau.

Hình ảnh được tạo sẽ được hiển thị lớn ở chính giữa màn hình. Khi nhấp vào hình ảnh, bạn có thể phóng to toàn màn hình để xem chi tiết hơn.

Nếu nhấp vào nút tải xuống ở góc dưới bên phải của hình ảnh, bạn có thể tải ảnh về. Hãy lưu ảnh vào nơi bạn muốn để có thể xem lại sau.

Bạn có thể thay đổi kích thước hình ảnh bằng thanh trượt điều chỉnh kích thước ảnh. Nếu muốn lưu ảnh ở kích thước khác, hãy điều chỉnh đến kích thước mong muốn rồi tải xuống.

1 bình luận

 
undercat 2024-10-17

Làm rất tốt!

Có lẽ sẽ còn tốt hơn nếu bài viết được trình bày bằng Markdown ^^