- Sora là mô hình AI tạo ra các cảnh chân thực và giàu trí tưởng tượng theo chỉ dẫn bằng văn bản
- Có thể tạo video dài tối đa 1 phút, vừa bám sát prompt của người dùng vừa duy trì chất lượng hình ảnh
- Giới thiệu các ví dụ video được tạo theo nhiều prompt khác nhau, cung cấp những kịch bản chi tiết
- Tất cả video trên trang này đều do chính Sora tạo ra và hoàn toàn chưa qua chỉnh sửa
- Hiện tại, Sora đang được cung cấp cho các nhóm 'red team' để đánh giá rủi ro, đồng thời OpenAI cũng đang nhận phản hồi từ các nghệ sĩ thị giác, nhà thiết kế và nhà làm phim
- OpenAI muốn chia sẻ tiến độ nghiên cứu để nhận phản hồi từ bên ngoài và cho công chúng thấy tương lai của năng lực AI
Khả năng của Sora
- Có thể tạo ra các cảnh phức tạp với nhiều nhân vật, chuyển động cụ thể, cùng các chi tiết chính xác của chủ thể và bối cảnh
- Không chỉ hiểu prompt của người dùng mà còn hiểu cách mọi thứ tồn tại và vận hành trong thế giới vật lý
Tính an toàn của Sora
- OpenAI dự kiến sẽ áp dụng nhiều biện pháp an toàn trước khi tích hợp Sora vào các sản phẩm của mình
- Bao gồm phát triển công cụ phát hiện nội dung gây hiểu lầm, cũng như bộ phân loại có thể xác định liệu video có được tạo bởi Sora hay không
Công nghệ nghiên cứu
- Sora là mô hình khuếch tán tạo video bằng cách bắt đầu từ một video đầy nhiễu rồi dần loại bỏ nhiễu
- Sử dụng kiến trúc transformer tương tự các mô hình GPT để mang lại khả năng mở rộng vượt trội
Ý kiến của GN⁺
- Sora là công nghệ AI đột phá tạo video từ chỉ dẫn bằng văn bản, mở ra những khả năng mới cho các chuyên gia sáng tạo
- Thông qua các biện pháp an toàn và phản hồi, hệ thống có thể học cách được sử dụng trong thế giới thực và đóng vai trò quan trọng trong việc từng bước làm cho AI an toàn hơn
- Công nghệ này có vẻ sẽ trở thành một cột mốc quan trọng trên con đường hướng tới AGI (trí tuệ nhân tạo tổng quát) trong tương lai
6 bình luận
Thật sự chỉ biết thốt lên đầy thán phục thôi.
Sắp nhận được 7 nghìn tỷ rồi chăng...?
Nếu chỉ nhìn qua loa thì khó mà biết đó là video thật hay video do AI tạo ra.
Wow... mình muốn thử dùng sớm quá.
Vậy "mô hình khuếch tán" nghĩa là nó hoạt động theo cách giống như Stable Diffusion đúng không?
Chắc thị trường stock photo và stock video sẽ khó khăn đây..
Chất lượng tạo sinh thật đáng kinh ngạc. Công nghệ phát triển nhanh đến vậy sao?
Ý kiến trên Hacker News