-
Tóm tắt
- Meta FAIR công bố các thành quả nghiên cứu mới nhất, giới thiệu nhiều mô hình gồm Meta Motivo cho điều khiển hành vi của tác nhân ảo và Meta Video Seal cho watermark video.
- Những nghiên cứu này hướng đến việc thúc đẩy trí tuệ máy móc và thể hiện mục tiêu dân chủ hóa khả năng tiếp cận các công nghệ có thể thay đổi một cách đột phá cách tương tác với thế giới vật lý.
- Các nghiên cứu được công bố tập trung vào việc nâng cao năng lực của tác nhân, tăng cường độ vững chắc và an toàn, cũng như đổi mới kiến trúc để mô hình có thể học thông tin mới hiệu quả hơn.
-
Meta Motivo
- Meta Motivo là mô hình dựa trên hành vi đầu tiên dùng để điều khiển chuyển động của tác nhân hình người ảo, được thiết kế để thực hiện các tác vụ phức tạp.
- Mô hình này sử dụng học tăng cường không giám sát để học các hành vi giống con người và có thể giải quyết nhiều tác vụ điều khiển toàn thân khác nhau mà không cần huấn luyện bổ sung.
- Mô hình cho thấy độ vững chắc cao trước các thay đổi của môi trường và có tiềm năng đóng góp vào việc phát triển các tác nhân hiện thân hoàn chỉnh trong metaverse.
-
Meta Video Seal
- Meta Video Seal là một framework toàn diện cho watermark video, bổ sung watermark giúp truy vết nguồn gốc của video.
- Mô hình này có khả năng chống chịu trước chỉnh sửa video hoặc các thuật toán nén, đồng thời hỗ trợ cộng đồng nghiên cứu tích hợp tính năng watermarking.
- Thông qua leaderboard Meta Omni Seal Bench, các nhà nghiên cứu có thể kiểm thử và bổ sung công trình của mình.
-
Flow Matching
- Flow Matching là một paradigm sinh dữ liệu cho nhiều modality khác nhau như hình ảnh, video và âm thanh, giúp cải thiện hiệu năng và hiệu quả.
- Phương pháp này cho phép khái quát hóa dữ liệu phức tạp dễ dàng hơn, đồng thời giúp cộng đồng nghiên cứu tận dụng nó cho các dự án tạo sinh của riêng mình.
-
Meta Explore Theory-of-Mind
- Meta Explore Theory-of-Mind đóng góp vào việc đánh giá và cải thiện hiệu năng của các mô hình ngôn ngữ lớn bằng cách tạo ra nhiều loại dữ liệu suy luận ToM khác nhau.
- Framework này có thể được dùng để đánh giá hiệu năng của LLM, tăng cường các kịch bản định hướng mục tiêu và thu thập các bộ dữ liệu tương tác.
-
Meta Large Concept Models
- Meta Large Concept Models là một paradigm huấn luyện mới cho language modeling, tách biệt biểu diễn ngôn ngữ thông qua dự đoán khái niệm.
- Mô hình này cho thấy hiệu năng vượt trội so với các LLM gần đây trong tác vụ tóm tắt và cung cấp khả năng khái quát hóa zero-shot mạnh mẽ cho các ngôn ngữ chưa biết.
-
Meta Dynamic Byte Latent Transformer
- Dynamic Byte Latent Transformer là mô hình không dùng tokenizer, cải thiện hiệu năng trên các chuỗi văn bản hiếm.
- Mô hình này góp phần cải thiện suy luận trong nhiều lĩnh vực khác nhau và cho thấy thế mạnh trong xử lý các chuỗi hiếm.
-
Meta Memory Layers
- Meta Memory Layers đưa ra phương pháp mở rộng các lớp bộ nhớ để tăng tính thực tế của tri thức.
- Phương pháp này cho phép mở rộng hiệu quả kiến trúc bộ nhớ thưa và cải thiện hiệu năng trên các benchmark factuality phổ biến.
-
Meta Image Diversity Modeling
- Meta đang tiến hành nghiên cứu để phát triển an toàn các mô hình sinh ảnh và công bố công cụ đánh giá cho các mô hình sinh văn bản-thành-hình ảnh.
- Họ cũng hợp tác với các chuyên gia bên ngoài để cải thiện tính trách nhiệm trong nghiên cứu về image diversity modeling.
-
Meta CLIP 1.2
- Meta CLIP 1.2 là một cột mốc quan trọng trong phát triển encoder thị giác-ngôn ngữ, góp phần ánh xạ chính xác ý nghĩa giữa hình ảnh và ngôn ngữ.
- Công ty công bố các thuật toán dữ liệu và phương pháp huấn luyện để giúp các nhà nghiên cứu và nhà phát triển thúc đẩy năng lực hiểu thị giác-ngôn ngữ.
1 bình luận
Ý kiến trên Hacker News
Nhiều công nghệ đổi mới đang được phát triển tại Meta. Đặc biệt, các công nghệ liên quan đến LLM rất thú vị
Đã có cơ hội nghe bài nói chuyện của Ross Taylor, cựu nhân viên Meta, tại buổi gặp mặt AI Engineer London
Việc thử demo đầu tiên rất vui
"Meta Explore Theory of Mind" còn thú vị hơn
Xét tình hình tài chính của Meta, việc đầu tư hàng triệu đô la cho các chuyên gia AI không phải là gánh nặng lớn
Kỳ vọng vào thành công của Dynamic Byte Latent Transformers
Mỗi lần dọn dẹp văn bản lại thấy tiếc vì đã không huấn luyện một autoencoder khử nhiễu ở mức byte
"Video Seal" của Meta là một công cụ số nhấn mạnh tính tin cậy
Tò mò việc tự nguyện thêm watermark vào video AI sẽ giúp ích cho an toàn AI như thế nào
Meta đang góp phần khiến AI không trở nên độc quyền