1 điểm bởi GN⁺ 2025-02-10 | 1 bình luận | Chia sẻ qua WhatsApp

1 bình luận

 
GN⁺ 2025-02-10
Ý kiến trên Hacker News
  • Đây là phần mô tả về một hộp công cụ demo đa dạng

    • Segment Anything 2: tạo cắt ghép video và các hiệu ứng hình ảnh thú vị chỉ với vài cú nhấp chuột
    • Seamless Translation: có thể trải nghiệm giọng nói của chính mình khi phát ra bằng một ngôn ngữ khác
    • Animated Drawings: biến các bản phác thảo vẽ tay thành hoạt ảnh sống động
    • Audiobox: tạo các câu chuyện âm thanh bằng giọng nói và âm thanh do AI tạo ra
  • Seamless Translation là một tính năng khá đáng kinh ngạc

    • khi một người dùng nói được tiếng Anh và tiếng Tây Ban Nha ghi âm một câu tiếng Anh rồi nghe đầu ra tiếng Tây Ban Nha được tạo ra, nó gần như rất giống với tiếng Tây Ban Nha của chính họ
    • tuy vậy, tiếng Tây Ban Nha của người dùng này có chứa nhiều cách diễn đạt đặc trưng của tiếng Castilia hơn
  • Thắc mắc vì sao tiêu đề lại viết là Aidemos

  • Thắc mắc về hướng nghiên cứu AI của Meta

    • Có thể hiểu mục tiêu của Google và MSFT, nhưng không rõ mục tiêu cuối cùng của Meta là gì
  • Demo Seamless Translation rất xuất sắc

    • giọng nói đã dịch nghe giống với giọng gốc của chính mình
    • nếu có thể triển khai tính năng này theo thời gian thực thì sẽ thật đáng kinh ngạc
  • Meta hiểu rất sâu tác động của GPT-3 và ChatGPT

    • mô hình là điểm khởi đầu, còn UX tận dụng mô hình mới là thứ thể hiện trí tuệ
    • điều này đặc biệt nổi bật ở các mô hình thị giác
    • thật thú vị khi SAM2 nói rằng nó có thể "nhìn thấy mọi thứ"
    • thật ấn tượng khi bấm vào quả bóng đá và thấy mô hình theo dõi mượt mà trong video ngay cả khi nó bị che khuất
  • Không phải tất cả demo đều được đưa vào

    • ví dụ, demo Meta Motivo bị thiếu (mô hình điều khiển humanoid)
  • Xuất hiện thông báo: "Hiện tại không thể sử dụng trang web tại khu vực của bạn"

  • Thắc mắc mọi liên kết tới các mô hình đang ở đâu

  • Thú vị đấy, nhưng mong Meta nói rõ hơn rốt cuộc họ thực sự muốn gì

    • có lẽ ý là: "hãy cung cấp dữ liệu In the Wild để tiếp tục huấn luyện thêm cho mô hình"
  • Đã từng có trải nghiệm với công nghệ ước lượng tuổi vài năm trước

    • người dùng tải ảnh lên và nếu hỗ trợ căn chỉnh 10% số điểm mốc khuôn mặt thì bộ ước lượng sẽ chạy
    • nếu sai thì sẽ nhận yêu cầu chỉnh sửa để cải thiện
    • vẫn khá hay, nhưng không còn ấn tượng lớn so với trải nghiệm trước đó