Phỏng vấn CEO OpenAI Sam Altman về Sora, năng lượng và việc xây dựng đế chế AI

(a16z.substack.com)

11 điểm bởi GN⁺ 2025-10-10 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Trên podcast a16z, ông mô tả tầm nhìn của OpenAI là sự tích hợp giữa dịch vụ đăng ký AI cá nhân, hạ tầng quy mô lớn và nghiên cứu AGI, đồng thời nhấn mạnh rằng ba yếu tố này tạo thành một stack được kết nối theo chiều dọc
Mục tiêu của OpenAI là một dịch vụ đăng ký AI cá nhân, tích hợp theo chiều dọc giữa nghiên cứu, hạ tầng và sản phẩm tiêu dùng để đồng thời theo đuổi phát triển AGI và ứng dụng thực tế
Ý đồ chiến lược của việc ra mắt Sora không chỉ là tung ra một sản phẩm tạo video, mà còn là giúp xã hội chuẩn bị cho sự xuất hiện của các mô hình video mạnh mẽ, đồng thời thúc đẩy nghiên cứu AGI thông qua phát triển world model
Với GPT-5, kỷ nguyên nhà khoa học AI đang đến, và đã xuất hiện những ví dụ ban đầu về việc mô hình thực sự thực hiện khám phá khoa học; ông dự đoán trong vòng 2 năm tới sẽ có những khám phá khoa học quan trọng
Ông đưa ra cái nhìn lạc quan về sự hội tụ giữa năng lượng và AI, khả năng áp dụng nguyên tắc fair use cho bản quyền, và việc AGI sẽ đến một cách dần dần hơn dự kiến để xã hội có thời gian thích nghi; đồng thời đánh giá rằng kỷ nguyên AI tăng tốc tiến bộ khoa học đã bắt đầu

Tầm nhìn và cấu trúc của OpenAI

OpenAI được cấu thành từ ba trụ cột: dịch vụ đăng ký AI cho người dùng, hạ tầng quy mô lớn và viện nghiên cứu
- Mục tiêu là thông qua AI cá nhân hóa để hiểu ngữ cảnh của người dùng và cung cấp dịch vụ thuê bao đóng vai trò trợ lý cá nhân thực thụ
- Phần lớn mọi người sẽ có một gói AI cá nhân, và một số người có thể dùng nhiều gói
- Người dùng sẽ đăng nhập vào nhiều dịch vụ và sử dụng AI thông qua thiết bị chuyên dụng
- Mục tiêu là AI dần hiểu người dùng và trở nên cực kỳ hữu ích
Hạ tầng là yếu tố thiết yếu để hỗ trợ phát triển AGI và cung cấp dịch vụ
- Hiện tại chưa có kế hoạch bán hạ tầng thô cho các công ty khác
- Tuy nhiên vẫn để ngỏ khả năng phải cân nhắc mục đích sử dụng khác vì quy mô quá lớn
- Đang xây dựng data center lớn nhất trong lịch sử loài người, hay chính xác hơn là dự án hạ tầng lớn nhất trong lịch sử
Ban đầu ông hoài nghi về tích hợp dọc, nhưng nay đã chuyển sang quan điểm rằng không thể hiện thực hóa AGI nếu không có tích hợp dọc
- Ông đã trải qua sự chuyển đổi từ góc nhìn nhà đầu tư sang góc nhìn người vận hành
- Lý thuyết cho rằng nền kinh tế hiệu quả và doanh nghiệp có thể làm tốt một việc không áp dụng được với OpenAI
- Câu chuyện của OpenAI đã phát triển theo hướng phải làm nhiều thứ hơn dự kiến để hoàn thành sứ mệnh
Ông đánh giá iPhone là sản phẩm đáng kinh ngạc nhất mà ngành công nghệ từng tạo ra, và xem đó là ví dụ của tích hợp dọc ở mức cực độ
Cần một cấu trúc stack theo chiều dọc trong đó nghiên cứu giúp tạo ra sản phẩm tuyệt vời, còn hạ tầng giúp nghiên cứu trở nên khả thi

Ý đồ chiến lược của việc ra mắt Sora

Bề ngoài Sora có thể trông như không liên quan đến AGI, nhưng ông cho rằng xây dựng world model là điều quan trọng đối với AGI
- Cũng như ChatGPT đã giúp xã hội chuẩn bị cho AGI, Sora cũng đóng vai trò giúp xã hội thích nghi với tác động thực tế của video do AI tạo ra
- Video có độ cộng hưởng cảm xúc lớn hơn nhiều so với văn bản, nên điều quan trọng là xã hội phải hiểu điều này
- Sớm thôi sẽ xuất hiện các mô hình video đáng kinh ngạc có thể tạo deepfake hoặc hiển thị bất cứ điều gì người ta muốn
AI không chỉ phải hiệu quả mà còn phải mang lại sự vui vẻ và thú vị
- Không phải phần lớn tài nguyên tính toán đều đổ vào đây, nhưng xét theo quy mô tuyệt đối thì lượng tài nguyên投入 vẫn rất lớn
Sora mới đang phát triển theo hướng thú vị với việc bổ sung các tính năng mạng xã hội
Ông nhấn mạnh rằng xã hội và công nghệ phải cùng tiến hóa, và cần có quá trình thử nghiệm, thích nghi trước khi AI thực sự xuất hiện rộng khắp

Sự xuất hiện của nhà khoa học AI

Thông qua GPT-5, đã xuất hiện các ví dụ ban đầu về việc AI thực hiện khám phá khoa học
- Những phát hiện toán học mới, các đóng góp nhỏ trong nghiên cứu vật lý và sinh học
- Trong 2 năm tới, ông kỳ vọng các mô hình sẽ làm khoa học ở quy mô lớn hơn và tạo ra các khám phá quan trọng
Sam Altman cho rằng một tiêu chuẩn tương tự Turing test chính là khả năng AI có thể làm khoa học
- Điều này sẽ tạo ra thay đổi thực sự cho thế giới
- Tiến bộ khoa học là yếu tố quan trọng nhất về dài hạn để làm cho thế giới tốt đẹp hơn
Turing test về cơ bản đã bị vượt qua, nhưng thế giới không thay đổi lớn đến mức không tưởng
- AGI cũng sẽ đến theo cách tương tự, nhưng điểm kỳ dị sẽ không thực sự xảy ra, và sự thay đổi sẽ diễn ra dần dần hơn dự đoán
- Ngay cả khi nghiên cứu được đẩy điên cuồng, xã hội vẫn sẽ học cách thích nghi nhanh hơn người ta nghĩ
Con người và xã hội có khả năng thích nghi tốt hơn rất nhiều so với tưởng tượng
- Họ sẽ cập nhật nhận thức rằng AGI đang đến, chấp nhận nó và tìm được sự bình ổn
- Mọi thứ sẽ liên tục hơn rất nhiều so với dự báo

Sự tiến hóa của giao diện AI-con người

Các mô hình hiện đã đạt mức rất cao ở khía cạnh đối thoại chatbot cơ bản
- Tuy nhiên vẫn chưa thể thực hiện các yêu cầu như "hãy chữa khỏi ung thư"
- Phong cách giao diện văn bản vẫn còn rất nhiều dư địa để phát triển
Tương lai sẽ mở rộng sang một thế giới nơi video render theo thời gian thực trở thành giao diện
- AI nhận biết môi trường xung quanh và chỉ hiển thị thông tin khi cần, dưới dạng thiết bị ambient luôn nhận biết ngữ cảnh
- Thay vì gửi thông báo tin nhắn một cách bừa bãi, AI sẽ hiểu ngữ cảnh và cung cấp thông tin vào đúng thời điểm
Về dài hạn, giao diện sẽ tiến hóa thành AI hiểu người dùng và chủ động quyết định kiểu hội thoại cá nhân hóa trước
Tầm quan trọng của cá nhân hóa người dùng
- Việc hàng tỷ người cùng trò chuyện với một bộ não giống hệt nhau là điều kỳ lạ
- Cách người dùng muốn AI hành xử khác nhau rất nhiều
- ChatGPT sẽ phát triển theo hướng phỏng vấn người dùng, nắm bắt sở thích và tự động điều chỉnh

Hạ tầng, hợp tác và năng lượng

OpenAI đang thúc đẩy mở rộng hạ tầng quy mô lớn, hợp tác với AMD, NVIDIA, Oracle và các bên khác
- Vì lý do tồn tại của OpenAI là xây dựng AGI, nghiên cứu có mức ưu tiên cao hơn nên GPU được phân bổ cho nghiên cứu trước sản phẩm
- Chỉ có ngoại lệ trong những trường hợp đặc biệt như khi một tính năng mới lan truyền mạnh
Mục tiêu của việc xây dựng năng lực quy mô lớn là để không còn phải đưa ra những quyết định đau đớn như vậy
Văn hóa nghiên cứu tốt giống như vận hành một công ty đầu tư giai đoạn đầu
- Đặt cược vào nhà sáng lập và hỗ trợ họ
- Đây là cách tiếp cận khác với việc điều hành một công ty sản phẩm
Về năng lượng, ông nhấn mạnh rằng nguồn năng lượng dồi dào và giá rẻ chính là chìa khóa nâng cao chất lượng sống của nhân loại
- Trong ngắn hạn, khí tự nhiên sẽ đóng vai trò lớn; về dài hạn, điện mặt trời + lưu trữ và điện hạt nhân tiên tiến (SMR, nhiệt hạch) sẽ trở thành xu hướng chủ đạo
- Việc nới lỏng quy định với điện hạt nhân là điều thiết yếu, và nếu giá giảm mạnh thì tốc độ chuyển đổi cũng sẽ rất nhanh

Đánh giá năng lực mô hình

Điểm benchmark tĩnh đang dần mất sức hấp dẫn và bị game hóa nghiêm trọng
Khám phá khoa học sẽ trở thành một chỉ số đánh giá hữu ích trong thời gian dài
Doanh thu cũng được xem là một chỉ số đánh giá thú vị

Góc nhìn về an toàn AI và quy định

Việc công nghệ hiện chưa tạo ra những rủi ro thật sự đáng sợ và khổng lồ không có nghĩa là tương lai cũng sẽ như vậy
- Ông dự đoán sẽ có một số khoảnh khắc rất kỳ quặc hoặc đáng sợ
- Cũng như các công nghệ trước đây, sẽ có một số điều thực sự tồi tệ xảy ra
Ông thừa nhận rằng công nghệ AI rồi sẽ tất yếu đối mặt với những thời điểm nguy hiểm, và cần xây dựng các cơ chế an toàn xã hội
Vì phần lớn quy định có thể mang lại nhiều mặt trái, ông đề xuất chỉ áp dụng quy định hạn chế với các mô hình siêu mạnh
- Khi mô hình thực sự sở hữu năng lực siêu nhân ở mức cực cao, thì những mô hình đó và chỉ những mô hình đó mới đáng để trải qua kiểm thử an toàn rất thận trọng
- Ông hy vọng gánh nặng quy định sẽ không đổ lên mọi điều tốt đẹp mà các mô hình kém mạnh hơn có thể làm được
Một cuộc siết chặt toàn diện kiểu châu Âu sẽ là điều rất tệ
- Vì Trung Quốc sẽ không chịu những ràng buộc như vậy, nên nếu Mỹ tụt lại trong AI thì đó sẽ là rủi ro rất lớn với thế giới
Quy định quá mức có thể làm gia tăng rủi ro toàn cầu

Bản quyền, open source và tương lai nội dung

Với dữ liệu huấn luyện, ông dự đoán "học là fair use" nhiều khả năng sẽ được công nhận
- Tuy vậy, việc tạo nội dung dựa trên nhân vật, phong cách hay IP sẽ cần những mô hình thương mại mới
- Điều này tương tự việc một nhà văn có thể đọc tiểu thuyết để lấy cảm hứng nhưng không thể sao chép nguyên tác
- Một số bên nắm quyền thậm chí phàn nàn rằng “nhân vật của tôi không xuất hiện đủ nhiều”, cho thấy cấu trúc hợp tác nội dung đang được tái thiết
Mô hình open source gpt-oss được đánh giá tích cực, đồng thời ông cũng nhắc đến sự cần thiết phải kiềm chế đà lan rộng mang tính độc quyền của các mô hình Trung Quốc

Sự hội tụ giữa năng lượng và AI

Hai mối quan tâm lớn là AI và năng lượng đang hội tụ thành một
- Nhìn lại lịch sử, yếu tố có tác động lớn nhất đến việc nâng cao chất lượng sống của con người chính là năng lượng rẻ hơn và dồi dào hơn
- Vì thế, đẩy mạnh năng lượng hơn nữa là một ý tưởng tốt
Trong ngắn hạn, khí tự nhiên được dự báo sẽ chiếm phần lớn công suất điện nền mới ròng của Mỹ
Về dài hạn, điện mặt trời + lưu trữ và điện hạt nhân sẽ là các nguồn năng lượng chi phối
- Bao gồm điện hạt nhân tiên tiến như SMR và nhiệt hạch
- Nếu điện hạt nhân rẻ vượt trội về kinh tế so với mọi lựa chọn khác, quá trình chuyển đổi sẽ diễn ra nhanh chóng
- Trong lịch sử, khi xuất hiện một nguồn năng lượng rẻ hơn nhiều, thế giới đã dịch chuyển rất nhanh sang nó
Điện hạt nhân nên trở thành dạng năng lượng rẻ nhất trên Trái Đất, hay ở bất kỳ đâu

Kiếm tiền và niềm tin người dùng

Chi phí tạo video bằng Sora cao nên cần mô hình kiếm tiền mới
- Đã xuất hiện những kiểu sử dụng ngoài dự đoán, như mọi người tạo meme vui về bản thân và bạn bè trong chat nhóm
- Cần những cách kiếm tiền khác cho những người dùng hàng trăm lần mỗi ngày
- Chi phí GPU cao nên sẽ cần mô hình pay-per-generation
Những giả định truyền thống về sáng tạo nội dung đang thay đổi
- Mô hình truyền thống là 1% tạo nội dung, 10% bình luận, 100% xem
- Thực ra nhiều người muốn tạo nội dung hơn rất nhiều, chỉ là trước đây điều đó khó
Ông cởi mở với quảng cáo nhưng niềm tin là yếu tố cốt lõi
- Chỉ có thể làm điều đó trong phạm vi không làm tổn hại niềm tin của người dùng
- Quảng cáo trên Instagram là ví dụ tốt về việc tạo ra giá trị ròng (khám phá sản phẩm trước đây chưa biết)
- Không được phá vỡ mối quan hệ tin cậy cao giữa ChatGPT và người dùng
- Nếu với câu hỏi "Nên mua máy pha cà phê nào?" mà AI đề xuất sản phẩm trả tiền thay vì sản phẩm tốt nhất, thì niềm tin sẽ mất đi

Nhìn lại OpenAI thời kỳ đầu

OpenAI thời kỳ đầu thiên về nghiên cứu hơn kinh doanh, nhưng với vai trò CEO, điều thay đổi lớn nhất là ông học được sự phức tạp về vận hành và tâm lý tổ chức
Những năm đầu là quãng thời gian nghề nghiệp vui nhất, khi ông cùng những người thông minh nhất vận hành một viện nghiên cứu và thực hiện công việc mang tính lịch sử
Sau khi ChatGPT ra mắt, cuộc sống của ông đảo lộn hoàn toàn. Gần 3 năm đã trôi qua, và theo thời gian thì mọi thứ ngày càng điên hơn một chút, nhưng ông đã quen dần
Sự chuyển đổi từ nhà đầu tư sang CEO
- Ban đầu ông không hề có sự phù hợp tự nhiên với việc điều hành công ty
- Từ tư duy đưa lời khuyên cho công ty với tư cách nhà đầu tư, ông dần hiểu rằng mình thực sự phải là người vận hành công ty
- Theo thời gian, ông học được rất nhiều về những gì cần thiết để điều hành tổ chức

Lời khuyên cho tương lai

Thế hệ công ty khổng lồ tiếp theo sẽ không xuất hiện bằng cách bắt chước OpenAI, mà sẽ nổi lên trên nền tảng công nghệ do OpenAI tạo ra
Những nỗ lực dự đoán ngành công nghiệp tương lai phần lớn đều sai; câu trả lời duy nhất là trực tiếp xây dựng, thử nghiệm và học hỏi

Học được sự khiêm tốn sâu sắc: dự đoán gần như luôn sai
- Ngồi ghế bành làm quarterback thì nghe có vẻ thông minh, nhưng rốt cuộc cũng gần giống những gì mọi người khác đang nói
- Rất khó để có được niềm tin đúng đắn
Cách duy nhất để biết là dấn sâu vào tuyến đầu khám phá ý tưởng
- Trò chuyện với nhiều người, tạo ra sản phẩm, nghịch công nghệ và thực sự bước ra thế giới
Mức độ sẵn sàng hỗ trợ những thứ như vậy từ phía nhà đầu tư thấp đến mức đáng thất vọng
- Phần lớn công ty chỉ đang chạy theo xu hướng hiện tại
- Ông hy vọng mọi người sẽ thử những điều mới

Tầm nhìn về thế giới sau AGI

Altman định nghĩa AI là động lực cốt lõi dẫn dắt tiến bộ liên tục trong khoa học, năng lượng và toàn bộ nền kinh tế
AI sẽ bị cuốn hút vào việc nghiên cứu và quan sát mọi thứ khác: ông kỳ vọng nó sẽ quan tâm đến toàn bộ thuật toán của con người
Nếu OpenAI hoàn thành sứ mệnh, AGI quy mô lớn với chi phí gần như bằng 0 sẽ khả thi
Dù rất khó đưa ra dự đoán cụ thể, con người vẫn phải khám phá bằng cách chơi với công nghệ, trò chuyện với nhau và bước ra thế giới
AGI sẽ không thấm vào xã hội như một cú nổ thay đổi đột ngột, mà như một quá trình tiến hóa liên tục, và nhân loại đang bước vào kỷ nguyên học hỏi chung không ngừng cùng AI

Phỏng vấn CEO OpenAI Sam Altman về Sora, năng lượng và việc xây dựng đế chế AI

Tầm nhìn và cấu trúc của OpenAI

Ý đồ chiến lược của việc ra mắt Sora

Sự xuất hiện của nhà khoa học AI

Sự tiến hóa của giao diện AI-con người

Hạ tầng, hợp tác và năng lượng

Đánh giá năng lực mô hình

Góc nhìn về an toàn AI và quy định

Bản quyền, open source và tương lai nội dung

Sự hội tụ giữa năng lượng và AI

Kiếm tiền và niềm tin người dùng

Nhìn lại OpenAI thời kỳ đầu

Lời khuyên cho tương lai

Tầm nhìn về thế giới sau AGI

Bài viết liên quan

Chưa có bình luận nào.