Phỏng vấn CEO OpenAI Sam Altman về Sora, năng lượng và việc xây dựng đế chế AI
(a16z.substack.com)- Trên podcast a16z, ông mô tả tầm nhìn của OpenAI là sự tích hợp giữa dịch vụ đăng ký AI cá nhân, hạ tầng quy mô lớn và nghiên cứu AGI, đồng thời nhấn mạnh rằng ba yếu tố này tạo thành một stack được kết nối theo chiều dọc
- Mục tiêu của OpenAI là một dịch vụ đăng ký AI cá nhân, tích hợp theo chiều dọc giữa nghiên cứu, hạ tầng và sản phẩm tiêu dùng để đồng thời theo đuổi phát triển AGI và ứng dụng thực tế
- Ý đồ chiến lược của việc ra mắt Sora không chỉ là tung ra một sản phẩm tạo video, mà còn là giúp xã hội chuẩn bị cho sự xuất hiện của các mô hình video mạnh mẽ, đồng thời thúc đẩy nghiên cứu AGI thông qua phát triển world model
- Với GPT-5, kỷ nguyên nhà khoa học AI đang đến, và đã xuất hiện những ví dụ ban đầu về việc mô hình thực sự thực hiện khám phá khoa học; ông dự đoán trong vòng 2 năm tới sẽ có những khám phá khoa học quan trọng
- Ông đưa ra cái nhìn lạc quan về sự hội tụ giữa năng lượng và AI, khả năng áp dụng nguyên tắc fair use cho bản quyền, và việc AGI sẽ đến một cách dần dần hơn dự kiến để xã hội có thời gian thích nghi; đồng thời đánh giá rằng kỷ nguyên AI tăng tốc tiến bộ khoa học đã bắt đầu
Tầm nhìn và cấu trúc của OpenAI
- OpenAI được cấu thành từ ba trụ cột: dịch vụ đăng ký AI cho người dùng, hạ tầng quy mô lớn và viện nghiên cứu
- Mục tiêu là thông qua AI cá nhân hóa để hiểu ngữ cảnh của người dùng và cung cấp dịch vụ thuê bao đóng vai trò trợ lý cá nhân thực thụ
- Phần lớn mọi người sẽ có một gói AI cá nhân, và một số người có thể dùng nhiều gói
- Người dùng sẽ đăng nhập vào nhiều dịch vụ và sử dụng AI thông qua thiết bị chuyên dụng
- Mục tiêu là AI dần hiểu người dùng và trở nên cực kỳ hữu ích
- Hạ tầng là yếu tố thiết yếu để hỗ trợ phát triển AGI và cung cấp dịch vụ
- Hiện tại chưa có kế hoạch bán hạ tầng thô cho các công ty khác
- Tuy nhiên vẫn để ngỏ khả năng phải cân nhắc mục đích sử dụng khác vì quy mô quá lớn
- Đang xây dựng data center lớn nhất trong lịch sử loài người, hay chính xác hơn là dự án hạ tầng lớn nhất trong lịch sử
- Ban đầu ông hoài nghi về tích hợp dọc, nhưng nay đã chuyển sang quan điểm rằng không thể hiện thực hóa AGI nếu không có tích hợp dọc
- Ông đã trải qua sự chuyển đổi từ góc nhìn nhà đầu tư sang góc nhìn người vận hành
- Lý thuyết cho rằng nền kinh tế hiệu quả và doanh nghiệp có thể làm tốt một việc không áp dụng được với OpenAI
- Câu chuyện của OpenAI đã phát triển theo hướng phải làm nhiều thứ hơn dự kiến để hoàn thành sứ mệnh
- Ông đánh giá iPhone là sản phẩm đáng kinh ngạc nhất mà ngành công nghệ từng tạo ra, và xem đó là ví dụ của tích hợp dọc ở mức cực độ
- Cần một cấu trúc stack theo chiều dọc trong đó nghiên cứu giúp tạo ra sản phẩm tuyệt vời, còn hạ tầng giúp nghiên cứu trở nên khả thi
Ý đồ chiến lược của việc ra mắt Sora
- Bề ngoài Sora có thể trông như không liên quan đến AGI, nhưng ông cho rằng xây dựng world model là điều quan trọng đối với AGI
- Cũng như ChatGPT đã giúp xã hội chuẩn bị cho AGI, Sora cũng đóng vai trò giúp xã hội thích nghi với tác động thực tế của video do AI tạo ra
- Video có độ cộng hưởng cảm xúc lớn hơn nhiều so với văn bản, nên điều quan trọng là xã hội phải hiểu điều này
- Sớm thôi sẽ xuất hiện các mô hình video đáng kinh ngạc có thể tạo deepfake hoặc hiển thị bất cứ điều gì người ta muốn
- AI không chỉ phải hiệu quả mà còn phải mang lại sự vui vẻ và thú vị
- Không phải phần lớn tài nguyên tính toán đều đổ vào đây, nhưng xét theo quy mô tuyệt đối thì lượng tài nguyên投入 vẫn rất lớn
- Sora mới đang phát triển theo hướng thú vị với việc bổ sung các tính năng mạng xã hội
- Ông nhấn mạnh rằng xã hội và công nghệ phải cùng tiến hóa, và cần có quá trình thử nghiệm, thích nghi trước khi AI thực sự xuất hiện rộng khắp
Sự xuất hiện của nhà khoa học AI
- Thông qua GPT-5, đã xuất hiện các ví dụ ban đầu về việc AI thực hiện khám phá khoa học
- Những phát hiện toán học mới, các đóng góp nhỏ trong nghiên cứu vật lý và sinh học
- Trong 2 năm tới, ông kỳ vọng các mô hình sẽ làm khoa học ở quy mô lớn hơn và tạo ra các khám phá quan trọng
- Sam Altman cho rằng một tiêu chuẩn tương tự Turing test chính là khả năng AI có thể làm khoa học
- Điều này sẽ tạo ra thay đổi thực sự cho thế giới
- Tiến bộ khoa học là yếu tố quan trọng nhất về dài hạn để làm cho thế giới tốt đẹp hơn
- Turing test về cơ bản đã bị vượt qua, nhưng thế giới không thay đổi lớn đến mức không tưởng
- AGI cũng sẽ đến theo cách tương tự, nhưng điểm kỳ dị sẽ không thực sự xảy ra, và sự thay đổi sẽ diễn ra dần dần hơn dự đoán
- Ngay cả khi nghiên cứu được đẩy điên cuồng, xã hội vẫn sẽ học cách thích nghi nhanh hơn người ta nghĩ
- Con người và xã hội có khả năng thích nghi tốt hơn rất nhiều so với tưởng tượng
- Họ sẽ cập nhật nhận thức rằng AGI đang đến, chấp nhận nó và tìm được sự bình ổn
- Mọi thứ sẽ liên tục hơn rất nhiều so với dự báo
Sự tiến hóa của giao diện AI-con người
- Các mô hình hiện đã đạt mức rất cao ở khía cạnh đối thoại chatbot cơ bản
- Tuy nhiên vẫn chưa thể thực hiện các yêu cầu như "hãy chữa khỏi ung thư"
- Phong cách giao diện văn bản vẫn còn rất nhiều dư địa để phát triển
- Tương lai sẽ mở rộng sang một thế giới nơi video render theo thời gian thực trở thành giao diện
- AI nhận biết môi trường xung quanh và chỉ hiển thị thông tin khi cần, dưới dạng thiết bị ambient luôn nhận biết ngữ cảnh
- Thay vì gửi thông báo tin nhắn một cách bừa bãi, AI sẽ hiểu ngữ cảnh và cung cấp thông tin vào đúng thời điểm
- Về dài hạn, giao diện sẽ tiến hóa thành AI hiểu người dùng và chủ động quyết định kiểu hội thoại cá nhân hóa trước
- Tầm quan trọng của cá nhân hóa người dùng
- Việc hàng tỷ người cùng trò chuyện với một bộ não giống hệt nhau là điều kỳ lạ
- Cách người dùng muốn AI hành xử khác nhau rất nhiều
- ChatGPT sẽ phát triển theo hướng phỏng vấn người dùng, nắm bắt sở thích và tự động điều chỉnh
Hạ tầng, hợp tác và năng lượng
- OpenAI đang thúc đẩy mở rộng hạ tầng quy mô lớn, hợp tác với AMD, NVIDIA, Oracle và các bên khác
- Vì lý do tồn tại của OpenAI là xây dựng AGI, nghiên cứu có mức ưu tiên cao hơn nên GPU được phân bổ cho nghiên cứu trước sản phẩm
- Chỉ có ngoại lệ trong những trường hợp đặc biệt như khi một tính năng mới lan truyền mạnh
- Mục tiêu của việc xây dựng năng lực quy mô lớn là để không còn phải đưa ra những quyết định đau đớn như vậy
- Văn hóa nghiên cứu tốt giống như vận hành một công ty đầu tư giai đoạn đầu
- Đặt cược vào nhà sáng lập và hỗ trợ họ
- Đây là cách tiếp cận khác với việc điều hành một công ty sản phẩm
- Về năng lượng, ông nhấn mạnh rằng nguồn năng lượng dồi dào và giá rẻ chính là chìa khóa nâng cao chất lượng sống của nhân loại
- Trong ngắn hạn, khí tự nhiên sẽ đóng vai trò lớn; về dài hạn, điện mặt trời + lưu trữ và điện hạt nhân tiên tiến (SMR, nhiệt hạch) sẽ trở thành xu hướng chủ đạo
- Việc nới lỏng quy định với điện hạt nhân là điều thiết yếu, và nếu giá giảm mạnh thì tốc độ chuyển đổi cũng sẽ rất nhanh
Đánh giá năng lực mô hình
- Điểm benchmark tĩnh đang dần mất sức hấp dẫn và bị game hóa nghiêm trọng
- Khám phá khoa học sẽ trở thành một chỉ số đánh giá hữu ích trong thời gian dài
- Doanh thu cũng được xem là một chỉ số đánh giá thú vị
Góc nhìn về an toàn AI và quy định
- Việc công nghệ hiện chưa tạo ra những rủi ro thật sự đáng sợ và khổng lồ không có nghĩa là tương lai cũng sẽ như vậy
- Ông dự đoán sẽ có một số khoảnh khắc rất kỳ quặc hoặc đáng sợ
- Cũng như các công nghệ trước đây, sẽ có một số điều thực sự tồi tệ xảy ra
- Ông thừa nhận rằng công nghệ AI rồi sẽ tất yếu đối mặt với những thời điểm nguy hiểm, và cần xây dựng các cơ chế an toàn xã hội
- Vì phần lớn quy định có thể mang lại nhiều mặt trái, ông đề xuất chỉ áp dụng quy định hạn chế với các mô hình siêu mạnh
- Khi mô hình thực sự sở hữu năng lực siêu nhân ở mức cực cao, thì những mô hình đó và chỉ những mô hình đó mới đáng để trải qua kiểm thử an toàn rất thận trọng
- Ông hy vọng gánh nặng quy định sẽ không đổ lên mọi điều tốt đẹp mà các mô hình kém mạnh hơn có thể làm được
- Một cuộc siết chặt toàn diện kiểu châu Âu sẽ là điều rất tệ
- Vì Trung Quốc sẽ không chịu những ràng buộc như vậy, nên nếu Mỹ tụt lại trong AI thì đó sẽ là rủi ro rất lớn với thế giới
- Quy định quá mức có thể làm gia tăng rủi ro toàn cầu
Bản quyền, open source và tương lai nội dung
- Với dữ liệu huấn luyện, ông dự đoán "học là fair use" nhiều khả năng sẽ được công nhận
- Tuy vậy, việc tạo nội dung dựa trên nhân vật, phong cách hay IP sẽ cần những mô hình thương mại mới
- Điều này tương tự việc một nhà văn có thể đọc tiểu thuyết để lấy cảm hứng nhưng không thể sao chép nguyên tác
- Một số bên nắm quyền thậm chí phàn nàn rằng “nhân vật của tôi không xuất hiện đủ nhiều”, cho thấy cấu trúc hợp tác nội dung đang được tái thiết
- Mô hình open source gpt-oss được đánh giá tích cực, đồng thời ông cũng nhắc đến sự cần thiết phải kiềm chế đà lan rộng mang tính độc quyền của các mô hình Trung Quốc
Sự hội tụ giữa năng lượng và AI
- Hai mối quan tâm lớn là AI và năng lượng đang hội tụ thành một
- Nhìn lại lịch sử, yếu tố có tác động lớn nhất đến việc nâng cao chất lượng sống của con người chính là năng lượng rẻ hơn và dồi dào hơn
- Vì thế, đẩy mạnh năng lượng hơn nữa là một ý tưởng tốt
- Trong ngắn hạn, khí tự nhiên được dự báo sẽ chiếm phần lớn công suất điện nền mới ròng của Mỹ
- Về dài hạn, điện mặt trời + lưu trữ và điện hạt nhân sẽ là các nguồn năng lượng chi phối
- Bao gồm điện hạt nhân tiên tiến như SMR và nhiệt hạch
- Nếu điện hạt nhân rẻ vượt trội về kinh tế so với mọi lựa chọn khác, quá trình chuyển đổi sẽ diễn ra nhanh chóng
- Trong lịch sử, khi xuất hiện một nguồn năng lượng rẻ hơn nhiều, thế giới đã dịch chuyển rất nhanh sang nó
- Điện hạt nhân nên trở thành dạng năng lượng rẻ nhất trên Trái Đất, hay ở bất kỳ đâu
Kiếm tiền và niềm tin người dùng
- Chi phí tạo video bằng Sora cao nên cần mô hình kiếm tiền mới
- Đã xuất hiện những kiểu sử dụng ngoài dự đoán, như mọi người tạo meme vui về bản thân và bạn bè trong chat nhóm
- Cần những cách kiếm tiền khác cho những người dùng hàng trăm lần mỗi ngày
- Chi phí GPU cao nên sẽ cần mô hình pay-per-generation
- Những giả định truyền thống về sáng tạo nội dung đang thay đổi
- Mô hình truyền thống là 1% tạo nội dung, 10% bình luận, 100% xem
- Thực ra nhiều người muốn tạo nội dung hơn rất nhiều, chỉ là trước đây điều đó khó
- Ông cởi mở với quảng cáo nhưng niềm tin là yếu tố cốt lõi
- Chỉ có thể làm điều đó trong phạm vi không làm tổn hại niềm tin của người dùng
- Quảng cáo trên Instagram là ví dụ tốt về việc tạo ra giá trị ròng (khám phá sản phẩm trước đây chưa biết)
- Không được phá vỡ mối quan hệ tin cậy cao giữa ChatGPT và người dùng
- Nếu với câu hỏi "Nên mua máy pha cà phê nào?" mà AI đề xuất sản phẩm trả tiền thay vì sản phẩm tốt nhất, thì niềm tin sẽ mất đi
Nhìn lại OpenAI thời kỳ đầu
- OpenAI thời kỳ đầu thiên về nghiên cứu hơn kinh doanh, nhưng với vai trò CEO, điều thay đổi lớn nhất là ông học được sự phức tạp về vận hành và tâm lý tổ chức
- Những năm đầu là quãng thời gian nghề nghiệp vui nhất, khi ông cùng những người thông minh nhất vận hành một viện nghiên cứu và thực hiện công việc mang tính lịch sử
- Sau khi ChatGPT ra mắt, cuộc sống của ông đảo lộn hoàn toàn. Gần 3 năm đã trôi qua, và theo thời gian thì mọi thứ ngày càng điên hơn một chút, nhưng ông đã quen dần
- Sự chuyển đổi từ nhà đầu tư sang CEO
- Ban đầu ông không hề có sự phù hợp tự nhiên với việc điều hành công ty
- Từ tư duy đưa lời khuyên cho công ty với tư cách nhà đầu tư, ông dần hiểu rằng mình thực sự phải là người vận hành công ty
- Theo thời gian, ông học được rất nhiều về những gì cần thiết để điều hành tổ chức
Lời khuyên cho tương lai
Thế hệ công ty khổng lồ tiếp theo sẽ không xuất hiện bằng cách bắt chước OpenAI, mà sẽ nổi lên trên nền tảng công nghệ do OpenAI tạo ra
Những nỗ lực dự đoán ngành công nghiệp tương lai phần lớn đều sai; câu trả lời duy nhất là trực tiếp xây dựng, thử nghiệm và học hỏi
- Học được sự khiêm tốn sâu sắc: dự đoán gần như luôn sai
- Ngồi ghế bành làm quarterback thì nghe có vẻ thông minh, nhưng rốt cuộc cũng gần giống những gì mọi người khác đang nói
- Rất khó để có được niềm tin đúng đắn
- Cách duy nhất để biết là dấn sâu vào tuyến đầu khám phá ý tưởng
- Trò chuyện với nhiều người, tạo ra sản phẩm, nghịch công nghệ và thực sự bước ra thế giới
- Mức độ sẵn sàng hỗ trợ những thứ như vậy từ phía nhà đầu tư thấp đến mức đáng thất vọng
- Phần lớn công ty chỉ đang chạy theo xu hướng hiện tại
- Ông hy vọng mọi người sẽ thử những điều mới
Tầm nhìn về thế giới sau AGI
- Altman định nghĩa AI là động lực cốt lõi dẫn dắt tiến bộ liên tục trong khoa học, năng lượng và toàn bộ nền kinh tế
- AI sẽ bị cuốn hút vào việc nghiên cứu và quan sát mọi thứ khác: ông kỳ vọng nó sẽ quan tâm đến toàn bộ thuật toán của con người
- Nếu OpenAI hoàn thành sứ mệnh, AGI quy mô lớn với chi phí gần như bằng 0 sẽ khả thi
- Dù rất khó đưa ra dự đoán cụ thể, con người vẫn phải khám phá bằng cách chơi với công nghệ, trò chuyện với nhau và bước ra thế giới
- AGI sẽ không thấm vào xã hội như một cú nổ thay đổi đột ngột, mà như một quá trình tiến hóa liên tục, và nhân loại đang bước vào kỷ nguyên học hỏi chung không ngừng cùng AI
Chưa có bình luận nào.