5 lĩnh vực AI nơi startup có cơ hội

xguru · 2023-10-30T10:38:01+09:00

Nội dung do Ahmad Khan, Trưởng chiến lược AI/ML của Snowflake, trình bày Tạo doanh thu từ việc khai thác dữ liệu 'phi cấu trúc' Hơn 80% dữ liệu doanh nghiệp là 'dữ liệu phi cấu trúc' như tài liệu Word, hình ảnh, tệp âm thanh/video Tuy nhiên, phần lớn doanh nghiệp hầu như không tận dụng những thông tin này, đồng nghĩa với việc họ đang sử dụng chưa đến 20% lượng dữ liệu sẵn có khi đưa ra quyết định kinh doanh Nếu đặt lượng dữ liệu phi cấu trúc này bên cạnh các mô hình ngôn ngữ lớn để xây dựng chatbot hiệu quả, có thể giúp diễn giải và phân tích khối lượng thông tin khổng lồ hiện đang bị khai thác rất ít Tiềm năng xây dựng các mô hình phù hợp với từng ngành cụ thể của các doanh nghiệp này là gần như vô hạn Quyền riêng tư và bảo mật Các doanh nghiệp ngày càng lo ngại dữ liệu của họ có thể bị dùng để huấn luyện các mô hình mà công ty khác, kể cả đối thủ cạnh tranh, có thể sử dụng Kết quả là nhiều doanh nghiệp chấp nhận những sản phẩm kém hơn nhưng bảo mật tốt hơn, từ đó tạo ra thị trường cho các sản phẩm an toàn hơn Ví dụ, Llama 2 không phải là mô hình ngôn ngữ lớn mạnh nhất, nhưng khách hàng vẫn chọn Llama 2 thay vì các mô hình ít khả năng kiểm soát hơn như Chat GPT Nhiều doanh nghiệp xem tính độc nhất của dữ liệu là lợi thế cạnh tranh, nên muốn tránh tình huống dữ liệu bị công khai trên Internet công cộng Giành lợi thế cạnh tranh bằng cách mang lại trải nghiệm người dùng vượt trội Startup nên cạnh tranh với quy mô của các tập đoàn lớn bằng cách nào? Gợi ý là hãy tập trung vào việc tạo ra trải nghiệm người dùng thú vị, chẳng hạn xây dựng giao diện người dùng hấp dẫn Đây cũng là cách tiếp cận mà Snowflake đã chọn Đặc biệt, vì phần lớn dịch vụ của họ không thể cạnh tranh trực diện với các nhà cung cấp đám mây như Amazon Web Services, họ tập trung vào việc tạo ra trải nghiệm người dùng xuất sắc để biện minh cho mức giá cao Tập trung vào chiều dọc ngành Một cách khác để David đánh bại Goliath là tập trung vào các ngành cụ thể như sản xuất, tài chính, y tế và giải trí thay vì ứng dụng đa dụng Ông khuyên rằng: "Hãy tìm hiểu các doanh nghiệp trong ngành đó đang cần gì, rồi cung cấp dịch vụ đáp ứng đúng những nhu cầu đó" Ví dụ, Google có nhiều khả năng sẽ phát triển mô hình ngôn ngữ lớn cho y tế, nhưng cũng có khả năng sẽ không đi quá sâu, vì vậy đây là cơ hội để các công ty nhỏ xây dựng mô hình đó Nhu cầu về data attribution đang ngày càng tăng Có khả năng xuất hiện các mô hình mới theo đó tài liệu có bản quyền được theo dõi và tác giả gốc được trả thù lao, tạo động lực để họ phát triển thêm nhiều tư liệu hơn Khan đưa ra nhiều ví dụ về các trường hợp không thể dùng mô hình mã nguồn mở vì lý do pháp lý, trong đó có một hãng phim không muốn dùng mô hình mã nguồn mở cho việc tạo ảnh Hãng phim này trả phí bản quyền và chi phí để dùng mô hình được huấn luyện trên dữ liệu của Getty Images Trong tương lai, thị trường cho các mô hình tương tự sử dụng bộ dữ liệu attribution sẽ ngày càng mở rộng

(lsvp.com)

20 điểm bởi xguru 2023-10-30 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Nội dung do Ahmad Khan, Trưởng chiến lược AI/ML của Snowflake, trình bày

Tạo doanh thu từ việc khai thác dữ liệu 'phi cấu trúc'

Hơn 80% dữ liệu doanh nghiệp là 'dữ liệu phi cấu trúc' như tài liệu Word, hình ảnh, tệp âm thanh/video
Tuy nhiên, phần lớn doanh nghiệp hầu như không tận dụng những thông tin này, đồng nghĩa với việc họ đang sử dụng chưa đến 20% lượng dữ liệu sẵn có khi đưa ra quyết định kinh doanh
Nếu đặt lượng dữ liệu phi cấu trúc này bên cạnh các mô hình ngôn ngữ lớn để xây dựng chatbot hiệu quả, có thể giúp diễn giải và phân tích khối lượng thông tin khổng lồ hiện đang bị khai thác rất ít
Tiềm năng xây dựng các mô hình phù hợp với từng ngành cụ thể của các doanh nghiệp này là gần như vô hạn

Quyền riêng tư và bảo mật

Các doanh nghiệp ngày càng lo ngại dữ liệu của họ có thể bị dùng để huấn luyện các mô hình mà công ty khác, kể cả đối thủ cạnh tranh, có thể sử dụng
Kết quả là nhiều doanh nghiệp chấp nhận những sản phẩm kém hơn nhưng bảo mật tốt hơn, từ đó tạo ra thị trường cho các sản phẩm an toàn hơn
Ví dụ, Llama 2 không phải là mô hình ngôn ngữ lớn mạnh nhất, nhưng khách hàng vẫn chọn Llama 2 thay vì các mô hình ít khả năng kiểm soát hơn như Chat GPT
Nhiều doanh nghiệp xem tính độc nhất của dữ liệu là lợi thế cạnh tranh, nên muốn tránh tình huống dữ liệu bị công khai trên Internet công cộng

Giành lợi thế cạnh tranh bằng cách mang lại trải nghiệm người dùng vượt trội

Startup nên cạnh tranh với quy mô của các tập đoàn lớn bằng cách nào?
Gợi ý là hãy tập trung vào việc tạo ra trải nghiệm người dùng thú vị, chẳng hạn xây dựng giao diện người dùng hấp dẫn
Đây cũng là cách tiếp cận mà Snowflake đã chọn
Đặc biệt, vì phần lớn dịch vụ của họ không thể cạnh tranh trực diện với các nhà cung cấp đám mây như Amazon Web Services, họ tập trung vào việc tạo ra trải nghiệm người dùng xuất sắc để biện minh cho mức giá cao

Tập trung vào chiều dọc ngành

Một cách khác để David đánh bại Goliath là tập trung vào các ngành cụ thể như sản xuất, tài chính, y tế và giải trí thay vì ứng dụng đa dụng
Ông khuyên rằng: "Hãy tìm hiểu các doanh nghiệp trong ngành đó đang cần gì, rồi cung cấp dịch vụ đáp ứng đúng những nhu cầu đó"
Ví dụ, Google có nhiều khả năng sẽ phát triển mô hình ngôn ngữ lớn cho y tế, nhưng cũng có khả năng sẽ không đi quá sâu, vì vậy đây là cơ hội để các công ty nhỏ xây dựng mô hình đó

Nhu cầu về data attribution đang ngày càng tăng

Có khả năng xuất hiện các mô hình mới theo đó tài liệu có bản quyền được theo dõi và tác giả gốc được trả thù lao, tạo động lực để họ phát triển thêm nhiều tư liệu hơn
Khan đưa ra nhiều ví dụ về các trường hợp không thể dùng mô hình mã nguồn mở vì lý do pháp lý, trong đó có một hãng phim không muốn dùng mô hình mã nguồn mở cho việc tạo ảnh
Hãng phim này trả phí bản quyền và chi phí để dùng mô hình được huấn luyện trên dữ liệu của Getty Images
Trong tương lai, thị trường cho các mô hình tương tự sử dụng bộ dữ liệu attribution sẽ ngày càng mở rộng