AlphaProteo: AI tạo ra các protein mới cho nghiên cứu sinh học và sức khỏe

(deepmind.google)

1 điểm bởi GN⁺ 2024-09-06 | Chưa có bình luận nào. | Chia sẻ qua WhatsApp

Tương tác protein chi phối các quá trình sinh học cốt lõi như tăng trưởng tế bào và phản ứng miễn dịch; AlphaProteo là hệ thống AI đầu tiên của Google DeepMind nhằm tự động hóa việc thiết kế các chất gắn kết mới để điều khiển các tương tác này
Khi nhập cấu trúc protein mục tiêu và vị trí gắn kết mong muốn, hệ thống tạo ra các protein ứng viên dựa trên các mẫu đã học từ Protein Data Bank và hơn 100 triệu cấu trúc do AlphaFold dự đoán
Trong các thí nghiệm trên 7 protein mục tiêu, hệ thống đạt tỷ lệ thành công và ái lực gắn kết cao hơn phương pháp tốt nhất hiện có, và ở một số mục tiêu cho kết quả mạnh hơn cả các chất gắn kết đã được tối ưu hóa trước đó
Với BHRF1, 88% ứng viên đã gắn kết trong thử nghiệm phòng thí nghiệm; đây cũng được giới thiệu là trường hợp đầu tiên một công cụ AI thiết kế protein gắn kết thành công với VEGF-A
Có tiềm năng lớn trong việc rút ngắn thời gian thí nghiệm ban đầu cho các chất gắn kết protein, nhưng vẫn còn các mục tiêu khó như thất bại với TNFɑ, nên cần thêm xác minh và cải tiến công nghệ sinh học trước khi ứng dụng thực tế

Thiết kế chất gắn kết protein mà AlphaProteo nhắm tới

Các quá trình sinh học, từ tăng trưởng tế bào đến phản ứng miễn dịch, phụ thuộc nhiều vào tương tác giữa các protein
Các công cụ dự đoán cấu trúc protein như AlphaFold đã mở rộng hiểu biết về tương tác protein, nhưng không tạo ra protein mới để trực tiếp điều khiển các tương tác đó
AlphaProteo là hệ thống AI của Google DeepMind dùng để thiết kế các chất gắn kết protein mới có khả năng gắn mạnh vào phân tử mục tiêu
Các chất gắn kết này có thể được ứng dụng trong nhiều lĩnh vực nghiên cứu
- Phát triển thuốc mới
- Chụp ảnh tế bào và mô
- Hiểu và chẩn đoán bệnh
- Khả năng kháng sâu hại của cây trồng

Dữ liệu huấn luyện và cách tạo sinh

AlphaProteo được huấn luyện trên lượng lớn dữ liệu protein từ Protein Data Bank và hơn 100 triệu cấu trúc do AlphaFold dự đoán
Đầu vào là cấu trúc của phân tử mục tiêu và tập hợp các vị trí gắn kết ưu tiên trên phân tử đó
Đầu ra là protein ứng viên được thiết kế để gắn vào các vị trí đã chỉ định
Việc thiết kế các chất gắn kết protein mạnh bằng phương pháp hiện có tốn nhiều thời gian và cần nhiều vòng thí nghiệm trong phòng lab cùng tối ưu hóa ái lực gắn kết

Kết quả thí nghiệm trên 7 protein mục tiêu

AlphaProteo đã thiết kế các chất gắn kết cho nhiều protein mục tiêu liên quan đến nhiễm trùng, ung thư, viêm và bệnh tự miễn
- Protein virus tham gia vào nhiễm trùng: BHRF1, SC2RBD là receptor-binding domain của spike protein SARS-CoV-2
- Protein liên quan đến ung thư, viêm và bệnh tự miễn: IL-7Rɑ, PD-L1, TrkA, IL-17A, VEGF-A
Các protein ứng viên được tạo in silico cho 7 mục tiêu đã gắn kết mạnh với protein dự định trong thử nghiệm thực nghiệm
Xét trên toàn bộ thử nghiệm, hệ thống có tỷ lệ thành công thực nghiệm cao hơn phương pháp thiết kế tốt nhất hiện có, và ái lực gắn kết được cải thiện 3~300 lần
Với BHRF1, 88% phân tử ứng viên đã gắn kết thành công trong thử nghiệm tại Google DeepMind Wet Lab
Trên các mục tiêu đã kiểm thử, các chất gắn kết của AlphaProteo trung bình gắn kết mạnh hơn 10 lần so với phương pháp thiết kế tốt nhất hiện có
Ở mục tiêu TrkA, chất gắn kết của AlphaProteo mạnh hơn chất gắn kết được thiết kế trước đó sau nhiều vòng tối ưu hóa thực nghiệm
Đây là lần đầu tiên một công cụ AI thiết kế được protein gắn kết thành công với VEGF-A

Xác minh bên ngoài và chức năng sinh học

Ngoài xác minh in silico và thử nghiệm wet lab nội bộ, Google DeepMind đã xác minh các chất gắn kết với các nhóm nghiên cứu tại Francis Crick Institute
Việc xác minh có sự tham gia của các nhóm nghiên cứu Peter Cherepanov, Katie Bentley, David LV Bauer
Họ đã thí nghiệm sâu hơn với một số ứng viên mạnh trong các chất gắn kết SC2RBD và VEGF-A
Tương tác gắn kết được xác nhận là tương tự như dự đoán của AlphaProteo
Một số chất gắn kết SC2RBD được cho thấy có khả năng ngăn SARS-CoV-2 và một số biến thể lây nhiễm vào tế bào

Thất bại với TNFɑ và các thách thức còn lại

AlphaProteo không thiết kế được chất gắn kết thành công cho mục tiêu thứ 8 là TNFɑ
TNFɑ là protein liên quan đến các bệnh tự miễn như viêm khớp dạng thấp
Theo phân tích tính toán, TNFɑ được đánh giá là mục tiêu rất khó cho thiết kế chất gắn kết và được chọn để thử thách AlphaProteo một cách nghiêm ngặt
Đạt được gắn kết mạnh thường chỉ là bước đầu tiên trong quá trình thiết kế protein hữu ích cho các ứng dụng thực tiễn
Trong quá trình nghiên cứu và phát triển, vẫn còn các rào cản công nghệ sinh học

Phát triển có trách nhiệm và ứng dụng trong tương lai

Thiết kế protein có tiềm năng trong nhiều lĩnh vực khoa học, từ hiểu nguyên nhân gây bệnh, tăng tốc phát triển xét nghiệm chẩn đoán khi virus bùng phát, hỗ trợ quy trình sản xuất bền vững, đến làm sạch chất ô nhiễm môi trường
Google DeepMind đang hợp tác với các chuyên gia bên ngoài để cân nhắc rủi ro an toàn sinh học và xây dựng cách chia sẻ theo từng giai đoạn
Công việc liên quan cũng gắn với các nỗ lực phát triển thực hành tốt nhất của cộng đồng, bao gồm AI Bio Forum mới của NTI
Trong tương lai, họ có kế hoạch cùng cộng đồng khoa học ứng dụng AlphaProteo cho các vấn đề sinh học quan trọng và tìm hiểu các giới hạn của hệ thống
Isomorphic Labs cũng đang khám phá ứng dụng AlphaProteo trong thiết kế thuốc mới
Google DeepMind muốn cải thiện tỷ lệ thành công và ái lực của thuật toán AlphaProteo, mở rộng phạm vi các bài toán thiết kế mà hệ thống có thể xử lý, đồng thời phát triển các công cụ thiết kế protein toàn diện hơn cùng các nhà nghiên cứu về machine learning, sinh học cấu trúc và hóa sinh

AlphaProteo: AI tạo ra các protein mới cho nghiên cứu sinh học và sức khỏe

Thiết kế chất gắn kết protein mà AlphaProteo nhắm tới

Dữ liệu huấn luyện và cách tạo sinh

Kết quả thí nghiệm trên 7 protein mục tiêu

Xác minh bên ngoài và chức năng sinh học

Thất bại với TNFɑ và các thách thức còn lại

Phát triển có trách nhiệm và ứng dụng trong tương lai

Bài viết liên quan

Chưa có bình luận nào.