- Tương tác protein chi phối các quá trình sinh học cốt lõi như tăng trưởng tế bào và phản ứng miễn dịch; AlphaProteo là hệ thống AI đầu tiên của Google DeepMind nhằm tự động hóa việc thiết kế các chất gắn kết mới để điều khiển các tương tác này
- Khi nhập cấu trúc protein mục tiêu và vị trí gắn kết mong muốn, hệ thống tạo ra các protein ứng viên dựa trên các mẫu đã học từ Protein Data Bank và hơn 100 triệu cấu trúc do AlphaFold dự đoán
- Trong các thí nghiệm trên 7 protein mục tiêu, hệ thống đạt tỷ lệ thành công và ái lực gắn kết cao hơn phương pháp tốt nhất hiện có, và ở một số mục tiêu cho kết quả mạnh hơn cả các chất gắn kết đã được tối ưu hóa trước đó
- Với BHRF1, 88% ứng viên đã gắn kết trong thử nghiệm phòng thí nghiệm; đây cũng được giới thiệu là trường hợp đầu tiên một công cụ AI thiết kế protein gắn kết thành công với VEGF-A
- Có tiềm năng lớn trong việc rút ngắn thời gian thí nghiệm ban đầu cho các chất gắn kết protein, nhưng vẫn còn các mục tiêu khó như thất bại với TNFɑ, nên cần thêm xác minh và cải tiến công nghệ sinh học trước khi ứng dụng thực tế
Thiết kế chất gắn kết protein mà AlphaProteo nhắm tới
- Các quá trình sinh học, từ tăng trưởng tế bào đến phản ứng miễn dịch, phụ thuộc nhiều vào tương tác giữa các protein
- Các công cụ dự đoán cấu trúc protein như AlphaFold đã mở rộng hiểu biết về tương tác protein, nhưng không tạo ra protein mới để trực tiếp điều khiển các tương tác đó
- AlphaProteo là hệ thống AI của Google DeepMind dùng để thiết kế các chất gắn kết protein mới có khả năng gắn mạnh vào phân tử mục tiêu
- Các chất gắn kết này có thể được ứng dụng trong nhiều lĩnh vực nghiên cứu
- Phát triển thuốc mới
- Chụp ảnh tế bào và mô
- Hiểu và chẩn đoán bệnh
- Khả năng kháng sâu hại của cây trồng
Dữ liệu huấn luyện và cách tạo sinh
- AlphaProteo được huấn luyện trên lượng lớn dữ liệu protein từ Protein Data Bank và hơn 100 triệu cấu trúc do AlphaFold dự đoán
- Đầu vào là cấu trúc của phân tử mục tiêu và tập hợp các vị trí gắn kết ưu tiên trên phân tử đó
- Đầu ra là protein ứng viên được thiết kế để gắn vào các vị trí đã chỉ định
- Việc thiết kế các chất gắn kết protein mạnh bằng phương pháp hiện có tốn nhiều thời gian và cần nhiều vòng thí nghiệm trong phòng lab cùng tối ưu hóa ái lực gắn kết
Kết quả thí nghiệm trên 7 protein mục tiêu
- AlphaProteo đã thiết kế các chất gắn kết cho nhiều protein mục tiêu liên quan đến nhiễm trùng, ung thư, viêm và bệnh tự miễn
- Các protein ứng viên được tạo in silico cho 7 mục tiêu đã gắn kết mạnh với protein dự định trong thử nghiệm thực nghiệm
- Xét trên toàn bộ thử nghiệm, hệ thống có tỷ lệ thành công thực nghiệm cao hơn phương pháp thiết kế tốt nhất hiện có, và ái lực gắn kết được cải thiện 3~300 lần
- Với BHRF1, 88% phân tử ứng viên đã gắn kết thành công trong thử nghiệm tại Google DeepMind Wet Lab
- Trên các mục tiêu đã kiểm thử, các chất gắn kết của AlphaProteo trung bình gắn kết mạnh hơn 10 lần so với phương pháp thiết kế tốt nhất hiện có
- Ở mục tiêu TrkA, chất gắn kết của AlphaProteo mạnh hơn chất gắn kết được thiết kế trước đó sau nhiều vòng tối ưu hóa thực nghiệm
- Đây là lần đầu tiên một công cụ AI thiết kế được protein gắn kết thành công với VEGF-A
Xác minh bên ngoài và chức năng sinh học
- Ngoài xác minh in silico và thử nghiệm wet lab nội bộ, Google DeepMind đã xác minh các chất gắn kết với các nhóm nghiên cứu tại Francis Crick Institute
- Việc xác minh có sự tham gia của các nhóm nghiên cứu Peter Cherepanov, Katie Bentley, David LV Bauer
- Họ đã thí nghiệm sâu hơn với một số ứng viên mạnh trong các chất gắn kết SC2RBD và VEGF-A
- Tương tác gắn kết được xác nhận là tương tự như dự đoán của AlphaProteo
- Một số chất gắn kết SC2RBD được cho thấy có khả năng ngăn SARS-CoV-2 và một số biến thể lây nhiễm vào tế bào
Thất bại với TNFɑ và các thách thức còn lại
- AlphaProteo không thiết kế được chất gắn kết thành công cho mục tiêu thứ 8 là TNFɑ
- TNFɑ là protein liên quan đến các bệnh tự miễn như viêm khớp dạng thấp
- Theo phân tích tính toán, TNFɑ được đánh giá là mục tiêu rất khó cho thiết kế chất gắn kết và được chọn để thử thách AlphaProteo một cách nghiêm ngặt
- Đạt được gắn kết mạnh thường chỉ là bước đầu tiên trong quá trình thiết kế protein hữu ích cho các ứng dụng thực tiễn
- Trong quá trình nghiên cứu và phát triển, vẫn còn các rào cản công nghệ sinh học
Phát triển có trách nhiệm và ứng dụng trong tương lai
- Thiết kế protein có tiềm năng trong nhiều lĩnh vực khoa học, từ hiểu nguyên nhân gây bệnh, tăng tốc phát triển xét nghiệm chẩn đoán khi virus bùng phát, hỗ trợ quy trình sản xuất bền vững, đến làm sạch chất ô nhiễm môi trường
- Google DeepMind đang hợp tác với các chuyên gia bên ngoài để cân nhắc rủi ro an toàn sinh học và xây dựng cách chia sẻ theo từng giai đoạn
- Công việc liên quan cũng gắn với các nỗ lực phát triển thực hành tốt nhất của cộng đồng, bao gồm AI Bio Forum mới của NTI
- Trong tương lai, họ có kế hoạch cùng cộng đồng khoa học ứng dụng AlphaProteo cho các vấn đề sinh học quan trọng và tìm hiểu các giới hạn của hệ thống
- Isomorphic Labs cũng đang khám phá ứng dụng AlphaProteo trong thiết kế thuốc mới
- Google DeepMind muốn cải thiện tỷ lệ thành công và ái lực của thuật toán AlphaProteo, mở rộng phạm vi các bài toán thiết kế mà hệ thống có thể xử lý, đồng thời phát triển các công cụ thiết kế protein toàn diện hơn cùng các nhà nghiên cứu về machine learning, sinh học cấu trúc và hóa sinh
Chưa có bình luận nào.