ARR-MEDIC CYP3A4: nền tảng giáo dục và nghiên cứu mã nguồn mở để dự đoán tương tác thuốc (DDI)
(github.com/Flamehaven)ARR-MEDIC CYP3A4 là gì?
- Đây là dự án dự đoán khả năng ức chế CYP3A4, enzyme chủ chốt ở gan chịu trách nhiệm chuyển hóa hơn một nửa số thuốc kê đơn lâm sàng, nhằm ước lượng nguy cơ tương tác giữa các thuốc.
- Dự án được công khai dưới dạng mã nguồn mở cho mục đích nghiên cứu và giáo dục, đồng thời cung cấp web demo dễ dùng và pipeline ML có thể mở rộng. Đường cơ sở đạt khoảng 70% độ chính xác, được thiết kế như điểm khởi đầu để học khái niệm và so sánh phương pháp.
Vì sao dự án này được tạo ra?
- Vào cuối tháng 6/2025 có một cuộc thi AI về phát triển thuốc mới. Trong 3 tuần, tác giả đã hoàn thành việc phát triển bằng cách thức trắng đêm đọc hàng loạt bài báo về lĩnh vực y học vốn hoàn toàn xa lạ, đặc biệt là về enzyme CYP3A4.
- Tuy nhiên, do đang sinh sống ở nước ngoài nên cuối cùng lại không thể nộp bài dự thi. Sau một thời gian để đó trong tâm trạng hụt hẫng, tác giả thấy tiếc nên đã bổ sung, nâng cấp và đưa dự án lên mã nguồn mở.
Vì sao đáng chú ý?
- An toàn bệnh nhân & đa dụng thuốc: Việc ức chế CYP3A4 có thể làm tăng nồng độ của một số thuốc lên 2–10 lần, dẫn đến độc tính hoặc thất bại điều trị. Dự án này đóng vai trò như một sân tập để nhận diện sớm các tín hiệu rủi ro đó.
- Vai trò cầu nối: Bắt đầu từ mã nguồn mở, dự án đưa ra lộ trình nâng cấp dần từ RDKit·ML cổ điển sang GNN/Transformer.
Có gì bên trong? (điểm nổi bật)
- Web demo: Trải nghiệm dự đoán trực tiếp trên trình duyệt (chuyển đổi giao diện tiếng Hàn/tiếng Anh, nhập và trực quan hóa SMILES, kèm các hợp chất mẫu).
- API & backend: REST API dựa trên FastAPI (dự đoán đơn/lô, tài liệu OpenAPI), lưu trữ SQLite bất đồng bộ, hỗ trợ Docker.
- Khả năng mở rộng: Dễ tùy biến bằng cách thêm descriptor RDKit, các mô hình như RandomForest/XGBoost, phân tích độ quan trọng của feature, v.v.
- Kiến trúc: Gồm
backend(FastAPI)/frontend(React)/models/data/docs.
Dùng thử nhanh
- Có thể chạy theo cách bạn muốn giữa local/Conda/Docker (khởi động API bằng uvicorn,
docker-compose up -d, v.v.). Sau khi khởi động, kiểm tra đặc tả tạihttp://localhost:8000/docs. - *Cũng có cung cấp demo online (Hugging Face Spaces) để có thể trải nghiệm mà không cần cài đặt.
🚀 Cài đặt nhanh
Linux/macOS
# Clone repository
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource
cd arr-medic-cyp3a4-opensource
# Run automated installer
chmod +x scripts/install.sh
./scripts/install.sh
Windows
# Clone repository
git clone https://github.com/your-org/arr-medic-cyp3a4-opensource
cd arr-medic-cyp3a4-opensource
# Run automated installer
scripts\install.bat
- Conda + RDKit (độ chính xác tốt nhất)
- chỉ pip (chế độ đơn giản hóa)
- Docker (đóng gói container)
Hiệu năng & thông số (chỉ số cho giáo dục/nghiên cứu)
- Độ chính xác: Trên dữ liệu kiểm thử CYP3A4 dựa trên ChEMBL, đạt ~70%, độ nhạy ~75%, độ đặc hiệu ~65% (mốc khởi đầu cho giáo dục và benchmark).
- Hệ thống: Dự đoán 1 mẫu trong <2 giây ngay cả trên một CPU đơn, hướng đến thiết kế gọn nhẹ để xử lý theo lô và đáp ứng nhiều người dùng đồng thời.
Lộ trình
- v1.0 (hiện tại): Đường cơ sở dựa trên luật (~70%).
- v2.0: Mục tiêu ~80–85% với RDKit + RandomForest/XGBoost.
- v3.0: Hướng tới ~85–90% với GNN/Transformer, tăng cường khả năng diễn giải (ví dụ: SHAP).
Giấy phép & lưu ý
- Giấy phép MIT. GitHub
- Không dùng cho mục đích y tế/chẩn đoán: Dự án này dành cho nghiên cứu và giáo dục, không được sử dụng cho quyết định lâm sàng, khám chữa bệnh cho bệnh nhân hoặc nộp hồ sơ quản lý.
Liên kết
- GitHub: Flamehaven/Arr-Medic-CYP3A4
- Demo online: Hugging Face Spaces (có thể chạy demo nhanh)
- Câu chuyện phát triển còn dang dở: My First Attempt at a Medical AI with ELI5 (ghi lại quá trình có thể tạo ra dự án dù không phải chuyên gia y tế)
Tóm tắt một dòng
- Dù không phải công cụ dùng cho lâm sàng thực tế, đây là bộ mã giáo dục và nghiên cứu về y học được tổ chức tốt, phù hợp để học trọn quy trình DDI từ “khái niệm → thử nghiệm → nâng cấp” tại một nơi.
Chưa có bình luận nào.