- Các mô hình AI như CheXNet, được công bố năm 2017, cho thấy độ chính xác cao hơn bác sĩ chẩn đoán hình ảnh con người trong chẩn đoán viêm phổi, nhưng lại không thể tái hiện kết quả đó trong môi trường y tế thực tế
- Dù gần đây hàng trăm mô hình AI chẩn đoán hình ảnh đã được FDA phê duyệt, số vị trí việc làm và mức lương của bác sĩ chẩn đoán hình ảnh tại Mỹ lại đang ở mức cao kỷ lục
- Những giới hạn của AI y tế bao gồm thiếu dữ liệu, khác biệt giữa môi trường thực tế và điều kiện huấn luyện, rào cản về quy định và bảo hiểm, cùng với việc bác sĩ chẩn đoán hình ảnh còn đảm nhiệm nhiều vai trò ngoài chẩn đoán
- Thay vì tự động hóa hoàn toàn, mô hình con người và AI cùng phối hợp đã trở thành tiêu chuẩn của ngành y tế, và ngay cả khi AI phát triển thì nhu cầu lao động bác sĩ chẩn đoán hình ảnh cũng không giảm
- 10 năm đầu tiên của làn sóng phổ biến AI y tế cho thấy một nghịch lý: AI có tiềm năng lớn trong việc nâng cao năng suất, nhưng trên thực tế lại làm tăng nhu cầu lao động của con người
Mở đầu: Sự xuất hiện của AI và những kỳ vọng
- Các mô hình AI như CheXNet xuất hiện năm 2017 đã được huấn luyện trên hơn 100.000 ảnh X-quang ngực và cho thấy kết quả vượt trội hơn chuyên gia con người về độ chính xác trong đọc viêm phổi
- Nhiều công ty như Annalise.ai, Lunit, Aidoc, Qure.ai đã tung ra các hệ thống AI có thể phát hiện hàng trăm bệnh, đồng thời có thể tích hợp vào hệ thống hồ sơ bệnh viện
- Có hơn 700 mô hình AI chẩn đoán hình ảnh được FDA phê duyệt, chiếm 75% tổng số thiết bị AI y tế
- Chẩn đoán hình ảnh từ lâu được đánh giá là lĩnh vực phù hợp nhất để AI thay thế nhờ đầu vào số hóa, nhận diện mẫu, và khả năng đo lường kết quả rõ ràng
- Tuy nhiên trên thực tế, nhu cầu đào tạo bác sĩ chẩn đoán hình ảnh đã lên mức cao nhất từ trước đến nay, còn thu nhập cũng tăng 48% so với năm 2015, cho thấy nhu cầu nhân lực con người đang gia tăng
Những giới hạn của hệ thống AI chẩn đoán hình ảnh
Khác biệt giữa môi trường thực tế và dữ liệu huấn luyện
- Các mô hình AI chẩn đoán hình ảnh thể hiện hiệu năng xuất sắc trên dữ liệu chuẩn hóa và trong những điều kiện cụ thể, nhưng trong môi trường bệnh viện thực tế thì hiệu năng suy giảm do khác biệt dữ liệu giữa các bệnh viện, đặc tính thiết bị chẩn đoán, và sự thiếu đa dạng
- Phần lớn mô hình chỉ đạt độ chính xác cao với một bệnh cụ thể hoặc một loại ảnh cụ thể; trong nhiều trường hợp đa dạng hơn, phải thay phiên áp dụng nhiều mô hình khác nhau, gây bất tiện
- Ngay cả các thuật toán đã được FDA phê duyệt cũng chỉ xử lý một phần của công việc đọc ảnh thực tế, chủ yếu tập trung vào một số bệnh quan trọng như đột quỵ, ung thư vú, ung thư phổi
- Việc thiếu dữ liệu về trẻ em, phụ nữ và các nhóm chủng tộc thiểu số, cùng với các trường hợp bệnh biểu hiện tinh vi hoặc lẫn với bệnh khác, cũng làm giảm năng lực dự đoán
Khoảng cách giữa benchmark và ứng dụng lâm sàng
- Trong các bài kiểm thử benchmark, AI đạt các chỉ số định lượng cao, nhưng trong môi trường lâm sàng thực tế, kết quả của bác sĩ chẩn đoán hình ảnh cùng hệ thống hỗ trợ lại không tốt như kỳ vọng
- Ví dụ, trong lĩnh vực chụp nhũ ảnh, các hệ thống AI hỗ trợ đã nâng độ nhạy khi đọc ảnh nhưng chỉ làm tăng tỷ lệ xét nghiệm bổ sung và sinh thiết không cần thiết, mà không nâng tỷ lệ phát hiện ung thư
- Việc đọc kép bởi một hoặc hai bác sĩ đọc ảnh cùng nhau cho thấy khả năng phát hiện ung thư cao hơn AI hỗ trợ, đồng thời tỷ lệ tái khám không cần thiết cũng thấp hơn
Quy định pháp lý và thể chế làm chậm tốc độ tự động hóa
- FDA phân loại phần mềm chẩn đoán hình ảnh thành công cụ hỗ trợ/phân loại và công cụ tự động hóa hoàn toàn
- Tự động hóa hoàn toàn là rất hiếm, chỉ áp dụng trong một số điều kiện đặc biệt như IDx-DR
- Với các hình ảnh mà AI khó đọc, phần mềm phải tự dừng và chuyển cho nhân viên y tế xử lý
- Yêu cầu pháp lý rất cao, và mỗi lần mô hình được huấn luyện lại hoặc thay đổi cũng cần phê duyệt mới
- Các công ty bảo hiểm cho rằng công cụ tự động hóa có xác suất gây thiệt hại hàng loạt cao hơn nếu xảy ra sai sót, nên có xu hướng không muốn bồi hoàn cho kết quả chẩn đoán chỉ do AI đưa ra
- Về mặt pháp lý, tiêu chuẩn thường là chỉ những bản đọc ảnh do bác sĩ trực tiếp diễn giải và ký xác nhận mới được bảo hiểm chi trả
Vai trò thay đổi của bác sĩ chẩn đoán hình ảnh
- Trên thực tế, bác sĩ chẩn đoán hình ảnh chỉ dành 36% thời gian cho việc diễn giải hình ảnh; phần còn lại được dùng cho tư vấn với bệnh nhân và đồng nghiệp, giám sát xét nghiệm, đào tạo, thay đổi chỉ định điều trị và nhiều công việc khác
- Ngay cả khi thời gian đọc ảnh giảm đi thì cũng không xảy ra sa thải không cần thiết; ngược lại, công việc mới còn tăng lên, kéo theo hiện tượng tổng khối lượng đọc ảnh nói chung tiếp tục tăng
- Ví dụ, khi chuyển từ phim sang kỹ thuật số, năng suất đọc ảnh tăng mạnh nhưng không có cắt giảm nhân sự y tế; ngược lại tổng số xét nghiệm hình ảnh còn tăng hơn 60%
- Việc tăng tốc xử lý hình ảnh dẫn đến nhiều cách ứng dụng hơn trong hệ thống y tế, như giảm thời gian chờ xét nghiệm và cải thiện khả năng ứng phó tình huống khẩn cấp
Triển vọng tương lai: Bài học từ 10 năm đầu phổ biến AI
- Trong 10 năm qua, việc đưa AI vào khám chữa bệnh hằng ngày diễn ra chậm hơn rất nhiều so với trình độ kỹ thuật của các mô hình AI
- Các yếu tố phi kỹ thuật như quy định, bảo hiểm, tư vấn bệnh nhân và vai trò chủ thể của bác sĩ đang là rào cản đối với việc thay thế hoàn toàn
- Mô hình cơ bản hiện nay là AI không thay thế nhân lực mà đóng góp vào tăng năng suất thông qua hợp tác với con người
- Trên các nền tảng lớn như Facebook, khả năng tự động hóa bằng AI có thể cao hơn, nhưng với các công việc tri thức gồm nhiều loại nhiệm vụ khác nhau, việc đưa phần mềm vào thường có xu hướng làm tăng thay vì giảm khối lượng lao động của con người
- Kinh nghiệm trong lĩnh vực chẩn đoán hình ảnh cho thấy AI không thay thế ngay công việc của con người, mà ngược lại còn tạo ra kết quả mang tính nghịch lý: nhu cầu nhân lực con người được duy trì hoặc mở rộng cùng với những thay đổi về xã hội, thể chế và hành vi
1 bình luận
Ý kiến Hacker News
Tôi là bác sĩ X quang can thiệp và có bằng thạc sĩ khoa học máy tính; ngoài lĩnh vực X quang thì mọi người dường như không hiểu vì sao AI vẫn chưa thể thay thế X quang. Giải thích ngắn gọn là, nếu hỏi AI có thể chẩn đoán hình ảnh tốt hơn bác sĩ X quang con người hay không thì câu trả lời gần như là “có”, hoặc sẽ sớm như vậy. Nhưng nếu hỏi X quang có bị thay thế không thì câu trả lời gần như là “không”. Lý do là rủi ro pháp lý trong y tế. Trừ khi luật hiện hành thay đổi, bác sĩ X quang vẫn phải là người ký cuối cùng trên mọi báo cáo. Vì vậy dù AI có đọc ảnh và viết ra một báo cáo hoàn hảo, bước xác nhận cuối cùng của bác sĩ X quang vẫn là nút thắt cổ chai. Hiện nay bác sĩ X quang đọc rất nhanh ít nhất 60~100 ca mỗi ngày thuộc nhiều loại xét nghiệm khác nhau, và đây đã gần như là giới hạn con người có thể gánh được. Ngay cả khi AI viết toàn bộ báo cáo thay họ, họ vẫn phải xem lại và ký từng cái, nên gần như không tiết kiệm được bao nhiêu thời gian. Tất nhiên có thể sẽ có một bác sĩ vô trách nhiệm chỉ bấm ký cho xong, nhưng cũng sẽ có luật sư sẵn sàng khởi kiện việc đó
Khi Tesla công bố video trình diễn tự lái hoàn toàn năm 2016 với thông điệp “người lái chỉ ngồi đó vì lý do pháp lý, không làm gì cả, xe tự chạy”, tôi đã nghĩ ngành vận tải đường bộ sẽ thay đổi mãi mãi và cân nhắc lại việc bước vào ngành. Nhưng giờ 2025 đã cận kề mà phần lớn thay đổi vẫn rất chậm hoặc gần như chưa xảy ra. Có rất nhiều lạc quan cho rằng công nghệ sẽ thay đổi thế giới mạnh mẽ, nhưng thực tế nhiều khi thay đổi diễn ra cực chậm hoặc bị đình trệ
Giai thoại hay nhất về machine learning và X quang là hồi ai cũng thi nhau dùng AI để phân loại ảnh X-ray phổi của người nhiễm COVID. Có một nhóm nghiên cứu đạt kết quả phân loại khá ổn, nhưng sau đó người ta phát hiện AI thực ra học sự khác nhau về font watermark trên ảnh của các bệnh viện khác nhau trong bộ dữ liệu, tức là nó đang phân biệt “font chữ” chứ không phải tình trạng nhiễm COVID. Bài tham khảo: Bài báo trên Nature Machine Intelligence Từ khóa tìm kiếm: “AI for radiographic COVID-19 detection selects shortcuts over signal”. Có thể tìm được cả bản open access
Trọng tâm của bài là ba ý sau: 1) nếu muốn giao thêm việc cho mô hình thì sẽ vướng rào cản pháp lý 2) cơ quan quản lý và công ty bảo hiểm không phê duyệt/hoàn trả cho mô hình tự trị 3) phần chẩn đoán chỉ chiếm tỷ trọng nhỏ trong công việc của bác sĩ X quang, còn phần lớn là giao tiếp với bệnh nhân và nhân viên y tế. Kể cả khi mô hình machine learning chẩn đoán hoàn hảo và miễn phí, cấu trúc nghề này vẫn khiến bác sĩ X quang chưa thể bị “thay thế” ngay
Chỉ riêng hôm nay tôi đã chuyển một nữ bệnh nhân sang X quang để sinh thiết lõi, một nam bệnh nhân sang tiêm cột sống thắt lưng, một bệnh nhân khác sang tiêm vai, và một tháng trước còn chuyển một phụ nữ khác sang can thiệp thuyên tắc điều trị lạc nội mạc tử cung. Sắp tới tôi còn định chuyển một ca thuyên tắc do rò nước tiểu sau cắt thận. Liệu LLM có làm được các thủ thuật này không? Khi AI làm phổ cập một kỹ năng nào đó, giới chuyên gia sẽ chuyển sang kỹ năng khác và nhường lại phần việc đã bị commoditized. Ví dụ, sau khi đọc ECG được máy tự động hóa, mức hoàn trả giảm mạnh đến mức chính tôi cũng cố tình bỏ qua kỹ năng đó để tập trung vào não và rối loạn vận động. Vì vậy khi bệnh nhân cần giải thích ECG, tôi chỉ việc gửi sang bác sĩ tim mạch, rồi họ lại chỉ định thêm đủ loại xét nghiệm. Điều này làm tăng chi phí và thời gian cho bệnh nhân cũng như hệ thống y tế, nhưng cũng đành chịu. Tương lai có thể xuất hiện những “sa mạc y tế” giống như các “sa mạc thực phẩm”, tức là những lĩnh vực mà chuyên gia AI không muốn làm, nhất là lão khoa, vùng nông thôn hay tâm thần học
Năm 2016, giáo sư Geoffrey Hinton từng nói rằng “giờ nên dừng đào tạo bác sĩ X quang lại”. Nếu chỉ tin hết mọi điều những người ủng hộ AI nói, có lẽ thế giới đã sụp đổ từ lâu rồi
Tôi là bác sĩ đồng thời là kỹ sư full-stack, nên tôi không muốn theo X quang hay học thêm chuyên sâu nữa. AI sẽ trước tiên tăng cường năng lực cho X quang, rồi sau đó mới bắt đầu thay thế một số công việc. Các bác sĩ X quang hiện tại sẽ tự nhiên chuyển sang những mảng mới như X quang can thiệp
Hồi tháng 5 năm nay, New York Times cũng có một bài tương tự rằng “AI không thay thế bác sĩ X quang” Xem bài NYT. Ý kiến của các bác sĩ và phát biểu của Hinton khá thú vị. “AI sẽ hỗ trợ, định lượng, nhưng sẽ không đi đến kết luận diễn giải cuối cùng của kỹ thuật.” “Trong 5 năm nữa, không dùng AI thậm chí có thể bị xem là sai sót y khoa.” “Nhưng cuối cùng con người và AI sẽ cùng đi với nhau.” Về sau Hinton cũng thừa nhận qua email rằng ông đã nói quá khái quát; ông chỉ đang nói về phần diễn giải hình ảnh, hướng đi thì đúng nhưng dự báo thời điểm thì sai
Cần bắt buộc chuyển đổi AI trong ngành X quang. Mỗi ngày khoa X quang phải sử dụng AI vượt một tỷ lệ nhất định, phải tăng năng suất gấp đôi, nếu không thì nên bị sa thải. Theo lời các CEO, AI là công nghệ đột phá nhất chúng ta từng thấy, nên vì lo lắng mà càng phải chấp nhận nó. Ngoài ra không có lựa chọn nào khác
Tôi không tin vào việc giao cho bác sĩ không thuộc chuyên ngành X quang nhiệm vụ diễn giải kết quả AI đọc phim. Dù AI có xuất sắc trên benchmark đến đâu, nếu không có nền tảng kiến thức để tự phân tích thì cũng giống như đọc một bài báo khoa học 20 trang mà không thể đánh giá xem nó có đáng tin hay không