Retour
Chapitre 59
Comment l'intelligence artificielle va changer nos pratiques

A. Miere, C. Beluffi-Marin, M. Wack

Introduction
L'intelligence artificielle (IA) a connu des avancées majeures dans le domaine médical ces dernières années, notamment grâce aux progrès des techniques d'apprentissage profond ( deep learning ). Par exemple, les réseaux neuronaux profonds ont atteint, voire surpassé, la précision des experts dans divers domaines, de l'ophtalmologie à la radiologie. Ces modèles d'IA sont généralement conçus à partir de grands volumes de données annotées avec précision, ce qui nécessite une expertise spécifique, entraînant ainsi une charge de travail considérable. À l'heure actuelle, la plupart des chercheurs et des entreprises ont un accès limité aux données, souvent restreint à des échantillons de taille réduite provenant de zones géographiques spécifiques, ce qui rend difficile la généralisation des résultats (à d'autres bases de données ou populations). Par ailleurs, de grandes quantités de données médicales restent inexploitées, faute d'experts capables de les annoter correctement. Cela est particulièrement vrai pour les maladies rares, où de nombreux écarts restent à combler.
Les difficultés liées au diagnostic des maladies rares sont souvent accompagnées de difficultés au niveau du pronostic, en raison de l'absence de paramètres et/ou de biomarqueurs fiables, étant donné que les mécanismes physiopathologiques moléculaires demeurent encore largement inconnus pour certaines de ces pathologies. De plus, le faible nombre de patients rend difficile l'établissement de paramètres statistiquement significatifs.
Cependant, les modèles d'IA ont la capacité d'identifier des caractéristiques importantes de ces maladies (génétiques, cliniques, d'imagerie), même sur des jeux de données limités. Ainsi, ils peuvent aider les chercheurs à mieux comprendre les mécanismes sous-jacents de ces maladies et, potentiellement, à identifier de nouveaux biomarqueurs et de nouvelles cibles thérapeutiques.
Dans ce chapitre, nous aborderons les différents types de données utilisées par les modèles d'IA, leurs applications pour le diagnostic et le pronostic des maladies rétiniennes rares, et les enjeux éthiques associés.
Données utilisées par l'intelligence artificielle (IA)
Quelles données utiliser pour faire de l'IA?
Les données sont essentielles afin de mener à bien des projets de recherche multiples et variés. On peut retenir plusieurs catégories de données à exploiter :
  • les données cliniques provenant des dossiers médicaux électroniques et comprenant les données de soin des patients, leur historique médical et les résultats des examens cliniques;
  • les données de génétique/génomique, données sur les variations génétiques extraites des comptes-rendus de test génétiques. Dans certains cas (recherche dans le secteur des maladies rares par exemple), il peut être intéressant d'exploiter directement les génomes;
  • les images rétiniennes, toutes les modalités pouvant être exploitées.
Ces données peuvent être exploitées de différentes manières, notamment pour l'aide au diagnostic, la détection précoce et la prédiction de l'évolution des maladies. L'utilisation de l'IA s'appuie principalement sur l'analyse des données médicales pour soutenir les médecins dans la prise de décisions. La plupart de ces systèmes sont des supports décisionnels qui fournissent au médecin des recommandations fondées sur des symptômes cliniques et des antécédents médicaux pour orienter le diagnostic [1].
Quelle réglementation pour ces données?
En France et en Europe, la réglementation sur les données de santé est principalement régie par la loi informatique et libertés et le règlement général sur la protection des données (RGPD). La Commission nationale de l'informatique et des libertés (CNIL) joue un rôle central en supervisant et en assurant le respect de ces lois. Les données de santé, considérées comme très sensibles, requièrent des mesures de protection accrues, pouvant aller jusqu'à la demande du consentement explicite des patients.
En 2024, la CNIL s'est penchée en profondeur sur la question de l'utilisation de l'IA sur des données personnelles en publiant ses premières recommandations sur le développement des systèmes d'IA [2]. Elle recommande notamment que les systèmes d'IA respectent des principes éthiques comme la transparence, et souligne l'importance d'une évaluation d'impact sur la vie privée ainsi que la nécessité d'informer les utilisateurs de manière claire et compréhensible.
Quels freins pour l'usage de données avec l'IA et comment y pallier?
L'utilisation d'algorithmes d'IA requiert un grand nombre de données de qualité pour l'entraînement, et plusieurs freins peuvent se poser à l'accumulation de statistiques nécessaire à cela. Tout d'abord, la collecte de ces données dans les centres de soins exige souvent du personnel dédié ou du temps supplémentaire pour les soignants, qui doivent saisir des informations dans des outils de collecte. Cela peut détourner les professionnels de santé de leur activité principale : soigner les patients. Par ailleurs, la collecte, le stockage et la gestion de ces données nécessitent des infrastructures coûteuses, comme des serveurs sécurisés et des logiciels performants. Les coûts d'installation, de maintenance et de mise à niveau peuvent être élevés, surtout pour les petits centres de soins.
Enfin, les données utilisées doivent être de qualité, les jeux complets et cohérents pour induire des modèles d'IA fiables. En effet, des jeux de données complets permettent au modèle d'apprendre toutes les relations pertinentes entre les variables d'entrée et les cibles, améliorant leurs capacités à généraliser à de nouveaux exemples.
Afin de contrecarrer le problème de statistique, plusieurs stratégies peuvent être suivies :
  • tout d'abord, il est essentiel de partager la donnée et, pour ce faire, d'encourager les collaborations entre les centres collecteurs et consommateurs de données;
  • afin que ce partage soit facilité, la donnée doit être standardisée. Il est important de s'aligner sur des ontologies et des protocoles d'acquisition de données;
  • cela implique également une souplesse des réglementations en vigueur afin de ne pas freiner ou bloquer le partage de la donnée, tout en protégeant les droits des patients ayant permis leur recueil.
Transparence des modèles de données
Avec l'utilisation de l'IA dans les pratiques de soins et de recherche en santé, il est indispensable d'opter pour une totale transparence dans les sources et les méthodes de collecte des données afin de permettre une vérification de la qualité et de l'exactitude des résultats générés par les algorithmes d'IA, et ainsi une confiance dans l'utilisation de ces algorithmes, souvent qualifiés de « boîtes noires».
En effet, les modèles de machine learning (ML) sont de plus en plus complexes et donc difficiles à appréhender. Mais ces modèles sophistiqués sont aujourd'hui très prisés, car ils permettent généralement d'aboutir à des prédictions plus précises qu'avec des modèles simples (de régression linéaire ou arbre de décision). Il existe ainsi un compromis à trouver entre la performance d'un modèle et son interprétabilité (capacité pour un humain à comprendre les raisons d'une décision d'un modèle) : ce qu'un modèle gagne en performance, il le perd en interprétabilité, et donc en transparence.
Des méthodes d'explicabilité des algorithmes comme LIME peuvent aider en ce sens [3]. LIME est un modèle lui-même interprétable (avec des relations entrées-sorties faciles à comprendre) qui permet d'expliquer une prédiction locale par analyse du voisinage. Ce modèle joue donc le rôle de modèle de substitut pour interpréter les résultats du modèle complexe d'origine.
Une documentation exhaustive et claire est bien entendue indispensable pour que les modèles puissent être compris et utilisés correctement par d'autres chercheurs.
L'usage de données synthétiques en ophtalmologie, est-ce possible?
Les données synthétiques sont des données générées artificiellement par des algorithmes plutôt que collectées directement à partir de sources réelles. Elles sont conçues pour imiter les caractéristiques des données réelles. Leur utilisation en IA apparaît comme particulièrement alléchante, car cela permet une augmentation des volumes de données disponibles pour l'entraînement des modèles d'IA. De plus, ces données n'étant pas des données de patients, leur utilisant permet a priori de ne pas compromettre la confidentialité et donc de s'affranchir d'un cadre légal complexe à appliquer.
L'utilisation de réseaux antagonistes génératifs ( generative adversarial networks [GAN]) [4] permet de générer des données synthétiques, par exemple des images. Dans l'exemple de l'étude SynthEye [5], des images de fonds d'œil et d'autofluorescence imitant des patients atteints de dystrophies rétiniennes héréditaires ont été générées, avec une qualité telle qu'en moyenne 47 % des images synthétiques ont été classées comme réelles par les experts. Cela montre que le GAN a pu généraliser les caractéristiques des images réelles. De plus, les performances des modèles entraînés avec des données synthétiques se sont montrées comparables à celles de modèles entraînés uniquement sur des données réelles, suggérant que les données synthétiques pourraient être utilisées comme substitut aux données réelles pour l'utilisation de modèles d'IA.
Toutefois, leur usage n'est pas applicable à tous les cas de figure, notamment dans le cas où l'échantillon de données réelles à partir duquel sont générées les données synthétiques est de faible statistique. Il pourrait alors être possible, par inférence, de remonter aux données réelles de patients, celui-ci étant par construction proche du vrai jeu et hautement identifiant par sa rareté.
Applications de l'IA dans les maladies rétiniennes héréditaires (MRH)
Le diagnostic des MRH repose sur une évaluation clinique approfondie, y compris l'examen de l'acuité visuelle, l'imagerie rétinienne (rétinophotographie – color fundus photography [CFP] –, la tomographie par cohérence optique [OCT], l'autofluorescence – fundus autofluorescence [FAF] – et la photographie grand champ) et les examens fonctionnels, comme le champ visuel et l'électrorétinogramme (ERG). Au-delà du diagnostic, avoir une image plus claire du risque de progression des MRH est essentiel pour les cliniciens et les patients, même s'il n'est actuellement pas possible de prédire avec précision la progression individuelle de la maladie – une telle tâche nécessiterait l'analyse de grandes quantités de données longitudinales.
C'est pour cela que les applications de l'IA dans les MRH se sont concentrées sur des problèmes de diagnostic/classification et de segmentation à partir des différentes techniques d'imagerie rétinienne, de corrélation génotype-phénotype ou bien de prédiction de la fonction.
L'IA dans le diagnostic et la classification des MRH
L'IA, et en particulier le deep learning , a montré un grand potentiel dans l'analyse des images rétiniennes pour le diagnostic et la classification des MRH. Des réseaux neuronaux convolutifs ( convolutional neural networks [CNN]) ont été utilisés pour classer différentes MRH, en particulier dans le cadre des images de FAF et d'OCT. Notre groupe s'est intéressé à la classification des MRH – rétinite pigmentaire (RP), maladie de Stargardt (STGD1) et maladie de Best (BD), ainsi que des yeux normaux – en utilisant le deep learning sur des images de FAF. En détail, nous avons utilisé un jeu de données en FAF de patients atteints de RP, STGD1 et BD diagnostiqués cliniquement et de témoins sains. En utilisant l'apprentissage par transfert et un CNN ResNet 101, nous avons obtenu une précision de 0,95, ainsi que d'excellentes sensibilité, spécificité, aire sous la courbe receiver operating characteristics (AUC-ROC) et precision-recall (AUC-PRC), respectivement, pour toutes les classes [6]. Sur les 94 images dans le jeu de données de test, seulement 5 ont été mal classées par le modèle. De plus, en utilisant le concept d'« IA explicable», essentiel pour que les cliniciens comprennent comment le modèle a atteint un certain résultat à partir d'une entrée donnée, nous avons démontré par le gradient intégré que le modèle s'appuyait sur les mêmes zones que le clinicien pour la génération d'une prédiction (fig. 59-1
Fig. 59-1
Exemple de modèle de classification des maladies rétiniennes héréditaires (MRH) sur des images d'autofluorescence du fond d'œil (FAF), avec comme donnée d'entrée une image d'autofluorescence de Stargardt et une prédiction correcte du modèle (maladie de Stargardt).
La visualisation par gradients intégrés permet d'expliquer les zones sur lesquelles la prédiction s'est fondée.
).
Ensuite, nous avons évalué la capacité d'un CNN préformé (ResNet101) à distinguer entre l'atrophie secondaire aux MRH (STGD1 et la pseudo-Stargardt pattern dystrophy [PSPD]) et l'atrophie associée à la DMLA sèche (atrophie géographique), toujours sur l'imagerie FAF, obtenant une précision du modèle de 0,92 et une AUC-ROC de 0,98 [7]. La différenciation entre une forme tardive de MRH et de DMLA sèche est essentielle, car cela impacte directement le pronostic de la maladie, le taux de progression et l'accès à de nouvelles thérapies. De façon analogue, notre groupe et d'autres groupes ont utilisé des classificateurs deep learning pour distinguer entre différentes phénocopies, tels que le STGD1 et la PSPD [8], ou entre la maladie de Best et la dystrophie pseudovitelliforme de l'adulte [9], ou bien entre l'atrophie géographique et l'EMAP ( extensive macular atrophy with pseudodrusen ) [10]. Bien que surprenants, les modèles de deep learning dans ces études n'étaient pas seulement non inférieurs aux experts humains, mais leurs précisions (ainsi que leur sensibilité) respectives étaient supérieures, montrant qu'à terme ces modèles pourraient, dans un certain sens, mener à une démocratisation de l'expertise en MRH, actuellement disponible uniquement dans quelques centres dans le monde.
Outre la classification, l'IA permet également la segmentation des différentes caractéristiques rétiniennes. Cela inclut la détection et la segmentation des vaisseaux rétiniens, du disque optique, et des zones présentant une hypo- ou une hyperautofluorescence. Ces informations sont essentielles pour une évaluation plus précise dans un contexte de MRH. Le modèle AIRDetect, par exemple, a été développé pour identifier et segmenter les caractéristiques de l'autofluorescence rétinienne dans une large gamme de MRH [11].
L'IA pour la corrélation génotype-phénotype dans les MRH
L'intérêt récent pour la thérapie génique dans les MRH a été souligné par l'approbation par la Food and Drug Administration (FDA) du Luxturna® (voretigène néparvovec-rzyl), la première thérapie génique oculaire pour la dystrophie rétinienne associée à RPE65 . Malgré ces progrès, les tests génétiques peuvent s'avérer coûteux et chronophages. Les modèles de deep learning ont montré un fort potentiel dans la prédiction des gènes responsables de diverses MRH, facilitant ainsi le diagnostic génétique, le conseil génétique, la planification familiale et le recrutement pour les essais cliniques. Une première étude avait utilisé la plateforme Medic Mind, exploitant l'architecture Inception V3, pour prédire les gènes responsables des rétinopathies associées aux gènes ABCA4 , RP1L1 et EYS à partir d'images OCT, avec une précision moyenne des tests de 1,0 pour ABCA4 , 0,78 pour RP1L1 , 0,89 pour EYS et 0,93 pour les yeux normaux [12]. Le même groupe s'est intéressé par la suite à la capacité d'un modèle de deep learning de prédire les mêmes mutations au niveau des gènes ABCA4 , RP1L1 et EYS à partir d'images de CFP et de FAF, obtenant une précision globale de 0,88 pour les rétinophotographies et de 0,81 pour l'autofluorescence [13].
Par la suite, l'ambitieux projet Eye2Gene, mené au Moorfields Eye Hospital à Londres, a pour but d'identifier un diagnostic génétique pour une MRH à partir d'une technique d'imagerie rétinienne en utilisant le deep learning . Eye2Gene est entraîné et testé sur de l'imagerie rétinienne de patients MRH de Moorfields avec un diagnostic moléculaire; ensuite, le modèle est testé sur des jeux de données indépendants d'autres centres. Eye2Gene a obtenu une très haute précision de 88 % sur l'ensemble des données de Moorfields ainsi que sur l'ensemble de données de validation externe. Cet algorithme d'IA semble capable de prédire les 36 gènes de MRH les plus courants avec une précision de 80 % ou plus, avec des performances similaires à un consensus d'experts humains sur un ensemble des données externes [14 , 15] (fig. 59-2
Fig. 59-2
Eye2Gene comprend trois principales modalités d'imagerie rétinienne : infrarouge, autofluorescence du fond d'œil (FAF) et tomographie par cohérence optique en spectral domain (OCT-SD).
Ces modalités d'imagerie seront introduites dans trois réseaux neuronaux convolutionnels afin de prédire la mutation à partir de chaque modalité d'imagerie. Au final, une prédiction sera générée, avec des méthodes de visualisation permettant d'expliquer les zones sur lesquelles la prédiction s'est fondée.
). L'application de l'IA dans ce contexte a montré un grand potentiel pour améliorer la précision du diagnostic et la compréhension des relations entre le génotype et le phénotype.
L'IA pour la prédiction de la fonction dans les MRH
Les prédictions fonctionnelles fondées sur l'IA sont également cruciales pour améliorer la prise en charge des patients. L'IA peut être utilisée pour prédire la progression de la maladie, en particulier en étudiant la vitesse de la constriction des anneaux rétiniens chez les patients atteints de RP [11]. Ces informations peuvent aider à personnaliser les traitements et à mieux planifier les interventions médicales. De plus, une étude récente démontre un modèle de deep learning développé pour établir une corrélation entre la structure et la fonction visuelle en utilisant des données d'imagerie OCT cSLO chez des patients atteints de RP ayant un diagnostic moléculaire confirmé. Cet algorithme a réussi à prédire les déficiences visuelles en se fondant sur le seuil d'acuité visuelle de 20/40 sur l'échelle de Snellen. Il s'agit de la première étude à appliquer l'apprentissage profond pour établir une corrélation structure-fonction dans les MRH [16]. Cependant, il faut noter que la performance de l'algorithme a diminué en présence d'anomalies structurelles, comme l'œdème maculaire cystoïde. Les recherches futures viseront sans doute à étendre le jeu de données d'entraînement afin d'améliorer les prédictions.
Cadre éthique
L'éthique est un sujet en constante évolution, car fortement imprégné des changements qui animent notre société. L'utilisation de l'IA dans les données de santé pose évidemment plusieurs problématiques éthiques, au-delà de la transparence et de la protection des données.
Les biais algorithmiques sont une préoccupation majeure, car ils peuvent entraîner des inégalités dans les soins en favorisant certains groupes par rapport à d'autres. En effet, si un algorithme est entraîné principalement sur des données provenant d'un groupe démographique particulier, il risque de moins bien fonctionner pour d'autres groupes, compromettant ainsi l'exactitude des diagnostics et des traitements pour ces populations. Cela peut exacerber les disparités existantes en matière de santé.
La responsabilité des décisions prises par l'IA doit également être clairement définie pour garantir une réponse claire en cas d'erreurs ou de préjudices. Lorsque l'IA est utilisée pour diagnostiquer des maladies ou recommander des traitements, il est crucial de déterminer comment utiliser les résultats fournis par l'IA et qui, parmi les développeurs, les utilisateurs ou les institutions de santé, est responsable des résultats fournis, et à quels degrés en cas d'erreurs.
Enfin, l'impact de l'IA sur la relation patient-médecin doit être approfondi et correctement évalué. En effet, des craintes réelles existent quant aux risques que l'usage de cette technologie puisse diminuer la qualité des soins et la relation médecin-patient. On pourrait en effet penser qu'une dépendance excessive aux technologies de l'IA pourrait réduire la vigilance des professionnels de santé, qui pourraient se fier trop aux recommandations automatisées sans exercer leur propre jugement, et qu'à l'inverse des décisions majeures sur la santé du patient puissent être prises sans l'intervention d'un professionnel de santé. Ces questions éthiques exigent en réponse une réglementation stricte et une vigilance constante pour équilibrer innovation technologique et respect des droits des patients.
Défis et perspectives
Bien que l'IA offre des avantages indéniables dans le diagnostic et le suivi des MRH, plusieurs défis demeurent. L'un des principaux obstacles est la nécessité de bases de données d'images rétiniennes bien annotées et de haute qualité pour l'entraînement des modèles. L'annotation manuelle des images par des experts demande du temps et des ressources considérables, et la disponibilité d'une « vérité terrain» est essentielle pour valider les modèles d'IA. De plus, l'intégration de l'IA dans la pratique clinique nécessite la création de modèles capables de se généraliser à travers des populations diverses, et l'adoption de techniques d'IA explicables pour garantir la transparence et la confiance dans les environnements cliniques.
Conclusion
L'intelligence artificielle (IA) a le potentiel de révolutionner le diagnostic, la prise en charge et le traitement des maladies rétiniennes héréditaires (MRH). En facilitant la classification des maladies, la prédiction de la fonction visuelle et la corrélation génotype-phénotype, l'IA offre de nouvelles possibilités pour un diagnostic précoce, de nouveaux biomarqueurs, une prédiction fiable de la progression et une meilleure compréhension des MRH. Toutefois, pour que ces technologies puissent être pleinement intégrées dans la pratique clinique, des efforts continus sont nécessaires afin de surmonter les défis liés aux bases de données, à l'explicabilité des modèles et à la généralisation à travers des populations diversifiées. Les recherches futures sur l'IA dans les MRH devraient se concentrer sur l'amélioration de l'accessibilité des données et la validation clinique des modèles.
Bibliographie
[1]
Safai A, Froines C, Slater R, et al. Quantifying geographic atrophy in age-related macular degeneration : a comparative analysis across 12 deep learning models. Invest Ophthalmol Vis Sci 2024 ; 65(8) : 42.
[2]
CNIL. IA : la CNIL publie ses premières recommandations sur le développement des systèmes d’intelligence artificielle. 8 avril 2024 ; https://www.cnil.fr/fr/ia-la-cnil-publie-ses-premieres-recommandations-sur-le-developpement-des-systemes-dintelligence.
[3]
Yasin P, Yimit Y, Cai X, et al. Machine learning-enabled prediction of prolonged length of stay in hospital after surgery for tuberculosis spondylitis patients with unbalanced data : a novel approach using explainable artificial intelligence (XAI). Eur J Med Res 2024 ; 29(1) : 383.
[4]
Goodfellow IJ, Pouget-Abadie J, Mirza M, et al. Generative adversarial networks. arXiv : 1406.2661.
[5]
Veturi YA, Woof W, Lazebnik T, et al. SynthEye : investigating the impact of synthetic data on artificial intelligence-assisted gene diagnosis of inherited retinal disease. Ophthalmol Sci 2022 ; 3(2) : 100258.
[6]
Miere A, Le Meur T, Bitton K, et al. Deep learning-based classification of inherited retinal diseases using fundus autofluorescence. J Clin Med 2020 ; 9(10) : 3303.
[7]
Miere A, Capuano V, Kessler A, et al. Deep learning-based classification of retinal atrophy using fundus autofluorescence imaging. Comput Biol Med 2021 ; 130 : 104198.
[8]
Miere A, Zambrowski O, Kessler A, et al. Deep learning to distinguish ABCA4-related Stargardt disease from PRPH2-related pseudo-Stargardt pattern dystrophy. J Clin Med 2021 ; 10(24) : 5742.
[9]
Crincoli E, Zhao Z, Querques G, et al. Deep learning to distinguish Best vitelliform macular dystrophy (BVMD) from adult-onset vitelliform macular degeneration (AVMD). Sci Rep 2022 ; 12(1) : 12745.
[10]
Chouraqui M, Crincoli E, Miere A, et al. Deep learning model for automatic differentiation of EMAP from AMD in macular atrophy. Sci Rep 2023 ; 13(1) : 20354.
[11]
Woof WA, de Guimarães TAC, Al-Khuzaei S, et al. Quantification of fundus autofluorescence features in a molecularly characterized cohort of >3500 patients with inherited retinal disease from the United Kingdom. Ophthalmol Sci 2024 ; 5(2) : 100652.
[12]
Fujinami-Yokokawa Y, Pontikos N, Yang L, et al. Prediction of causative genes in inherited retinal disorders from spectral-domain optical coherence tomography utilizing deep learning techniques. J Ophthalmol 2019 ; 2019 : 1691064.
[13]
Fujinami-Yokokawa Y, Ninomiya H, Liu X, et al. Prediction of causative genes in inherited retinal disorder from fundus photography and autofluorescence imaging using deep learning techniques. Br J Ophthalmol 2021 ; 105(9) : 1272-9.
[14]
Pontikos N, Woof, W, Krawitz P, et al. Eye2Gene : prediction of causal inherited retinal disease gene from multimodal imaging using deep-learning. Juin 2022. https://iovs.arvojournals.org/article.aspx?articleid=2783397.
[15]
Nguyen Q, Woof W, Kabiri N, et al. Can artificial intelligence accelerate the diagnosis of inherited retinal diseases ? Protocol for a data-only retrospective cohort study (Eye2Gene). BMJ Open 2023 ; 13(3) : e071043.
[16]
Liu TYA, Ling C, Hahn L, et al. Prediction of visual impairment in retinitis pigmentosa using deep learning and multimodal fundus images. Br J Ophthalmol 2023 ; 107(10) : 1484-9.