Au cours des dernières années, le recours à l’endoscopie a considérablement augmenté dans le domaine de la chirurgie de la chambre postérieure de l’œil. Cependant cette chirurgie souffre de deux défauts principaux : un champ de vue restreint et une faible résolution des images.
Ce résumé propose une méthode basée sur les réseaux de neurones profonds pour augmenter le champ de vue pendant la chirurgie en créant une carte dynamique du fond de l’œil.
L’algorithme estime le mouvement entre deux images consécutives et construit au fur et à mesure la carte. Afin de l’entraîner, plusieurs bases de données ont été utilisées. Avant l’entraînement principal, une étape d’initialisation a été nécessaire sur la base de données « Flying Chairs » contenant 22000 paires d’images.
L’entraînement du réseau a utilisé 22000 rétinophotographies. Deux imagettes de 384x512 pixels ont été extraites de chaque rétinophotographie en connaissant la transformation qui les lie. Cette transformation est représentative d’un déplacement lors d’une chirurgie endoscopique.
Mille paires d’images de fond d’œil ont été utilisées pour valider le modèle. En utilisant uniquement l’entraînement sur « Flying Chairs », l’erreur est de 6,25 pixels. En raffinant sur la base d’entraînement, cette erreur a été réduite à 0,69 pixels. Une base de données de chirurgies endoscopique comprenant 24 vidéos de durée moyenne 35 minutes (min = 7 minutes, max = 64 minutes) a permis la validation qualitative de l’intégralité de la chaîne de traitement. L’entraînement principal a nécessité 10 « epochs » et 20 heures de calculs sur un ordinateur équipé d’une carte graphique Nvidia Geforce GTX 1080.
Cette étude a permis de valider une nouvelle approche pour construire des cartes dynamiques de fond d’œil en utilisant les réseaux de neurones profonds. Les résultats quantifiés sont très bons sur les clichés de fond d’œil.
La prochaine étape de cette recherche sera d’estimer quantitativement les cartes obtenues sur les vidéos d’endoscopie et d’utiliser ces cartes pour augmenter artificiellement la résolution des images.