Les bases de données d'images des affections cutanées sont notoirement biaisées en faveur des peaux plus claires. Plutôt que d'attendre le lent processus de collecte d'images d'affections telles que le cancer ou l'inflammation sur une peau plus foncée, un groupe souhaite combler les lacunes en utilisant l'intelligence artificielle. Il travaille sur un programme d'IA pour générer des images synthétiques de maladies sur la peau plus foncée – et utilise ces images pour un outil qui pourrait aider à diagnostiquer le cancer de la peau.
“Avoir de vraies images de peau plus foncée est la solution ultime”, déclare Eman Rezk, un expert en apprentissage automatique à l'Université McMaster au Canada qui travaille sur le projet. “Jusqu'à ce que nous ayons ces données, nous devons trouver un moyen de combler l'écart.”
Mais d'autres experts travaillant dans le domaine craignent que l'utilisation d'images synthétiques puisse introduire leurs propres problèmes. L'accent devrait être mis sur l'ajout d'images réelles plus diversifiées aux bases de données existantes, déclare Roxana Daneshjou, chercheuse clinicienne en dermatologie à l'Université de Stanford. “Créer des données synthétiques semble être une voie plus facile que de travailler dur pour créer un ensemble de données diversifié”, dit-elle.
Il existe des dizaines d'efforts pour utiliser l'IA en dermatologie. Les chercheurs créent des outils capables de numériser des images d'éruptions cutanées et de grains de beauté pour déterminer le type de problème le plus probable. Les dermatologues peuvent ensuite utiliser les résultats pour les aider à établir des diagnostics. Mais la plupart des outils sont construits sur des bases de données d'images qui n'incluent pas beaucoup d'exemples de conditions sur une peau plus foncée ou qui n'ont pas de bonnes informations sur la gamme de tons de peau qu'elles incluent. Il est donc difficile pour les groupes d'être sûrs qu'un outil sera aussi précis sur une peau plus foncée.
C'est pourquoi Rezk et l'équipe se sont tournés vers les images de synthèse. Le projet comporte quatre phases principales. L'équipe a déjà analysé les ensembles d'images disponibles pour comprendre à quel point les tons de peau plus foncés étaient sous-représentés. Il a également développé un programme d'IA qui a utilisé des images d'états de la peau sur une peau plus claire pour produire des images de ces conditions sur une peau foncée et a validé les images que le modèle leur a données. “Grâce aux progrès de l'IA et de l'apprentissage en profondeur, nous avons pu utiliser les images de numérisation blanches disponibles pour générer des images synthétiques de haute qualité avec différents tons de peau”, explique Rezk.
Ensuite, l'équipe combinera les images synthétiques de peau plus foncée avec de vraies images de peau plus claire pour créer un programme capable de détecter le cancer de la peau. Il vérifiera en permanence les bases de données d'images pour trouver de nouvelles images réelles d'affections cutanées sur des peaux plus foncées qu'ils pourront ajouter au futur modèle, explique Rezk.
L'équipe n'est pas la première à créer des images de peau synthétique – un groupe qui comprenait des chercheurs de Google Health a publié un article en 2019 décrivant une méthode pour les générer, et cela pourrait créer des images de différents tons de peau. (Google s'intéresse à l'IA en dermatologie et a annoncé au printemps dernier un outil capable d'identifier les affections cutanées.)
Rezk dit que les images synthétiques sont un palliatif jusqu'à ce qu'il y ait plus d'images réelles des conditions sur la peau plus foncée disponibles. Daneshjou, cependant, s'inquiète de l'utilisation d'images synthétiques, même comme solution temporaire. Les équipes de recherche devraient vérifier soigneusement si les images générées par l'IA auraient des bizarreries habituelles que les gens ne pourraient pas voir à l'œil nu. Ce type de bizarrerie pourrait théoriquement fausser les résultats d'un programme d'IA. La seule façon de confirmer que les images synthétiques fonctionnent aussi bien que les images réelles dans un modèle serait de les comparer avec des images réelles – qui sont rares. “Puis revient au fait de, eh bien, pourquoi ne pas simplement essayer d'obtenir des images plus réelles?” elle dit.
Si un modèle de diagnostic est basé sur des images synthétiques d'un groupe et des images réelles d'un autre – même temporairement – c'est un problème, dit Daneshjou. Cela pourrait conduire à ce que le modèle fonctionne différemment sur différents tons de peau.
S'appuyer sur des données synthétiques pourrait également rendre les gens moins susceptibles de pousser pour des images réelles et diverses, dit-elle. « Si vous allez faire ça, allez-vous réellement continuer à faire le travail ? elle dit. “En fait, j'aimerais voir plus de personnes s'efforcer d'obtenir des données réelles et diversifiées, plutôt que d'essayer de contourner ce problème.”