Billeddatabaser over hudsygdomme er notorisk orienteret mod lysere hud. I stedet for at vente på den langsomme proces med at indsamle flere billeder af tilstande som kræft eller betændelse på mørkere hud, ønsker en gruppe at udfylde hullerne ved hjælp af kunstig intelligens. Det arbejder på et AI-program til at generere syntetiske billeder af sygdomme på mørkere hud – og bruger disse billeder til et værktøj, der kan hjælpe med at diagnosticere hudkræft.
“At have rigtige billeder af mørkere hud er den ultimative løsning,” siger Eman Rezk, en maskinlæringsekspert ved McMaster University i Canada, der arbejder på projektet. “Indtil vi har disse data, er vi nødt til at finde en måde at lukke hullet.”
Men andre eksperter, der arbejder på området, bekymrer sig om, at brug af syntetiske billeder kan give deres egne problemer. Fokus bør være på at tilføje flere forskellige rigtige billeder til eksisterende databaser, siger Roxana Daneshjou, en klinisk forsker i dermatologi ved Stanford University. “At skabe syntetiske data lyder som en nemmere vej end at gøre det hårde arbejde for at skabe et mangfoldigt datasæt,” siger hun.
Der er dusinvis af bestræbelser på at bruge AI i dermatologi. Forskere bygger værktøjer, der kan scanne billeder af udslæt og modermærker for at finde ud af den mest sandsynlige type problem. Dermatologer kan derefter bruge resultaterne til at hjælpe dem med at stille diagnoser. Men de fleste værktøjer er bygget på databaser med billeder, der enten ikke indeholder mange eksempler på tilstande på mørkere hud eller ikke har god information om rækken af hudfarver, de inkluderer. Det gør det svært for grupper at være sikre på, at et værktøj vil være lige så præcist på mørkere hud.
Derfor vendte Rezk og teamet sig til syntetiske billeder. Projektet har fire hovedfaser. Holdet har allerede analyseret tilgængelige billedsæt for at forstå, hvor underrepræsenterede mørkere hudtoner var til at begynde med. Det udviklede også et AI-program, der brugte billeder af hudtilstande på lysere hud til at producere billeder af disse tilstande på mørk hud og validerede de billeder, som modellen gav dem. “Takket være fremskridtene inden for kunstig intelligens og dyb læring var vi i stand til at bruge de tilgængelige hvide scanningsbilleder til at generere syntetiske billeder af høj kvalitet med forskellige hudfarver,” siger Rezk.
Dernæst vil teamet kombinere de syntetiske billeder af mørkere hud med rigtige billeder af lysere hud for at skabe et program, der kan opdage hudkræft. Den vil løbende tjekke billeddatabaser for at finde nye, rigtige billeder af hudsygdomme på mørkere hud, som de kan tilføje til den fremtidige model, siger Rezk.
Holdet er ikke det første til at lave syntetiske hudbilleder – en gruppe, der inkluderede Google Health-forskere, udgav et papir i 2019, der beskrev en metode til at generere dem, og det kunne skabe billeder af forskellige hudtoner. (Google er interesseret i dermatologisk kunstig intelligens og annoncerede et værktøj, der kan identificere hudsygdomme sidste forår.)
Rezk siger, at syntetiske billeder er et stop, indtil der er flere rigtige billeder af tilstande på mørkere hud tilgængelige. Daneshjou bekymrer sig dog om overhovedet at bruge syntetiske billeder, selv som en midlertidig løsning. Forskerhold skulle omhyggeligt kontrollere, om AI-genererede billeder ville have nogle sædvanlige særheder, som folk ikke ville være i stand til at se med det blotte øje. Den type særheder kunne teoretisk set skæve resultater fra et AI-program. Den eneste måde at bekræfte, at de syntetiske billeder fungerer lige så godt som rigtige billeder i en model, ville være at sammenligne dem med rigtige billeder – som er en mangelvare. “Gå så tilbage til faktum, ja, hvorfor ikke bare arbejde på at prøve at få flere rigtige billeder?” hun siger.
Hvis en diagnostisk model er baseret på syntetiske billeder fra én gruppe og rigtige billeder fra en anden – selv midlertidigt – er det en bekymring, siger Daneshjou. Det kan føre til, at modellen præsterer forskelligt på forskellige hudtoner.
At læne sig op ad syntetiske data kan også gøre folk mindre tilbøjelige til at presse på for rigtige, forskelligartede billeder, siger hun. “Hvis du vil gøre det, vil du så blive ved med at udføre arbejdet? hun siger. “Jeg vil faktisk gerne se, at flere mennesker arbejder på at få rigtige data, der er forskelligartede, i stedet for at forsøge at gøre denne løsning.”