Adobe inkluderte AI-genererte bilder i 'kommersielt sikre' Firefly treningssett

0
13
firefly-collage.png Adobe

Generativ kunstig intelligens (AI)-bildeskapere blir stadig mer populære, men bruken av dem har også utløst debatter om opphavsrettsbeskyttet materiale i opplæringsdatasett. Nå kompliserer ny informasjon om Adobe Firefly, selskapets svar på generative AI-verktøy som Midjourney og DALL-E, samtalen ytterligere. 

Som andre bildegeneratorer, skaper Firefly visuelle innhold, vektorbilder, teksteffekter og mer fra brukerinntastede tekstmeldinger. Men Adobe har posisjonert Firefly som utstikkeren i rommet på grunn av datasettet, som selskapet fremhever som en kvalitetskontroll. 

Også: De beste AI-bildegeneratorene å prøve akkurat nå

De store språkmodellene (LLM) som støtter bildegeneratorer, får inn milliarder av bilder for å fungere. Riktig lisensiering av så mye innhold er dyrt, og databehandling i denne skalaen er allerede dyrt, noe som betyr at bedrifter oppmuntres til å skrape gratis innhold fra internett uten å kreditere eller kompensere skapere. Populære tekstgeneratorer, inkludert ChatGPT, trenes også på denne måten, med språkeksempler skrapet fra nettet. 

AI-selskaper blir stadig mer undersøkt for å samle inn data på denne måten. Stable Diffusion og Midjourney har blitt saksøkt av artister og organisasjoner som Getty på grunn av feil lisensiering. I desember saksøkte The New York Times OpenAI og Microsoft for å bruke arbeidet deres til å trene ChatGPT. 

Også: Adobe kjøper videoer til trene det nye AI-verktøyet, men betaler det nok?

Adobes nettsted sier at Firefly er “kommersielt trygt” sammenlignet med konkurrerende produkter fordi det ble trent på “lisensiert innhold, som Adobe Stock, og innhold i offentlig domene der opphavsretten har utløpt.” Adobe har til og med en kompensasjonsplan for enkelte aksjebidragsytere hvis innhold ble brukt til å trene opp den første iterasjonen av verktøyet. 

Imidlertid rapporterte Bloomberg fredag ​​at omtrent 5 % av Fireflys treningsdata er AI-generert, laget av konkurrenter som Midjourney. Innholdet kom inn i Fireflys datasett fordi skaperne kunne sende inn AI-genererte bilder til Adobes aksjemarked, som de ble kompensert for som en del av Adobes program. 

At Adobe bruker syntetisk innhold etter å ha hyllet datasettet som strengere enn konkurrentene, virker motintuitivt. Selv om det ikke er lovpålagt å publisere opplæringsdata, vekker denne detaljen tvil om gyldigheten av Adobes kvalitetspåstander, spesielt med tanke på at bildene ble laget ved å bruke verktøy som nå er utsatt for opphavsrett.

Også:& #xA0;Dette nye AI-verktøyet fra Adobe gjør det enda enklere å generere bildene du trenger

Til tross for avsløringen, fastholder Adobe at det kvalitetskontrollerer datasettet. “Hvert bilde som sendes til Adobe Stock, inkludert en svært liten del av bilder generert med AI, går gjennom en streng modereringsprosess for å sikre at det ikke inkluderer IP, varemerker, gjenkjennelige tegn eller logoer, eller referanseartister” navn," En talsperson for Adobe fortalte Bloomberg. 

Oppdagelsen peker på et avvik mellom offentlige meldinger og intern kommunikasjon. Bloomberg fant ut at en artist Relations-ansvarlig for Adobe Stock postet i et Discord-fellesskap at Firefly ville bruke en ny treningsdatabase fri for generativ AI når den forlot beta. Men etter den offentlige utgivelsen av verktøyet sa en annen Adobe-ansatt på Discord at AI-genererte bilder “forbedrer vår datasettopplæringsmodell, og vi bestemte oss for å inkludere dette innholdet for den kommersielt utgitte versjonen av Firefly.” /p>

Selskapet ser ut til å trekke en grense mellom syntetisk innhold mer generelt og spesifikke elementer som må lisensieres, men territoriet er uklart. Det gjenstår å se om Firefly-brukere vil møte opphavsrettsproblemer i fremtiden. Gitt den begynnende naturen til generativ bildegenerering, er det trygt å si at det er et visst nivå av juridisk risiko ved å lage innhold med noen av disse verktøyene.