Google Books and Scholar-brukere pass på: AI-generert tull oversvømmer søkeresultatene

0
21
8642 funky-data/Getty Images

Bruker du Google Bøker til å finne bøker om bestemte emner?  Eller Google Scholar for å dykke ned i akademisk forskning? Her er noe du bør vite: Disse nettstedene, som gjør det mulig for brukere å “søke i verdens mest omfattende indeks over fulltekstbøker” — og søk i akademisk litteratur på tvers av alle disipliner — har begynt å indeksere lavkvalitets, AI-genererte bøker som ser ut til å være skrevet av ekte, menneskelige forfattere.  

Også: Meta lover å merke AI-genererte videoer, bilder og lyd bedre

Dette tipset kommer med tillatelse fra 404 Media, som brukte et enkelt triks for å spore opp AI-genererte bøker. 

Hvis du refererer til aktuelle hendelser på ChatGPT, vil du ofte bli møtt med setningen, "Fra min siste kunnskapsoppdatering." Det er bare OpenAIs måte å fortelle deg at den har tidsbegrensninger på hvilken informasjon den kan få tilgang til.

Men hvis du søker på den spesifikke frasen — “Som av min siste kunnskapsoppdatering” — på Google Bøker vil du støte på bøker som tilsynelatende publiserte innhold generert av ChatGPT ordrett.

Et raskt søk etter den setningen dukket opp side etter side med titler. Noen av bøkene handlet faktisk om ChatGPT og inkluderer den formuleringen for å vise dens grenser, men dusinvis av andre prøver å utgi de AI-genererte skriftene som ekte.

Også: AI tar på seg mer arbeid betyr ikke at det erstatter deg. Her er 12 grunner til å bekymre deg mindre

For eksempel brukte en bok om bombingen i Boston Marathon uttrykket “Som av min siste kunnskapsoppdatering i september 2021, fortsatte saken å være gjenstand for rettslige prosesser, og det endelige resultatet var fortsatt usikkert” når de henvender seg til angrepets gjerningsmenn. "forfatteren" av den boken har 50 andre verk, inkludert titler om den kalde krigen,  9/11, USAs grunnleggere, antikkens Roma, kjente boksere og kjente indianere.

Hver og en av disse titlene ble utgitt i 2023 (ZDNETs egen Jack Wallen tok 30 år å publisere så mange bøker) og var på mellom 50 og 100 sider. Når jeg blar gjennom dem, fant jeg ut at alle tilbød overfladiske fortellinger som i beste fall lignet en Wikipedia-oppføring og i verste fall så ut som ChatGPT bare spyttet ut fakta.

Et raskt søk på nettet avslørte disse bøkene for salg på Amazon og andre forhandlere. 

Også: Dette er grunnen til at AI-drevet feilinformasjon er den største globale risikoen

Når jeg koblet den samme setningen til Google Scholar, som skal være et oppbevaringssted for menneskelig forskning, ble 19 sider med resultater returnert, inkludert artikler om utsatt ungdom, diabetes, autisme, COVID-19 og trøtthet i flyselskaper.

Faktum at AI-generert innhold er der ute, er ikke noe nytt, men når det dukker opp i pålitelige ressurser som Google Books og Google Scholar sammen med ekte, er det litt bekymringsfullt. 

Snakker til 404 Media sa Google at de ville “fortsette å evaluere vår tilnærming etter hvert som bokpubliseringsverdenen utvikler seg” men nevnte ikke å fjerne disse resultatene fra søket.