AI-ledere oppfordret til å integrere lokale datamodeller for mangfoldets skyld

0
20
Yuichiro Chino/Getty Images

Tekniske giganter som for tiden presser ut generative verktøy for kunstig intelligens (GenAI) oppfordres til å innlemme regionale og lokale datamodeller for å sikre at produktene deres bedre gjenspeiler en mangfoldig global befolkning. 

Integrering av de sørøstasiatiske språkene i ett nettverk ( SEA-LION) store språkmodell (LLM), for eksempel, vil hjelpe disse GenAI-verktøyene til å generere mer nøyaktige svar, ifølge Laurence Liew, direktør for AI-innovasjon ved AI Singapore. 

Også : Hvordan Lenovo jobber med å demontere AI-bias mens du bygger bærbare datamaskiner

Han fortalte en test der teamet hans hadde lagt inn et spørsmål spesifikt for et nylig valg i Asia, og ba SEA-LION og en mer populær global offentlig GenAI-plattform om å forutsi utfallet. Det viste seg at førstnevnte genererte et mer nøyaktig resultat, sa han.

Den nåværende iterasjonen av SEA-LION kjører på to basismodeller: en modell med 3 milliarder parametere og en modell med 7 milliarder parametere. Treningsdataene er sammensatt av 981 milliarder språktokens, som AI Singapore definerer som fragmenter av ord laget av å bryte ned tekst under tokeniseringsprosessen. Disse fragmentene inkluderer 623 milliarder engelske tokens, 128 milliarder Sørøst-Asia-tokens og 91 milliarder kinesiske tokens.  

Liew sa at de fleste offentlige GenAI-verktøy i dag er ikke-asiatisk fokuserte og derfor kan ha iboende databias. LLM-er som SEA-LION er mer “kulturelt sensitive”, noe han sa vil sikre at GenAI-genererte svar bedre gjenspeiler regionens samfunnssammensetning. 

Asiatiske land som Thailand og India har også utviklet sine egne LLM-er.

Liew la merke til at SEA-LION er åpen kildekode, og la til at AI Singapore håper slike som Microsoft og Google kan innlemme slike regionale og lokale LLM-er for organisasjoner som opererer i denne regionen.  

AI Singapore, som ble lansert i mai 2017, er et regjeringsdekkende samarbeid som samler alle Singapore-baserte forskningsinstitusjoner, startups og selskaper som utvikler AI-produkter. Det nasjonale programmet tar sikte på å drive landets AI-evner og støttes av flere offentlige etater, inkludert Smart Nation og Digital Government Office og Economic Development Board.

Også: Hvorfor åpen kildekode generative AI-modeller fortsatt er et skritt bak GPT-4

Liew fremhevet ytterligere økende interesse blant bedrifter for å ta i bruk GenAI-produkter. Han pekte på de mange diskusjonene hans team har hatt med Microsoft, som hadde registrert en flom av forespørsler fra bedriftskunder om “tusenvis av seter” for å rulle ut Copilot. 

Ikke alle organisasjoner føler det den har IT-infrastrukturen for å støtte GenAI-adopsjonen. 

Bare 30 % føler at selskapet deres har IT-ressursene som er avgjørende for å distribuere GenAI, ifølge en studie bestilt av Telstra International. Utført av MIT Technology Review Insights, undersøkte studien 300 ledere og bedriftsledere på C-nivå, med 66 % fra Asia-Stillehavsmarkedene – inkludert Australia, Singapore, Sør-Korea, Japan og India – og 17 % hver fra Europa og Amerikanerne. Undersøkelsen ble utført mellom november og desember 2023. 

Dessuten: Singapore ser ut til å akselerere AI-utvikling med investeringer i databehandling og talent

Omtrent 67 % av de tidlige GenAI-brukerne mente at maskinvaren deres var “beskjedent gunstig” for rask bruk. Omtrent halvparten sa det samme for sin lagringsinfrastruktur. 

Mens 76 % sa at de hadde jobbet med GenAI på en eller annen måte i fjor, sa bare 9 % at organisasjonen deres hadde tatt det i bruk bredt. De fleste nevnte automatisering av lavverdioppgaver som hovedårsaken til å gjøre det, mens andre pekte på kundeservice, strategisk analyse og produktinnovasjon.

Omtrent 60 % erkjente at GenAI ville forstyrre industrien deres betydelig på grunn av neste fem år, med 78 % som behandler teknologien som en konkurransemulighet. Bare 8 % så på det som en trussel. Omtrent 65 % sa at organisasjonen deres aktivt ser på nye og innovative måter å bruke GenAI for å trekke ut verdi fra data. 

Også: Generativ AI bør være mer inkluderende etter hvert som den utvikler seg, ifølge OpenAIs administrerende direktør

På spørsmål om barrierer for adopsjon, pekte 77 % på regulerings-, samsvars- og personvernhensyn, mens 56 % fremhevet budsjett som en begrensning. 

Respondentene bemerket også mangel på nødvendige ferdigheter, med maskinlæring ingeniører, AI-dataforskere og oversettere blant topptalentene som trengs.

“Når verden blir stadig mer digitalisert og menneske-til-maskin-interaksjoner blomstrer, er det viktig å kunne behandle data for å ta informerte sanntids- eller nesten sanntids forretningsbeslutninger,” sa Geraldine Kor, administrerende direktør og leder for Telstra International i Sør-Asia. av global virksomhet. 

“Men å bygge ende-til-ende-kapasiteter for å håndtere store datasett, nøyaktig kontekstualisere dataene for forretningsverdi og sikre ansvarlig og etisk anvendelse av AI er ekstremt utfordrende.” sa Kor, som diskuterte undersøkelsens funn på en mediebriefing mandag som inkluderte Liew som gjest. 

Også: Gå over Gemini, åpen kildekode AI har egne videotriks

I tillegg fortsetter organisasjoner å operere i et globalt klima som er full av geopolitiske spørsmål og et usikkert økonomisk landskap. Dette vil påvirke beslutningene deres om hvordan de skal investere IT-utgifter og om dette bør inkludere GenAI, sa Kor. Hun anbefaler at bedrifter starter med å identifisere én spesifikk funksjon de kan bruke GenAI på. 

“Singapore, som de fleste land, er fortsatt i de tidlige stadiene av å ta i bruk GenAI, med teknologien som først nylig ble tilgjengelig i produktivitetssuiter som passer for et bredere publikum,” sa Liew. “Kravene for effektiv implementering av GenAI inkluderer tilgang til ekte datasett, AI-ingeniører og datamaskininfrastruktur.”

Bedrifter står også overfor et dilemma når det gjelder å anskaffe nødvendig maskinvare, bemerket han. “Valg inkluderer direkte kjøp og outsourcing etter hvert, som begge har sin egen risiko. I tillegg forblir datakvalitet, lagring og talent flaskehalser for effektiv distribusjon,” sa han. 

Også: De beste AI-chatbotene: ChatGPT er ikke den eneste som er verdt å prøve

Han la til at AI Singapore ønsker å tette noen av disse hullene med initiativer som AI Lærlingsprogram og LLM Application Developer Program. 

Singapore publiserte i januar også en håndbok for å hjelpe lokale bedrifter, inkludert små og mellomstore bedrifter, med å navigere i bruken av GenAI og tilegne seg de nødvendige ferdighetene for å støtte slike initiativer .