Hva er dyp læring? Alt du trenger å vite

0
40
Robothode med abstrakte forbindelser. Bilde: Imaginimia via Getty Images

Hva er dyp læring?

Deep learning er en undergruppe av maskinlæring, som i seg selv faller innenfor feltet kunstig intelligens (AI). Denne teknologien fungerer ved å lære en datamodell å lære ved hjelp av eksempel, på samme måte som et barn kan lære av foreldre og lærere. 

Helt enkelt vises en datamodell forskjellige bilder av en rekke objekter og blir fortalt hva hver enkelt representerer. Med trening kan modellen lære å gjenkjenne og kategorisere de forskjellige mønstrene den lager i bildene, og etter hvert gjenkjenne og lære av nye bilder den oppfatter. 

Også: Denne nye teknologien kan blås bort GPT-4 og alt som det

Dyp læring er avgjørende for funksjonen til autonome eller førerløse biler. En førerløs bil bruker en kombinasjon av kameraer og sensorer for å fange opp data fra omgivelsene, for eksempel trafikksignaler, fotgjengere, andre biler på veien, og behandler deretter disse dataene for å bestemme den beste handlingen: om du skal bremse ned, stoppe, gå osv.

Hvordan fungerer dyp læring?

Deep learnings evner skiller seg på flere viktige punkter fra tradisjonell grunn maskinlæring, og lar datamaskiner løse en rekke komplekse problemer.

Den bruker nevrale nettverk, en modell som er basert på aktiviteten til den menneskelige hjernen. På samme måte som hjernen inneholder lag med sammenkoblede nevroner, gjør også et nevralt nettverk i AI det samme, der noder er sammenkoblet for å dele informasjon med hverandre.

Også: < strong>Hva er ChatGPT og hvorfor betyr det noe? Her er det du trenger å vite

Opplæring av disse dyplæringsnettverkene kan ta svært lang tid, og krever at enorme mengder data tas inn og gjentas etter hvert som systemet gradvis avgrenser modellen for å oppnå det beste resultatet.

Nevrale nettverk utvides. inn i vidstrakte nettverk med et stort antall store lag som trenes opp ved hjelp av enorme mengder data. Disse dype nevrale nettverkene har drevet det nåværende spranget fremover i datamaskiners evne til å utføre talegjenkjenning, de mange egenskapene til generativ AI og fremskritt innen helsevesenet.

Hva er noen eksempler på dyp læring?

I denne tiden kan dyp læring finnes overalt fra banebrytende AI-selskaper til stemmeassistenten på smarttelefonen din.

Her er bare noen av de mest populære dyplæringsapplikasjonene:

ChatGPT

OpenAIs chatbot bruker dyp læring og er en av de største dyplæringsmodellene som finnes. ChatGPT bruker OpenAIs 3.5-versjon av en generativ forhåndstrent transformator (GPT 3.5), som viser 175 milliarder parametere. Det nevrale nettverket som gjør ChatGPT så effektivt er opplært til å lære mønstre og relasjoner i språk. 

Også: Hvordan bruke ChatGPT< /p>

Den fjerde versjonen av denne generative ferdigtrente transformatoren (GPT-4) utfører ekspertoppgaver med naturlig språkbehandling (NLP) med den største arkitekturen av store språkmodeller (LLM), bestående av en billion parametere.

p>

Virtuelle assistenter

Taleassistenter, som Google Assistant, Amazon Alexa og Apples Siri, bruker alle dyp læring for talegjenkjenning og NLP. De bruker disse dyplæringsteknikkene for å behandle det du forteller dem nøyaktig og svare deretter. 

Også: De beste AI-kunstgeneratorene å prøve

< p>Disse dyplæringsalgoritmene kan også lære av mønstre i brukerinteraksjoner for å kontinuerlig forbedre opplevelsen for brukeren. 

Svindeloppdagelse

Dyplæring kan brukes av ulike enheter for å oppdage og forhindre svindel. Finansinstitusjoner bruker for eksempel forskjellige algoritmer for å oppdage svindel. En du kanskje er kjent med er langtidsminne (LSTM), en dyplæringsmodell som flagger mistenkelig aktivitet som avviker fra dataene den har blitt trent på. 

Også: AI kan kompromittere vår personlige informasjon

LSTM er et tilbakevendende nevralt nettverk (RNN) som håndterer sekvensielle data og lagrer informasjon om hva det behandler, for å gjenkjenne en fremtredende hendelse, som en potensielt uredelig transaksjon, for å flagge for menneskelig intervensjon.

Helsetjenester< /h3>

Kunstig intelligens har allerede hatt en betydelig innvirkning i helsevesenet. Dyplæringsteknologi har vist seg nyttig ved diagnostisering av øyesykdommer, inkludert diabetisk retinopati og glaukom, og til og med visse kreftformer. 

Også: AI-roboter har vært dyktige medisinske eksamener, men bør de bli din lege?

Fremskritt innen AI innen medisin har bare så vidt begynt.

Hva er maskinlæring vs dyp læring?

Kunstig intelligens omfatter mange forskningsfelt som kan gjøre maskiner i stand til å utføre oppgaver som ville vanligvis ha krevd menneskelig intelligens, og kan variere fra genetiske algoritmer til naturlig språkbehandling. 

Maskinlæring er en undergruppe av AI, og er definert som prosessen med å lære en datamaskin å utføre en oppgave, i stedet for å programmere den hvordan den skal utføre den oppgaven trinn for trinn.

Dyp læring, på sin side , er en undergruppe av maskinlæring, hvis evner på flere viktige punkter skiller seg fra tradisjonell grunn maskinlæring, som lar datamaskiner løse en rekke komplekse problemer som ellers ikke kunne takles.

Også:  Hva er Auto-GPT? Alt å vite om det neste kraftige AI-verktøyet

Maskinlæring kan takle grunne spådommer når data mates, for eksempel å avgjøre om en frukt på et bilde er et eple eller en appelsin. Dyplæring kan løse mer komplekse problemer, som å gjenkjenne håndskrevne tall der en enorm mengde data er nødvendig under trening. 

I det spesifikke eksemplet som er illustrert nedenfor, må datamaskinen være i stand til å takle stor variasjon i hvordan dataene kan presenteres. Hvert siffer mellom 0 og 9 kan skrives på en myriade av måter: størrelsen og den nøyaktige formen til hvert håndskrevne siffer kan variere betydelig avhengig av hvem som skriver og under hvilke omstendigheter.

Også:  Hvordan skrive bedre AI-instruksjoner

Å takle variasjonen til disse funksjonene, og det enda større rotet av interaksjoner mellom dem, er der dyp læring og dype nevrale nettverk bli nyttig.

Hvert nevron i et nevralt nettverk er en matematisk funksjon som tar inn data gjennom en inngang, transformerer disse dataene til en mer mottagelig form og spytter dem ut via en utgang. Du kan tenke på nevroner i et nevralt nettverk som ordnet i lag, som illustrert i bildet nedenfor.

< img src="https://www.zdnet.com/article/" width="1280" height="720" fetchpriority="low" alt="Neuralt nettverk" height="0" width="0" title= "Hva er dyp læring? Alt du trenger å vite" />

Et enkelt diagram over hvordan et nevralt nettverk er organisert.

Bilde: Maria Diaz/ZDNET

How does a deep neural nettverksarbeid?

I eksemplet ovenfor, der en modell lærer å gjenkjenne håndskrevne tall, kan du se en veldig enkel skildring av anatomien til et nevralt nettverk. 

Alle nevrale nettverk har et inputlag , der de første dataene mates inn, og et utdatalag som genererer den endelige prediksjonen. 

Også: ChatGPTs intelligens er null, men det er en revolusjon i nytten, sier AI-ekspert

Men i et dypt nevralt nettverk kan det være titalls hundrevis av skjulte lag med nevroner mellom disse input- og outputlagene, som hver mater data inn i hverandre. Derav begrepet “dyp” i “dyp læring” og “dyp nevrale nettverk”; det er en referanse til det store antallet skjulte lag i hjertet av disse nevrale nettverkene.

I grafikken ovenfor representerer hver sirkel et nevron i nettverket, og de er organisert i vertikale lag og sammenkoblet . De skjulte lagene i dype nevrale nettverk kan ha titalls hundrevis av skjulte lag.

Når bør du bruke dyp læring?

Dyplæringsalgoritmer kan ta rotete og stort sett umerkede data, som video, bilder, lydopptak og tekst, og pålegge nok rekkefølge til å lage nyttige spådommer, bygge et hierarki av funksjoner som utgjør en hund eller katt i et bilde eller av lyder som danner et ord i tale.

Også: AI kan automatisere 25 % av alle jobber. Her er hvilke som er mest (og minst) utsatt

Som et resultat er det best å bruke dyp læring når det er en enorm mengde data og det er stort sett ustrukturert. 

Hva er ulempene med dyp læring?

En av de store ulempene er mengden data de trenger for å trene, da dette betyr at de krever tilgang til enorme mengder distribuert datakraft. Dette kravet resulterer i høye kostnader for opplæring og maskinvare, siden opplæring kan kreve dyr maskinvare, som avanserte GPUer og GPU-matriser. 

Også: Generativ AI endrer din teknologikarrierebane. Hva du bør vite

En annen ulempe er at dype nevrale nettverk er vanskelig å trene av flere grunner bortsett fra beregningsressurser. 

Noen vanlige utfordringer for dype nevrale nettverk inkluderer: problemet med forsvinnende gradient og eksploderende gradienter, som kan påvirke gradientbaserte læringsmetoder; ta riktig tid til å justere hyperparametre, som batchstørrelse og treningshastighet; og overtilpasning, når den høye kompleksiteten til nettverket gjør at det også lærer støyen i treningsdataene. 

Hvilke dyplæringsteknikker finnes?

Det finnes ulike typer dyplæringsdata. nevrale nettverk, slik som eksemplene forklart nedenfor, med strukturer som er egnet for ulike typer oppgaver. Denne listen forblir flytende, ettersom forskning gir nye dyplæringsteknikker som skal utvikles med tiden:

    Konvolusjonelle nevrale nettverk (CNN): Disse pleier å bli brukt til datasynoppgaver, ettersom de første lagene deres er spesialiserte for å trekke ut distinkte trekk fra et bilde, som deretter behandles av et mer konvensjonelt nevralt nettverk for å kategorisere det. Recurrent neural networks (RNN) : Disse er mer vanlige for prosesseringsspråk, ettersom de har innebygde tilbakemeldingsløkker, der datautdata fra ett lag sendes tilbake til laget før det, og gir nettverket en form for minne.  Langtidsminnenettverk (LSTM): Som diskutert i et eksempel ovenfor, kan LSTM-er brukes i svindeldeteksjon ettersom de utmerker seg ved å fange opp langsiktige avhengigheter i sekvenser.Generative adversarial networks (GANs): Mest vanlig brukt til å generere data, som f.eks. bilder, tekst og videoer, GAN-er har to kjempende nevrale nettverk: generatoren og diskriminatoren. Generatornettverket prøver å lage overbevisende syntetiske data, og diskriminatoren prøver å skille mellom falske og ekte data. 

Det finnes et stort antall forskjellige typer dype nevrale nettverk. Ingen nettverk er iboende bedre enn de andre, de er bare bedre egnet til å lære bestemte oppgaver.

Hvor lang tid tar det å trene en dyplæringsmodell?

Trening av en dyplæringsmodell -Læringsmodellen kan ta fra timer eller uker, til måneder. Tiden varierer mye, siden den avhenger av faktorer som tilgjengelig maskinvare, optimalisering, antall lag i det nevrale nettverket, nettverksarkitekturen, størrelsen på datasettet og mer.