NORSK

OpenAI foreslår åpen kildekode Triton-språk som et alternativ til Nvidias CUDA

158

Av Tiernan Ray | 28. juli 2021 – 16:06 GMT (17:06 BST) | Tema: Kunstig intelligens

Grafikkbehandlingsenheter fra Nvidia er for vanskelige å programmere, blant annet med Nvidias eget programmeringsverktøy, CUDA, ifølge forskningsfirmaet OpenAI for kunstig intelligens.

Den San Francisco-baserte AI-oppstarten, støttet av Microsoft og VC-firmaet Khosla ventures, introduserte 1.0-versjonen onsdag, et nytt programmeringsspråk spesielt utviklet for å lette den byrden, kalt Triton, beskrevet i et blogginnlegg lenken til GitHub-kildekoden.

OpenAI hevder Triton kan levere betydelige brukervennlige fordeler i forhold til koding i CUDA for noen nevrale nettverksoppgaver som er kjernen i maskinlæringsformer av AI, for eksempel matrisemultiplikasjoner.

“Målet vårt er at det skal bli et levedyktig alternativ til CUDA for Deep Learning,” sa lederen for innsatsen, OpenAI -forsker Philippe Tillet, til ZDNet via e -post.

Triton “er for maskinlæringsforskere og ingeniører som ikke er kjent med GPU -programmering til tross for gode programvareutviklingskunnskaper,” sa Tillet.

Det faktum at språket kommer fra OpenAI, som utviklet GPT-3-programmet for naturlig språkbehandling som har tatt verden med storm, kan gi koden en ekstra forrang i AI-feltet.

Programvaren tilbys som åpen kildekode med kravet, bare merknaden om opphavsrett og tillatelser er inkludert i enhver distribusjon av betydelige kopier av koden.

Også: Chipindustrien kommer til å trenge mye mer programvare for å fange Nvidias ledelse innen AI

Den opprinnelige Triton -avdukingen skjedde med et papir lagt ut av Tillet i 2019 mens en doktorgradsstudent ved Harvard University, sammen med sine rådgivere, HT Kung og David Cox.

Problemet Tillet bestemte seg for å løse var hvordan man lager et språk som ville være mer uttrykksfullt enn de leverandørspesifikke bibliotekene for AI, for eksempel Nvidias cuDNN, som betyr å kunne håndtere en rekke operasjoner på matriser involvert i nevrale nettverk, samtidig som de også å være bærbar og ha ytelse som kan sammenlignes med cuDNN og lignende leverandørbiblioteker.

Å programmere GPUer direkte i CUDA, ifølge Tillet og teamet, er bare for vanskelig. For eksempel kan det være overraskende vanskelig å skrive innfødte kjerner eller funksjoner for GPUer “på grunn av de mange finurligheter i GPU -programmering,” skriver Tillet og team i innlegget.

Spesielt er “GPUer utrolig utfordrende å optimalisere for lokalitet og parallellitet”, som Triton -dokumentasjon forklarer.

Men Tillet ønsket også at språket skulle være lettere å programmere enn tilpasset innsats til dags dato, basert på det som kalles “mikrokjerner” som “innebærer mye manuell innsats.” Spesielt presenteres Triton som et alternativ til de to hovedmetodene som brukes i stedet for leverandørbiblioteker, som kalles polyhedrale kompilerings- og planleggingsspråk.

Det Tillet bestemte seg for er en tilnærming som kalles fliser. Fliser, som brukes mye i CUDA -programmering, tar matrisene som brukes i et maskinlæringsprogram og bryter dem inn i fragmenter som effektivt kan distribueres over delt SRAM -minne og raskt registerminne og effektivt opereres via flere instruksjonstråder parallelt.

Imidlertid er det vanskelig å gjøre parallellisering i CUDA på grunn av ting som behovet for å gjøre eksplisitte synkroniseringsuttalelser mellom instruksjonstrådene i et program.

Også: Hva er GPT-3? Alt bedriften din trenger å vite om OpenAIs banebrytende AI -språkprogram

Tritons semantikk spesifiserer fliser som innebygde typer, slik at en Triton-kompilator kan gjøre arbeidet med å finne ut hvordan disse fragmentene effektivt kan fordeles mellom de mange kjernene i en GPU og tilhørende registre.

Effektivt presses arbeidet med parallellisering og optimalisering av kode fra språket ned i kompilatoren.

Som Tillet uttrykker det, utfører kompilatoren automatisk en rekke viktige programoptimaliseringer.

“For eksempel kan data automatisk lagres i delt minne ved å se på operandene for beregningsmessig intensive blokkeringsoperasjoner.”

OpenAI foreslår åpen kildekode Triton-språk som et alternativ til Nvidias CUDA

OpenAI foreslår åpen kildekode Triton-språk som et alternativ til Nvidias CUDA

Relaterte emner:

LEAVE A REPLY