Brikkegiganten Intel avduket tirsdag sin siste brikke dedikert til prosessering av kunstig intelligens, “Gaudi 3”, " varmt i hælene til erkerivalen Nvidia som avduket sin Blackwell GPU to uker før.
Avduket på scenen av administrerende direktør Pat Gelsinger, under en direktesendt keynote på selskapets kunde- og partnerkonferanse, Intel Vision 2024, i Phoenix, Arizona, ble fokus plassert på Gaudi 3s appell til virksomheter, med vekt på mål som automatisering av virksomhetsoppgaver.
Også: Nvidia-sjef Jensen Huang avduker neste generasjons 'Blackwell' brikkefamilie hos GTC
Gaudi 3 er tredje generasjon av Intels dedikerte brikke for å utføre kunstig intelligenstrening og inferens. Intel kjøpte brikkefamilien da de kjøpte det risikostøttede oppstartsselskapet Habana Labs i Tel Aviv i 2019 for 2 milliarder dollar.
Gaudi 3 er nesten dobbelt så rask som Nvidias ordinære GPU, H100-brikken, når man trener AI-modeller som TensorRT-modellen for store språk, sa Gelsinger.
(En “AI-modell” er delen av et AI-program som inneholder mange nevrale nettparametere og aktiveringsfunksjon, som er nøkkelelementene for hvordan AI-programmet fungerer.)
Guadi 3 er 50 % raskere enn H100 når man utfører inferens, der et trent nevralt nett gir spådommer som svar på virkelige spørsmål.
Gaudi-brikkefamilien har vist dyktighet i nylige benchmark-tester som går opp mot Nvidia. I den siste runden av MLPerf-konkurransen holdt av MLCommons, et industrikonsortium, var den eksisterende Gaudi 2-brikken den eneste datasenterbrikken som konkurrerte med H100 om å lage spådommer ved å bruke Metas åpen kildekode Llama 2 70 milliarder store språkmodell.
Også: AI-oppstart Cerebras avduker WSE-3, den største brikken til nå for generativ AI
"Best av alt, enorme eierkostnadsfordeler for din organisasjon," sa Gelsinger.
Gelsinger fikk selskap på scenen av gjester, inkludert Michael Dell, IBMs visepresident for produkt Edward Calvesbert, Databricks-sjef for generative AI Naveen Rao (en tidligere Intel-leder), og ledere av Naver, som varemerker seg Sør-Koreas største Internett-selskap.
"Det vi trenger er mer Gaudi 3 i volum," sa Michael Dell, hvorpå han ble presentert for en metallkoffert. Dell åpnet kofferten og en uhyggelig blå glød dukket opp, som fremkalte en scene fra Quentin Tarantino-filmen Pulp Fiction, og uttrykte “Wow.”
Gaudi 3 består av 64 separate tensorkjerner på dysen, for å akselerere matrisemultiplikasjoner i hjertet av AI-prosessering, hjulpet av åtte diskrete “matrisematikkmotorer”. Delen trekker på 96 megabyte med hurtig SRAM-bufferminne på brikken, og ytterligere 128 gigabyte ekstern “HBM3e”; minne, den raskeste bransjens DRAM, sammensatt av flere minnebrikker som er stablet ved siden av prosessoren.
Guadi 3 kan oppnå 1,84 teraFLOPs, en billion flytepunktoperasjoner per sekund, når du arbeider med 8-bit flytepunkts matematiske operasjoner, det mye brukte målet for chipytelse.