Intel -arkitekten Koduri säger att varje chip kommer att vara en neural nätprocessor

0
111

 Tiernan Ray

Av Tiernan Ray | 19 augusti 2021 – 13:05 GMT (14:05 BST) | Ämne: Artificiell intelligens

 intel-raja-koduri-2021.png

Intels arkitektchef, Raja Koduri.

Bearbetningen av neurala nätverk för artificiell intelligens blir en viktig del av arbetsbelastningen för alla typer av chip, enligt chipjätten Intel, som på torsdagen presenterade detaljer om kommande processorer under sin årliga “Arkitekturdag” -ritual.

“Neurala nät är de nya apparna”, säger Raja M. Koduri, senior vice president och general manager för Intels Accelerated Computing Systems and Graphics Group, i en intervju med ZDNet via Microsoft -team.

“Det vi ser är att varje uttag, det är inte CPU, GPU, IPU, allt kommer att ha matrisacceleration”, säger Koduri.

Koduri tog över Intels nybildade Accelerated Computing Unit i juni som en del av en bred omorganisation av Intels ledande ledning under VD Pat Gelsinger.

Koduri hävdade Intel genom att påskynda matrismultiplikationerna i hjärtat av neurala nätverk, Intel kommer att ha de snabbaste chipsen för maskininlärning och djupinlärning och någon form av bearbetning av artificiell intelligens.

Också: Intel bildar Accelerated Computing, Software business units

“Vi är den snabbaste AI -CPU, och vår Sapphire Rapids, vår nya datacenterarkitektur, är den snabbaste för AI -arbetsbelastningar, våra nya GPU: er, ingen hittills, det har varit dussintals uppstarter, men ingen slog Nvidia på ett träningsriktmärke, och det har vi visat idag. ”

Intel visade en demonstration där dess kommande fristående GPU, Ponte Vecchio, bested Nvidias A100 GPU i en gemensam riktmärke neuralt nätverk uppgift, kör ResNet-50 neurala nätverk för att kategorisera bilder i från ImageNet bibliotek med fotografier.

21"

Intel hävdar att pre-prodution-versioner av sin Ponte Vecchio GPU kan bäst Nvidia på ett standardmått för neurala nätverksprestanda i deep learning-applikationer, där ResNet-50 neuralt nätverk måste utbildas för att bearbeta tusentals bilder per sekund från ImageNet bildsamling .

Intel hävdar att Ponte Vecchio också kan skapa förutsägelser snabbare med ResNet-50 på ImageNet jämfört med Nvidia och andra i så kallade inferene -uppgifter.

I demonstrationen hävdar Intel att Ponte Vecchio, i förproduktionskisel, kan bearbeta över 3400 av bilderna på en sekund och toppa tidigare poster med 3000 bilder. Det är för neurala nätverksträning. Inom området för inferens, när ett utbildat neuralt nät gör förutsägelser, kan Ponte Vecchio göra förutsägelser för över 43 000 bilder på en enda sekund, och toppar vad det nämner som det konkurrerande toppresultatet på 40 000 bilder per sekund.

Intels Xeon -chips har tenderat att dominera marknaden för AI -slutsatser, men Nvidia har gjort inhopp. Intel har en liten andel i neurala nätverksträning medan Nvidia dominerar fältet med sina GPU: er.

Koduri sa att företaget avser att tävla mot Nvidia i den årliga bakningen av AI-chips, MLPerf, där företaget hävdar skryt på ResNet-50 och andra sådana jämförelseuppgifter.

Arkitekturdagen fokuserar på Intels färdplan för hur dess chips design av kretsar kommer att lägga ut transistorerna och de funktionella blocken på chipet, till exempel aritmetiska logiska enheter, cacher och rörledningar.

En arkitekturändring, för Intel eller för vilket företag som helst, ger nya “kärnor”, hjärtat i processorn som styr hur “datapat” hanteras, det vill säga lagring och hämtning av siffror och kontrollvägen, betydelsen, rörelsen instruktioner kring chipet.

Många aspekter av de nya processorerna har tidigare avslöjats av Intel, bland annat under förra årets arkitekturdag. Företaget måste få mjukvarudesigners att tänka på och arbeta med sina processorer år innan de är redo att rulla av linjen.

Till exempel har världen känt att Intel skulle marknadsföra en ny CPU för klientberäkning, kallad Alder Lake, som kombinerar två sorters processorer. På torsdagen meddelade Intel att de skulle döpa om de två, tidigare kodenamn Golden Cove och Gracemont, till “Performance Core” och “Efficient Core”. Mer information om det från ZDNets Chris Duckett.

Också: Intel presenterar Alder Lake hybridarkitektur med effektiva och prestandakärnor

Bland de nya avslöjandena idag finns att de nya processorerna kommer att använda sig av en hårdvarustruktur som kallas “Thread Director”. Thread Director tar kontroll över hur exekveringstrådar är planerade att köras på processorn på ett sätt som anpassar sig till faktorer som energianvändning, för att ta emot operativsystemet för en del av den rollen.

“Hela sättet som operativsystemet interagerar med hårdvara är en hårdvaruinnovation.” Intel-tråddirektören “ger telemetri på låg nivå om kärnans tillstånd och trådens instruktionsblandning, vilket ger operativsystemet möjlighet att placera rätt tråd på rätt kärna vid rätt tidpunkt.”

 intel-architecture-day -2021-pressdeck-final-slide-63.jpg

Thread Director, en hårdvaruschema som kommer att ta över en del ansvar för hantering av instruktionstrådar från operativsystemet, var en av de nya artiklarna som diskuterades på Intels archticture -dag.

Intel

En annan ny avslöjande är hur chipsen kommer att använda teknik för minnesbandbredd. Till exempel kommer Intels kommande datacenterprocessor, Sapphire Rapids,

Alder Lake att stödja PCIe Gen 5, DDR 5 -minnesgränssnitt, avslöjades.

Intel avslöjade att den kommande datacenterprocessorn, Sapphire Rapids, nästa era i sin Xeon -familj, kommer att ha vissa prestandaspekter. Till exempel kommer chipet att utföra 2048 operationer per klockcykel på 8-bitars heltal datatyper med hjälp av vad Intel kallar sin AMX, eller “avancerade matrisförlängningar”. Återigen ligger tonvikten på neurala typer av operationer. AMX är en speciell typ av matrismultiplikationsförmåga som fungerar över separata brickor i ett chip. Sapphire Rapids består av fyra separata fysiska brickor som var och en har CPU- och accelerator- och input/output -funktioner, men som ser ut som ett logiskt CPU -operativsystem.

 intel -architecture-day-2021-pressdeck-final-slide-128.jpg

Intel hävdar att Sapphire Rapids är optimerat för AI via tillägg som AMX.

Intel

Sapphire Rapids är ett exempel på hur Intel alltmer tittar på den fysiska konstruktionen av chips över flera substrat som en fördel. Användningen av flera fysiska plattor, till exempel, snarare än en monolitisk halvledarmatris, använder vad Intel dubbar sin inbäddade multi-die-sammankopplingsbro.

Torsdagens presentation innehöll också massor av diskussioner om Intels processteknologi, som företaget har försökt rätta till efter felaktiga åtgärder de senaste åren.

På grund av gränserna för Moore's Laws traditionella skalning av transistorstorlek, säger Koduri, är det viktigt att utnyttja andra fördelar som Intel kan erbjuda spånframställning, inklusive stapling av flera munstycken i ett paket.

“Idag är det mycket viktigare för arkitekter att utnyttja alla verktyg i vår process och förpackningsverktygsbröstet än för ett decennium sedan att bygga det här,” sa Koduri. “Innan var det, ja, ja, ja, den traditionella Dennard -skalningen, Moores lag tog hand om det, ta min nya CPU, sätt den på den nya processnoden, du får det gjort.”

 intel-2021-sapphire-rapids.jpg

Han syftade på observationen av Robert Dennard, en forskare vid IBM, på 1970 -talet att allt fler transistorer är packad i ett kvadratiskt område av ett chip, går strömförbrukningen för varje transistor ner så att processorn blir mer energieffektiv. Dennard Scaling anses vara effektivt död, precis som Moores lag.

Både Alder Lake och Sapphire Rapids kommer att byggas av Intel med hjälp av vad det kallar sin “Intel 7” processteknik. Det är ett namn på det som hade kallats “10nm Enhanced SuperFin”, där företaget lägger till en mer effektiv tredimensionell transistor, en FinFet, till 10-nanometerprocessen för ökad effektivitet i energianvändningen. (Intel 7 -beteckningen är en del av ett brett namn på Intels processteknologi som företaget presenterade i juli.)

Samtidigt kommer vissa delar av Intels delar att tillverkas med produktion på Taiwan Semiconductor Manufacturing, som levererar Intels konkurrenter. Att flytta till att outsourca selektivt är en förlängning av Intels befintliga användning av outsourcad transistorproduktion. Det är vad VD Gelsinger har kallat Intels “IDM 2.0” -strategi.

Också: Intel: Databandbredd, sparsamhet är de två största utmaningarna för AI -chips

Idag, säger Koduri, “är det en guldålder för arkitekter eftersom vi måste använda dessa verktyg mycket mer effektivt.” Koduri upprepade ett påstående från U.C. Berkeley -professor David Patterson att datorarkitekter måste kompensera för enhetens fysik som innebär att Moores lag och Dennard Scaling inte längre dominerar.

Naturligtvis, med Nvidia som fortsätter att förnya sig i GPU: er och nu planerar att presentera sin egen CPU, “Grace”, under kommande år, och med startups som Cerebras Systems som bygger helt nya typer av chips, är målet för Intel i AI inte helt enkelt för att göra dess processorer mer AI -vänliga. Det måste vara att förändra hur AI -fältet fungerar.

På frågan om hur Intels olika innovationer kan förändra hur neurala nätverk byggs, sa Koduri att de många typer av processortyper som nu sprider sig hos Intel och på andra håll kommer att behöva samarbeta mycket mer och fungera mindre isär, för att samarbeta på uppgifter.

“Arbetsbelastningarna går definitivt i den riktning där dessa saker som kallas CPU: er, GPU: er och DPU: er och minnen talar till varandra på ett mycket mer sätt än de pratar med varandra just nu.”

“De kommer att prata med varandra, de kommer att ha ett närmare samarbete mellan dessa saker, för att få jobbet gjort, än du har sett under de första fem åren av djupinlärning.”

Koduri hänvisade till perioden 2016 till 2021 som “de första fem åren av djupinlärning”, som han ser det. “De kommande fem åren kommer att föra alla dessa saker närmare varandra.”

måste läsa

 Ethics of AI: Fördelar och risker med artificiell intelligens

AI för AI: Fördelar och risker med artificiell intelligens

Den ökande omfattningen av AI ökar insatserna för stora etiska frågor .

Läs mer

Relaterade ämnen:

Hardware Digital Transformation CXO Internet of Things Innovation Enterprise Software Tiernan Ray

Av Tiernan Ray | 19 augusti 2021 – 13:05 GMT (14:05 BST) | Ämne: Artificiell intelligens