NORSK

AMD ruller ut Instinct MI200 GPUer for HPC- og AI-arbeidsbelastninger

147

Av Stephanie Condon for Between the Lines | 8. november 2021 | Emne: Prosessorer

AMD avduket mandag Instinct MI200-akseleratoren, den siste generasjonen av datasenterets GPU. Brikkeprodusenten sier at det er den raskeste HPC- og AI-akseleratoren, og overgår rekorder satt av MI100, rullet ut i fjor.

Instinct MI200 leverer opptil 4,9x økning i databehandling med høy ytelse enn eksisterende datasenter-GPUer, sier AMD. Selskapet hevder også at det er den raskeste for AI-trening, og leverer opptil 1,2 ganger høyere toppflopper for ytelse med blandet presisjon.

akseleratoren inneholder 58 milliarder transistorer produsert med 6nm-teknologi. Dette gir mulighet for opptil 220 beregningsenheter, noe som øker beregningstettheten med over 80 % sammenlignet med MI100. Det er også verdens første GPU med 128 GB HBM2E-minne.

AMD siterer foretak, skystyrke i Q3-takt, høyere årsvisning.Med Epyc Milan-lanseringen har AMD som mål å presse videre inn i bedriften.

Det er verdens første multi-die GPU, med andre generasjon av AMDs CDNA-arkitektur. AMD avduket CDNA-arkitekturen i fjor da den splittet datasenter- og spill-GPU-designene. CDNA-arkitekturen er utformet eksplisitt for å optimalisere datasenterets dataarbeidsbelastning.

“Disse arbeidsbelastningene kjører selvfølgelig på svært forskjellige systemer, så å skille dem i to produkter og to brikkefamilier var en enkel måte for oss å designe bedre produkter,” sa Brad McCreadie, AMD VP for datagalopp GPU-akseleratorer, til journalister forrige uke .

Den nye MI200-akseleratoren er omtrent 5 ganger raskere enn Nvidias A100 GPU i topp FP64-ytelse. Dette er nøkkelen for HPC-arbeidsbelastninger som krever høy presisjon som værvarsling. Dens høyeste FP32 vektorytelse er omtrent 2,5 ganger raskere. Dette er viktig for typer matematiske operasjoner som brukes til vaksinesimuleringer, påpekte AMD.

AMD tar også omslaget av Milan-X, sin første server-CPU med 3D Chiplet-teknologi. Den lanseres offisielt i Q1 2022.

Disse prosessorene har 3 ganger L3-cachen sammenlignet med standard Milan-prosessorer. I Milano hadde hver CCD 32 MB cache. I Milan-X bringer AMD 96 MB per CCD. CPU-en har totalt 804 MB cache per socket på toppen av stabelen, noe som avlaster minnebåndbreddetrykket og reduserer ventetiden. Det igjen øker applikasjonsytelsen dramatisk.

På socket-nivå er Milan-X den raskeste serverprosessoren for tekniske dataarbeidsbelastninger, med en økning på mer enn 50 % for målrettede tekniske dataarbeidsbelastninger over Milano.

AMD har nullstilt noen arbeidsbelastninger som muliggjør produktdesign, for eksempel EDA-verktøy, som brukes til å simulere og optimalisere brikkedesign. En stor hurtigbuffer er avgjørende for å oppnå bedre ytelse for disse arbeidsbelastningene.

I brikkedesign er verifisering en av de viktigste oppgavene. Det hjelper med å fange opp defekter tidlig før en brikke bakes inn i silisium. Sammenlignet med Milan fullfører Milan-X 66 % flere jobber på en gitt tid. Dette bør hjelpe kunder som bruker EDA-verktøy til å fullføre verifiseringen og gå raskere ut på markedet, eller legge til flere tester på samme tid for å forbedre kvaliteten eller robustheten til designet ytterligere.

Prosessorer

Forhåndsutgivelse av Intel Alder Lake-brikken slår Apples M1 Max Alibaba Cloud for å bygge egne servere med ny intern brikke. Det finnes to typer kvantedatabehandling. Ett selskap ønsker å tilby begge Arm-prosessorene: Alt du trenger å vite nå Artificial Intelligence | Maskinvare | Intel | ARM | Innovasjon

Prosessorer

LEAVE A REPLY