Computex 2017: ARM har designs på mere end mobil

0
112
ARM Nandan Nyampally

ARM ejer det mobile marked. Sidste år halvleder IP virksomhedens processor design blev anvendt i omkring 16 millioner chips, herunder dem, der er i centrum for næsten nogensinde smartphone. Dens Mali grafik, som ikke har været omkring så længe, krydsede en milliard i 2016, giver det omkring halvdelen af den telefon på markedet.

Men branchen er under forandring. Smartphones er at skubbe det i nye retninger som VR-og konsol-kvalitet gaming. Den hurtige vedtagelse af machine learning er ansporer til designs, der kan køre disse modeller på kanten i alt fra video-kameraer til at selvkørende biler. Disse ansøgninger er til gengæld placere stejle krav til datacentre, som tvinger virksomheder til at være mere innovative med servere og netværks infrastruktur.

Disse programmer kræver fleksible, heterogene design, der blander Cpu ‘er, Gpu’ er, og i nogle tilfælde acceleratorer, med masser af hukommelse, båndbredde og specialiseret software, instruktioner til at levere et nyt niveau af ydeevne på omkring samme effekt. Den nye platform, at ARM meddelte tidligere i dag, er designet til at levere denne “samlede compute” med Cortex-A75 for high performance beregne, Cortex-A55 for strømeffektivitet, og Mali-G72 grafik til VR, gaming og machine learning.

“ARMEN er ved at ændre adresse, hvordan beregne ændrer sig hver dag over alt omkring os,” sagde Jem Davies, Vice President og General Manager for Medier Behandling Gruppe på selskabets pressekonference på tærsklen til Computex i Taiwan.

Annonceringen kommer det ene år til dagen efter meddelte ARM Cortex-A73, sin første design baseret på Artemis mikroarkitektur. En afvigelse fra sin forgænger, Cortex-A72, med en tungere vægt på energieffektivitet og vedvarende ydeevne, A73, var et vellykket design finde sin vej ind Qualcomm ‘ s Snapdragon 835 (i modificeret form af Kryo 280), MediaTek Helio X30 og HiSilicon er Kirin 960 blandt andre high-end chips. På samme tid, meddelte ARM Mali-G71, sin første Bifrost GPU, som er anvendt i Samsung Exynos 8895, at beføjelser Galaxy S8 og S8+ på mange markeder, samt Kirin 960 i Huawei Mate 9.

A75, der tilhører samme familie som A73 med en relativt kort, out-of-order pipeline, men ARM er helt klart efter højere ydelse her, og det er vendt tilbage til bredere design langs linjer af A72 i stand til at afsende flere instruktioner pr cyklus. Alt andet lige, A75 vil levere 20% bedre ydelse end A73. Men A75 vil også nå højere frekvenser–op til omkring 3 ghz på en 10nm proces–levere en 50% stigning på rå heltal præstation og endnu mere for floating-point og machine learning arbejdsbelastninger, i henhold til Nandan Nayampally, Vice President og General Manager af Compute-Produkt Gruppe. “Det er en betydelig stigning i ydeevne,” tilføjede han.

Den A55 er en erstatning for den A53, der har været omkring længere. Designet er lignende, men bedre branch prediction, en ny cache design, og støtte til 16 8-bit integer operationer per cyklus (eller otte 16-bit floating point operationer) resultater i op til dobbelt ydelse på den samme proces og frekvens-eller omkring 30% lavere strømforbrug for den samme ydelse. ARM forventer, A55 til at blive brugt på sin egen i entry-level og mid-range telefoner, eller i en Stor.Lidt konfiguration med A75 i high-end smartphones, og en lang række andre produkter.

Både A75 og A55 støtte ARM ‘ s nyeste instruktionssæt, ARM v8.2, der omfatter en udvidet hukommelse model for 32 – og 64-bit drift, halv-precision floating point databehandling, RAS (pålidelighed tilgængelighed servicevenlighed) funktioner til enterprise applikationer, og nye Scalable Vector Extension for high-performance computing. De er også ARM ‘s første processorer til støtte for sin nyligt annoncerede Dynamiq clustering teknologi, der understøtter op til 8 Cpu’ er per klynge med en ny fælles L3-cache i en Dynamiq Fælles Unit (DSU) delt på tværs af alle kerner. Mere interessant, klynge kan indeholde enhver kombination af Cpu ‘ er (med forskellig effekt, frekvens og område) med uafhængig strømforsyning og skinner for de enkelte kerner eller grupper af kerner.

For telefoner, der betyder, at kunderne kan bruge en bred vifte af kombinationer, herunder fire Store A75 kerner og fire Små A55 kerner, otte A55 kerner, eller endda en enkelt A75 og syv Små A55 kerner-og få langt bedre resultater end de nuværende løsninger i om den samme magt og område. Den øgede ydeevne og fleksibilitet betyder også, at det er egnet for en bred vifte af andre enheder også. Dette inkluderer bærbare computere, der kører Windows 10, Chrome OS eller noget andet. Nayampally sagde, at nogle lande (læs: Kina) har givet udtryk for stor interesse i at opbygge deres egen hardware og software. ARM er også at understrege dens potentiale i at servere ved hjælp af flere A75 klynger og dens CoreLink sammenhængende mesh-netværk. “Det er meget attraktivt for netværksinfrastruktur, [og] det er meget attraktivt for de data center,” Nayampally sagde.

Sammen med den nye CPU-design, ARM annonceret den næste version af sit Bifrost GPU familie Mali-G72, hvori det siges, giver 40% bedre performance i et mindre område og magt budget. Selskabet sagde, at de casual gaming markedet er ved at flytte, især i Kina til mere fotorealistiske spil på mobil som Digital Legends’ Afterpulse first-person shooter. Mali-G72 har ydeevne og effektivitet optimeringer at reducere båndbredde og gøre disse former for spil, det er muligt. VR ups ante yderligere, fordi systemet skal gøre to billeder (ét til hvert øje) og G72 omfatter flere teknologier, der kan reducere overhead og øge kvaliteten-herunder 8x eller 16x Multi Prøve Anti-Aliasing-til mobil VR.

Den største tendens, dog er kunstig intelligens og ARM viet meget af dagens pressekonference, at ny hardware og software funktioner for machine learning. For at være klar, ARM er ikke tale om træning dyb læring modeller, hvor meget større og mere strømslugende processorer såsom Nvidia Tesla Gpu ‘er og Google’ s nyeste Tensor Processing Unit, der dominerer. I virkeligheden, Nayampally sagde en accelerator er ikke engang på køreplanen. Snarere ARM er fokuseret på SoCs, der kan køre disse modeller (inferencing) i kanten. Dette er især vigtigt i applikationer, hvor lav latency er kritisk, såsom selv-kørsel med køretøjer.

Den nyligt udgivet ARM Beregne Biblioteket er et sæt af lav-niveau-softwaren instruktioner til at køre AI arbejdsopgaver såsom billedbehandling, computer vision og machine learning på Cortex-Cpu ‘En og for en Rundvisning og Bifrost Gpu’ er. ARM sagde, at vejledningen vil øge inferencing med 10 til 15 gange på CPU ‘ en alene. Mali-G72 GPU omfatter matematik, optimeringer og lager caches, der giver 17% bedre ydelse end de nuværende G71 på GEMM (General Matrix-Matrix Multiplication), der udgør hovedparten af neurale netværk. Alt i alt ARM er lovende, at kombinationen af nye kerner, Dynamiq cluster arkitektur og hukommelse hierarki, og software vil levere en 50x stigning i ydeevne kører machine-learning algoritmer, der i løbet af de næste tre til fem år.

I en afgang, ARM ikke annoncere antallet af licenshavere eller nævne nogen af dets ledende partnere til A75/A55 og Mali-G72. Selskabet forklarede, at kunderne i stigende grad foretrækker at gøre deres egne meddelelser. Den nye platform vil uden tvivl resultere i mere kraftige telefoner. Men det er klart, at ARM sigter ud over mobile og rettet mod et meget bredere vifte af applikationer med denne generation af processorer, og det vil være interessant at se de typer af produkter, der kommer på markedet, der starter senere i år.