Computex 2017: ARM har mönster på mer än mobil

0
136
ARM Nandan Nyampally

ARM äger den mobila marknaden. Förra året halvledare IP företagets processor mönster användes i cirka 16 miljarder marker, inklusive de i hjärtat av nästan allt smartphone. Dess Mali grafik, som inte funnits så länge, passerat en miljard i år 2016, vilket ger ungefär hälften av telefonen på marknaden.

Men branschen är i förändring. Smartphones driver på i nya riktningar som VR och konsol-kvalitet spel. Ett snabbt antagande av maskininlärning är att sporra mönster som kan köra dessa modeller på kanten i allt från videokameror och självstyrande bilar. Dessa program är i sin tur placerar brant krav på data centers, tvingar företag att bli mer innovativa med servrar och nätverk infrastruktur.

Dessa program kräver en flexibel, heterogena mönster att blanda Cpu, Gpu, och i vissa fall acceleratorer, med massor av minne bandbredd och specialiserad programvara instruktioner för att leverera nya nivåer av prestanda vid ungefär samma effekt. Den nya plattformen som ARM meddelade tidigare i dag är utformad för att leverera denna “totala beräkna” med Cortex-A75 för hög prestanda beräkna, Cortex-A55 för energieffektivitet och Mali-G72 grafik för VR, spel och maskininlärning.

“ARM är att byta till adress beräkna hur förändras varje dag, runt omkring oss,” sade Jem Davies, Vice President och General Manager för Media Bearbetning Grupp på företagets presskonferens på tröskeln till Computex i Taiwan.

Tillkännagivandet kommer på dagen ett år efter ARM meddelade Cortex-A73, sin första design baserad på Artemis mikroarkitektur. Ett avsteg från sin föregångare, Cortex-A72, med ett tyngre fokus på effektivitet och bibehållen prestanda, A73 var en lyckad design finna sin väg in Qualcomms Snapdragon 835 (i modifierad form av Kryo 280), MediaTek Helio X30 och HiSilicon är Kirin 960 bland andra high-end marker. Vid samma tid, ARM meddelade Mali-G71, sin första Bifrost GPU, som används i Samsung Exynos 8895 som driver Galaxy S8 och S8+ på många marknader, liksom Kirin 960 i Huawei Mate 9.

A75 tillhör samma familj som A73 med en relativt kort, out-of-order-ledningen, men ARMEN är klart efter högre resultat i det här, och det har återgått till det bredare design längs rader av A72 kan sända fler instruktioner per cykel. Allt annat lika, A75 kommer att leverera 20% bättre prestanda än A73. Men A75 kommer också att nå högre frekvenser–upp till 3 ghz på en 10mn process-att leverera en 50% ökning på raw heltal prestanda och ännu mer för flyttal och maskininlärning arbetsbelastning, enligt Nandan Nayampally, Vice President och General Manager för den Beräkna produktgrupp. “Det är en väsentlig höjning på prestanda,” tillade han.

Den A55 är en ersättning för den A53, som har funnits längre. Mönstret är liknande men bättre hoppgissning, en ny cache design och stöd för 16 8-bitars heltal operationer per cykel (eller åtta 16-bit floating-point operations) resultat i upp till dubbelt så höga prestanda på samma process och frekvens-eller ca 30% lägre energiförbrukning för samma prestanda. ARM förväntar sig att de A55 att användas på egen hand i entry-nivån och mid-range-telefoner, eller i en Stor.Lite konfiguration med A75 i high-end smartphones och ett brett sortiment av andra produkter.

Både A75 och A55 stöd för ARM: s senaste instruction set, ARM v8.2, som inkluderar en förbättrad minne modell för 32 – och 64-bitars drift, halv-precision flyttal databehandling, RAS (tillförlitlighet tillgänglighet användbarhet) funktioner för företag, och den nya Scalable Vector Extension för high-performance computing. De är också ARM: s första processorer till stöd för den nyligen annonserade Dynamiq klustring teknik som stöder upp till 8 Processorer per kluster med en ny, enhetlig L3-cache i en Dynamiq Gemensam Enhet (DSU) delas mellan alla kärnor. Mer intressant, kluster kan innehålla en kombination av Processorer (med olika effekt, frekvens och område) med oberoende matningsspänning och-skenor för enskilda kärnor eller grupper av kärnor.

För telefoner som innebär att kunder kan använda en mängd olika kombinationer, inklusive fyra Stora A75 kärnor och fyra Små A55 kärnor, åtta A55 kärnor, eller ens en enda A75 och sju Små A55 kärnor-och få mycket bättre prestanda än nuvarande lösningar i ungefär samma makt och område. Ökad prestanda och flexibilitet betyder också att den är lämplig för ett brett utbud av andra produkter också. Detta inkluderar bärbara datorer som kör Windows 10, Chrome OS eller något annat. Nayampally sade att vissa länder (läs: Kina) har uttryckt ett stort intresse i att bygga egen hårdvara och mjukvara. ARM är också att betona dess potential på servrar med flera A75 kluster och dess CoreLink sammanhängande mesh-nätverk. “Det är mycket attraktiv för nätinfrastruktur, [och] det är mycket attraktiv för data center” Nayampally sagt.

Tillsammans med den nya PROCESSORN design, ARM meddelade att nästa version av sitt Bifrost GPU familj Mali-G72, som sagt ger 40% bättre prestanda i ett mindre område och makt budget. Företaget sade att den avslappnade spel marknaden är skiftande särskilt i Kina för att mer fotorealistiska spel på mobil, såsom Digital-Legends ” Afterpulse första-person shooter. Mali-G72 har prestanda och effektivitet optimeringar att minska bandbredden och göra dessa typer av spel som möjligt. VR ups ante ytterligare eftersom systemet behöver för att göra två bilder (en för varje öga) och G72 finns flera tekniker för att minska kostnader och öka kvaliteten–exempelvis 8x eller 16x Multi Prov Anti-Aliasing-för mobil VR.

Den största trenden är dock artificiell intelligens och ARM ägnade en stor del av dagens presskonferens till ny hårdvara och programvara funktioner för maskininlärning. För att vara tydlig, ARMEN är inte att tala om utbildning djupt lärande modeller där mycket större och mer makthungriga processorer som Nvidias Tesla Gpu och Googles senaste Tensor Processing Unit dominera. I själva verket, Nayampally sade en accelerator är inte ens på plan. Snarare ARM är inriktad på Soc som kan köra dessa modeller (inferencing) på kanten. Detta är särskilt viktigt i applikationer där låg latens är kritisk till exempel självgående fordon.

De nyligen släppt ARMEN Beräkna Bibliotek är en uppsättning av låg-programvara instruktioner för att köra AI arbetsbelastning som bildbehandling, datorseende och maskininlärning på Cortex-Processorer och Midgård och Bifrost Grafikprocessorer. ARM sa att instruktionerna kommer att öka inferencing med 10 till 15 gånger på CPU ensam. Mali-G72 GPU har matte optimeringar och lager cachar att leverera 17% bättre prestanda än nuvarande G71 på GEMM (Allmänt Matris för att matrismultiplikation) som utgör den största delen av neurala nätverk. Generellt ARM är lovande att kombinationen av den nya kärnor, Dynamiq kluster arkitektur och minne hierarki, och mjukvaran kommer att leverera en 50x ökning i prestanda köra maskin-lärande algoritmer under de kommande tre till fem åren.

I en avgång, ARM inte meddela antalet licenstagare eller nämna någon av dess ledande partner för A75/A55 och Mali-G72. Bolaget förklarade att kunder i allt större utsträckning föredrar att göra sina egna meddelanden. Den nya plattformen kommer tveklöst att leda till mer kraftfulla telefoner. Men det är klart att ARM siktar bortom mobil och inriktad på en mycket bredare spektrum av applikationer med denna generation av processorer, och det kommer att bli intressant att se vilka typer av produkter som kommer till marknaden påbörjas senare i år.