Cerebras inte spendera en minut att arbeta på MLPerf, säger VD

0
133

Tiernan Ray

Genom Att Tiernan Ray

| 19 November 2019 — 17:40 GMT (17:40 GMT)

| Ämne: Artificiell Intelligens

cs-1-exploded-transparent-copy.png

En sprängskiss bild av CS-1, med de plana dörrar på nedre vänstra, pumpar för vatten kylning och fläktar i mitten, och “motor block” i det övre högra som innehåller WSE chip.

(Bild: Cerebras Systems Inc.)

“Jag är mycket mindre intresserade av saker du kan argumentera om på Twitter och mer intresserad av att ha riktiga kunder komma och kolla vad vi har.”

Det är hur Andrew Feldman, verkställande av datorn startar Cerebras System, beskriver sin syn på industrin riktmärken för artificiell intelligens, i synnerhet MLPerf, den mest citerade mått på datorn chip prestanda på AI.

Också: Cerebras VD berättar om den stora konsekvenser för lärande i bolagets stora chip

“Vi har inte spendera en minut att arbeta på MLPerf, vi hunnit med att arbeta på riktiga kunder”, säger Feldman i en intervju per telefon.

“Vi fokuserade tid och uppmärksamhet på överföringen av konkurrenter på stora kunder, och arbetar för att uppnå extraordinära resultat på kunden arbetsbelastning.”

Tillfälle för Feldman kommentarer var avtäckningen tisdag, vid superdator visa SC19, i Boulder, Colo., av Cerebras första dator, CS-1.

cerebras-pv-v3.png

En värme karta över delar av det neurala nätverket som de kör på WSE chip. Varje rektangel är ett lager av neurala nätverk. Storleken på rektangeln är hur många av WSE chip 400,000 kärnor lagret är med. Proportionerna av rektanglar är förhållandet mellan beräkna till kommunikation lagret är med. Nyansen av den rektangel som är dess användning av chip, med mörkare är bättre, vilket innebär att mer fullt ut.

(Bild: Cerebras Systems Inc.)

CS-1, ett chassi som mäter 15 rack enheter högt (lite över två meter, och en och en halv fot bred och tre meter djup), hus bolagets WSE chip, som presenterades i augusti, världens största dator chip. Ett komplext system av vatten-och luftkylning är konstruerade i CS-1, tillsammans med en graf kompilator software suite som optimerar neurala nät för att dra nytta av systemets enorma makt.

Feldman attityd om MLPerf är lite kätterska. Efter alla, alla chip företag som lovar att avsätta Nvidia i neurala nätverk utbildning svartabörshajar sin prestanda på MLPerf. Grundades för ett år sedan i februari med Google, Baidu och akademiker, de MLPerf projektet är tänkt att vara ett “rimligt” ett mått på hur väl olika neurala nät kan tränas till att noggrannhet och hur väl de kan utföra slutledning.

Feldman anges ett par anledningar till undviker den MLPerf bake-off. En är att MLPerf kan vara mer ett mått på hur väl företag förbereda sig för testet än en sann indikator av få riktiga arbete. Hans anmärkningar innebär att riktmärke kan vara gamed, så MLPerf resultat som kanske inte är lika stor som arbetet skulle innebära.

Också: Cerebras har minst tre års leda på konkurrensen med sina gigantiska AI chip, säger upp investor

cs-1-corehero-alpha.jpg

“Motorn block” av CS-1. Koppar delen till vänster är “cold plate” som sitter bakom WSE chip. Mässing block är där kall-vatten pumpar ansluta.

(Bild: Cerebras Systems Inc.)

“MLPerf är en noggrannhet på ett mycket specifikt nätverk som de flesta människor inte använder, säger Feldman. Han var inte särskilt, men statistik som visas av AI nystartade företag tenderar att betona till exempel ResNet-50 utbildning som en gemensam åtgärd, en ganska gammal neurala nätet på denna punkt.

“Chip-nivå jämförelser aldrig att panorera ut på systemnivå”, tillade Feldman. “Riktmärken är faktiskt aldrig uppnås genom din kund.”

Därför, “Du måste ha ett system, och det måste jämföras med kunden arbeta.”

Mer viktigt att Feldman var att “vi är de första att meddela kunden i användning av någon av de nystartade företag” som arbetar på AI marker, som det finns många av. Han hänvisade till det faktum Cerebras meddelade Argonne National Laboratory of US Department of Energy som sin första kund tillbaka på September. 17. Argonne talar denna vecka om sin användning av CS-1 i saker såsom cancer-läkemedel forskning.

Argonne, påpekade han, “hade utplacerade tiotusentals Grafikprocessorer, och ändå är de konsekvent väljer oss.”

I stället för MLPerf och sådana åtgärder, Cerebras erbjuder en mängd olika jämförelser mellan CS-1 och andra system, åtgärder det betonas på tisdag i sin förberett material.

Också: Cerebras första kund för jätte AI chip är supercomputing hog US Department of Energy

Till exempel, företaget säger att det är tre gånger prestandan av Googles TPU 2 Pod, ett system som tar upp 10 standard rack till ett värde av utrustning. CS-1 är en 30 som storlek och drar bara en femtedel kraften i det systemet, Cerebras påståenden.

Cerebras hävdar också att deras system har mer beräkna makt än 1 000 av Nvidias V100 Grafikprocessorer och det är bara en fyrtiondel storlek och en femtionde makt. (Och, Cerebras menar att det är mycket lättare att få en enda CS-1 kör än det är att knyta ihop 1,000 V100s, ett arbete som tar månader.)

De kan inte vara standard i branschen riktmärken, men de är mått på framgång som Feldman anser att världen bör inriktas på åtgärder som faktiskt kan sälja system som motsätter sig beviljande bara skryta.

Artificiell Intelligens

Facial recognition: Denna nya AI: n verktyget kan upptäcka när du är nervös eller förvirrad

Hög energi: Facebook AI guru LeCun föreställer AI: s nästa gräns

Vad är AI? Allt du behöver veta om Artificiell Intelligens

Forskarna använder AI för att spåra stora vita hajar (ZDNet YouTube)

Titta på den här roboten lösa en rubiks Kub med en hand (CNET)

Artificiell intelligens: Cheat sheet (TechRepublic)

Relaterade Ämnen:

Big Data Analytics

Digital Omvandling

CXO

Sakernas Internet

Innovation

Affärssystem

Tiernan Ray

Genom Att Tiernan Ray

| 19 November 2019 — 17:40 GMT (17:40 GMT)

| Ämne: Artificiell Intelligens