Nieuwe supercomputer van de Universiteit van Edinburgh, mogelijk gemaakt door Nvidia

0
69

Asha Barbaschow

Door Asha Barbaschow | 28 juni 2021 — 07:00 GMT (08:00 BST) | Onderwerp: Innovatie

De Universiteit van Edinburgh heeft een nieuw high-performance computerplatform ontvangen, genaamd Tursa, dat is geoptimaliseerd voor computationele deeltjesfysica.

Het nieuwe systeem wordt aangedreven door het Nvidia HGX high-performance computerplatform en is de derde van de vier aangekondigde DiRAC “next-generation” supercomputers.

DiRAC is de geïntegreerde supercomputerfaciliteit van het Verenigd Koninkrijk voor theoretische modellering en HPC-gebaseerde onderzoek in astronomie, kosmologie, deeltjesfysica en kernfysica. Het zal het Tursa-systeem aansturen.

Tursa stelt onderzoekers in staat om ultraprecieze berekeningen uit te voeren van de eigenschappen van subatomaire deeltjes die nodig zijn om gegevens te interpreteren van experimenten met massieve deeltjesfysica, zoals de Large Hadron Collider .

“Tursa is ontworpen om unieke onderzoeksuitdagingen aan te pakken om nieuwe mogelijkheden voor wetenschappelijke modellering en simulatie te ontsluiten”, zegt professor theoretische natuurkunde aan de Universiteit van Edinburgh en projectleider voor de DiRAC-3-implementatie Luigi Del Debbio.

Tursa is gebouwd met Atos en zal beschikken over 448 Nvidia A100 Tensor Core GPU's en vier Nvidia HDR 200Gb/s InfiniBand-netwerkadapters per node.

Bij het aankondigen van het laatste nieuws over zijn samenwerking met DiRAC, gebruikte Nvidia ook Mobile World Congress om te zeggen dat het het Nvidia HGX AI-supercomputerplatform “turbocharged” en rekende op de combinatie van AI met HPC om in andere industrieën door te breken.

< p>“HPC gaat overal naartoe, AI gaat overal heen, elke onderneming ter wereld zal supercomputing gebruiken om hun bedrijf te versnellen”, vertelde Gilad Shainer, senior vice president Networking bij Nvidia, aan de media.

“Supercomputing [is] voor steeds meer applicaties … het beheren van de supercomputer wordt daarom veel gecompliceerder. Je moet beveiliging in supercomputing brengen omdat je de gebruikers moet isoleren, tussen de applicaties moet isoleren, tussen de gebruikers moet beschermen, je moet gegevens beschermen .”

Nvidia heeft drie technologieën toegevoegd aan zijn HGX-platform: de Nvidia A100 80GB PCIe GPU, Nvidia NDR 400G InfiniBand-netwerken en Nvidia Magnum IOTM GPUDirect Storage-software.

image-nvidia-a100-80gb -pcie.jpg

Nvidia A100 80Gb PCle

Afbeelding: Nvidia

De Nvidia A100 Tensor Core GPU's leveren volgens het bedrijf “ongekende HPC-versnelling” om complexe AI-, data-analyse-, modeltraining- en simulatie-uitdagingen op te lossen die relevant zijn voor industriële HPC. A100 80GB PCIe GPU's vergroten de GPU-geheugenbandbreedte met 25% vergeleken met de A100 40GB, tot 2TB/s, en bieden 80GB HBM2e geheugen met hoge bandbreedte.

“Als we een supercomputer bouwen, draait het altijd om prestaties… maar dit is waar we een groot probleem beginnen te raken,” zei Shainer. “De manier om het op te lossen is door de GPU te gebruiken … de GPU in de supercomputer te brengen en de GPU te gebruiken om al het infrastructuurbeheer uit te voeren … vanaf de CPU.”

Nvidia-partnerondersteuning voor de A100 80GB PCIe omvat Atos, Cisco, Dell Technologies, Fujitsu, H3C, HPE, Inspur, Lenovo, Penguin Computing, QCT en Supermicro. Het HGX-platform met op A100 gebaseerde GPU's die onderling zijn verbonden via NVLink, is ook beschikbaar via cloudservices van Amazon Web Services, Microsoft Azure en Oracle Cloud Infrastructure.

Nvidia NDR 400G InfiniBand-netwerken worden ondertussen aangeprezen als schaalprestaties om de enorme uitdagingen in industriële en wetenschappelijke HPC-systemen aan te pakken.

“Die systemen brengen onze bandbreedte naar een hoger niveau. We verplaatsen het datacenter van 200Gb/s naar 400Gb/s om gegevens sneller te kunnen verplaatsen, om de GPU's te kunnen voeden om te vergroten wat we kunnen doen,” zei Shainer.

Nvidia Quantum-2 switchsystemen met vaste configuratie leveren 64 poorten van NDR 400Gb/s InfiniBand per poort, of 128 poorten van NDR200, wat een drie keer hogere poortdichtheid biedt dan HDR InfiniBand , legde hij uit.

De Nvidia Quantum-2 modulaire switches, vervolgde hij, bieden schaalbare poortconfiguraties tot 2.048 poorten van NDR 400Gb/s InfiniBand — of 4.096 poorten van NDR200 — met een totale bidirectionele doorvoer van 1,64 petabits per seconde. De switch met 2048 poorten biedt een 6,5x grotere schaalbaarheid ten opzichte van de vorige generatie, met de mogelijkheid om meer dan een miljoen nodes aan te sluiten.

De schakelaars zullen naar verwachting tegen het einde van het jaar bemonsterd worden. Van infrastructuurfabrikanten zoals Atos, DDN, Dell Technologies, HPE en Lenovo wordt ook verwacht dat ze de Quantum-2 NDR 400Gb/s InfiniBand-switches integreren in hun enterprise- en HPC-aanbod.

Beschreven als “ongeëvenaarde prestaties voor complexe workloads”, maakt Magnum IO GPUDirect Storage, zei Nvidia, directe geheugentoegang mogelijk tussen GPU-geheugen en opslag.

“Het directe pad stelt applicaties in staat te profiteren van een lagere I/O-latentie en de volledige bandbreedte van de netwerkadapters te gebruiken, terwijl de gebruiksbelasting van de CPU wordt verminderd en de impact van een verhoogd dataverbruik wordt beheerd”, aldus Nvidia. .

Nvidia en Google Cloud kondigden ook plannen aan op het Mobile World Congress om een ​​AI-on-5G-innovatielab op te richten.

Het paar ziet het als een kans voor spelers op het gebied van netwerkinfrastructuur en AI-softwarepartners om te ontwikkelen, testen en en oplossingen aan te nemen die “de creatie van slimme steden, slimme fabrieken en andere geavanceerde 5G- en AI-toepassingen zullen helpen versnellen”.

Het bedrijf kondigde ook aan dat zijn “next-generation” Aerial A100 AI-on-5G-computerplatform 16 Arm-gebaseerde CPU-kernen zal opnemen in de Nvidia BlueField-3 A100.

NIEUWSTE VAN NVIDIA

Nvidia CEO vermijdt mobiele RTX ten gunste van GeForce Now CEO's van Arm en NVIDIA bespreken controversiële fusie: 'Onafhankelijkheid staat niet gelijk aan kracht' Er is nu een opening voor ARM in servers Nvidia voegt Base Command toe met SuperPod als een service, plant gecertificeerde Arm-systemen in 2022 Nvidia neemt AV-mappingbedrijf DeepMap over om zijn DRIVE-platform te versterken Nvidia maakt Fleet Command algemeen beschikbaar met AI Launchpad binnenkort beschikbaar

Verwante onderwerpen:

CXO Digital Transformation Tech Industry Smart Cities Cloud Asha Barbaschow

Door Asha Barbaschow | 28 juni 2021 — 07:00 GMT (08:00 BST) | Onderwerp: Innovatie