Nvidia will die virtuelle und physische Welt mit KI-Avataren füllen

0
124

Nvidia hat eine neue Plattform zur Erstellung virtueller Agenten namens Omniverse Avatar angekündigt. Die Plattform kombiniert eine Reihe von diskreten Technologien – darunter Spracherkennung, synthetische Sprache, Gesichtsverfolgung und 3D-Avatar-Animation –, die laut Nvidia für eine Reihe virtueller Agenten verwendet werden können.

In einer Präsentation auf der jährlichen GTC-Konferenz des Unternehmens zeigte Nvidia-CEO Jensen Huang einige Demos mit Omniverse Avatar-Technologie. In einem führt eine niedliche animierte Figur in einem digitalen Kiosk ein Paar durch die Speisekarte eines Fast-Food-Restaurants und beantwortet Fragen wie beispielsweise, welche Produkte vegetarisch sind. Der Charakter verwendet Gesichtsverfolgungstechnologie, um den Blickkontakt mit den Kunden aufrechtzuerhalten und auf ihre Mimik zu reagieren. „Dies wird für Smart Retail, Drive-Throughs und Kundenservice nützlich sein“, sagte Huang über die Technik.

In einer Demo wurde die Avatar-Technologie von Nvidia verwendet, um einen niedlichen Charakter zu erschaffen, der ein paar sprach über ein Menü.

In einer anderen Demo beantwortete eine animierte Spielzeugversion von Huang Fragen zu Themen wie Klimawandel und Proteinproduktion, und in einer dritten verwendete jemand einen realistischen animierten Avatar von sich selbst als Stellvertreter während einer Telefonkonferenz. Der Anrufer trug legere Kleidung in einem belebten Café, aber sein virtueller Avatar war elegant gekleidet und sprach ohne störende Hintergrundgeräusche. Dieses letzte Beispiel baut auf der Arbeit von Nvidia Project Maxine auf, die darauf abzielt, häufige Probleme bei Videokonferenzen (wie Streams mit geringer Qualität und Aufrechterhaltung des Blickkontakts) mit Hilfe von Korrekturen für maschinelles Lernen zu verbessern.

(Sie können die Spielzeugversion von Huang im Video unten ab 28 Minuten sehen. Oder springen Sie zu 1 Stunde 22 Minuten vor, um die Kiosk-Demo zu sehen.)

Die Ankündigung von Omniverse Avatar ist Teil von Nvidias unausweichlicher „Omniverse“-Vision – ein grandioses Branding für eine nebulöse Sammlung von Technologien. Wie beim „Metaversum“ geht es beim „Omniversum“ im Wesentlichen um gemeinsame virtuelle Welten, die eine Remote-Zusammenarbeit ermöglichen. Aber im Vergleich zu der Vision von Facebook-Besitzer Meta geht es Nvidia weniger darum, Ihre Büromeetings in die virtuelle Realität zu transportieren, sondern vielmehr darum, industrielle Umgebungen mit virtuellen Gegenstücken zu replizieren und – im Fall der Avatar-Arbeit – Avatare zu schaffen, die mit Menschen interagieren in der physischen Welt.

Wie immer bei diesen Präsentationen sahen die Demos von Nvidia ziemlich glatt aus, aber es ist nicht klar, wie nützlich diese Technologie in der realen Welt sein wird. Beim Kiosk-Charakter zum Beispiel ist es nicht klar, ob Kunden diese Art von interaktiver Erfahrung tatsächlich vorziehen werden, anstatt einfach die gewünschten Artikel aus einem Menü auszuwählen. Huang bemerkte in der Präsentation, dass der Avatar eine Reaktionszeit von zwei Sekunden hat – langsamer als ein Mensch und zwangsläufig zu Frustrationen führen wird, wenn die Kunden in Eile sind. Auch wenn die Project Maxine-Technologie des Unternehmens auffällig aussieht, haben wir noch keine signifikanten Auswirkungen in der realen Welt.