Durch die Nutzung virtueller 3D-Welten und IoT-Sensoren können digitale Zwillinge mittels KI deutlich einfacher und effizienter trainiert werden. shutterstock.com – Andrey Suslov Zu Beginn des Jahres hat Nvidia auf der CES eine neue Plattform namens Cosmos vorgestellt. Dabei soll es sich laut Hersteller um eine World Foundation Model (WFM)-Entwicklungsplattform handeln. Diese ist darauf ausgelegt, die Entwicklung von sogenannter Physical AI für Roboter und selbstfahrende Fahrzeuge voranzutreiben und zu beschleunigen. KI lernt in einer Simulation der realen Welt Bei Physical AI handelt es sich um ein Konzept, dessen Ziel es ist unter anderem ist, komplexe virtuelle Umgebungen zu schaffen. In diesen wird die Physik der realen Welt simuliert, damit sowohl Roboter als auch Systeme von diesen digitale Nachbildungen lernen und ihre Leistung optimieren können. Für Fabrikroboter kann ein „digitaler Zwilling“ der Fabrik in einem Virtual-Reality-Raum erstellt werden, der jedes Detail der realen Fabrik exakt abbildet. Internet of Things (IoT)-Sensoren in der echten Fabrik speisen kontinuierlich Daten in den Zwilling ein, um ihn aktuell zu halten. Um die KI jedoch effektiv zu trainieren, muss der Zwilling mit physikalischen Eigenschaften wie Schwerkraft und Reibung ausgestattet sein. Mit Nvidias Omniverse können virtuelle 3D-Welten erstellt und simuliert werden, um Programme sowie Roboter und Robotersysteme zu trainieren. Das neu eingeführte Cosmos-System baut auf dieser Omniverse-Plattform auf und erweitert diese durch die Erstellung und Nutzung von World Foundation Models (WFMs). Omniverse + „World Foundation Models“ = Weltsimulation? Der von Nvidia geprägte Begriff „World Foundation Model“ (WFM) vereint „Weltmodelle“, die komplexe Szenarien simulieren, und sogenannte „Foundation Models“, die auf großen Datensätzen trainiert werden. WFMs ermöglichen die Erstellung fotorealistischer, auf den physikalischen Grundregeln dieser Welt basierender Daten für das Training von Modellen. Entwickler können eigene Daten einbringen, die Cosmos erweitern, um Roboter für optimal für bestimmte Bewegungen zu programmieren. Die Cosmos-Plattform kombiniert WFMs, fortschrittliche Tokenizer und eine schnelle Videoverarbeitung, um präzise Szenarien zu generieren. Mit Nvidias Omniverse werden fotorealistische Videos für das Reinforcement Learning von Robotern erstellt, wobei Cosmos Tausende realistische Trainingsszenarien erzeugt. ChatGPT und Robotik Ein Vergleich mit ChatGPT hilft, das Konzept dahinter zu verstehen: Die „Audioübersichten“-Funktion von NotebookLM erstellt beispielsweise lebensechte Podcasts, die schneller und unterhaltsamer sind, als komplexe Texte zu lesen. Nutzer können den Schwierigkeitsgrad schrittweise von einfachen bis zu tiefer gehenden Erklärungen anpassen. Nvidia sieht in Cosmos einen „ChatGPT-Moment“ für die Robotik, da die Technologie neuronaler Netze durch Fortschritte wie das Transformer-Modell von Google revolutioniert wurde. Dies habe das Training beschleunigt, ähnlich wie bei LLM-Chatbots. Auch hier zeigt sich, dass Faktoren wie die Größe der Datensätze, die Trainingsgeschwindigkeit sowie die Leistung und Genauigkeit eng miteinander verbunden sind. KI-Daten sind eine begrenzte Ressource Die Trainingsdaten für Roboter sind begrenzt, da ihre Generierung in der realen Welt teuer und langsam ist. Elon Musk betonte kürzlich zudem, dass KI-Unternehmen die von Menschen erzeugten Daten für das KI-Training nahezu vollständig ausgeschöpft haben. Im Gegensatz zu von Menschen erstellten Texten müssen diese Daten neu erstellt werden. Roboter und autonome Fahrzeuge können jedoch lernen, Aufgaben zu bewältigen und sich in unbekanntem Terrain zurechtzufinden. Mehr autonome Fahrzeuge dank KI Der Einsatz von Cosmos für das Training autonomer Fahrzeuge ermöglicht die schnelle Erstellung realistischer, simulierter Szenarien, was die Fahrsicherheit und Effizienz im Vergleich zum traditionellen, riskanten Training in der realen Welt verbessert. Wenn Nvidia mit dem „ChatGPT-Moment“ der Robotik recht hat, könnte der Fortschritt in der Robotik deutlich beschleunigt werden, was zu mehr Effizienz und einer weitergehenden Verbreitung autonomer Fahrzeuge führen würde – möglicherweise schneller als erwartet.
Roboter bekommen ihren „ChatGPT-Moment”
Durch die Nutzung virtueller 3D-Welten und IoT-Sensoren können digitale Zwillinge mittels KI deutlich einfacher und effizienter trainiert werden. shutterstock.com – Andrey Suslov Zu Beginn des Jahres hat Nvidia auf der CES eine neue Plattform namens Cosmos vorgestellt. Dabei soll es sich laut Hersteller um eine World Foundation Model (WFM)-Entwicklungsplattform handeln. Diese ist darauf ausgelegt, die Entwicklung von sogenannter Physical AI für Roboter und selbstfahrende Fahrzeuge voranzutreiben und zu beschleunigen. KI lernt in einer Simulation der realen Welt Bei Physical AI handelt es sich um ein Konzept, dessen Ziel es ist unter anderem ist, komplexe virtuelle Umgebungen zu schaffen. In diesen wird die Physik der realen Welt simuliert, damit sowohl Roboter als auch Systeme von diesen digitale Nachbildungen lernen und ihre Leistung optimieren können. Für Fabrikroboter kann ein „digitaler Zwilling“ der Fabrik in einem Virtual-Reality-Raum erstellt werden, der jedes Detail der realen Fabrik exakt abbildet. Internet of Things (IoT)-Sensoren in der echten Fabrik speisen kontinuierlich Daten in den Zwilling ein, um ihn aktuell zu halten. Um die KI jedoch effektiv zu trainieren, muss der Zwilling mit physikalischen Eigenschaften wie Schwerkraft und Reibung ausgestattet sein. Mit Nvidias Omniverse können virtuelle 3D-Welten erstellt und simuliert werden, um Programme sowie Roboter und Robotersysteme zu trainieren. Das neu eingeführte Cosmos-System baut auf dieser Omniverse-Plattform auf und erweitert diese durch die Erstellung und Nutzung von World Foundation Models (WFMs). Omniverse + „World Foundation Models“ = Weltsimulation? Der von Nvidia geprägte Begriff „World Foundation Model“ (WFM) vereint „Weltmodelle“, die komplexe Szenarien simulieren, und sogenannte „Foundation Models“, die auf großen Datensätzen trainiert werden. WFMs ermöglichen die Erstellung fotorealistischer, auf den physikalischen Grundregeln dieser Welt basierender Daten für das Training von Modellen. Entwickler können eigene Daten einbringen, die Cosmos erweitern, um Roboter für optimal für bestimmte Bewegungen zu programmieren. Die Cosmos-Plattform kombiniert WFMs, fortschrittliche Tokenizer und eine schnelle Videoverarbeitung, um präzise Szenarien zu generieren. Mit Nvidias Omniverse werden fotorealistische Videos für das Reinforcement Learning von Robotern erstellt, wobei Cosmos Tausende realistische Trainingsszenarien erzeugt. ChatGPT und Robotik Ein Vergleich mit ChatGPT hilft, das Konzept dahinter zu verstehen: Die „Audioübersichten“-Funktion von NotebookLM erstellt beispielsweise lebensechte Podcasts, die schneller und unterhaltsamer sind, als komplexe Texte zu lesen. Nutzer können den Schwierigkeitsgrad schrittweise von einfachen bis zu tiefer gehenden Erklärungen anpassen. Nvidia sieht in Cosmos einen „ChatGPT-Moment“ für die Robotik, da die Technologie neuronaler Netze durch Fortschritte wie das Transformer-Modell von Google revolutioniert wurde. Dies habe das Training beschleunigt, ähnlich wie bei LLM-Chatbots. Auch hier zeigt sich, dass Faktoren wie die Größe der Datensätze, die Trainingsgeschwindigkeit sowie die Leistung und Genauigkeit eng miteinander verbunden sind. KI-Daten sind eine begrenzte Ressource Die Trainingsdaten für Roboter sind begrenzt, da ihre Generierung in der realen Welt teuer und langsam ist. Elon Musk betonte kürzlich zudem, dass KI-Unternehmen die von Menschen erzeugten Daten für das KI-Training nahezu vollständig ausgeschöpft haben. Im Gegensatz zu von Menschen erstellten Texten müssen diese Daten neu erstellt werden. Roboter und autonome Fahrzeuge können jedoch lernen, Aufgaben zu bewältigen und sich in unbekanntem Terrain zurechtzufinden. Mehr autonome Fahrzeuge dank KI Der Einsatz von Cosmos für das Training autonomer Fahrzeuge ermöglicht die schnelle Erstellung realistischer, simulierter Szenarien, was die Fahrsicherheit und Effizienz im Vergleich zum traditionellen, riskanten Training in der realen Welt verbessert. Wenn Nvidia mit dem „ChatGPT-Moment“ der Robotik recht hat, könnte der Fortschritt in der Robotik deutlich beschleunigt werden, was zu mehr Effizienz und einer weitergehenden Verbreitung autonomer Fahrzeuge führen würde – möglicherweise schneller als erwartet.
Roboter bekommen ihren „ChatGPT-Moment” Durch die Nutzung virtueller 3D-Welten und IoT-Sensoren können digitale Zwillinge mittels KI deutlich einfacher und effizienter trainiert werden. shutterstock.com – Andrey Suslov Zu Beginn des Jahres hat Nvidia auf der CES eine neue Plattform namens Cosmos vorgestellt. Dabei soll es sich laut Hersteller um eine World Foundation Model (WFM)-Entwicklungsplattform handeln. Diese ist darauf ausgelegt, die Entwicklung von sogenannter Physical AI für Roboter und selbstfahrende Fahrzeuge voranzutreiben und zu beschleunigen. KI lernt in einer Simulation der realen Welt Bei Physical AI handelt es sich um ein Konzept, dessen Ziel es ist unter anderem ist, komplexe virtuelle Umgebungen zu schaffen. In diesen wird die Physik der realen Welt simuliert, damit sowohl Roboter als auch Systeme von diesen digitale Nachbildungen lernen und ihre Leistung optimieren können. Für Fabrikroboter kann ein „digitaler Zwilling“ der Fabrik in einem Virtual-Reality-Raum erstellt werden, der jedes Detail der realen Fabrik exakt abbildet. Internet of Things (IoT)-Sensoren in der echten Fabrik speisen kontinuierlich Daten in den Zwilling ein, um ihn aktuell zu halten. Um die KI jedoch effektiv zu trainieren, muss der Zwilling mit physikalischen Eigenschaften wie Schwerkraft und Reibung ausgestattet sein. Mit Nvidias Omniverse können virtuelle 3D-Welten erstellt und simuliert werden, um Programme sowie Roboter und Robotersysteme zu trainieren. Das neu eingeführte Cosmos-System baut auf dieser Omniverse-Plattform auf und erweitert diese durch die Erstellung und Nutzung von World Foundation Models (WFMs). Omniverse + „World Foundation Models“ = Weltsimulation? Der von Nvidia geprägte Begriff „World Foundation Model“ (WFM) vereint „Weltmodelle“, die komplexe Szenarien simulieren, und sogenannte „Foundation Models“, die auf großen Datensätzen trainiert werden. WFMs ermöglichen die Erstellung fotorealistischer, auf den physikalischen Grundregeln dieser Welt basierender Daten für das Training von Modellen. Entwickler können eigene Daten einbringen, die Cosmos erweitern, um Roboter für optimal für bestimmte Bewegungen zu programmieren. Die Cosmos-Plattform kombiniert WFMs, fortschrittliche Tokenizer und eine schnelle Videoverarbeitung, um präzise Szenarien zu generieren. Mit Nvidias Omniverse werden fotorealistische Videos für das Reinforcement Learning von Robotern erstellt, wobei Cosmos Tausende realistische Trainingsszenarien erzeugt. ChatGPT und Robotik Ein Vergleich mit ChatGPT hilft, das Konzept dahinter zu verstehen: Die „Audioübersichten“-Funktion von NotebookLM erstellt beispielsweise lebensechte Podcasts, die schneller und unterhaltsamer sind, als komplexe Texte zu lesen. Nutzer können den Schwierigkeitsgrad schrittweise von einfachen bis zu tiefer gehenden Erklärungen anpassen. Nvidia sieht in Cosmos einen „ChatGPT-Moment“ für die Robotik, da die Technologie neuronaler Netze durch Fortschritte wie das Transformer-Modell von Google revolutioniert wurde. Dies habe das Training beschleunigt, ähnlich wie bei LLM-Chatbots. Auch hier zeigt sich, dass Faktoren wie die Größe der Datensätze, die Trainingsgeschwindigkeit sowie die Leistung und Genauigkeit eng miteinander verbunden sind. KI-Daten sind eine begrenzte Ressource Die Trainingsdaten für Roboter sind begrenzt, da ihre Generierung in der realen Welt teuer und langsam ist. Elon Musk betonte kürzlich zudem, dass KI-Unternehmen die von Menschen erzeugten Daten für das KI-Training nahezu vollständig ausgeschöpft haben. Im Gegensatz zu von Menschen erstellten Texten müssen diese Daten neu erstellt werden. Roboter und autonome Fahrzeuge können jedoch lernen, Aufgaben zu bewältigen und sich in unbekanntem Terrain zurechtzufinden. Mehr autonome Fahrzeuge dank KI Der Einsatz von Cosmos für das Training autonomer Fahrzeuge ermöglicht die schnelle Erstellung realistischer, simulierter Szenarien, was die Fahrsicherheit und Effizienz im Vergleich zum traditionellen, riskanten Training in der realen Welt verbessert. Wenn Nvidia mit dem „ChatGPT-Moment“ der Robotik recht hat, könnte der Fortschritt in der Robotik deutlich beschleunigt werden, was zu mehr Effizienz und einer weitergehenden Verbreitung autonomer Fahrzeuge führen würde – möglicherweise schneller als erwartet.