Es passiert wahrscheinlich gerade jetzt
Im Zuge der Vorstellung des Universal Robots UR20e, der sich von seinen älteren Geschwistern durch ein völlig anderes Innenleben unterscheidet, wurde hier u.a. der Zulieferer Synapticon (Stuttgart) vorgestellt. Ohne derartig innovative Zulieferer wären manche Neuheiten gar nicht möglich, so die Aussage im Sommer 2022. Der CEO des Unternehmens, Nikolai Ensslen, verfügt über eine herausragende Markt- und Technologiekenntnis. Seine zahlreichen Geschäftsreisen rund um den Globus haben hierzu sicherlich beigetragen. Ohne Zweifel kann Nikolai Ensslen als ein Vordenker der Branche bezeichnet werden. Ich freue mich, ihn als Gastautor an dieser Stelle begrüßen zu dürfen. Der Beitrag paßt gut zum gestrigen über den Einstieg von OpenAI bei 1X Raises.
In den letzten Jahren wurde ich oft nach meiner Meinung zum Stand der Entwicklung der künstlichen Intelligenz gefragt, meist im Zusammenhang mit der Robotik. Meine übliche Antwort war, dass die KI in der Robotik zwar dazu beigetragen hat, uns auf ein solides Niveau der autonomen Navigation und Bewegungsplanung, der Objekterkennung und -manipulation sowie der Mensch-Roboter-Interaktion (Sprache) zu bringen, dass aber das wirklich intelligente Verhalten, das Denken und die Entscheidungsfindung von Robotern noch in weiter Ferne liegen. Während alle genannten „infrastrukturellen KI-Funktionen“ seit mehr als zehn Jahren gut funktionieren, entwickelte sich ihre Verarbeitungsgeschwindigkeit in dieser Zeit von „erschreckend langsam“ zu „akzeptabel“.
Inspiriert von der Science-Fiction seit 80 Jahren, beeindruckt von der vor allem japanischen Forschung vor mehr als 30 Jahren und verblüfft von viralen Videos scheinbar sehr fähiger Roboter im letzten Jahrzehnt, fragen sich die Menschen, wann Roboter endlich so werden, wie wir sie uns schon lange vorstellen. Nach den Enthüllungen der letzten zwei Wochen bin ich zu dem Schluss gekommen, dass die Chancen gut stehen, dass wir bald soweit sind – wenn nicht sogar sehr schnell.
OpenAI veröffentlichte GPT-4, kündigte die Plug-in-Unterstützung für ChatGPT an und 1X (ehemals Halodi) gab bekannt, dass es von OpenAI und anderen finanziert wird – was mir wie ein Wink mit dem Zaunpfahl vorkommt: Nur wenige haben bisher die potenziellen Auswirkungen der großen Sprachmodelle auf die physische Robotik erkannt.
Als ChatGPT Ende letzten Jahres veröffentlicht wurde, konnte ich mir vorstellen, wie nützlich die LLM-Technologie sein könnte, um bessere Mensch-Roboter-Schnittstellen zu schaffen, so wie sie z.B. NEURA Robotics fast zwei Jahre zuvor mit ihrer MAiRA-Serie eingeführt hatte. Obwohl ich bei meinem Einstieg in die Robotikindustrie vor etwa 14 Jahren an Glueware und HW-Beschleunigern für KI-Technologiekomponenten arbeitete, war mir nicht klar, wie weit darüber hinaus die Rolle von LLMs in der Robotik gehen könnte. Die Bildeingabe des GPT-4 hat schließlich den Ausschlag für mich gegeben.
Wenn GPT in der Lage ist, zu erklären, warum irgendein nerdiges Gadget lustig ist, ist es wahrscheinlich auch in der Lage zu verstehen, dass zum Beispiel ein bewusstloser Mensch bei einem Unfall Hilfe braucht. Wir werden sehen, wie weit das gehen kann, und es ist noch einiges an Arbeit nötig, um die generierte Sprache sinnvoll als Input für bestehende Robotersoftwarestapel zurückzugeben. Dennoch bin ich hier hoffnungsvoll: ChatGPT auf Basis von 3.5 war schon nicht schlecht beim Schreiben von ROS-Knoten. Sicher ist, dass Roboter dadurch VIEL intelligenter werden können, als sie es heute sind.
Im Gegensatz zu den Auswirkungen auf die Robotik wurde in der Öffentlichkeit die Frage diskutiert, ob ChatGPT als AGI (künstliche allgemeine Intelligenz, d.h. menschenähnliche Intelligenz) betrachtet werden kann. Meine Meinung dazu ist: Nein, noch nicht. Aber ChatGPT hat sehr deutlich gemacht, was für ein fließender und schwer einzuschätzender Übergang von zweckgebundener KI/Komponenten zu AGI es sein wird. Und die Erkenntnisse der letzten Wochen haben mein Urteil über die Bedeutung von AGI für die Robotik geschärft.
Als ich in den letzten Monaten zu dem aufkommenden Hype um humanoide Roboter befragt wurde, teilte ich meine Vorhersage, dass humanoide Roboter AGI benötigen, damit ihre Anwendung und Akzeptanz in Schwung kommt – rationaler ausgedrückt, damit sie als kommerzielle Produkte Sinn machen. Zweckgebundene Roboter werden sich durchsetzen, solange die Software ebenfalls zweckgebunden ist. Sobald die Software universell wird, muss es auch der Roboter werden, so meine einfache Logik.
In einem humanoiden Roboter werden mehr Hochleistungsantriebe verbaut sein als in einem Auto
Die hohen Kosten für humanoide Hardware werden erst dann auf das gewünschte Niveau sinken, nämlich auf den Preis eines erschwinglichen Autos, wenn die Industrie auch eine Adoption in der Größenordnung von Autos erfährt. Die elektrotechnische Komplexität eines Humanoiden kann als noch höher angesehen werden als die eines Autos: In einem Humanoiden sind viel mehr Hochleistungsantriebe erforderlich als in einem Auto, die übrige Gerätekomplexität ist ähnlich, wenn auch im Volumen natürlich geringer.
Ich glaube nun, dass GPT-4 (und vergleichbare Technologien) es ermöglichen werden, Robotersoftware so universell zu machen, dass auch universelle physische Roboterkörper sinnvoll sind. Deshalb bin ich jetzt der festen Überzeugung, dass die humanoide Welle, die wir derzeit erleben, nachhaltig sein wird. Die verfügbare Softwaretechnologie wird es bald ermöglichen, „ausreichend nützliche“ Roboterprodukte zu entwickeln, um zumindest für die ersten Anwender einen Markt zu schaffen.
Gleichzeitig müssen wir bedenken, dass hier das extreme Tempo der generativen KI auf die übliche harte Realität der physischen Robotik trifft – die leider viel langsamer ist als die rasche Abfolge von Neuigkeiten, an die wir uns bei der „IT-KI“ gewöhnt haben. Mechanische, elektromechanische, mechatronische und eingebettete Technologie ist einfach viel schwieriger zu beherrschen als Dinge aus der IT-Welt. Deshalb gibt es auch weniger Menschen mit dem erforderlichen Fachwissen. Und wegen des höheren Risikos fliegt hier viel weniger Geld herum als dort. Vielleicht, hoffentlich, ist dies eine weitere Veranstaltung, um das zu ändern.
Auf der anderen Seite: Wenn die virtuelle Welt auf die physische Welt trifft, wird es wahrscheinlich aus gutem Grund viel schwieriger. Einige haben bereits Angst vor den jüngsten Fortschritten der KI (zu Recht). Die jüngste Einführung von Plug-ins für ChatGPT wird von Experten als große Risikobereitschaft von OpenAI angesehen – und als Bruch ihres Versprechens, ein vorsichtiger KI-Akteur zu sein. Wie sehr müssen wir uns fürchten, wenn diese Plug-ins mechatronisch werden?
Ziemlich viel. Der Weg dorthin: Eine neue Industrie, vergleichbar mit der zertifizierungsintensiven Automobil-, Luft- und Raumfahrt- oder Medizingeräteindustrie, ist im Entstehen. Glücklicherweise ist durch die Einführung der kollaborativen Robotik und der autonomen mobilen Roboter in den letzten Jahren die zertifizierte funktionale Sicherheit ein immer zentraleres Thema in der Industrierobotik geworden und die Branche ist gerade an dem Punkt angekommen, an dem eine vollständige Zertifizierung der sicheren Bewegungsüberwachung und -begrenzung ein Muss wird.
Als Leiter des Unternehmens mit dem weltweit einzigen vollständig sicherheitszertifizierten Motion-Control-Produktportfolio für die Robotik weiß ich, was heute möglich ist, wenn es darum geht, die Roboter sicher zu machen, die wir heute als kommerzielle Produkte haben. Die zertifizierbare funktionale Sicherheit muss viel weiter gedacht werden als die zertifizierbare Verhaltenssicherheit, sobald universelle humanoide Roboter für die Öffentlichkeit freigegeben werden sollen.
Mit jedem Schritt, den die KI von nun an macht, wird die Robotik drei Anstrengungen unternehmen müssen. Lassen Sie uns die Ärmel hochkrempeln, es kommen spannende Zeiten auf uns zu!
Im nachfolgenden Video begründet der Kunde Robco seine Entscheidung für Synapticon.