Blog

The Human vs. AI Race: When Robots Run but Humans Still Lead

Roboter der durch ein Ziel läuft
22. April 2025
Larissa Arthofer

In Peking wurde am 19.4.2025 Science-Fiction zur Realität: 21 humanoide Roboter traten beim Yizhuang-Halbmarathon gegen über 10.000 menschliche Läufer:innen an. Während der schnellste Mensch die 21,1 Kilometer in knapp über einer Stunde absolvierte, erreichte der schnellste Roboter, „Tiangong Ultra“, das Ziel nach 2:40:24 Stunden – begleitet von menschlichen Techniker:innen, die gelegentlich eingreifen mussten. Einige andere Roboter stolperten bereits am Start, andere benötigten unterwegs Unterstützung. Trotzdem markiert dieses Ereignis einen (PR-)Meilenstein in der Robotik.

Dieses spektakuläre Rennen wirft Fragen auf: Wie weit ist die KI in der physischen Welt tatsächlich? Warum scheint sie in digitalen Bereichen wie Textgenerierung und Datenanalyse schneller voranzukommen als in der Mechanik? In diesem Artikel analysieren wir die aktuellen Fortschritte und Herausforderungen der KI im mechanischen Bereich.

 

Vom Schraubenschlüssel zur Tastatur: Warum KI zuerst unsere Gedanken und nicht unsere Hände ersetzte​

Als Künstliche Intelligenz noch in den Kinderschuhen steckte, herrschte eine klare Erwartung: Maschinen würden zuerst physische Aufgaben wie Greifen, Gehen oder das Erkennen von Objekten meistern – während komplexe kognitive Fähigkeiten wie Sprache erst viel später erreichbar wären. Sprache galt als „zu menschlich“, zu subtil, zu schwer greifbar für die Maschinenlogik. Diese Annahme beruhte auf der Vorstellung, dass körperliche Bewegungen einfacher zu modellieren seien als die Nuancen menschlicher Sprache.

Doch die Realität entwickelte sich anders:

Während humanoide Robotik weiter an technischen Hürden scheitert, hat sich Natural Language Processing (NLP) in den letzten Jahren sprunghaft entwickelt. Modelle wie GPT-4 beherrschen heute Konversation, Textanalyse und sogar juristische Argumentation. Das liegt unter anderem daran, dass:

  • Sprache strukturiert und in großen Mengen digital verfügbar ist.
    Milliarden Texte im Internet bieten exzellentes Trainingsmaterial – standardisiert, annotiert und maschinenlesbar.
  • Kognitive Aufgaben lassen sich mathematisch modellieren.
    Während Bewegungsabläufe hochgradig situationsabhängig sind, folgen viele sprachliche Strukturen wiederkehrenden Mustern. Das ermöglicht den Einsatz leistungsfähiger neuronaler Netze, die skalierbar sind und aus Mustern Wahrscheinlichkeiten ableiten.
  • Die physische Welt = unvorhersehbar.
    Ein Mensch greift intuitiv zur Kaffeetasse – passt Kraft, Winkel und Tempo unbewusst an. Ein Roboter muss dafür zahllose physikalische und sensorische Parameter exakt erkennen und koordinieren. Schon kleine Störungen wie verändertes Licht oder ein unebener Tisch können das System aus dem Tritt bringen.

Das Ergebnis: KI hat sich nicht in der Werkhalle durchgesetzt, sondern in Textfeldern, Suchleisten und juristischen Recherchetools. Und das schneller, als alle Studien voraussagten.

 

Status quo der Robotik: Laufen lernen – im wörtlichen Sinn

Dass Robotik nach wie vor zu den komplexesten Disziplinen der KI zählt, zeigen aktuelle Entwicklungen deutlich. Zwar gibt es sichtbare Fortschritte – man denke an die viralen Videos von Boston Dynamics, deren humanoide Roboter inzwischen tanzen, springen und Gleichgewicht halten – doch der Weg in den praktischen Alltag bleibt steinig. 

Der Weg: 3 Meter. Der Aufwand: mehrere Jahre.

YouTube-Link: Walk, Run, Crawl, RL Fun | Boston Dynamics | Atlas

Ein weiteres Beispiel: Amazon testet seit Jahren vollautomatisierte Kommissionier-Roboter in seinen Logistikzentren. Doch sobald ein Objekt leicht verrutscht oder aus weichem Material besteht, versagen viele Systeme bei der präzisen Entnahme – ein banales Problem mit großer technischer Fallhöhe.

Auch im Pflege- und Gastronomiebereich werden Assistenzroboter pilotiert – oft mit viel medialem Echo, aber begrenzter Praxisdauer. Der Grund: Selbst einfachste Alltagssituationen enthalten eine Vielzahl an unvorhersehbaren Variablen, die sich schwer generalisieren lassen. Genau diese Variabilität ist bis heute eine der größten Herausforderungen physischer KI-Systeme.

 

🔍  Das Moravec-Paradoxon: Was einfach wirkt, ist oft am schwersten

Dieses Missverständnis erklärt das Moravec-Paradoxon: Für Maschinen sind Aufgaben, die uns intuitiv erscheinen – etwa Sehen, Laufen oder Fühlen – oft besonders schwer, weil sie tief in unserer biologischen Entwicklung verankert sind. Komplexe Denkaufgaben wie Schach hingegen lassen sich formalisieren und algorithmisch abbilden. Moravec ging davon aus, dass menschenähnliche Intelligenz frühestens ab 2040 möglich sei – für „Reptilien-Intelligenz“ hingegen gäbe es bereits bald erste Roboter.

 

Zwischen Fortschritt und Frustration 

Während humanoide Roboter noch mit dem Gleichgewicht kämpfen, hat die Künstliche Intelligenz längst damit begonnen, die Wissensarbeit zu verändern – und das spürbar. Gerade im juristischen Alltag bringt sie heute schon konkrete Entlastung.

Die Genjus KI von MANZ zeigt, was das bedeuten kann: Statt sich durch seitenlange Kommentierungen und Parallelstellen zu arbeiten, bekommen Jurist:innen heute transparente und fundierte Antworten – sekundenschnell, kontextbezogen, verlässlich.

Natürlich ersetzt das keine juristische Prüfung im klassischen Sinn. Aber es verschafft genau das, was in der Praxis oft fehlt: Zeit. Fokus. Klarheit. Und macht die digitale Recherche nicht nur effizienter – sondern auch ein Stück angenehmer.

 

Was erwartet uns in Sachen Robotik?

In den nächsten Jahren dürfte die Entwicklung weitergehen – vor allem bei spezialisierter Robotik. Einige nennenswerte Beispiele bisher sind:

  • Agility Robotics' Digit: 

Der humanoide Roboter Digit ist darauf ausgelegt, sich in menschenzentrierten Umgebungen zu bewegen und Aufgaben wie das Heben und Transportieren von Behältern zu übernehmen. Er wird bereits in Lagerhäusern von Amazon eingesetzt. Seine Fähigkeiten sollen dazu beitragen, die körperliche Belastung der Mitarbeitenden zu reduzieren und repetitive Aufgaben effizienter zu gestalten. Trotz der hohen Investitionskosten erwartet Amazon, dass sich diese Technologien innerhalb von zwei bis drei Jahren amortisieren. Die Innovationskraft von „Digit“ wurde auch international anerkannt: Das TIME Magazine kürte den Roboter zu einer der „Best Inventions of 2024“.

  • Toyotas Haushaltsroboter: 

Toyota hat mit der Entwicklung von Haushaltsrobotern einen bedeutenden Schritt gemacht, indem es eine innovative Methode namens „Diffusion Policy“ einsetzt. Diese Technik ermöglicht es Robotern, “komplexe” Aufgaben wie das Aufräumen oder Geschirrspülen zu erlernen, indem sie menschliche Handlungen beobachten und analysieren. Sie nutzt Prinzipien, die auch bei fortschrittlichen KI-Bildgeneratoren Anwendung finden, um in Sekundenbruchteilen die nächste geeignete Aktion aus einer Vielzahl von Möglichkeiten auszuwählen. Ein bemerkenswerter Aspekt dieser Technologie ist die Fähigkeit der Roboter, aus Videos zu lernen. Toyota arbeitet daran, diese Methode mit Sprachmodellen zu kombinieren, um es Robotern zu ermöglichen, Aufgaben allein durch das Ansehen von Videos zu erlernen. Dies könnte Plattformen wie YouTube in leistungsstarke Trainingsressourcen für Roboter verwandeln.

  • Robotergestützte Chirurgie: Da Vinci 5 – Präzision, die unter die Haut geht

Mit dem „Da Vinci 5“ hebt Intuitive Surgical die robotergestützte Chirurgie auf ein neues technologisches Niveau. Das System verfügt über das mehr als 10.000-fache der Rechenleistung seines Vorgängers und vereint gleich mehrere Schlüsseltechnologien, die bislang vor allem aus der Industrie- oder KI-Forschung bekannt waren – jetzt aber mit unmittelbarem Nutzen im OP-Saal.

So kommt etwa virtuelle Realität zum Einsatz, um chirurgische Eingriffe präzise zu simulieren und vorzubereiten – inklusive realistischer 3D-Modelle, die vor der Operation eingesehen und im Training durchgespielt werden können. Ergänzt wird das durch Force-Feedback-Technologie, die erstmals haptisches Empfinden in die robotergestützte Chirurgie bringt: Chirurg:innen spüren über das System feinste Gewebewiderstände, was eine erheblich präzisere, gewebeschonende Arbeitsweise ermöglicht. Möglich wird all das durch Edge-Computing – eine Architektur, bei der die Datenverarbeitung direkt am Netzrand (Edge) erfolgt, ohne Umwege über entfernte Rechenzentren. Die Folge: minimale Latenz und Echtzeit-Reaktion auf jede noch so feine Handbewegung.

Das Ergebnis: deutlich präzisere, gewebeschonendere Eingriffe mit weniger Blutverlust und kürzeren Erholungszeiten. Erste Kliniken wie das Hackensack University Medical Center berichten bereits von spürbar besseren OP-Ergebnissen und einer höheren Patientenzufriedenheit – und setzen den Da Vinci 5 zunehmend als neuen Standard im OP ein.

 

Fazit

Vielleicht liegt gerade darin die eigentliche Stärke: Nicht der Wettlauf „Mensch gegen Maschine“ entscheidet, sondern die Zusammenarbeit. Wenn Roboter operieren, ohne zu zittern, oder Haushaltsaufgaben wie ein Kind erlernen – und Jurist:innen endlich nicht mehr die Fußnote 237 selbst suchen müssen –, dann ist das kein Machtwechsel, sondern ein Fortschritt. Und bis humanoide Roboter einen Halbmarathon ganz allein meistern? Dürfen wir uns freuen, dass wir ihnen – noch – einen Schritt voraus sind.

 


Quellen:

https://www.zdf.de/nachrichten/panorama/halbmarathon-roboter-gegen-menschen-china-100.html

https://www.wired.com/story/fast-forward-toyota-robots-learning-housework/

https://time.com/7094773/agility-robotics-digit/?utm_source=chatgpt.com

https://www.intuitive.com/de-de/products-and-services/da-vinci