Technologie & Forschung

Das Modell-Feuerwerk geht weiter:
Warten auf Apple Intelligence, GPT-5.6, Gemini 3.5 Pro, Mythos 5 und Sonnet 4.8
Eine außergewöhnliche Woche in der KI-Entwicklung. Fünf neue Modelle von OpenAI, Google, Anthropic und Apple - einige bestätigt, andere Spekulation. Und WWDC startet morgen.

KI-Drohne schlägt drei Drohnen-Weltmeister:
Wie TU Delft die Grenzen physischer KI neu gezogen hat
Eine Kamera, kein GPS, keine Karte - und trotzdem schneller als die besten menschlichen FPV-Piloten der Welt. Was das MAVLab-Team technisch gemacht hat.

Claude Mythos kommt: Codename Oceanus im Red-Teaming - Launch um den 11. Juni
Erste Outputs begeistern die Community. Oceanus schreibt in 5 Minuten eine eigene 3D-Engine. Red-Teaming läuft, der Release-Termin naht.

LM Studio bringt lokale KI-Modelle aufs iPhone
Locally heißt die neue iOS-App von LM Studio. Sie verbindet sich per LM Link mit dem Desktop und macht große lokale Modelle mobil nutzbar.

Hermes Desktop: Nous Research bringt Open-Source-Agenten auf Mac, Windows und Linux
Mit Hermes Desktop wird der offene KI-Agent zur nativen App. Die Software integriert sich tief in das Betriebssystem und bietet persistentes Gedächtnis sowie isolierte Sandbox-Umgebungen.

Project Solara: Microsoft baut Agent-First-Hardware auf Android-Basis
Auf der Build 2026 zeigt Microsoft zwei Referenzgeräte - Desktop Hub und Wearable Badge - die keine Apps mehr ausführen, sondern ausschließlich KI-Agenten. Die Plattform läuft auf Android, nicht Windows.

Sieben neue MAI-Modelle:
Microsoft setzt auf Hillclimbing-Architektur
Microsoft AI launcht sieben spezialisierte Modelle - von Reasoning über Coding bis Multimodal. Die Hillclimbing-Strategie ersetzt den Alles-in-einem-Ansatz.

Project Eden: Tripos Weltmodell entkoppelt Zustand und Darstellung
VAST AI Research veröffentlicht eine Research Preview: Ein persistentes Weltmodell, das den Spielzustand vom Rendering trennt - und damit echtes Multiplayer sowie KI-Agententraining in generierten Welten ermöglicht.

Nemotron 3 Ultra: Nvidia liefert das stärkste offene KI-Modell der USA
550 Milliarden Parameter, 55 Milliarden aktiv, 309 Tokens pro Sekunde: Mit Nemotron Ultra greift Nvidia die proprietären Frontier-Modelle an - und veröffentlicht alles als Open Source.

Nvidias Referenz-Humanoider:
Ein Roboter als Blaupause für die ganze Industrie
Nvidia stellt mit dem Isaac GR00T Reference Robot den ersten offenen humanoiden Referenzentwurf vor. Der Ansatz erinnert an Googles Nexus-Strategie: Chip, Software und Blaupause liefern - die Fertigung anderen überlassen.

RTX Spark: Nvidias Antwort auf Apple Silicon - und eine Kampfansage an Intel, AMD und Qualcomm
Nvidia vereint erstmals CPU und GPU in einem ARM-Superchip für Windows-PCs. Mit 1 Petaflop KI-Leistung, vollem CUDA-Ökosystem und AAA-Gaming löst RTX Spark das Problem, an dem bisherige Windows on ARM Versuche gescheitert sind.

Startup in New York City startet kostenlosen Putzdienst, bezahlt wird mit Trainingsdaten
Das Startup MicroAGI bietet kostenlosen Reinigungsservice - im Tausch gegen Ego-Perspektiv-Videos, die Haushaltsroboter trainieren sollen. Zwei Millionen Views in Stunden.

Bonsai Image 4B: Das erste 1-Bit-Bildmodell läuft auf dem iPhone
PrismML komprimiert einen Bildgenerator auf unter 1 GB – und erreicht dabei 88 bis 95 Prozent der Originalqualität. Lokal, offline, unter Apache 2.0.

Figure schickt humanoide Roboter in JCPenney-Logistik – Brookfield orchestriert den Deal
Catalyst Brands setzt Figure-Roboter im Logistikzentrum Reno ein. Hinter dem Deal steht Brookfield – der Investor, der Roboter, Gebäude und Betreiber gleichzeitig kontrolliert.

Robotik im Eiltempo: Vom Demo-Video zur Schichtarbeit in Wochen statt Jahren
Konferenzräume aufräumen, Pakete sortieren, Labore bedienen, Startbahnen patrouillieren - in einer einzigen Woche zeigt die Robotik mehr reale Einsätze als in den zehn Jahren zuvor.

Zwei KI-Labore, zehn Erdős-Probleme, 48 Stunden:
Wie Maschinen die Mathematik aufbrechen
OpenAI widerlegt eine 80 Jahre alte Vermutung, DeepMind löst neun offene Probleme autonom. Was passiert, wenn KI Werkzeuge findet, die Generationen von Mathematikern übersehen haben.

Mit Kopf-Kamera in der Fabrik:
Das flüchtige Zeitalter des KI-Trainierens
Von indischen Schneidern mit Kopfkameras bis zu Metas Mitarbeiter-Tracking: Millionen Menschen liefern physische Daten für Roboter - doch die Sammelphase könnte historisch kurz sein.

Der ChatGPT-Moment für humanoide Roboter:
Figure läuft 200 Stunden ohne Ausfall
Was ChatGPT 2022 für Sprachmodelle war, könnte Figures 200-Stunden-Dauertest für humanoide Roboter werden: der Moment, in dem Skepsis in Staunen umschlägt.

Von Street View in die begehbare Welt mit Genie 3
Google DeepMind stellt Genie 3 vor - ein neues Modell, das Street-View-Panoramen in interaktive, begehbare Welten verwandelt.

Google Gemini Spark: Die Ära der Hintergrund-Agenten beginnt
Google-Labs-Chef Josh Woodward im Interview über den Wandel von Ausführung zu Steuerung und die Bedeutung des persönlichen Kontexts.