Zum Inhalt springen Technologie & Forschung — Seite 9 — Die KI Woche
Aktuelle Beiträge
Lade Beiträge…
📰 Alle Beiträge 📬 Newsletter

🔬 Technologie & Forschung

214 Beiträge · Seite 9 von 18

Nadella: Software wird zur Datenbank — KI-Agenten übernehmen die Intelligenz
Modelle & Agenten

Nadella: Software wird zur Datenbank — KI-Agenten übernehmen die Intelligenz

Im BG2-Podcast beschreibt Microsofts CEO eine Zukunft, in der Apps nur noch CRUD-Systeme sind. Die Geschäftslogik wandert komplett zum KI-Agenten.

Google-Paper: Die KI-Singularität ist eine Gesellschaft, kein Superhirn
Modelle & Agenten

Google-Paper: Die KI-Singularität ist eine Gesellschaft, kein Superhirn

Forscher von Google, UChicago und UCSD zeigen: Reasoning-Modelle wie DeepSeek-R1 entwickeln spontan interne Debatten. Die nächste Intelligenzexplosion wird sozial, nicht monolithisch.

TRIBE v2: Metas KI-Modell liest Gehirnaktivität in Echtzeit
Forschung & Wissenschaft

TRIBE v2: Metas KI-Modell liest Gehirnaktivität in Echtzeit

Trainiert auf über 1.100 Stunden fMRI-Daten von 700 Probanden erstellt der Trimodal Brain Encoder einen digitalen Zwilling neuronaler Aktivität — ohne individuelle Kalibrierung.

Gemini 3.1 Flash Live: Googles Echtzeit-KI versteht Emotionen beim Sprechen
Modelle & Agenten

Gemini 3.1 Flash Live: Googles Echtzeit-KI versteht Emotionen beim Sprechen

Sub-Sekunden-Latenz und über 90 Sprachen — das neue Modell hört nicht nur zu sondern erkennt Frustration und Tonfall. Ab 0,5 Cent pro Minute im Developer-Preview.

Vibe Coding XR: Google macht Mixed-Reality-Apps per Sprachbefehl möglich
Modelle & Agenten

Vibe Coding XR: Google macht Mixed-Reality-Apps per Sprachbefehl möglich

Ein Prompt, 60 Sekunden, eine fertige Android-XR-App: Googles Vibe Coding XR kombiniert Gemini mit dem Open-Source-Framework XR Blocks — und senkt die Schwelle für räumliches Computing radikal.

ARC-AGI-3: Der Benchmark, an dem jede KI scheitert
Modelle & Agenten

ARC-AGI-3: Der Benchmark, an dem jede KI scheitert

Menschen lösen ihn zu 100 Prozent, die besten KI-Modelle schaffen weniger als 1 Prozent. ARC-AGI-3 misst, was kein anderer Benchmark misst: echte Abstraktionsfähigkeit.

MolmoWeb: Der offene Web-Agent, der nur Screenshots braucht
Modelle & Agenten

MolmoWeb: Der offene Web-Agent, der nur Screenshots braucht

Mit 8 Milliarden Parametern erreicht MolmoWeb 78 Prozent auf WebVoyager — mit Test-Time Scaling sogar 95 Prozent. Allen AI veröffentlicht Modell, Dataset und Training komplett offen.

AutoGaze: 100-mal weniger Tokens für Videoanalyse — bei besserer Qualität
Modelle & Agenten

AutoGaze: 100-mal weniger Tokens für Videoanalyse — bei besserer Qualität

Das Modul von UC Berkeley und NVIDIA entfernt redundante Video-Patches, bevor sie den Vision Transformer erreichen. Ergebnis: 19-facher Speedup und erstmals 4K-Videos mit 1.000 Frames in MLLMs.

LeWorldModel: LeCuns Team baut Physik-KI auf einer einzigen GPU
Hardware & Robotik

LeWorldModel: LeCuns Team baut Physik-KI auf einer einzigen GPU

Ein Weltmodell mit nur 15 Millionen Parametern lernt die Gesetze der Physik direkt aus Pixeln — 200-mal effizienter als bisherige Ansätze. Die Grundlage für Robotik und autonomes Fahren.

HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle
Modelle & Agenten

HeroUI v3: Kompletter Neustart mit React Native und KI-Agenten-Schnittstelle

75 Web-Komponenten, 37 Native-Komponenten, Tailwind CSS v4, CSS-only Animationen und ein MCP-Server für KI-Agenten — HeroUI liefert das umfassendste Update seiner Geschichte.

KI kann wissenschaftlichen Geschmack lernen — und Forschungsideen nach Impact bewerten
Forschung & Wissenschaft

KI kann wissenschaftlichen Geschmack lernen — und Forschungsideen nach Impact bewerten

Ein Paper zeigt: Trainiert auf Zitationsdaten, kann KI lernen, welche Forschungsrichtungen langfristig am meisten Wirkung entfalten — und sogar neue Ideen mit höherem Impact generieren.

Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen
Modelle & Agenten

Omma: 3D-Szenen, Websites und Apps per Textbeschreibung bauen

Die neue Plattform orchestriert mehrere KI-Agenten parallel — Code, Bilder, 3D-Modelle und Daten gleichzeitig. Was Stunden dauerte, soll in Sekunden erledigt sein.

🔗 Link kopiert!