Metas KI denkt jetzt parallel

Lesezeit
1 Minute
Bis jetzt gelesen

Metas KI denkt jetzt parallel

09.04.2026 - 09:06
Veröffentlicht in:

Meta hat sein vielleicht ambitioniertestes KI-Projekt gestartet: Muse Spark soll nicht nur mithalten, sondern langfristig eine KI liefern, die sich wirklich persönlich anfühlt – und in manchen Benchmarks schlägt das neue Modell bereits die prominente Konkurrenz von OpenAI und Google.

Meta hat unter dem Dach seiner neu gegründeten Meta Superintelligence Labs das Sprachmodell Muse Spark vorgestellt. Es handelt sich um das erste Modell der neuen "Muse"-Familie und soll laut dem Unternehmen der Auftakt einer gezielten Skalierungsstrategie in Richtung sogenannter persönlicher Superintelligenz sein.

Muse Spark ist ab sofort unter meta.ai und in der Meta-AI-App verfügbar; ein privates API-Preview richtet sich zunächst an ausgewählte Nutzer. Das Modell verarbeitet von Grund auf Text und Bilder gemeinsam und unterstützt Werkzeugnutzung, visuelles Schritt-für-Schritt-Denken sowie die Koordination mehrerer KI-Agenten.

Drei Ansätze zur Skalierung

Technisch setzt Meta dabei auf drei Skalierungsachsen: verbessertes Vortraining, Reinforcement Learning (RL) und sogenanntes Test-Time Reasoning. Den eigenen Angaben zufolge hat das Unternehmen seinen Vortraining-Stack in den vergangenen neun Monaten von Grund auf neu aufgebaut.

Das Ergebnis: Muse Spark soll dieselbe Leistung mit einer mehr als zehnfach geringeren Rechenlast erreichen als das Vorgängermodell Llama 4 Maverick. Beim Reinforcement Learning wiederum zeigt das Modell laut Meta ein stabiles, log-lineares Wachstum beim sogenannten pass@1-Wert – also der Wahrscheinlichkeit, eine Aufgabe im ersten Versuch korrekt zu lösen – ohne dabei die Vielfalt seiner Lösungsansätze zu opfern.

Ein zentrales neues Feature ist der "Contemplating"-Modus, der mehrere Agenten parallel denken lässt und so aufwendige Reasoning-Aufgaben ohne proportional steigende Latenz bewältigen soll. In den veröffentlichten Benchmarks zeigt sich ein gemischtes Bild: Muse Spark führt im Contemplating-Modus beim "Humanity's Last Exam" ohne Werkzeuge mit 50,2 Punkten knapp vor Gemini 3.1 Deep Think (48,4) und GPT 5.4 Pro (43,9) und dominiert klar beim FrontierScience-Research-Benchmark (38,3 gegenüber 36,7 bei GPT und 23,3 bei Gemini).

Beim Physik-Olympiad-Benchmark IPhO 2025 hingegen landet Muse Spark mit 82,6 Punkten spürbar hinter der Konkurrenz. Im breiteren Modellvergleich glänzt Muse Spark vor allem bei Gesundheits- und Reasoning-Aufgaben, während es bei abstrakten Denkaufgaben (ARC AGI 2) und Büro-Benchmarks noch aufholen muss.

Fokus auf Gesundheitsanwendungen

Einen inhaltlichen Schwerpunkt legt Meta auf Gesundheitsanwendungen. Für das Training soll das Unternehmen mit mehr als 1000 Ärzten zusammengearbeitet haben, um medizinisch fundierte Trainingsdaten zu kuratieren. Das Modell soll interaktive Darstellungen zu Gesundheitsinformationen generieren können – etwa Nährwertangaben oder Muskelgruppen, die bei bestimmten Übungen beansprucht werden.

Auch multimodale Alltagsanwendungen stehen im Fokus: Muse Spark soll in der Lage sein, Haushaltsgeräte per Kamera zu diagnostizieren oder aus einem einfachen Screenshot ein spielbares Minispiel zu bauen.

Auf der Sicherheitsseite hat Meta nach eigenen Angaben umfangreiche Evaluierungen durchgeführt, bevor Muse Spark in den Markt gegangen ist. Das Modell soll in Hochrisikobereichen wie Bio- und Chemiewaffen zuverlässig verweigern. Auffällig ist ein Befund des unabhängigen Sicherheitsinstituts Apollo Research: Muse Spark erkannte in Tests am häufigsten von allen bisher untersuchten Modellen, dass es sich in einer Evaluierungssituation befand und verhielt sich entsprechend kooperativer.

Meta räumt ein, dass dies möglicherweise das Verhalten in realen Einsatzszenarien beeinflussen könnte, hält das jedoch nicht für einen Grund, den Launch zu stoppen. Weitere Details will das Unternehmen in einem eigenen Safety & Preparedness Report veröffentlichen.