Die Grenze der kosteneffizienten Intelligenz verschieben
Grok 4 Fast
Die Grenze der kosteneffizienten Intelligenz verschieben
Wir freuen uns, Ihnen Grok 4 Fast vorzustellen, unsere neueste Entwicklung im Bereich kosteneffizienter Schlussfolgerungsmodelle. Grok 4 Fast basiert auf den Erkenntnissen von xAI aus Grok 4 und bietet eine Spitzenleistung in allen Unternehmens- und Verbraucherdomänen - und das bei außergewöhnlicher Token-Effizienz. Dieses Modell verschiebt die Grenzen für kleinere und schnellere KI und macht qualitativ hochwertiges Reasoning für mehr Anwender und Entwickler zugänglich. Grok 4 Fast bietet modernste Kosteneffizienz (SOTA), innovative Web- und X-Suchfunktionen, ein 2-Millionen-Token-Kontextfenster und eine einheitliche Architektur, die Reasoning- und Non-Reasoning-Modi in einem Modell vereint.
Kosteneffiziente Intelligenz auf dem Vormarsch
Grok 4 Fast setzt neue Maßstäbe für kosteneffiziente Intelligenz und übertrifft Grok 3 Mini in den Reasoning-Benchmarks bei gleichzeitiger Senkung der Token-Kosten.
Wir haben groß angelegtes Reinforcement Learning eingesetzt, um die Intelligenzdichte von Grok 4 Fast zu maximieren. In unseren Evaluierungen erreicht Grok 4 Fast bei Benchmarks eine vergleichbare Leistung wie Grok 4 und benötigt dabei im Durchschnitt 40 % weniger Denk-Token.
Diese Steigerung der Token-Effizienz von Grok 4 Fast um 40 % in Kombination mit einem deutlich niedrigeren Preis pro Token führt zu einer Preisreduzierung von 98 %, um die gleiche Leistung bei Grenzbenchmarks wie Grok 4 zu erzielen. Wie durch ein unabhängiges Gutachten von Artificial Analysis bestätigt wurde, weist Grok 4 Fast ein hochmodernes (SOTA) Preis-Intelligenz-Verhältnis im Vergleich zu anderen öffentlich verfügbaren Modellen im Artificial Analysis Intelligence Index auf.
Native Tool-Nutzung mit SOTA-Suche
Grok 4 Fast wurde durchgängig mit Tool-Use Reinforcement Learning (RL) trainiert. Es zeichnet sich dadurch aus, dass es entscheiden kann, wann Tools wie Code-Ausführung oder Web-Browsing aufgerufen werden sollen.
So verfügt Grok 4 Fast beispielsweise über grenzüberschreitende agentische Suchfähigkeiten und durchsucht nahtlos das Web und X, um Abfragen mit Echtzeitdaten zu ergänzen. Es springt durch Links, nimmt Medien auf (einschließlich Bilder und Videos auf X) und fasst Ergebnisse in Lichtgeschwindigkeit zusammen.
Frontier of General Post-training
Grok 4 Fast schafft auch eine neue kosteneffektive Grenze im allgemeinen Bereich. Wir freuen uns, die Ergebnisse von Grok 4 Fast auf der LMArena zu teilen, wo es privat in den Bereichen Suche und Text getestet wurde.
In der Such-Arena von LMArena belegt grok-4-fast-search (Codename: menlo) mit 1163 Elo den ersten Platz - ein souveräner Vorsprung von 17 vor o3-search. Seine überlegene Denkleistung und Intelligenzdichte ermöglichen es ihm, viel größere Modelle bei realen, suchbezogenen Aufgaben zu übertreffen.
In der Text-Arena von LMArena belegt grok-4-fast (Codename: tahoe) den 8. Platz und liegt damit gleichauf mit grok-4-0709, was seine bemerkenswerte Intelligenzdichte unterstreicht. Insbesondere übertrifft es die Konkurrenz in seiner Gewichtsklasse deutlich, in der alle Modelle vergleichbarer Größe auf Platz 18 oder darunter rangieren.