Einführung in OpenAI o1-Vorschau
Einführung in OpenAI o1-Vorschau
Eine neue Reihe von Denkmodellen zur Lösung schwieriger Probleme. Jetzt verfügbar.
Aktualisierung am 17. September 2024: Die Ratenbegrenzung beträgt jetzt 50 Abfragen pro Woche für o1-preview und 50 Abfragen pro Tag für o1-mini.
Wir haben eine neue Reihe von KI-Modellen entwickelt, die mehr Zeit zum Nachdenken benötigen, bevor sie antworten. Sie können komplexe Aufgaben durchdenken und schwierigere Probleme lösen als frühere Modelle in den Bereichen Wissenschaft, Programmierung und Mathematik.
Heute veröffentlichen wir das erste Modell dieser Serie in ChatGPT und unserer API. Dies ist eine Vorschau und wir erwarten regelmäßige Updates und Verbesserungen. Zusammen mit dieser Veröffentlichung enthalten wir auch Bewertungen für das nächste Update, das sich derzeit in der Entwicklung befindet.
Wie es funktioniert
Wir haben diese Modelle so trainiert, dass sie mehr Zeit damit verbringen, über Probleme nachzudenken, bevor sie reagieren, ähnlich wie ein Mensch es tun würde. Durch das Training lernen sie, ihren Denkprozess zu verfeinern, verschiedene Strategien auszuprobieren und ihre Fehler zu erkennen.
In unseren Tests zeigt das nächste Modell-Update ähnliche Leistungen wie Doktoranden bei anspruchsvollen Benchmark-Aufgaben in Physik, Chemie und Biologie. Wir haben auch festgestellt, dass es in den Bereichen Mathematik und Programmierung hervorragende Leistungen erbringt. In einer Qualifikationsprüfung für die Internationale Mathematik-Olympiade (IMO) löste GPT-4o nur 13 % der Aufgaben richtig, während das Denkmodell 83 % erreichte. Ihre Programmierfähigkeiten wurden in Wettbewerben bewertet und erreichten bei Codeforces-Wettbewerben den 89. Mehr darüber können Sie in unserem Beitrag zur technischen Forschung lesen.
Da es sich um ein frühes Modell handelt, verfügt es noch nicht über viele der Funktionen, die ChatGPT nützlich machen, wie das Durchsuchen des Internets nach Informationen und das Hochladen von Dateien und Bildern. Für viele gängige Fälle wird GPT-4o in naher Zukunft leistungsfähiger sein.
Aber für komplexe Denkaufgaben ist dies ein bedeutender Fortschritt und stellt eine neue Stufe der KI-Fähigkeit dar. Aus diesem Grund setzen wir den Zähler wieder auf 1 zurück und nennen diese Serie OpenAI o1.
Sicherheit
Im Rahmen der Entwicklung dieser neuen Modelle haben wir einen neuen Ansatz für das Sicherheitstraining entwickelt, der ihre Denkfähigkeiten nutzt, um sie zur Einhaltung von Sicherheits- und Ausrichtungsrichtlinien zu bewegen. Indem sie in der Lage sind, über unsere Sicherheitsregeln im Kontext nachzudenken, können sie diese effektiver anwenden.
Eine Möglichkeit, die Sicherheit zu messen, besteht darin, zu testen, wie gut unser Modell seine Sicherheitsregeln befolgt, wenn ein Benutzer versucht, sie zu umgehen (bekannt als "Jailbreaking"). In einem unserer härtesten Jailbreaking-Tests erreichte GPT-4o einen Wert von 22 (auf einer Skala von 0-100), während unser o1-Vorschaumodell 84 erreichte. Sie können mehr darüber in der Systemkarte und in unserem Forschungsbeitrag lesen.
Um den neuen Fähigkeiten dieser Modelle gerecht zu werden, haben wir unsere Sicherheitsarbeit, die interne Verwaltung und die Zusammenarbeit mit den Bundesbehörden verstärkt. Dazu gehören strenge Tests und Bewertungen mit Hilfe unseres Preparedness Framework(öffnet in einem neuen Fenster), erstklassiges Red Teaming und Überprüfungsprozesse auf Vorstandsebene, u. a. durch unseren Safety & Security Committee.
Um unser Engagement für die KI-Sicherheit weiter voranzutreiben, haben wir vor kurzem Vereinbarungen mit den KI-Sicherheitsinstituten in den USA und in Großbritannien getroffen. Wir haben damit begonnen, diese Vereinbarungen zu operationalisieren und den Instituten frühzeitig Zugang zu einer Forschungsversion dieses Modells zu gewähren. Dies war ein wichtiger erster Schritt in unserer Partnerschaft, der dazu beiträgt, einen Prozess für die Erforschung, Bewertung und Erprobung künftiger Modelle vor und nach ihrer öffentlichen Freigabe zu etablieren.
Für wen es gedacht ist
Diese erweiterten Argumentationsfähigkeiten können besonders nützlich sein, wenn Sie komplexe Probleme in Wissenschaft, Programmierung, Mathematik und ähnlichen Bereichen angehen. So kann o1 beispielsweise von Forschern im Gesundheitswesen zur Kommentierung von Zellsequenzierungsdaten, von Physikern zur Erstellung komplizierter mathematischer Formeln, die für die Quantenoptik benötigt werden, und von Entwicklern in allen Bereichen zur Erstellung und Ausführung mehrstufiger Arbeitsabläufe verwendet werden.
OpenAI o1-mini
Die o1-Serie zeichnet sich durch die präzise Generierung und Fehlersuche in komplexem Code aus. Um Entwicklern eine effizientere Lösung zu bieten, bringen wir auch OpenAI o1-mini auf den Markt, ein schnelleres und kostengünstigeres Modell, das sich besonders gut für die Codierung eignet. Als kleineres Modell ist o1-mini 80 % billiger als o1-preview, was es zu einem leistungsstarken, kostengünstigen Modell für Anwendungen macht, die logisches Denken, aber kein umfassendes Weltwissen erfordern.
Wie Sie OpenAI o1 verwenden
**ChatGPT Plus- und Team-Benutzer können ab heute auf o1-Modelle in ChatGPT zugreifen. Sowohl o1-preview als auch o1-mini können manuell in der Modellauswahl ausgewählt werden, und zum Start wird die wöchentliche Rate auf 30 Nachrichten für o1-preview und 50 für o1-mini begrenzt sein. Wir arbeiten daran, diese Raten zu erhöhen und ChatGPT in die Lage zu versetzen, automatisch das richtige Modell für eine bestimmte Anfrage auszuwählen.
ChatGPT Enterprise- und Edu-Benutzer werden ab nächster Woche Zugang zu beiden Modellen haben.
Entwickler, die sich für die API-Nutzungsstufe 5 (öffnet in einem neuen Fenster) qualifizieren, können bereits heute mit einer Geschwindigkeitsbegrenzung von 20 RPM mit beiden Modellen in der API Prototypen erstellen. Wir arbeiten daran, diese Grenzen nach weiteren Tests zu erhöhen. Die API für diese Modelle umfasst derzeit keine Funktionsaufrufe, kein Streaming, keine Unterstützung für Systemmeldungen und keine anderen Funktionen. Weitere Informationen finden Sie in der API-Dokumentation (wird in einem neuen Fenster geöffnet).
Wir planen außerdem, den o1-mini-Zugang für alle ChatGPT Free-Benutzer zu ermöglichen.
Was kommt als nächstes
Dies ist eine frühe Vorschau auf diese Argumentationsmodelle in ChatGPT und die API. Zusätzlich zu den Modellaktualisierungen erwarten wir, dass wir das Browsen, das Hochladen von Dateien und Bildern und andere Funktionen hinzufügen werden, um sie für alle nützlicher zu machen.
Wir planen auch die weitere Entwicklung und Veröffentlichung von Modellen in unserer GPT-Serie, zusätzlich zu der neuen OpenAI o1-Serie.