Oh, das ging ja schneller als gedacht. #OpenAI hat mit #o1 ein neues LLM vorgestellt, das stärker auf „Reasoning“ setzt, während andere Funktionen zurückgefahren wurden. Was bedeutet das für Unternehmen?
➡ Jetzt stärker: Denkprozess und Problemlösung
– 𝗼𝟭 nutzt mehr Zeit zum Nachdenken, bevor es antwortet, was den menschlichen Denkprozessen ähnlicher ist.
– Es kann komplexe Gedankengänge besser verarbeiten und mehrstufige Probleme effektiver lösen.
– Das Modell erkennt eigene Fehler, kann sich selbst korrigieren und alternative Ansätze verfolgen, falls nötig.
➡ Das Ergebnis: Bessere Leistungen in bestimmten Bereichen
– 𝗠𝗮𝘁𝗵𝗲𝗺𝗮𝘁𝗶𝗸: 𝗼𝟭 erreichte bei der Internationalen Mathematik-Olympiade 83 % richtige Lösungen, verglichen mit 13 % bei GPT-4o.
– 𝗡𝗮𝘁𝘂𝗿𝘄𝗶𝘀𝘀𝗲𝗻𝘀𝗰𝗵𝗮𝗳𝘁𝗲𝗻: In Physik, Chemie und Biologie zeigt es Leistungen auf dem Niveau von Doktoranden.
– 𝗣𝗿𝗼𝗴𝗿𝗮𝗺𝗺𝗶𝗲𝗿𝘂𝗻𝗴: Bei Codeforces-Wettbewerben erreicht 𝗼𝟭 das 89. Perzentil.
➡ Ebenfalls verbessert: Sicherheit und Zuverlässigkeit
– 𝗦𝗶𝗰𝗵𝗲𝗿𝗲𝗿: 𝗼𝟭 ist widerstandsfähiger gegenüber „Jailbreaking“-Versuchen, mit einer Bewertung von 84 von 100 Punkten (GPT-4o: 22 Punkte).
– 𝗪𝗲𝗻𝗶𝗴𝗲𝗿 𝗛𝗮𝗹𝗹𝘂𝘇𝗶𝗻𝗮𝘁𝗶𝗼𝗻𝗲𝗻: Dank des neuen Trainingsverfahrens liefert 𝗼𝟭 weniger falsche oder erfundene Informationen.
➡ Was (noch) nicht funktioniert:
Webbrowsing, der Upload von Dateien und Bildern fehlen noch. 𝗼𝟭 ist langsamer in der Verarbeitung und teurer im Vergleich zu GPT-4o.
➡ Modelle und Verfügbarkeit:
Es gibt 𝗼𝟭-𝗽𝗿𝗲𝘃𝗶𝗲𝘄 als Hauptversion und 𝗼𝟭-𝗺𝗶𝗻𝗶, eine kleinere, schnellere und günstigere Variante, die besonders effizient für Codierungsaufgaben ist. Zunächst steht 𝗼𝟭 ChatGPT Plus- und Team-Benutzern zur Verfügung, weitere Nutzergruppen sollen folgen.
➡ Was haben Unternehmen davon?
– Wissenschaftliche Forschung und Datenanalyse:
𝗼𝟭 unterstützt Forscher bei der Analyse komplexer wissenschaftlicher Daten, etwa bei der Annotation großer Datenmengen, der Erstellung komplexer Formeln oder der Erkennung von Mustern in großen Datensätzen. Das beschleunigt Entwicklungsprozesse.
– Software-Entwicklung und Programmierung:
Mit verbesserten Programmierfähigkeiten löst 𝗼𝟭 komplexe Programmieraufgaben, erkennt Fehler im Code und erstellt mehrstufige Workflows. Das macht die Softwareentwicklung effizienter.
– Problemlösung in Mathematik und Naturwissenschaften:
𝗼𝟭 liefert beeindruckende Ergebnisse bei mathematischen und naturwissenschaftlichen Aufgaben, was allgemein für technische Unternehmen ein großer Vorteil ist.
➡ Fazit:
Es sieht so aus, als ob die generative KI einen weiteren Sprung nach vorne macht und bisherige Kritikpunkte (mangelndes Denken, Halluzinationen) adressiert. Wir werden sehen, wenn die ersten praktischen Erfahrungen vorliegen. Ein paar kurze Vergleiche bei mir mit identischen Prompts bei o1 und4o waren jedenfalls vielversprechend.
Anmerkungen und Kommentare:
https://www.linkedin.com/posts/volkermeise_openai-o1-llm-activity-7240262897401044992-B6TP