Skip to content

OpenAI präsentiert GPT-4o: Neues KI-Modell für Text, Sprache und Video

  • OpenAI stellt GPT-4o vor, ein KI-Modell für Text, Sprache und Video.
  • GPT-4o bietet verbesserte Fähigkeiten und ist ab heute in der kostenlosen Version von ChatGPT verfügbar.

OpenAI aus San Francisco hat das neue generative KI-Modell GPT-4o vorgestellt. Das 'o' steht für 'omni' und bezieht sich auf die Fähigkeit, Text, Sprache und Video zu verarbeiten. Die Einführung erfolgt schrittweise in den nächsten Wochen.

CTO Mira Murati erklärte, dass GPT-4o die Intelligenz von GPT-4 besitzt, aber in mehreren Modalitäten und Medien verbessert wurde. 'GPT-4o kann über Sprache, Text und Visionen hinaus denken', sagte Murati.

Das vorherige Modell, GPT-4 Turbo, konnte Bilder und Text analysieren. GPT-4o erweitert diese Fähigkeiten um Sprache, was neue Anwendungen ermöglicht, darunter eine verbesserte Nutzererfahrung im AI-gestützten Chatbot ChatGPT.

Mit GPT-4o wird ChatGPT benutzerfreundlicher, da Nutzer Fragen stellen und ChatGPT während der Antwort unterbrechen können. Das Modell reagiert in Echtzeit und erkennt Nuancen in der Stimme eines Nutzers.

GPT-4o verbessert auch die visuellen Fähigkeiten von ChatGPT. Das Modell kann auf Fragen zu einem Foto oder einem Bildschirm antworten, wie 'Was passiert in diesem Softwarecode?' oder 'Welche Marke trägt dieses Hemd?'

Diese Funktionen sollen weiterentwickelt werden. Künftig könnte GPT-4o ChatGPT ermöglichen, ein Live-Sportspiel zu 'sehen' und die Regeln zu erklären.

GPT-4o ist mehrsprachiger und zeigt in etwa 50 Sprachen eine verbesserte Leistung. In der OpenAI-API und im Azure OpenAI Service von Microsoft ist GPT-4o doppelt so schnell, halb so teuer und hat höhere Ratenlimits als GPT-4 Turbo.

Aktuell ist die Sprachfunktionalität von GPT-4o noch nicht für alle Kunden in der API verfügbar. OpenAI plant, die neuen Audio-Fähigkeiten zunächst einer kleinen Gruppe vertrauenswürdiger Partner bereitzustellen.

GPT-4o ist ab heute in der kostenlosen Version von ChatGPT verfügbar und für Abonnenten der Premium-Pläne ChatGPT Plus und Team mit '5x höheren' Nachrichtenlimits. Die verbesserte ChatGPT-Spracherfahrung wird in den nächsten Monaten in einer Alpha-Version für Plus-Nutzer verfügbar sein.

Zusätzlich hat OpenAI eine überarbeitete ChatGPT-Benutzeroberfläche im Web angekündigt, die eine 'konversationsorientiertere' Startseite und Nachrichtenlayout bietet. Eine Desktop-Version von ChatGPT für macOS ermöglicht es Nutzern, über eine Tastenkombination Fragen zu stellen oder Screenshots zu machen und zu besprechen.

Schließlich ist der GPT Store, OpenAIs Bibliothek und Erstellungstool für Drittanbieter-Chatbots, jetzt auch für Nutzer der kostenlosen ChatGPT-Version verfügbar. Kostenlose Nutzer können nun auch Funktionen nutzen, die zuvor hinter einer Paywall waren, wie eine Gedächtnisfunktion und die Möglichkeit, Dateien und Fotos hochzuladen.

Quelle: Eulerpool Research Systems

Alles, was du für den langfristigen Vermögensaufbau mit Aktien brauchst.

Deutschlands beliebteste Aktienanalysen, um alle Aktien wirklich zu verstehen — und jeden Monat bequem unsere besten Empfehlungen zum erfolgreichen Nachkaufen.

Abo testen