Vad är ChatGPT4o - omni?

Johannes Olsson

Skrivet av:

Johannes Olsson

VD & Grundare

Vad är ChatGPT4o

GPT-4o - Omni

GPT-4o o:t står för “omni“ eller “allt” som det översätts till. Modellen är ett steg mot en mycket mer naturlig interaktion mellan människa och ChatGPT. Det är en så kallad multimodal modell — den tar emot text, ljud, och bild som indata och genererar text, ljud och bild som utdata. Det kan svara på ljudindata på så lite som 1/4 dels sekund, vilket är liknande mänsklig responstid i en konversation.

Snabbare och bättre

Den matchar GPT-4 Turbo prestanda på text på engelska och kod, med betydande förbättringar på text på andra språk, samtidigt som det är mycket snabbare och API:t är 50 % billigare. GPT-4o är särskilt bättre på att förstå bilder och ljud jämfört med befintliga modeller.

GPT-4o voice

Innan GPT-4o kunde du använda Voice för att prata med ChatGPT men den kan inte direkt observera ton, flera talare eller bakgrundsljud, och den kan inte generera skratt, sång eller uttrycka känslor som GPT4o kan.

Vad kan GPT-4o mer?

I videos som OpenAI visat upp kan man också mitt i konversationen avbryta AI:t för att till exempel ställa en ny fråga vilket gör att flödet i konversationen blir mycket mer naturligt.

Skrivet: 2024-05-31
Uppdaterad: 2024-10-31





Genom att klicka på "Acceptera" samtycker du till lagringen av cookies på din enhet.