OpenAI, l’azienda di intelligenza artificiale (AI) dietro al popolare ChatGPT, ha annunciato ieri (13 maggio) il lancio del GPT-4o — con “o” che significa “omni”.

“GPT-4o è molto più veloce e migliora le sue capacità nel testo, nella visione e nell’audio”, ha detto Mira Murati, chief technology officer di OpenAI, durante un annuncio in diretta streaming. L’azienda ha dichiarato che il nuovo modello sarà liberamente disponibile per tutti gli utenti anche se gli abbonati a pagamento avranno fino a cinque volte i limiti di capacità rispetto agli utenti non paganti.

➡ GPT-4o consentirà al ChatGPT di interagire utilizzando testo, voce e visione. Ciò significa che può visualizzare screenshot, foto, documenti o grafici caricati dagli utenti e conversare su di essi. 😯

Murati ha detto che ChatGPT avrà ora anche capacità di memoria, il che significa che può imparare dalle conversazioni precedenti con gli utenti e può effettuare traduzioni in tempo reale.

Durante l’annuncio in diretta, OpenAI ha dimostrato la capacità del GPT-4o di adattarsi a vari casi d’uso, fornendo istruzioni per risolvere problemi di matematica, raccontare storie della buonanotte e offrire consigli di codifica.

🛠 API aperte permetteranno l’integrazione con software di terzi.

✅ Si aprono nuovo scenari di interazione uomo – macchina e servizi rivolti al pubblico.

🔊 Le emozioni, le sfumature nella voce che l’AI sembra avare nei dialoghi è incredibile.

La velocità e l’accelerazione con cui tutto questo sta accadendo è davvero impressionante. Consumo di energia a parte.

 

Di seguito un prezioso riassunto di CNET su Youtube:

Tags: