OpenAI, azienda leader nell’ambito dell’intelligenza artificiale, ha introdotto un nuovo modello di IA chiamato Sora, che è in grado di creare video di 60 secondi “realistici” e “immaginativi” a partire da semplici e rapidi prompt (comandi) testuali.
La compagnia ha dichiarato che Sora è capace di generare video fino a 60 secondi di lunghezza a partire da istruzioni testuali, con la capacità di visualizzare scene con più personaggi, tipi specifici di movimento e sfondi dettagliati. Il modello comprende non solo ciò che l’utente ha chiesto nel prompt, “ma anche come queste cose esistono e coesistono nel mondo fisico,” recita il post sul blog.
Sebbene i “modelli multi-modali” non siano una novità e modelli di testo-video esistano già, ciò che sembra distinguere Sora è la lunghezza e l’accuratezza che OpenAI afferma di avere raggiunto.
Del resto è possibile rendersene conto osservando gli incredibili video rilasciati dalla stessa OpenAI.
Al momento OpenAI preferisce tuttavia concentrarsi sulla sicurezza, Sora è infatti stato affidato per vari test ad un team di esperti al fine di esaminare attentamente varie aree tra cui la disinformazione, i contenuti d’odio, i pregiudizi e i deep fake anche con riferimento a quanto recentemente accaduto a Taylor Swift.
Sora sarà inizialmente reso disponibile a professori di cybersecurity, chiamati “red teamers”, che possono valutare il prodotto per eventuali danni o rischi, allo stesso modo è stato concesso un pre accesso ad artisti visivi, designer e cineasti per raccogliere feedback e ulteriori suggerimenti.
Post comments (0)