venerdì, Novembre 22, 2024

OpenAI lancia Sora: IA per creare video da testo

SORA: L’Intelligenza Artificiale CHE GENERA Video REALISTICI EH IMPRESSIONA IL MONDO

Sono ore di gran fermento per l’intelligenza artificiale.

E proprio l’azienda di Sam Altman è uscita allo scoperto con una grossa novità. OpenAI ha lanciato Sora, intelligenza artificiale in grado di produrre video realistici (estremamente, realistici) partendo da un comando testuale. Cosa sappiamo dello strumento?

OpenAI annuncia Sora

A poche ore dall’annuncio di Gemini 1.5 sul blog di Google, tocca a OpenAI, che lancia Sora. E lo fa sapere al mondo attraverso un lungo post (piuttosto simile a una sezione del sito), che contiene una serie di filmati davvero suggestivi.

Anche la presentazione di Sora è magniloquente: “Stiamo insegnando all’intelligenza artificiale a comprendere e simulare il mondo fisico in movimento, con l’obiettivo di formare modelli che aiutino le persone a risolvere problemi che richiedono l’interazione nel mondo reale.

Ti presentiamo Sora, il nostro modello da testo a video. Sora può generare video della durata massima di un minuto mantenendo grande qualità visiva e la massima aderenza alla richiesta dell’utente.”

Un esempio

Sora di OpenAI genera dunque video della durata massima di un minuto partendo da un testo.

La sezione del sito dedicata allo strumento riporta diversi video di esempio, ciascuno corredato dal prompt testuale utilizzato per produrlo. E il risultato è senza dubbio realistico. Un esempio: vediamo una giovane donna passeggiare di notte a Tokyo. È prima inquadrata a figura intera, poi in primo piano. Ecco, tradotto in italiano, il comando testuale che ha generato il video: “Una donna elegante cammina lungo una strada di Tokyo piena di neon caldi e luminosi e di segnaletica animata della città. Indossa una giacca di pelle nera, un lungo vestito rosso e stivali neri e porta una borsa nera. Indossa occhiali da sole e rossetto rosso. Cammina con Sicurezza e disinvoltura. La strada è umida e riflette le figure, creando un effetto specchio delle luci colorate. Molti pedoni passeggiano.”

I video realistici di Sora

I video sinora mostrati da OpenAI indicano Sora come il più potente Software generatore di video da comandi testuali.

Come si è evinto dal prompt appena citato, l’azienda spiega che “Sora è in grado di generare scene complesse con più personaggi, tipi specifici di movimento e dettagli accurati dei soggetti e dello sfondo. Il modello comprende non solo ciò che l’utente ha chiesto nel prompt, ma anche il modo in cui i diversi elementi coesistono nel mondo reale”.

Non è dato di sapere la data in cui OpenAI renderà disponibile Sora al pubblico. Per ora, Sam Altman ha lanciato un’iniziativa lungimirante dal punto di vista promozionale. Tramite il proprio account di X ha chiesto agli utenti di inviargli proposte di prompt testuali che vorrebbero vedere trasformati in video. Periodicamente, il Ceo di OpenAI li pubblicherà sul proprio profilo.

Qualità e limiti

La qualità dei video di Sora sposta di molto in là il livello rispetto a quanto visto finora. Sembrano preistoria le Immagini deepfake di personaggi con sei dita nelle mani. Eppure, OpenAI ha dichiarato che “il modello attuale presenta dei punti deboli. Potrebbe avere difficoltà a simulare accuratamente i movimenti di una scena complessa e potrebbe non comprendere istanze specifiche di causa ed effetto. Ad esempio, una persona potrebbe dare un morso a un biscotto, ma in seguito il biscotto potrebbe non lasciare il segno del morso.

Il modello può anche confondere i dettagli spaziali di un prompt, ad esempio confondendo sinistra e destra, e può avere difficoltà con descrizioni precise di eventi che si verificano nel tempo, come seguire una specifica traiettoria della telecamera”.

I rischi

In molti stanno pensando a un possibile utilizzo cinematografico di Sora. Ma sono ancora di più quelli che si stanno domandando se una simile straordinaria resa qualitativa dei video non renderà sempre più difficile la possibilità di distinguere il vero dal falso. Deepfake e disinformazione, con il boom dell’IA generativa, sono problemi sempre più urgenti e intricati.

In questo senso, sulla pagina dedicata a Sora ecco cosa dice OpenAI: “Coinvolgeremo politici, educatori e artisti di tutto il mondo per comprendere le loro preoccupazioni e identificare casi d’uso positivi per questa nuova Tecnologia.

Nonostante ricerche e test approfonditi, non siamo in grado di prevedere tutti i modi positivi in cui le persone utilizzeranno la nostra tecnologia, né tutti i modi in cui ne abuseranno. Ecco perché crediamo che imparare dall’uso nel mondo reale sia una componente fondamentale per creare e rilasciare nel tempo sistemi di IA sempre più sicuri.”

In conclusione, il lancio di Sora da parte di OpenAI ha suscitato un ampio interesse e molte domande riguardo alle implicazioni etiche e sociali di un tale sviluppo nell’intelligenza artificiale. Mentre i progressi tecnologici come quelli compiuti da Sora sono indubbiamente impressionanti, è importante esaminare attentamente il modo in cui tali tecnologie potrebbero influenzare la nostra società e l’etica circostante l’uso di intelligenza artificiale per creare contenuti visivi.

ARTICOLI COLLEGATI:

ULTIMI ARTICOLI: