Circa un anno e mezzo fa, ChatGPT ha aperto il vaso di Pandora, mostrando come l’IA potesse influenzare le routine lavorative quotidiane di molti, con la giusta cautela. Tuttavia, solo pochi giorni fa, OpenAI ha presentato uno strumento potenzialmente più rivoluzionario.

Sora: di cosa si tratta

Sora è un’IA in grado di convertire il testo in video, unendosi alle recenti innovazioni che generano immagini da video. In termini più tecnici, è un “diffusion transformer model”.

Questi modelli vengono addestrati fornendo loro immagini a cui è stato aggiunto del rumore, accompagnato da un testo descrittivo. Attraverso un processo iterativo, l’IA rimuove gradualmente il rumore fino a ottenere l’immagine originale.

Tuttavia, questo genererebbe solo immagini statiche cucite insieme, risultando in un’uscita “artificiale” percepita come anomala. Interviene quindi la componente del trasformatore, calcolando il modo migliore per collegare in modo fluido i frame che formeranno il video.

Esempi

Durante il video di presentazione sono stati mostrati vari input con i risultati ottenuti. Non tutti sono altrettanto convincenti.

Ad esempio, il video di una fuoristrada che corre ha ancora alcuni difetti nella gestione della fisica dell’auto. Somiglia più a un trailer di un videogioco che a un video reale. Le mani rimangono una sfida significativa per l’IA e sono le discrepanze più evidenti nei video che coinvolgono esseri umani.

D’altra parte, gli animali, il comportamento dell’acqua e dei corpi immersi nei fluidi sono ben realizzati. Senza dubbio, questi soggetti sono più semplici da gestire per l’IA, ma diciamocelo: i risultati sono comunque sorprendenti.

Problemi

Prima di affrontare le preoccupazioni etiche, è fondamentale esaminare una questione pratica evidenziata da Sam Altman, CEO di OpenAI.

Il primo problema è la potenza di calcolo: non ce n’è abbastanza per ciò che Altman immagina. Per questo, a Davos, si è detto pronto a cercare di raccogliere 7.000 miliardi di dollari per creare un gigante dei semiconduttori e rivoluzionare il mercato. Si tratta di un progetto ambizioso la cui fattibilità rimane incerta.

Questo problema non è staccato dai considerevoli requisiti energetici necessari per far funzionare computer potenti per addestrare l’IA e processi correlati.

Sora: Impatto sulla Sicurezza

Attualmente, i video generati in questo modo presentano ancora diversi errori che aiutano a distinguere quelli autentici da quelli falsi. Tuttavia, come abbiamo sperimentato nei mesi recenti, il futuro si avvicina rapidamente. Saranno necessari nuovi mezzi per differenziare tra video “deepfake” e video reali.

Le implicazioni sono significative, poiché tali video potrebbero raffigurare un politico importante pronunciare dichiarazioni controverse o portare al furto di identità di personaggi famosi per fini di lucro, come già visto. Ci sono domande senza risposta e OpenAI non ha ancora annunciato un rilascio, poiché vengono adottate misure preventive di sicurezza.

Recommended Posts