L'intelligenza artificiale di Google compie un nuovo, enorme salto evolutivo. Dopo aver rivoluzionato la creazione di immagini, l'azienda sposta l'attenzione sul video: da oggi fa il suo debutto Gemini Omni, un modello progettato per superare i confini della generazione tradizionale, unendo la profonda capacità di ragionamento di Gemini con una potenza creativa senza precedenti.
Un'evoluzione resa possibile anche dai continui avanzamenti nell'infrastruttura hardware, tra cui l'adozione di nuove tecnologie come la memoria HBM4, fondamentali per gestire l'enorme mole di dati di questi modelli.
Il primo modello di questa famiglia, Gemini Omni Flash, è già operativo e permette agli utenti di partire da qualsiasi tipo di input per generare contenuti visivi di alta qualità.
Gemini Omni: cosa può fare
La vera forza di Gemini Omni risiede nella sua natura nativamente multimodale. Non si limita a montare clip, ma ragiona su ciò che sta creando. Ecco le sue funzionalità principali:
- Editing conversazionale: hai provato a dire a un video come dovrebbe cambiare? Con Omni basta chiacchierare. Puoi modificare azioni, aggiungere oggetti o cambiare l'atmosfera con semplici istruzioni in linguaggio naturale. Il modello ricorda i passaggi precedenti, mantenendo la coerenza della scena e rispettando le leggi della fisica.
- Fisica e conoscenza reale: a differenza di molte IA che producono video "irreali", Omni attinge al vasto sapere di Gemini su scienza, storia e cultura. Il risultato è un video in cui la gravità, la luce e i movimenti risultano logici e realistici, trasformando idee complesse in video esplicativi chiari e facili da capire.
- Input misti: non sei limitato al testo. Puoi fornire un'immagine di riferimento, un video grezzo, uno schizzo o persino un input audio (per ora vocale) per dare vita alla tua idea. Omni fonde tutto in un output fluido e coerente.
Avatar digitali e sicurezza
Una delle funzioni più attese riguarda la creazione di contenuti tramite avatar digitale. Per iniziare, puoi utilizzare il tuo avatar AI per generare video che riproducono fedelmente il tuo aspetto e la tua voce, aprendo scenari incredibili per i creatori.
Dal lato sicurezza, Google bada alla trasparenza: ogni video generato da Omni includerà SynthID, una filigrana digitale invisibile a occhio nudo nascosta nei pixel del video, e le credenziali C2PA, una sorta di carta d'identità del file che ne certifica l'origine artificiale. Chiunque potrà verificare l'origine di un video direttamente dall'app Gemini, da Chrome o dalla Ricerca Google.
Disponibilità in Italia e nel mondo
Gemini Omni Flash sta iniziando a diffondersi da oggi per tutti gli abbonati ai piani Google AI Pro e Ultra tramite l'app Gemini e la nuova piattaforma Google Flow.
La grande novità per i creatori è l'arrivo gratuito, già da questa settimana, direttamente all'interno degli YouTube Shorts e dell'app YouTube Create. Nei prossimi mesi Google promette di espandere gli output anche alle immagini e all'audio, e di aprire le API anche agli sviluppatori aziendali.
