Il nuovo modello Flash elabora testi, immagini e audio per generare clip fotorealistiche, rispettare le leggi della fisica e creare avatar digitali personalizzati.
Google compie un passo decisivo nell'evoluzione dell'intelligenza artificiale con il lancio di Gemini Omni, un modello di nuova generazione sviluppato da Google DeepMind in cui la capacità di ragionamento logico si fonde con la creatività pura. Costruito fin dall'inizio come un'architettura nativamente multimodale, Omni è in grado di elaborare qualsiasi combinazione di input – testi, immagini, video e file audio – per generare video ad altissima fedeltà ancorati alla conoscenza del mondo reale. La prima versione della famiglia a debuttare sul mercato è Gemini Omni Flash, rilasciata globalmente per gli abbonati ai piani Google AI Plus, Pro e Ultra all'interno dell'app Gemini e di Google Flow, oltre a essere integrata gratuitamente per gli utenti di YouTube Shorts e dell'app YouTube Create.
La principale innovazione di Gemini Omni risiede nella possibilità di effettuare l'editing video attraverso una normale conversazione. Utilizzando il linguaggio naturale, l'utente può istruire il modello per modificare l'azione, inserire nuovi personaggi o alterare la materia degli oggetti, ad esempio trasformando una scultura in bolle di sapone o facendo increspare uno specchio come fosse un liquido. Ogni comando si sviluppa in modo sequenziale basandosi sul precedente: il sistema garantisce la perfetta coerenza dei personaggi e della fisica della scena, ricordando ciò che è accaduto nei fotogrammi antecedenti e permettendo di affinare il risultato su più passaggi consecutivi senza mai perdere il filo della narrazione originale.
Il modello si distingue dai tradizionali sistemi di pattern matching per la sua profonda comprensione del contesto e delle leggi della natura. Omni vanta una sensibilità intuitiva migliorata verso forze come la gravità, l'energia cinetica e la dinamica dei fluidi, che si traduce in effetti visivi dai movimenti estremamente realistici. Sfruttando l'enorme bagaglio di conoscenze storiche, scientifiche e culturale di Gemini, il software è in grado di creare video esplicativi complessi a partire da brevi descrizioni testuali – come la spiegazione del ripiegamento proteico in stile claymation (stop-motion con la plastilina) – unendo la precisione concettuale a una resa estetica impeccabile.
Parallelamente alle funzioni di editing, Google ha introdotto una funzionalità per la creazione di video tramite il proprio avatar digitale, consentendo agli utenti di generare contenuti video e tracce vocali che riproducono fedelmente le proprie sembianze e la propria voce. Sul fronte della sicurezza e della trasparenza, fondamentale per contrastare la diffusione di falsi d'autore, Google ha annunciato che tutti i contenuti generati con la nuova tecnologia includeranno la filigrana digitale impercettibile SynthID e le credenziali C2PA. Questa tracciabilità consentirà a chiunque di verificare la natura sintetica del video in modo rapido e sicuro attraverso l'app Gemini, Chrome e la Ricerca Google, integrandosi nei sistemi aziendali prima del prossimo rilascio del modello agli sviluppatori tramite API.
Gemini Omni Flash è in fase di rilascio per tutti gli abbonati a Google AI Pro e Ultra a livello globale attraverso l'app Gemini e Google Flow. A partire da questa settimana, sarà disponibile gratuitamente anche per gli utenti di YouTube Shorts e dell'app YouTube Create.
Esplora altri articoli su questi argomenti
Se questo articolo ti è piaciuto e vuoi rimanere sempre informato
Il nuovo modello Flash elabora testi, immagini e audio per generare clip fotorealistiche, rispettare le leggi della fisica e creare avatar digitali personalizzati.
20-05-2026
Il piano Transizione 5.0 ha già mobilitato 9,6 mld di euro di investimenti, il programma Parco Agrisolare ha superato i 23.000 progetti finanziati, quadruplicando la potenza installata rispetto agli obiettivi iniziali. L'analisi dei principali strumenti nazionali (Transizione 5.0, Parco Agrisolare, Nuova Sabatini Green, SIMEST), i programmi regionali più rilevanti e l’evoluzione della domanda delle imprese, che si sta orientando verso progetti integrati di efficientamento energetico.
20-05-2026
Al via un doppio progetto sperimentale incentrato sull'agricoltura rigenerativa e sulle tecnologie data-driven, mirato a sviluppare e tracciare proteine green ad altissime performance nutrizionali e ambientali.
19-05-2026
Lanciate da Cape Canaveral a bordo della missione SpaceX CRS-34, sedici unità tecnologiche studiano in microgravità terapie innovative contro l'osteoporosi e la perdita di massa ossea per rivoluzionare le cure cliniche sia sulla Terra che in orbita.
19-05-2026
Verdetto unanime a Oakland: le accuse di aver tradito la missione no-profit originale sono state presentate oltre i termini massimi di prescrizione previsti dalla legge.
Per circa 2.000 ore, uno dei motori della nave da crociera MSC Opera è stato alimentato esclusivamente dal biocarburante HVO, di origine biogenica al 100%, dimostrando che la decarbonizzazione delle grandi navi da crociera è una realtà immediatamente applicabile senza necessità di interventi strutturali o aggiornamenti tecnologici ai propulsori esistenti.
Uno studio IWG delinea i prossimi 25 anni: addio ai pendolari e alla giornata 9-18 in favore di ambienti intelligenti e connessioni cerebrali.
Dalle microalghe ai laser contro le infestanti: a Verona presentate le innovazioni per guidare la trasformazione digitale ed ecologica della filiera.