Google släppte sin nya AI – internet gick loss

Mindre än ett dygn efter att Google presenterade Gemini Omni Flash började sociala medier fyllas med exempel på vad användare lyckats skapa med den nya AI-modellen.

Det som först såg ut som ännu ett AI-verktyg för video börjar snabbt framstå som något betydligt större. Demonstrationerna visar hur användare kan förändra, redigera och bygga om videor med hjälp av vanliga textinstruktioner.

Enligt Google kan Gemini Omni Flash generera eller redigera video utifrån text, bilder, ljud eller befintliga videoklipp.

Annons

Videoredigering håller på att bli en textprompt

Det stora genombrottet är inte att AI kan skapa video. Det är att videoredigering håller på att bli en textprompt.

I exempel som spridits efter lanseringen syns hur användare lyckas byta ut människor mot animerade figurer, ta bort föremål ur videor, lägga till fyrverkerier som aldrig existerat och förvandla vardagliga miljöer till helt nya scener.

Andra exempel visar hur en enkel teckning på papper kan bli en levande animation eller hur en video kan förflyttas mellan olika miljöer och städer utan traditionellt redigeringsarbete.

Googles egen beskrivning är att modellen kan förstå både video, bild, ljud och text samtidigt för att skapa mer sammanhängande resultat.

Utmanar etablerade videoprogram

Det som gör Gemini Omni Flash intressant är att verktyget inte främst riktar sig till professionella filmstudior.

Tekniken verkar snarare vara byggd för kreatörer, marknadsförare, YouTubers och vanliga användare som vill skapa avancerade effekter utan att lära sig komplexa redigeringsprogram.

I dag kräver många av de effekter som visas timmar eller dagar av arbete i verktyg som Adobe Premiere Pro, After Effects eller DaVinci Resolve.

Med Gemini Omni Flash räcker det i många fall att beskriva önskat resultat.

Instagramsidan Ai Researches har samlat flera av de roliga kreationerna som männiksor skapat med verktyget.

View this post on Instagram

A post shared by AI researches | AI (@airesearches)

Förstår rörelse bättre än tidigare modeller

En av de största utmaningarna för AI-video har varit att objekt och människor ofta beter sig märkligt mellan bildrutorna. Händer förändras, föremål försvinner eller perspektiv skiftar på onaturliga sätt.

Google hävdar att Gemini Omni Flash är bättre på att förstå rörelse, fysik och hur objekt ska bete sig över tid.

Det är också något som märks i flera av de tidiga demonstrationerna där förändringarna följer rörelserna i originalvideon på ett sätt som tidigare generationers modeller haft svårt att hantera.

Samtidigt växer oron

Precis som med andra kraftfulla AI-verktyg väcker utvecklingen frågor. Ju enklare det blir att förändra video, desto svårare blir det att avgöra vad som är autentiskt.

Google har därför byggt in vattenmärkning och andra säkerhetsfunktioner för att identifiera AI-genererat innehåll. Men den tekniska utvecklingen går snabbt.

Det som kanske sticker ut mest med Gemini Omni Flash är inte hur bra resultaten ser ut i dag. Det är hur snabbt användarna började hitta nya sätt att använda verktyget.

Bara timmar efter lanseringen hade internet redan börjat visa en framtid där avancerad videoredigering inte längre kräver tidslinjer, lager och specialeffekter. Det kan räcka med några meningar i en chattruta.