Google esitteli huipputeknisen tekstist? videoksi -teko?lymallinsa, Veon, Google I/O -tapahtumassa toukokuussa 2024. Malli pystyy tuottamaan yli 60 sekunnin pituisia 1080p-videoleikkeit? yli 100 elokuvallisella tyylill?, mukaan lukien fotorealismi, surrealismi ja animaatio.
Veo on kokeiltavissa VideoFX-ty?kalun avulla, ja se kuuluu generatiivisen teko?lyn tekstist? videoksi -mallien kasvavaan kategoriaan, joka pyrkii tarjoamaan videotuotantovalmiuksia ep?teknisille k?ytt?jille ja taiteilijoille.
Alustan ensimm?iset esimerkit ovat toistaiseksi olleet vaikuttavia. Ne tarjoavat varteenotettavan haastajan OpenAI:n videogeneraattorimalli Soralle, joka julkistettiin t?m?n vuoden alussa huomattavan hypen saattelemana.
T?ss? artikkelissa esittelemme joitakin parhaita Google Veolla tehtyj? videoita, joita olemme t?h?n menness? n?hneet.
6 mahtavaa teko?lyll? luotua videota, jotka on tehty Google Veolla
1. Veo
Google DeepMind julkaisi Veo-innostuksen vauhdittamiseksi lyhyen videon, joka kuvaa neonvalaistua kaupunkia. Video alkaa, kun kamera panoroi kaupungin horisontin yli ennen katutasolle sukeltamista ja siell? kulkevan auton seuraamista.
Videon yksityiskohdat ovat uskomattomia, kaduilla kulkevan auton liikkeest? aina tien m?rk??n ulkon?k??n ja neonvalojen reunaan tarttuvaan sumuun.
Ensimm?isell? katselukerralla ainoa luonnollinen kohta, jonka huomasimme, oli tunnelin hankala siirtyminen y?st? p?iv??n. T?st? huolimatta Hongkongin kuvaus p?iv?nvalossa vaikutti eritt?in realistiselta, vaikka auton liikkeen ja tiemerkint?jen liikkeen v?lill? olikin ep?johdonmukaisuutta.
Introducing Veo: our most capable generative video model. ??
It can create high-quality, 1080p clips that can go beyond 60 seconds.
From photorealism to surrealism and animation, it can tackle a range of cinematic styles. ?? #GoogleIO pic.twitter.com/6zEuYRAHpH
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Videon luomiseen k?ytetty kehote:
“A fast-tracking shot through a bustling dystopian sprawl with bright neon signs, flying cars and mist, night, lens flare, volumetric lighting.
A neon hologram of a car driving at top speed, speed of light, cinematic, incredible details, volumetric lighting.
The cars leave the tunnel, back into the real-world city Hong Kong.”
Suomeksi:
“Pikakuvaus l?pi vilkkaan dystooppisen asutuksen, jossa on kirkkaita neonkylttej?, lent?vi? autoja ja sumua, y?, linssiheijastus, volumetrinen valaistus.
Neonhologrammi autosta, joka ajaa huippunopeutta, valonnopeudella, elokuvamainen, uskomattomat yksityiskohdat, volumetrinen valaistus.
Autot poistuvat tunnelista, takaisin reaalimaailman kaupunkiin Hongkongiin.”
2. Spotted Jellyfish
Seuraava esimerkkimme on video meress? uivasta meduusasta. Vaikka kyseess? on vain lyhyt p?tk?, vaikuttaa kaikki meduusan liikkeest? vedess? veden aaltoiluun aidolta ja luonnolliselta.
Ensi silm?yksell? on vaikea tunnistaa, ett? t?t? videota ei ole kuvattu perinteisell? kameralla, sill? meduusan t?pl?t ja rakenne n?ytt?v?t niin el?vilt?. Se on my?s luotu yksinkertaisella tekstikehotuksella.
?? Prompt: “Many spotted jellyfish pulsating under water. Their bodies are transparent and glowing in deep ocean.” pic.twitter.com/y9SmNd8NK0
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Videon luomiseen k?ytetty kehote:
“Many spotted jellyfish pulsating under water. Their bodies are transparent and glowing in the deep ocean.”
Suomeksi:
“Monet t?plikk??t meduusat sykkiv?t veden alla. Niiden ruumiit ovat l?pin?kyvi? ja hehkuvat syv?ll? meress?.”
3. Kultainen noutaja
Toisessa DeepMindin julkaisemassa esimerkiss? kultainen noutaja kulkee vuoristopolulla. T?m? video erottuu muiden joukosta sen vuoksi, kuinka aidolta koira n?ytt??, erityisesti sen k?velyn ja h?nn?n heiluttamisen osalta (vaikka turkin liike n?ytt??kin luonnottomalta takajalkojen ymp?rill?).
Videon tausta n?ytt?? my?s l?hes erottamattomalta todellisesta kuvamateriaalista, ja polku n?ytt?? laskevan vuorta alasp?in, aivan kuten aidossa ymp?rist?ss?. Kaiken kaikkiaan mik??n ei n?yt? v??rin sijoitellulta tai selke?lt??deepfakelta, joten kuva voisi helposti esiinty? oikeana videona.
?? Prompt: “A golden retriever walks on a winding mountain trail, its tail wagging excitedly as it explores the sights and scents of the wilderness.” pic.twitter.com/CeJ5VKfAaM
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Videon luomiseen k?ytetty kehote:
“A golden retriever walks on a winding mountain trail, it’s tail wagging excitedly as it explores the sights and scents of the wilderness.”
Suomeksi:
”Kultainen noutaja k?velee kiemurtelevalla vuoristopolulla, ja sen h?nt? heiluu innoissaan, kun se tutkii er?maan n?ht?vyyksi? ja tuoksuja.”
4. Nainen kahvilassa
Deepmindin film noir -tyylinen mainosvideo, jossa nainen istuu kahvilassa, kuvaa hienosti ihmist?.
Videolla kuvattu nainen vaikuttaa kasvojensa ilmeiden ja k?yt?ksens? osalta eritt?in el?v?iselt?. T?st? huolimatta on helppo huomata sormien luonnottomat liikkeet, kun ne tarttuvat h?nen pitelem??ns? kirjaan.
Vaikka video on melko lyhyt, voitaisiin sit? helposti k?ytt?? luovan projektin tai elokuvan kuvituskuvana, ja se havainnollistaa t?m?n teknologian k?yt?n tuomia mahdollisuuksia.
?? Prompt: “A woman sitting alone in a dimly lit cafe, a half-finished novel open in front of her. Film noir aesthetic, mysterious atmosphere. Black and white.” pic.twitter.com/vFVXr4Cvxi
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Videon luomiseen k?ytetty kehote:
“A woman sitting alone in a dimly lit cafe, a half-finished novel open in front of her. Film noir aesthetic, mysterious atmosphere. Black and white.”
Suomeksi:
“Nainen istuu yksin h?m?r?ss? kahvilassa, edess??n kesken oleva avoin romaani. Film noir -estetiikka, salaper?inen tunnelma. Mustavalkoinen.”
5. Vesililja Timelapse
Yksi erikoisimmista esimerkeist? DeepMindin mainosvideoiden joukossa on lyhyt leike, jossa vesililja avautuu hitaasti. Videolla vesililja avautuu v?hitellen ik??n kuin se olisi osa ajastettua kuvausta.
Liljan avautumisen liike on eritt?in yksityiskohtaista ja vakuuttavaa, vaikka tausta n?ytt?? huomattavan elottomalta ja tummalta.
T?m? esimerkki korostaa, miten Google Veon kaltaisia ty?kaluja voidaan k?ytt?? paitsi tyypilliseen videosis?lt??n, my?s aikajaksojen luomiseen ja tiettyjen prosessien visuaalisen erittelyn tarjoamiseen.
?? Prompt: “Timelapse of a water lily opening, dark background.” pic.twitter.com/t5uLQ89E1Y
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Videon luomiseen k?ytetty kehote:
“Time-lapse of a water lily opening, dark background.”
Suomeksi:
”Ajastettu kuvaus vesililjan avautumisesta, tumma tausta.”
6. Kebabin grillaaminen
Viimeinen esimerkki on lyhyt leike, jossa n?ytet??n teko?lyn luomia kana-viherpaprikakebabeja grilliss?. Yksi t?m?n klipin keskeisist? aineksista on se, kuinka luonnolliselta tulen ja savun liike n?ytt??.
Ainoa kritiikkimme on, ett? kameran kulma ja tarkennus vaikuttavat ep?luonnollisilta, joten lopputulos ei n?yt? kameralla kuvatulta.
?? Prompt: “Extreme close-up of chicken and green pepper kebabs grilling on a barbeque with flames. Shallow focus and light smoke. vivid colours.” pic.twitter.com/LDHC8XGyJA
— Google DeepMind (@GoogleDeepMind) May 14, 2024
Videon luomiseen k?ytetty kehote:
“Extreme close-up of chicken and green pepper kebabs grilling on a barbecue with flames. Shallow focus and light smoke. Vivid colours.”
Suomeksi:
“??rimm?inen l?hikuva kanaa ja vihre?? paprikaa sis?lt?vist? kebabeista, jotka grillataan liekehtiv?ss? grilliss?. Matala tarkennus ja kevyt savu. Eloisat v?rit.”.
Yhteenveto
Vuosi 2024 on teko?lyn generoimien videoiden vuosi, ja kaikki suuret toimijat astuvat varmasti areenalle, mik? saa luovan alan tekij?t sek? kiinnostumaan ett? huolestumaan.
Veo on toinen vaikuttava tulokas tekstist? videoksi -markkinoille, ja DeepMindin ensimm?iset mainosvideot osoittavat, ett? sill? on keskeiset valmiudet laadukkaan videosis?ll?n luontiin.
T?m? uusi toimiala on ollut olemassa vasta muutamia kuukausia, ja odotamme jo nyt innolla, mit? tuleman pit??.