Vapaavuoro
Mikä liikuttaa taiteessa juuri nyt? Ajankohtaisia ja ikuisia aiheita.
Taiteen paikka on Todellisuuden tutkimuskeskuksen ja Voiman yhteinen taidemedia. Lue kaikki Taiteen paikan artikkelit: voima.fi/taiteenpaikka
Tammikuussa 2021 päättyi muuan aikakausi ja alkoi uusi, muuallakin kuin Washingtonin Capitol-kukkulalla. Tuolloin kalifornialainen tutkimuslaboratorio OpenAI nimittäin julkisti DALL-E -tekoälyohjelmistonsa, joka kykeni tuottamaan yksinkertaisia kuvia englanniksi kirjoitettujen ohjeiden pohjalta. Tämä toinen historiallinen vedenjakaja jäi kuitenkin merkitystään vähemmälle huomiolle.
Erilaisia algoritmeja on toki käytetty generatiivisen taiteen tekemiseen jo vuosikymmenien ajan. Vuoden 2021 kuluessa markkinoille ilmaantuneet text-to-image -tekoälymallit kuitenkin mullistivat tilanteen – koodarin taitojen sijaan kuvan generoimiseen tarvitaan enää parin tekstirivin mittainen kuvailu aiheesta, ”prompt”.
Kehityksen vauhti on ollut huimaa. Käänteentekevä päivitys oli samaisen OpenAI:n tämän vuoden huhtikuussa julkaisema DALL-E 2, jolta taittuivat niin valokuvat, kuvitukset kuin maalauksetkin. Tekoälyn tuottama jälki alkoi muistuttaa jo erehdyttävästi ihmisen aikaansaannoksia. Alakulttuurin murtautuminen kohti valtavirtaa alkoi toden teolla elokuussa 2022, kun Stability AI julkaisi tähän mennessä tehokkaimman text-to-image -mallin eli Stable Diffusionin avoimen lähdekoodin. Tekoäly on sittemmin generoinut miljoonittain kuvia, joita pääsee selaamaan esimerkiksi Lexica.art -hakukoneella.
Malleja on toki muitakin, ja kaikilla on omat erityisluonteensa: esimerkiksi Midjourneyn generoimia kuvia leimaa selvästi tunnistettava esteettinen tyyli; edellä mainittu Stable Diffusion edustaa teknologian terävintä kärkeä ja sen avointa koodia hyödyntävät monet muut tekoälymallit ja -sivustot; DALL-E 2 on suuntautunut pääasiassa yritysmaailman ja kuvapankkien tarpeisiin; Craiyon on muihin verrattuna kuin lapsi, jolla on vilkas mielikuvitus mutta tuhruinen käsiala.
Vaikka kyseisten tekoälymallien testailua leimaa paljolti huumorin, leikkisyyden ja uteliaisuuden ilmapiiri, monet taiteilijat ja muut visuaalisen alan ammattilaiset pitävät kehityssuuntaa hälyttävänä. Kun teknisesti vaikuttavan, esteettisesti upean kuvan generoimiseen ei tarvita muuta kuin lyhyt kuvailu siitä, mitä käyttäjä haluaa nähdä, lähes ammattilaistasoisen kuvatuotannon rima on äkkiä pudonnut häkellyttävän alas.
Kuvataiteilijan dilemma
Eräänlaiseksi paradigman murtumisen symboliksi on noussut puolalaissyntyinen kuvataiteilija ja kuvittaja Grzegorz Rutkowski, jonka fantasia-aiheiset maalaukset ovat peliharrastajille tuttuja esimerkiksi Magic the Gathering ja Dungeons and Dragons -peleistä. Kesän 2022 kuluessa Rutkowskin nimestä muodostui promptinikkareiden keskuudessa eräänlainen viraalihitti, sillä seurauksella että tätä kirjoitettaessa Greg Rutkowskin nimellä varustettuja tekoälykuvia on suosituimmilla alustoilla generoitu jo satojatuhansia. Rutkowskin tavoin myös lukuisien muiden elävien taiteilijoiden nimillä on generoitu valtavia määriä keinotekoisia pastisseja.
Problematiikka on ”monikerroksista”, Greg Rutkowski sanoi Hyperallergic-sivustolle antamassaan haastattelussa.
”Ensinnäkin tekoälygeneraattorit/ohjelmistot käyttävät taiteilijoiden nimiä viitteenä tai opastuksena algoritmille, jotta se osaa noudattaa tiettyä tyyliä, kysymättä keneltäkään lupaa käyttää heidän töitään tietokannassa. Toiseksi tietojen kerääminen ilman laillisia säännöksiä on vakava ongelma.”
Rutkowski onkin vaatinut julkisesti elävien taiteilijoiden teosten poistamista tietokannoista.
Asetelma on kuvantekijän kannalta varsin hankala: Mitä auliimmin taiteilija jakaa teoksiaan netissä, ja mitä yksityiskohtaisempia tietoja teoksista hänen portfolionsa sisältää, sitä helpommin hänen portfolionsa päätyy osaksi algoritmin kouluttamiseen tarkoitettua tietokantaa. Ja mitä suositummaksi taiteilija sattuu nousemaan AI-mallien käyttäjien keskuudessa, sitä jyrkemmän inflaation hänen omat kuvansa potentiaalisesti kärsivät halpojen kopioiden tulvassa.
Harmailla alueilla
Tieteiskirjailija Arthur C. Clarken kuuluisa lausahdus – ”mikä tahansa riittävän kehittynyt teknologia vaikuttaa taikuudelta” – alkaa olla jo klisee, niin usein se tuntuu kuvaavan meitä parhaillaan ympäröivää teknologista hullunmyllyä. Silti on myönnettävä, että text-to-image -tekoälymallien kuin tyhjästä ilmaantuvat kuvat tuntuvat edelleen himpun verran taianomaisilta. Miten tämä on ylipäätään mahdollista?
Tekoälyllä ei ole näkemystä tai mielikuvitusta, mutta sen laskentateho on käsittämätön. Inhimillisyyden ja intention puutetta paikkaa iteratiivisuus, eli annetun teeman loputon versiointi: kunhan seinään paiskaa tarpeeksi paljon jotain taidetta muistuttavaa, aina jotain kehystettäväksi kelpaavaa tarttuu tapettiin. Ja kuten todettu, mallien osumatarkkuus paranee huimaa vauhtia.
Raaka voima ei kuitenkaan riitä, vaan kukin tekoälymalli täytyy kouluttaa tehtäväänsä näyttämällä sille ensin joukko erilaisia kuvia metatietoineen. Esimerkiksi ensimmäisten Stable Diffusion -mallien kouluttamiseen käytettiin kolmea, yhteensä 2,3 miljardin kuvan tietokantaa.
Yhtiöt eivät ole tiedottaneet valtavien tietokantojensa alkuperästä kovinkaan innokkaasti. Stability AI on ollut asian suhteen kilpailijoitaan avoimempi: Stable Diffusionin kouluttamiseen käytetyt tietokannat on koonnut ja prosessoinut LAION, Saksaan rekisteröity voittoa tavoittelematon tutkimusyksikkö. Prosessin rahoituksesta vastasi suurelta osin Stability AI. Myöskään itse tekoälymalli ei ole julkaisijansa työtä, vaan Stable Diffusion on Münchenin yliopistossa toimivan CompVis-tutkijaryhmän käsialaa.
Kyse on siis eräänlaisesta datanpesuoperaatiosta: AI-teknologiayhtiöt käyttävät tällä tavoin ei-kaupallisten toimijoiden, kuten yliopistojen tai voittoa tavoittelemattomien yhteisöjen, kokoamia big data-aineistoja omiin kaupallisiin tarkoituksiinsa. Ulkoistamalla raskaat datankeruuoperaatiot epäkaupallisille toimijoille yritykset säästyvät mahdolliselta (tekijän)oikeudellisen vastuun kantamiselta, ja kysymys vastuullisuudesta ylipäänsä häivytetään näkyvistä. Samalla yhtiöt antavat käyttäjille luvan käyttää generoituja kuvia kaupallisiin tarkoituksiin, mikä on omiaan sekoittamaan pakkaa entisestään.
Minkään maan lainsäädäntö ei ole tällä hetkellä tekoälygeneroitujen kuvien suhteen ajan tasalla. Alan yhtiöillä on omat erilaiset ohjeistuksensa mallien käytöstä, mutta vastuu niiden noudattamisesta on ulkoistettu kokonaan käyttäjille, eikä väärinkäytöksistä seuraa sanktioita. Myös taiteilijoiden taistelu teostensa poistamiseksi tietokannoista on toistaiseksi ollut tuloksetonta, eivätkä alan yhtiöt ole vastanneet heidän viesteihinsä ja vaatimuksiinsa lainkaan. Osasyynä siihen saattaa olla, että kerran valtavalla datamäärällä koulutetun tekoälymallin repertuaarista ei noin vain poisteta osia.
Kuka kuvia tekee?
Text-to-image -mallien olemassaolo herättää myös monenlaisia kiperiä kysymyksiä taiteesta ja taiteilijuudesta sinänsä. Vaikka tekoälyn tuottamat kuvat näyttävät nykyään jo varsin taiteellisilta, on tekstipromptin kirjoittajan suhde tekoälyyn lähinnä tilausteoksen ostavan asiakkaan suhdetta taiteilijaan: promptinikkari naputtaa tekstikenttään tilauksen, jonka taiteilija (tässä tapauksessa AI-malli) parhaansa mukaan toteuttaa.
Tämä sinällään perusteltu vertaus ei tunnu juuri miellyttävän vastikään taiteilijoiksi ryhtyneitä prompti-insinöörejä. Varsinkin nuorempi polvi signeeraa ja kaupustelee suvereenisti tekoälyn avulla generoituja kuvia ja julistautuu mielellään teosten tekijäksi. Kontribuutio ”teoksen” valmistumiseen on kuitenkin saattanut rajoittua noiden parin tekstirivin kirjoittamiseen, mikä on kaikin puolin kovin kaukana varsinaisesta kuvantekemisen prosessista.
Automatisoitua luovuutta kohti
Taiteilijoiden huoli toimeentulostaan ja oikeuksistaan lienee esimakua siitä, mitä tuleman pitää: tekoälyn lonkerot kietoutuvat lähivuosina tavalla tai toisella likimain kaikkien toimialojen toimintaan. Peliteollisuuden ja animaatiostudioiden graafiset konseptit menevät uusiksi ehkä ensimmäisenä, ja perässä seuraavat mainonta-, julkaisu- ja viihdeteollisuus. Yksilötasolla mullistusten edessä ovat valokuvaajien, graafisten suunnittelijoiden, mallien, näyttelijöiden, ohjaajien, kuvaajien ynnä muiden työnkuvat.
Midjourneyn perustajalla David Holzilla on asiasta idealistinen näkemys: hänen mukaansa tekoälymallien nousu nostaa kuvitusten ja käyttötaiteen standardien tasoa luovempaan ja mielikuvituksellisempaan suuntaan, ja ammattilaisille riittää kyllä töitä varsinkin nyt, kun tarjolla on ennennäkemättömän tehokkaita työkaluja. Totta on, että modernit tekoälymallit ammattimaisten taiteilijoiden ja koodaajien käsissä avaavat kuvantekemiseen ja taiteilijoiden mahdollisuuksiin näkymiä, jotka vielä vuosi pari sitten olisivat olleet täyttä scifiä. Silti on huomionarvoiosta, kuinka dramaattisesti, nopeasti ja laajalla skaalalla tekoälypohjainen kuvatuotanto on alkanut sekoittaa kuvioita sellaisilla aloilla, joiden vielä vastikään kuviteltiin ainakin olevan turvassa koneiden ylivallalta.
Pitkän aikaa oli vallalla jonkinlainen konsensus siitä, että varsinainen luovuus, ja sitä myöten taide, ovat syvästi inhimillisiä ominaisuuksia ja siten tekoälyn ulottumattomissa. Eksponentiaalisella vauhdilla parhaillaan kehittyvän teknologian synnyttämissä uhkakuvissa on siksi uudenlainen, eksistentiaalinen sävy. Monotonisten, raskaiden ja mekaanisten työtehtävien koneellistuminen on asia erikseen – mutta häviävätkö seuraavaksi luovat työt, jotka tähän asti on kulttuurisesti koettu syvästi merkityksellisiksi? Väittely aiheesta jatkuu varmasti monella rintamalla tästä hamaan tulevaisuuteen, mutta suuri murros on kiistatta käynnissä. Ja se käynnistyi niin nopeasti, ettemme oikein ehtineet edes huomata.
Visa Knuuttila on helsinkiläinen kuvataiteilija ja graafinen suunnittelija, jonka näyttelystä tekoälyavusteiset teokset karsiutuivat pois turhan pliisuina.