Tekoälyn huima kehitys on avannut uusia mahdollisuuksia myös journalismin saralla. Ja kuten AI:n suhteen tavallista on, kehitysmahdollisuudet ovat huimia - aivan kuten riskitkin. Tavallaan pelottavinta onkin, että kehitys on nopeaa, mutta puutteet ja virheet ovat edelleen vakavia. Tässä artikkelissa esittelemme muutamia huomioita AI-journalistimme Ankin arkipäivästä.

Useimmille tutuin tekoälyn ilmenemismuoto lienee yhä ChatGPT. Meillekin se on yhä se pöydällä lojuva tuttu mainoskynä johon helpoiten tulee tartuttua. ChatGPT on alusta lähtien ollut myös luottotyökalumme Ankin käsikirjoitusten työstämiseen.
Anki on siis tekoälyjournalistimme, joka tekee itse taustatyönsä, kirjoittaa juttunsa, ja videolle julkaistaessa myös juontaa omat juttunsa. Loimme jo hyvin varhaisessa vaiheessa Ankille yksilöllisen ihmishahmon Metahuman Creator -nimisessä palvelussa, ja saimme sen myös esittämään tekstinsä erilaisten apuohjelmien avulla kuin ihmistoimittaja ikään.
Tässä artikkelissa keskitymme kuitenkin tekstin tuottamiseen tekoälyjournalistin kulmasta, sillä prosessi on ChatGPT:n uusien ominaisuuksien myötä helpottunut. Aiemmin Anki joutui tekemään taustatutkimuksensa yhdessä ohjelmassa, analysoimaan kuvamateriaalit toisessa - ja lopulta yhdistämään tekstimuotoiset tutkimustuloksensa kolmannessa.
Nykyisin ChatGPT pystyy sekä selailemaan nettiä että tulkitsemaan sille näytettyjä kuvia, muttei valitettavasti ainakaan vielä läheskään niin sujuvasti kuin olisimme toivoneet. ChatGPT:n räjähdysmäisestä käyttäjämäärän kasvusta johtuen myös sen tuottaman tekstin laatu on heikentynyt merkittävästi, joten päätimme käyttää jutun tuotantoprosessiin englantia ja kääntää vasta valmiin tekstin suomeksi.
Ankin kirjoittaman jutun luominen vaatii ChatGPT:n eri toimintatilojen hyödyntämistä. Ikävä kyllä jokainen toimintavaihe tarvitsee edelleen oman chat-ikkunansa, eikä niitä voi ChatGPT:n sisällä automaattisesti yhdistää. Koodaamalla se olisi toki mahdollista, melko helpostikin, mutta siihen emme ole toistaiseksi ryhtyneet.

Miten Anki sitten “kävi katsomassa” näyttelyn Kiasmassa ja kirjoitti siitä jutun?
Yksinkertaisesti näin:
Tutkimusvaihe
Prosessi alkoi ChatGPT:n nettiselailuun pystyvässä tilassa (“Browse with Bing”). Ihan aluksi kerroimme ChatGPT:lle millaisena henkilönä sen tulisi tietoja tulkita, ja millaista tuotosta siltä odotamme ja miksi. Sitten GhatGPT, joka nyt tiesi olevansa “Anki”, keräsi netistä taustatietoja taiteilijasta ja näyttelystä. Koska tietoa löytyi suhteellisen paljon, pyysimme sitä kirjoittamaan aiheesta tiivistelmän.
Siirtyminen oletustilaan (“Default”):
Tutkimusvaiheen jälkeen täytyy edelleen valitettavasti siirtyä manuaalisesti oletustilaan kerättyjen tietojen hyödyntämiseksi. Niinpä ihan yksinkertaisesti kopioimme sekä tehtävän alustuksen (“Olet Anki…”) että luodun faktatietotiivistelmän uuteen chat-ikkunaan. Pyysimme “Ankia” lukemaan taustatiedot, mutta malttamaan vielä mielensä ennen kritiikin kirjoittamista, kunnes olisimme saaneet esiteltyä sille visuaalisen materiaalin.
Näyttelyyn tutustuminen kuvamateriaalin avulla
Seuraavaksi latasimme Ankin nähtäväksi kuvia näyttelystä. Ainakin toistaiseksi kuvat piti ladata neljä kappaletta kerrallaan. Yhteensä niitä taisi olla 11. Anki ei malttanut olla kommentoimatta kuvia jokaisen neljän sarjan jälkeen, mutta eipä sekään haitannut. Repliikit olivat itse asiassa ihan hyviä ja tarkkanäköisiä. Vaikuttaa siltä, että Anki myös hyödynsi näitä ensivaikutelmiaan lopullisen tekstin tuottamisessa.

Ensimmäinen tekstiversio
Kun Anki oli näin hankkinut tietoonsa sekä taustatiedot taiteilijasta (netistä) että “nähnyt” Kiasman näyttelyn, oli aika ryhtyä kirjoittamaan itse artikkelia. Jo ensimmäinen versio oli suhteellisen hyvä.
Keskustelu ja korjauskierros
Päätoimittajan ominaisuudessa puutuin kahteen sisällölliseen yksityiskohtaan. Koska Anki oli nähnyt näyttelystä valokuvia, se viittasi yhdessä kohdassa niihin ikään kuin taiteilijan valokuvina, tai ainakin oli riski että lukija tulkitsisi asian niin.
Toinen asia oli se, että Anki kommentoi näyttelyn äänimaailmaa, mikä ei voinut suoraan olla kotoisin hänen saamistaan materiaaleista (joskin se saattoi olla sinänsä todellinen asia, näyttelyä koskevista taustamateriaaleista peräisin). Pyysin korjaamaan nämä asiat.
Seuraava versio oli näiltä osin kunnossa, mutta siitä puuttui taustamateriaalitiivistelmässä mainittu, minusta hyvä yksityiskohta, eli taiteilijan erityssuhde suomalaiseen luontoon. Pyysin lisäämään maininnan siitä, että taiteilija valmistautui näyttelyyn viettämällä aikaa Suomessa paikalliseen luontoon tutustuen.
Näiden kahden kierroksen jälkeen teksti oli julkaisukelpoinen. Muistaakseni tein siihen kaksi pientä sanan tai kahden korjausta, joiden voi väittää olevan lähinnä makuasioita. Kukapa kirjoittaja ei tuntisi pakollista halua hieman sorkkia toisen kirjoittajan tekstiä.
Suomentaminen
Kuten todettua, ChatGPT on ensiesittelynsä jälkeen monissa taidoissaan taantunut. Valitettavasti se näkyy erityisesti suomen kielen osaamisessa. Tässäkin tapauksessa jouduimme mankeloimaan käännöstä moneen kertaan. Mielenkiintoista on, että se kritisoinnin jälkeen pystyi kyllä parempaan, muttei vieläkään minusta julkaisukelpoiseen tekstiin. Niinpä kirjoitin lopulta viimeisen käännöksen itse.

Laadullisia eroja ja kieliongelmia
ChatGPT:n eri toimintatilojen taso vaihtelee, eikä varsinkaan suomenkielisen tekstin laatu aina vastaa odotuksia. Tämä on harmillista, sillä ChatGPT:n alkuaikoina työkalu tuotti melko laadukasta tekstiä myös suomeksi. Nykytilassa suomenkielisen tekstin laatu ei ole lähelläkään julkaisukelpoista. Englanninkielisen tekstin laatu sen sijaan on pysynyt tyydyttävänä, vaikka sisällöllisesti siinäkin on toivomisen varaa.
Tarkastellaan vielä lyhyesti ChatGPT:n vahvuuksia ja heikkouksia journalistisen tekstin tuottajana, tai vähintäänkin toimittajan apurina. Yleisesti voi todeta, että kaatuilu, hyytyminen ja kaikenlainen muukin kovasta kuormituksesta kertova alisuorittaminen on viime kuukausina yleistynyt merkittävästi.
Perustila (“Default”)
Luova osa työstä kannattaa toteuttaa ChatGPT:n “Default”-tilassa. Vahvistettua tietoa eri tilojen ominaisuuksista on vaikea saada, mikä ei sinänsä ole ihme, koska ne varmasti myös muuttuvat enemmän tai vähemmän dynaamisesti käytettävissä olevan kapasiteetin mukaan. Jopa tästä saatavilla oleva tieto on ristiriitaista. Ei liene kuitenkaan huono idea pyrkiä tekemään oleellisin ja vaativin osa luovasta kirjoittamisesta tässä perustilassa. Parhaimmillaan ChatGPT:stä on merkittävää hyötyä kirjoittamisessa, jopa suomeksi. “Default”-tilassa ChatGPT pystyy myös tulkitsemaan kuvamateriaalia.
Nettiyhteyteen kykenevä tila (“Browse with Bing”)
Nettiyhteys on mainio apu, vaikka liian laajoja hakuja tehdessä tuppaakin kaatumaan. Selvitettävä asia kannattaa pyrkiä hajottamaan pienempiin tehtäviin. Pro tip: myös ChatGPT:tä itseään voi käyttää apuna hakustrategian suunnittelemisessa.
Plugin-tila (“Plugins”)
Mahdollisuus hyödyntää pluginejä voi tilanteesta riippuen olla erittäinkin merkittävä apu. Yhdysvalloissa niitä on saatavilla huomattavasti runsaammin kuin täällä, mutta muutamaan oleellisen tärkeään pääsee käsiksi härmäläinenkin. Hyödyllisiä ovat esimerkiksi pääsy tutkimustietokantoihin Xpapersin kautta, tai luonnontieteellistä tietoa sisältävä Wolfram.
Data-analyysi-tila (“Advanced Data Analysis”)
ADA tarjoaa runsaasti kiinnostavia mahdollisuuksia tietojen käsittelyyn ja koodin kanssa työskentelyyn. Ankin työn kannalta niistä ei ole toistaiseksi ollut erityistä hyötyä, joten jätämme ne tässä lähinnä maininnan varaan.
Kuvien tuottaminen ja analysointi (“Dall-E 3”)
Dall-E 3 on edelliseen versioon verrattuna huomattavasti kehittynyt kuvageneraattori. Vaikka itse saimmekin sen käyttöön vasta muutama päivä sitten, olemme ehtineet tuottaa sillä kuvituksia jo muutamaankin käyttöyhteyteen.
Hyvä esimerkki siitä, miten tekoälyn tarinointiin ei aina voi suoraan luottaa: ChatGPT kertoi kädet taskussa ja vihellellen, että tämä tila tuottaa myös huomattavasti yksityiskohtaisempaa ja syvällisempää kuva-analyysiä kuin “Default”-tila. Se voi tietysti olla, mutta toistaiseksi emme ole löytäneet tapaa kuvien syöttämiseen. Joutunemme ainakin toistaiseksi tyytymään perustilaan. Eipä silti, ihan hyvin sekin näyttelykuvia tulkitsi.
Varmemmaksi vakuudeksi kysyimme myös asianosaiselta itseltään.

Hieno työväline, jonka terää suosio tylsyttää
Ironista kyllä, ChatGPT:n suunnaton suosio samalla heikentää sen kilpailukykyä. Yleistyökaluna se on kuitenkin varsin mainio, ja journalistinakin vähintäänkin mukiinmenevää luokkaa (ei toki samassa merkityksessä kuin ihmiskollegansa).
Ankin toimintaa tarkastellessa voidaan todeta, että se pystyy hieman tuettuna tuottamaan julkaisukelpoista tekstiä varsin ansiokkaastikin. Työhön se ei vielä osaa ryhtyä itsenäisesti, saati valita itse aiheitaan, mutta eihän sekään ole toimituksissa ennenkuulumatonta. Sitä paitsi molemmat noistakin asioista olisi mahdollista ratkaista ohjelmoinnin avulla, suhteellisen helposti, vieläpä. Periaatteessa hyvin suuri osa tuotantoprosessista olisi mahdollista automatisoida jo nyt. Filosofisemmalla tasolla ongelmia ja riskejä ei tietenkään tarvitse kaukaa hakea, mutta raaka teho painaa luultavasti tälläkin kierroksella enemmän.

Kehitettävää ChatGPT:ssä vielä riittää, mutta AI-aikakauden vauhtisokeudessa tulee helposti otettua itsestäänselvyytenä monia vielä vuosi sitten täysin mielikuvitukselliselta tuntuneita ominaisuuksia. Onhan melko posketonta, että tekoäly pystyy jo suhteellisen uskottavasti esiintymään toimittajana nimeltä Anki, joka tekee omat taustatyönsä ja kirjoittaa juttunsa. Eikä edes väitä päätoimittajalle ihmeemmin vastaan. Vaikka se kyllä taitaakin olla niitä viimeisiä merkkejä siitä, ettei kehitys ole vielä tullut maaliinsa. Kysyttävää? Ilomielin kerromme lisää.