Makasin kesällä 2012 hiekkarannalla Pohjois-Italiassa ja luin tuoretta Wired-lehteä. Toimittaja Steven Levy maalasi eteeni kuvan yrityksestä, joka tekee jotain aivan vallankumouksellista: sen algoritmi kirjoittaa automaattisesti uutisia, jotka näyttävät oikeiden ihmisten kirjoittamilta. Tässä esimerkki viiden vuoden takaa:

”Friona fell 10-8 to Boys Ranch in five innings on Monday at Friona despite racking up seven hits and eight runs. Friona was led by a flawless day at the dish by Hunter Sundre, who went 2-2 against Boys Ranch pitching…”

Vuonna 2010 perustettu Narrative Science oli tuolloin 30-henkinen yritys ja sen robotit tehtailivat urheilu-uutisen kolmenkymmenen sekunnin välein. Nyt 43 miljoonaa euroa rahoitusta kerännyttä yritystä pidetään tekoälyfirmojen edelläkävijänä.

Viestinnän ihmiselle ajatus siitä, että kone jonain päivänä tekisi omat työni vaikutti etäiseltä vuonna 2012. Enää ei.

Vuonna 2018 jokainen suurehko suomalainen mediatalo on pitkällä omien sisällöntuotannon ja uutisaiheiden tunnistamisen sovelluksissaan. Pari viimeaikaista esimerkkiä – jotka listasin LinkedInin Viestintä ja tekoäly -ryhmässä – ovat Alman, Sanoman ja STT:n hankkeet. Sanoma ja Yle ovat tuottaneet jo jonkin aikaa automatisoituja uutisia. Saara Kolhon juttu M&M:ssä listaa lisää esimerkkejä.

Tekoäly luo seuraavaksi ääntä ja kuvaa tyhjästä

Jos tekstin automaattinen tuottaminen tuntuu jo arkipäiväiseltä – ja nyt kannattaa muistaa että kymmenen vuotta sitten se tuntui utopialta – kuvien, äänen ja videon kanssa ollaan vielä jonkin aikaa turvassa. Vai ollaanko?

Nvidian algoritmi osaa luoda aidolta tuntuvia kuvia ihmisistä tyhjästä. Alla olevat esimerkit ovat täysin tekoälyn piirtämiä. Lisää kuvia voi käydä katsomassa New York Timesin jutusta.

Microsoftin botti osaa luoda kuvan tekstimuotoisen kuvailun perusteella tyhjästä – alla olevaa lintua ei välttämättä ole olemassa luonnossa:

Entä videot? Alla olevissa esimerkeissä ohjaamatonta oppimista käyttävä algoritmi on muuttanut päivän yöksi ja kesän talveksi. Asialla on edelleen Nvidia.

Videon todistusvoima on romahtanut. Washingtonin yliopiston tutkijat tuottavat pelkän ääniraidan perusteella aidolta vaikuttavaa puhuva pää -videota:

Edellisessä videossa äänessä tosiaan oli Obama, vaikkakin eri videoraidalla kuin alun perin. Seuraavassa sekä ääni että video tulevat molemmat suoraan tekstistä – siis kirjoitetusta tekstistä. Asialla on Lyrebird-niminen sovellus:

Tässä “puhuu” Donald Trump:

Lyrebird antaa kenen tahansa luoda oman ääniprofiilinsa. Nauhoittamalla 30-300 lausetta – halutusta laadusta riippuen – voi kirjoittaa omalla äänellä puhuttuja tekstejä. Kokeilin vähimmäismäärällä, ja tulos kuulostaa tältä.

Jos kohta Lyrebirdin äänelaatu paljastaa vielä selkeästi, että kyseessä on kone, kokeilkaapa sanoa kumpi seuraavien kahden esimerkin äänistä on ihmisen, kumpi koneen aikaansaama?

“George Washington was the first President of the United States.”


“That girl did a video about Star Wars lipstick.”


Yllä olevissa esimerkeissä Google käyttää syviä neuroverkkoja ja tuottaa hämmästyttävän luonnolliselta kuulostavan koneäänen.

Jokainen annetuista esimerkeistä on jo totta. Jos tekstimuotoisen, tekoälyavusteisen sisällön tuottaminen trivialisoitui jossain vaiheessa vuosien 2010 ja 2017 välillä, on helppo nähdä samoin käyvän kuvalle, äänelle ja videolle.

Kirjoittaja Timo Nurmi työskentelee Vapalla tittelillä Director, Future of Communications.