Asiantuntijoiden kirjoituksia ajankohtaisista kielikysymyksistä. Laaja blogi- ja kolumniarkisto, kysymyksiä ja vastauksia -osio, teemakoosteita.

Kirjoittaako robotti uutiset sadan vuoden päästä?

Uutisten automatisaatiosta on puhuttu – ja sillä peloteltu, katsantokannasta riippuen – jo vuosikymmeniä. Edelleen uutiset kuitenkin kirjoittaa ihminen. Miksi näin?

Ilmeisin haaste automatisaatiolle on kieli. Sanamuotojen taivuttaminen jo onnistuu, mutta ihmiskielen hienovaraiset nyanssit eivät taivu ehtolauseiksi ”jos A, niin B”. Tämä puute tekee kielestä kankeahkoa ja pidemmän päälle yksitoikkoista.

Suurempi ongelma on sisältö. Pörssiyhtiöistä, urheilusta ja vaaleista tuotetaan tulosdataa, joka on numeerista ja hyvin jäsenneltyä, ja sen ansiosta näiden aihepiirien uutisointia on jo menestyksekkäästi automatisoitu, myös Suomessa ja suomeksi. Todellisessa jymyuutisessa on kuitenkin kyse uudesta ja yllättävästä, kenties vaivalla esiin kaivetusta tiedosta. Ei ennalta koodattu algoritmi saa sellaisesta otetta.

Kolmanneksi kehitystä on jarruttanut mediatalojen ja ohjelmistokehittäjien yhteistyön takeltelu. ”Voisi kuvitella, että alalla olisi paljonkin meneillään”, sanoo uutisautomatisaatiota tutkinut Carl-Gustav Lindén, ”mutta muutamia näytösluontoisia esimerkkejä lukuun ottamatta – eipä juuri ole”. Teknologia sinänsä ei ole toimitusalalla vieras asia, sitähän ovat uutishuoneet täynnä. Puhe ”robottitoimittajista” on kuitenkin säikäyttänyt ihmistoimittajat, vaikka ”ei ole mitään merkkejä siitä, että kehitys automatisaation saralla olisi vähentänyt toimittajien töitä”, Lindén muistuttaa. ”Tämä kehitys tulisi ennemminkin nähdä edistysaskeleena toimittajien ja teknologian yhteistyössä.”

Se on varmaa, että ”robotit” eivät vuosiin tai vuosikymmeniin kirjoita analyyttisiä ja mukaansatempaavia reportaaseja. Sekin on varmaa, että ihmisten ja ohjelmistojen yhteistyö tulee syvenemään: jo nyt eräät suomalaistoimitukset paikantavat algoritmien avulla potentiaalisia uutisaiheita julkisista pöytäkirjoista, joten miksipä ei ohjelmisto voisi koota myös taustamateriaalia, paljastaa piiloon jääviä korrelaatioita kaukaisten muuttujien välillä, tuottaa raakatekstiä ja tehdä valmiista jutusta versioita eri jakelukanaviin.

Ottaen huomioon sen nopeuden, jolla teknologia kehittyy, sadan vuoden päähän ennustaminen menee huumoriksi. Tiedon valitsemista ja välittämistä tullaan tarvitsemaan – mutta ehkäpä uutiset siirretään suoraan ihmisen tajuntaan ilman verbaalista kieltä, tarpeetonta pullonkaulaa.


LAURI HAAPANEN

Kirjoittaja on suomen kielen tohtori ja tutkija.

Carl-Gustav Lindén: ”Robot Journalism”: The damage done by a metaphor

Kirjoitus on osa ”Sanoin saavutettu” -sivustoa ja sen ”Sanoin saavutettavissa: 2117” -sivua. Sivusto kuuluu Suomi 100 -juhlavuoden ohjelmistoon.

Suomi 100
Klikkaamalla kuvaa pääseet Suomi 100 -juhlavuoden sivuille.