Asiantuntijoiden kirjoituksia ajankohtaisista kielikysymyksistä. Laaja blogi- ja kolumniarkisto, kysymyksiä ja vastauksia -osio, teemakoosteita.

Yhä tarvitaan kääntäjää

Kääntämisen merkitys kansakuntien kielten ja kirjallisuuden kehittymiselle tuppaa usein unohtumaan. Ei suomenkielistä kirjallisuutta tyhjästä luotu. Kääntäjät siirsivät kauno- ja tietokirjallisuutta suomalaisten ulottuville, minkä ansiosta muiden kulttuurien käyttämät kielelliset ja tekstuaaliset mallit alkoivat vaikuttaa suomen kielen kehittymiseen muun muassa perusopetuksen ja opettajankoulutuksen kautta (ks. Paloposki 2017). Suomalainenkin teknologia, kaupalliset keksinnöt ja kirjallisuus ovat levittäytyneet maailmalle sen avulla, että ajatuksemme on onnistuttu esittämään muilla kielillä.

Miten kuvitella kääntämisen merkitystä tässä yhteisössä ja tälle yhteisölle sadan vuoden päähän? Millainen tieto on arvokasta kaksisataavuotiaassa Suomessa? Ensimmäiseksi tulee mieleen ajatus, että teknologia auttaa meitä säästämään kielet ja kulttuurit ja erilaisten yhteisöjen moninaisuuden. Se voisi myös edistää helpompaa kielellistä ja kulttuurista rinnakkaiseloa.

Ehkä käännös- ja kieliteknologia turruttaa kuitenkin tyystin käsityksemme toisista kielistä ja kulttuureista, koska viestintä on niin kääntämisen läpitunkemaa, että koko kääntämistä ei enää havaita tapahtuvan eikä vieraiden kielien oppimista nähdä mitenkään tarpeellisena. Omaa kieltä tai omia kieliä saatetaan tästä huolimatta pitää edelleen tärkeänä ajattelulle, ja vanhemmat valitsevat omien kieltensä perusteella lapsilleen sopivat kielelliset perusasetukset.

Konekääntämisessä on tehty suuria harppauksia 2010-luvulla. Tällä hetkellä kehitetään erityisesti neuroverkkokääntämistä, jossa kone oppii isojen aineistojen avulla tunnistamaan ja hallitsemaan myös tekstin diskurssitason ilmiöitä ja päättelemään niiden merkityksen lauseiden ulkopuolisesta kontekstista (ks. Tiedemann & Scherrer 2017). Yllättävää kyllä, suurin ongelma koneiden opettamisessa on saatavilla olevan kieliaineksen määrä. Big dataa ei ole tarjolla riittävästi kaikista kielistä. Kestää siis oletettavasti vielä kauan, ennen kuin esimerkiksi suomen ja thain välinen koneellinen kääntäminen onnistuu tyydyttävästi monimutkaisissa käyttötilanteissa.

Suomen kielen konekääntämisen kehittäminen on ollut hitaampaa kuin esimerkiksi indoeurooppalaisten englannin ja espanjan kielten välinen kääntäminen, sillä suomen kielen runsas morfologia merkityksineen on ollut työläs opettaa koneelle. Vaikka valtakielten välillä konekääntäminen onnistuu jo rajatuissa yhteyksissä erittäin hyvin, hankalia kieliyhdistelmiä, tekstilajeja ja kulttuurisia käyttöyhteyksiä on vielä loputtomiin työstettäväksi ja koneille opetettavaksi. Maailmassa puhutaan tuhansia kieliä, ja yleisimpiäkin on olemassa lähes parisataa. Inhimillisen elämän moninaisten viestintätilanteiden runsautta ei pysty edes hahmottamaan.

Tieteiselokuvien korvaistukkeet antavat kuitenkin aavistaa, miltä tulevaisuus näyttää. Kaikkialle ulottuva tietoverkko tunnistaa automaattisesti vastaantulijat ja mukauttaa vastaanottomme heidän kieliasetustensa mukaisiksi. Viestimme välitteisesti, mutta tuskin enää huomaamme sitä. Pääsemme matkustamaan virtuaalisesti kaukaisiin maihin eikä meidän tarvitse murehtia kielen vieraudesta, jos olemme vain muistaneet päivittää sisäisen kovalevymme ympäristöön sopivaksi tai maksaneet riittävän suuren lisenssimaksun paikallisen kielen kattavaksi.

Oleellista onkin ajatella, että konekääntäminen mahdollistaa hyvin toteutuessaan pääsyn entistä laajempaan tietoainekseen, kun tieto ei enää tunne kielirajoja. Kenties tiedettäkin voidaan tehdä jatkossa pääasiassa suomeksi. On kuitenkin pyrittävä huolehtimaan kansainvälisellä sääntelyllä siitä, että pääsy tietoon ei ole kovin suurten maksumuurien takana, vaan että ihan tavallinen suomalainen voi lukea esimerkiksi venäläistä mediaa aamukahvinsa ääressä. Konekääntäminen mahdollistaa parhaimmillaan sen, että median portinvartijoita tai tiedon manipuloijia ei enää mahdu viestiketjuun. Toki tiedon manipulointi on entistäkin näkymättömämpää, jos järjestelmään saadaan pääsy vahingoittamistarkoituksessa.

Automaattinen puheentunnistus tulee siis ratkaisemaan monta kielten välistä viestintätilannetta tulevaisuudessa, mikäli siitä tulee kansalaiskäyttöön tarkoitettu hyödyke. Myös heikoimmassa asemassa oleva ihminen pystyy esittämään asiansa valtion viranomaisille ilman lisäkustannusta myös sellaisissa tilanteissa, joissa hän ei olisi aikaisemmin saanut tulkkia käyttöönsä maksutta. Tähän on kuitenkin vielä pitkä matka, ja sata vuotta on käytettävä myös poliittisesti tarkoituksenmukaisesti, jotta tavoite saavutetaan.

Arvaukseni on, että sadankin vuoden kuluttua tarvitaan ihmiskääntäjiä ja -tulkkeja. Koneet eivät ole vielä omaksuneet ja mallintaneet kaikkia vuorovaikutustilanteita luotettavasti. Vaikka niiden oppimiskapasiteetti on huima, sadassakaan vuodessa ne eivät ole ehtineet oppia kaikkea inhimillisestä vuorovaikutuksesta, vaikka oppivia pikku robotteja kävelisi joukoissamme ympäri maailmaa kaikissa mahdollisissa tilanteissa arvioimassa ilmeitämme, äänenpainojamme ja ilmausten erilaisia merkityksiä.

Voi kuitenkin käydä myöhemmin niin, että aivotoimintamme jää jatkossa ikuisten lasten tasolle, koska meidän ei enää tarvitse vaivautua kehittämään aivojamme toisten ymmärtämiseen. Jos koneet ovat jo ehtineet hankkia miljoonia kertoja laajemman ja monipuolisemman kokemuksen kuin kasvava lapsi ja ihmisten välinen keskinäinen kanssakäyminen hoituu robottien huolehtiessa puhumisesta ja kirjoittamisesta, niin mikä enää mahdollistaa ihmisaivojen oppimisen?

Timo Honkelan Rauhankone-kirja (2017) antaa hyvän tuen jatkovisioinnille. Puheentunnistus ja tulkkaus tekoälyn (tai tukiälyn) avulla ovat kehityksessään vielä koneellisesta kääntämisestä jäljessä. Varovainen arvaukseni on, että ihmistulkkeja tarvitsemme vielä paljon pitempään kuin ihmiskääntäjiä, koska monissa suullisen viestinnän tilanteissa tunteiden huomaaminen ja ennakointi, kaikkinainen aistinvarainen kehollisen vuorovaikutuksen tulkinta, kokemusten hyvin monipuolinen analysointi ja tilannekontekstin luotettava arviointi edellyttävät inhimillisiä taitoja. Tämä pätee myös kirjallisessa viestinnässä sitä varmemmin, mitä enemmän kyseessä on kielen monitulkintaisuuden ymmärtäminen. Merkityksistä neuvotteleva ja niiden tulkinnassa ohjaava kone on kuitenkin kutkuttava visio, jonka kehittymistä on syytä seurata, kun suuntaamme katseemme kohti vuotta 2117.


TUIJA KINNUNEN

Kirjoittaja on saksan kääntämisen yliopistonlehtori Helsingin yliopistossa.


Lähteet:

Honkela, Timo 2017. Rauhankone. Helsinki: Gaudeamus

Paloposki, Outi 2017. Kasvatus & aika. Suomen kasvatuksen ja koulutuksen historian seura. Luettu 1.12.2017. Verkossa.

Tiedemann, Jörg & Yves Scherrer 2017. Neural Machine Translation with Extended Context. Proceedings of the Third Workshop on Discourse in Machine Translation, s. 82–92. Luettu 1.12.2017. Verkossa.

Lue lisää:

Itse asiassa kuultuna: Timo Honkela (Yle, 29.5.2017)


Kirjoitus on osa ”Sanoin saavutettu” -sivustoa ja sen ”Sanoin saavutettavissa: 2117” -sivua. Sivusto kuuluu Suomi 100 -juhlavuoden ohjelmistoon.

Suomi 100
Klikkaamalla kuvaa pääseet Suomi 100 -juhlavuoden sivuille.