Asiantuntijoiden kirjoituksia ajankohtaisista kielikysymyksistä. Laaja blogi- ja kolumniarkisto.

Eino Koponen. Kuva: Kotuksen arkisto.

Eino Koponen on itämerensuomalaisten kielten ja saamen kielen dosentti, joka on käyttänyt suuren osan elämästään tutkimalla suomen, viron ja saamen kielen sanojen alkuperää. Hänen varsinainen työpaikkansa on Kotimaisten kielten keskus, mistä hän on ollut lainassa neljässä ulkomaisessa yliopistossa opettamassa suomen kieltä paikallisille. Palattuaan kolmen vuoden keikalta Tallinnasta hän tarkastelee maailmaa taas Helsingin perspektiivistä.

rss

28.5.2012 14.03

Suomea vai siansaksaa?

Eino Koponen

Viime syksynä, kun aloin taas lukea tallinnalaisten opiskelijoideni suomenkielisiä kirjoitusharjoituksia, törmäsin uuteen ilmiöön.

Joidenkuiden kirjoittajien teksteissä ei näyttänyt olevan juuri ollenkaan oikeinkirjoitus- ja taivutusvirheitä – jotka kokemukseni mukaan ovat toista vuotta suomea opiskeleville virolaisille kaikkein tyypillisimpiä – mutta pääosin lähes moitteettomassa suomenkielisessä tekstissä oli siellä täällä anakoluuttisia lauseita ja omituisia sanavalintoja, niin että kirjoittajan ajatusta oli välistä vaikea ymmärtää parhaalla tahdollakaan.

Aluksi ajattelin, että ensimmäistä vuosikurssia opettavat kollegani ovat ottaneet käyttöön joitakin aivan uusia opetusmetodeja, kunnes keksin, että opiskelijat tarjosivat minulle tekstiä, jonka he olivat kirjoittaneet äidinkielellään ja kääntäneet (Googlen) käännösohjelman avulla ”suomeksi”. Jekun paljastivat käännökseen jääneet muutamat vironkieliset sanat, joita ohjelma ei ollut osannut kääntää (esim. siksi, että sanassa oli lyöntivirhe).

Yllättävää asiassa ei ollut se, että (jotkut) opiskelijat halusivat mennä ylitse sieltä, missä aita on matalin, vaan se, miten hyvää suomea käännösohjelma paikoin tuotti. Testasin käännösohjelmaa käännättämällä sillä suomeksi joitakin netistä kopioimiani autenttisia vironkielisiä tekstejä, ja tulokset olivat samansuuntaisia.

Voisi tietysti ajatella, että hyvä käännöstulos johtui lähde- ja kohdekielen läheisyydestä, mutta tämä ei liene koko totuus. Jos nimittäin olen oikein ymmärtänyt, Googlen käännösohjelma kääntää kaikki muut kieliparit aina englannin kautta. Niinpä testasin, selviytyykö käännösohjelma yhtä hyvin saksankielisen tekstin suomentamisesta. Suorittamieni pistokokeiden pohjalta näytti siltä, että lopputulos oli vähemmän suomea ja enemmän siansaksaa.

Olisi kiinnostavaa tietää, minkälaisia kokemuksia muilla on eri kieliparien kääntämisestä tällä ohjelmalla. Ohjelma löytyy osoitteesta http://translate.google.fi/.

PS. Kokeilin ”kääntää” yllä olevan tekstin kaksi ensimmäistä kappaletta (a) suoraan viroksi; (b) ensin englanniksi ja sitten englanninkielisen tekstin viroksi. Vironnokset eivät ole identtisiä toisin kuin aiemmassa kokeessa, jossa sain tarkalleen saman lopputuloksen kun käänsin saksankielisen tekstin suoraan suomeksi ja ensin englanniksi ja sitten englannista suomeksi.


Palaa otsikoihin | 7 puheenvuoroa

28.5.2012 15.36
Hanna
anakoluuttinen
Asia 1) mikä on anakoluuttinen?
Asia 2) vaikuttaa siltä, että Google translate on kehittynyt. Se on mielestäni ihan hyvä asia. Yksinkertaisia tekstinpätkiä voi siis kääntää jo koneella.
28.5.2012 16.41
Eino Koponen
Hyvä kysymys
Perussanakirja (ja varmaan myös Kielitoimiston sanakirja) selittää sanan anakoluuttinen "anakoluutin sisältävä" ja sanan anakoluutti "virkkeen alun ja lopun yhteensopimattomuus". Anakoluuttinen virke on siis sellainen, jonka alku ja loppu eivät sovi keskenään yhteen, tai (minun tekstissäni) yleisesti epäkieliopillinen virke.

Kotus-blogissa asiat pitäisi pyrkiä sanomaan mahdollisimman yleiskielisesti ja välttämään turhia oppisanoja, joten huomautus oli paikallaan. Kiitos Hanna.
28.5.2012 18.14
Ikinörtti
Monimuotoista kääntelyä
Google-kääntäjän toiminta on monimuotoista, ja kaikki vähänkin kunnolliset yleiset käännösohjelmat soveltavat monia eri menetelmiä. Eroja tulee siitä, millainen on perusmenetelmänä, ja se on Googlella selvästikin tilastollinen: se käyttää suurista tekstimassoista koottua aineistoa, jossa eri kielten sanojen ja fraasien vastaavuuksia. Se pyrkii löytämään mahdollisimman pitkän fraasin, ja siksi se kääntääkin tavallisia lauseita niin hyvin - vastaus tulee apteekin hyllyltä.

Google-kääntäjä ei yleensä käännä englannin kautta, mutta se kyllä tarvittaessa menee myös kolmannen kielen kautta, jos suora käännös ei onnistu tai sen arvioitu luotettavuus ei ole tarpeeksi suuri.

Verkkosivulla http://groups.google.com/group/google-translate-general/browse_thread/thread/7f092608bc601651 on aika jännästi kuvattu sellaista toimintaa. Pitää kuitenkin muistaa, että tämä on lähinnä arvailua tai epäsuoraa päättelyä; Google-kääntäjän sisäinen toiminta on liikesalaisuus.

Tuolla sivulla oleva esimerkki voidaan esittää suomalaisille tutummin näin: käännetään ”Jag heter Ville” ruotsista saksaksi; tulos on ”Mein Name ist Ville”. Tuloshan ei ole kovin luontevaa saksaa; luonteva olisi ”Ich heiße Ville”. Selityksenä voi olla, että Google-kääntäjä on tehnyt käännöksen englannin kautta, eikä englannissa ole sellaista verbiä kuin ”heta” tai ”heissen”, vaan sisäinen välikäännös on ”My name is Ville”. Google-kääntäjä sitten kääntää tämän saksaksi yksinkertaisella tavalla.

Tosin tilanne on ilmeisesti mutkikkaampi. Nykyisin voi klikata Googlen tuottamaa käännöstä, jolloin se tarjoaa vaihtoehtoisia käännöksiä. Silloin näkyy, että sanoille ”Jag heter” on mm. vaihtoehtokäännös ”Ich heiße”, jonka voi valita pudotusvalikosta.

Todennäköisesti Google pitää kirjaa valinnoista, ja ne vaikuttavat sen toimintaan. Jos miljoona käyttäjää tekee tuollaisen korjauksen, Google-kääntäjä luultavasti muuttaa kääntämistapaansa tältä osin.
28.5.2012 19.27
Pilkunviilaaja
Käännösohjelma
Ammattikääntäjätkin käyttävät käännösohjelmia raakakäännösten tekemiseen. Lopullista tekstiähän ei millään koneella saa aikaiseksi, saati sitten Kookkelilla.

Tottakai se on kehittynyt, koska siinä(kin) käytetään parviälyä.
29.5.2012 13.15
Erkki (eka)
Parempi käännösohjelma
Kotimainen MOT kääntää suomesta englantiin paremmin kuin Google, mutta se ei ole ilmainen.
5.6.2012 14.26
Kielimies
Kääntäjänä tohdin sanoa, että vain amatöörit käyttävät käännösohjelmia raakakäännöksiään varten. Konekääntimien tuottamien raakakäännöksen muokkaaminen säälliseen asuun on niin hidasta ja henkisesti raastavaa, ettei sitä pysty tekemään keskittyneesti kovin pitkään yhteen menoon.

Sen sijaan käytämme yleisesti ns. CAT-työkaluja eli tietokoneavusteista kääntämistä, jossa hyödynnetään mm. käännösmuistiohjelmia. Niissä kone ei käännä mitään, vaan tallentaa kääntäjän kääntämää tekstiä muistiin yhdessä vastaavan lähdekielisen yksikön (yleensä virke) kanssa. Käännösmuisti on ehdoton apuväline, koska joissakin projekteissa voi olla hyvin vähän uutta käännettävää. Lisäksi muisti auttaa pitämään termistön yhtenäisenä.
5.6.2012 17.29
Erkki (eka)
CAT-työkalut
Lienenkö ymmärtänyt oikein, että myös Googlen käännin toimisi tuollaisten käännösmuistiohjelmien tapaan – ei varsinaisesti kääntäisi vaan etsisi valmiita käännösvastineita omista tekstitietokannoistaan?