Asiantuntijoiden kirjoituksia ajankohtaisista kielikysymyksistä. Laaja blogi- ja kolumniarkisto.

Suuret sanakirjamme

MATTI VILPPULA
Kotimaisten kielten tutkimuskeskuksen 30-vuotisjuhla 3.3.2006

Joitakin vuosia sitten ilmestyi suomeksi Simon Winchesterin kirja Professori ja hullu. Alaotsikkona on Kertomus murhasta, mielisairaudesta ja Oxford English Dictionaryn synnystä. Kirja on tositarina. Se liittyy erään maailman tunnetuimman sanakirjan alkuvaiheisiin. Päähenkilönä on William Minor, sotilaslääkäri, joka mielenhäiriössä on tehnyt Lontoossa murhan ja päätynyt vankimielisairaalaan. Samaan aikaan – 1870-luvulla – Oxford English Dictionary etsii vapaaehtoisia avustajia, joiden tehtävänä on kerätä vanhimmasta englantilaisesta kirjallisuudesta aineksia sanakirjan tarpeisiin. William Minor ilmoittautuu mukaan työhön. Sanakirjan silloinen päätoimittaja professori James Murray lähettää hänelle ohjeet. Minor alkaa lukea järjestelmällisesti 1500- ja 1600-luvun teoksia, alleviivata tärkeinä pitämänsä sanat, kirjoittaa jokaisen sanan erikseen omalle lomakkeelleen, merkitä lomakkeeseen teoksen nimen ja sivunumeron ja ottaa mukaan sopivan sitaatin, joka valaisee sanan merkitystä ja käyttöä. Minorista kehittyy yksi sanakirjan tärkeimmistä ja taitavimmista avustajista. Vasta vuosien kuluttua sanakirjan tekijöille paljastuu Minorin tausta ja se, että hänen lähettämänsä sanaliuskat on kirjoitettu vankimielisairaalassa.

Samalla tavalla, kirjallisuudesta poimimalla tai puheesta merkitsemällä, on paljolti kerätty se monimiljoonainen aineisto, johon Kotimaisten kielten tutkimuskeskuksen suurimmat sanakirjat nojaavat. Ne olivat hankkeina olemassa jo ennen keskuksen perustamista. Aineiston keruuseen oli jo ryhdytty. Keskuksen perustaminen turvasi näiden hankkeiden tulevaisuuden. Tutkimuskeskusta koskevan lain yleisperusteluissa on nimenomaan mainittu, että keskuksen tulee huolehtia sen hoidettavaksi siirtyneiden keskeneräisten sanakirjahankkeiden loppuun saattamisesta.

Suurin tutkimuskeskuksen sanakirjoista on Suomen murteiden sanakirja. Tämä noin 20-osaiseksi kaavailtu teos kattaa kaikki suomen kielen murteet, myös ne, joita on puhuttu Suomen lähialueilla Kannaksella, Inkerissä, Ruotsin Vermlannissa ja Länsipohjassa sekä Norjan Ruijassa. Suomen murteiden sanakirjaa pienempiä mutta silti suhteellisen suuria – kuusi-seitsemänosaisia – ovat ruotsalaismurteiden sanakirja, Ordbok över Finlands svenska folkmål, ja Vanhan kirjasuomen sanakirja. Jälkimmäisen kuvauskohteena on se sanasto, jota on käytetty suomeksi ilmestyneissä painotuotteissa Mikael Agricolan päivistä aina Ruotsin vallan loppuun eli vuoteen 1809 asti.

Nämä kolme sanakirjaa ovat ns. historiallisia sanakirjoja. Niiden kuvaama kieli tai kielimuoto on jo jäänyt taakse eikä enää sellaisenaan ole käytössä. Ne ovat oman aikansa kielen muistomerkkejä, ja siinä mielessä pysyviä. Ne tehdään vain kerran. Toisenlaista sanakirjatyyppiä edustavat nykykielen sanakirjat. Ne on paljolti suunnattu suurelle yleisölle. Ne ovat luonteeltaan paitsi nykyistä yleiskieltä kuvaavia myös kielenkäyttöä ohjailevia. Koska sanasto koko ajan uusiutuu ja osa kielen normeista muuttuu, nykykielen sanakirjoista joudutaan toimittamaan uusia laitoksia tai kokonaan uusia sanakirjoja. Tutkimuskeskuksen aikana ilmestynyt Suomen kielen perussanakirja on jo ehtinyt saada rinnalleen ajantasaisemman sanakirjan, Kielitoimiston sanakirjan. Se ilmestyi viime vuonna sähköisessä muodossa, ja tänä vuonna siitä on tulossa myös paperinen versio.

Etymologinen tutkimus, sanaston alkuperän selvittäminen, on alusta lähtien ollut mukana tutkimuskeskuksen toiminnassa. Kokonaan keskuksessa tehty etymologinen sanakirja on kolmiosainen Suomen sanojen alkuperä. Parhaillaan kootaan tietokantaa, jonka pohjalta on tarkoitus aluksi tuottaa kaksi saamelaiskielten etymologista sanakirjaa.

Saamen lisäksi muitakin suomen sukukieliä on ollut tutkimuskeskuksen sanakirjaohjelmassa. Viime vuonna valmistui kuusiosainen Karjalan kielen sanakirja, Venäjän Karjalassa puhuttavaa Karjalan kieltä ja murteita kuvaava sanakirja. Etäsukukielistä on valmistunut mordvan sanakirja. Tšeremissin eli marin ja vogulin eli mansin sanakirjat ovat parhaillaan tekeillä.

Suomen kielen perussanakirjan materiaali on ollut pohjana kahdessa suuressa kaksikielisessä sanakirjassa: Suomi–ruotsi-suursanakirjassa ja Suomi–viro-suursanakirjassa. Edellinen on toimitettu yhteistyössä WSOY:n ja jälkimmäinen Tallinnassa olevan Eesti Keele Instituutin kanssa. Yhdessä Kuurojen Liiton kanssa on toimitettu Suomalaisen viittomakielen perussanakirja. Myös toinen vähemmistökieli, romani, on saanut oman leksikkonsa. Suomi–romani sanakirja ilmestyi vuonna 2001.

***

Oxford English Dictionary oli aikanaan kokonaan uudentyyppinen ja käänteentekevä sanakirja. Uutta oli se, että jokaista sanaa ja jokaista merkitystä havainnollistettiin kirjallisuudesta poimituilla esimerkeillä. Esimerkkien tehtävänä oli osoittaa, miten kutakin sanaa oli vuosisatojen mittaan käytetty, millaisia muutoksia sen oikeinkirjoituksessa oli tapahtunut ja milloin se oli ensimmäisen kerran kirjakieleen ilmestynyt. Tämä menetelmä – sitaattien tai lause-esimerkkien käyttäminen – on tuttua myös tutkimuskeskuksen suurissa sanakirjoissa. Ne ovat sitaattisanakirjoja, joiden lause-esimerkit viime kädessä paljastavat merkitysten vivahteet, samoin sen, millaisissa yhteyksissä sanaa käytetään ja millaisia kytköksiä sanalla on ympärillä olevien sanojen kanssa.

Suuret historialliset sanakirjat ovat kansallisia monumentteja, joihin nykykieli nojaa. Niiden varjopuolena on pitkä valmistumisaika. Ne ovat tekijöille uuvuttavia. Ne ovat kustannuksiltaan kalliita.

Oxford English Dictionaryn ensimmäinen vihko ilmestyi vuonna 1884. Sanakirja valmistui 10-osaisena 44 vuotta myöhemmin. Sen jälkeen alettiin tehdä täydennysosia, ja uutena, 20-osaisena laitoksena kirja julkaistiin vuonna 1989, toista sataa vuotta ensimmäisen vihon ilmestymisen jälkeen. Työ jatkuu. Uuden, entistä laajemman laitoksen on määrä ilmestyä vuonna 2010.

Oxford English Dictionaryn ei maailmankieltä koskevana sanakirjana tarvitse välittää kustannuksista. Vaikka harva hankkii teoksen kotihyllyynsä, silti kysyntää riittää. Suomessa tehtävien vastaavanlaisten sanakirjojen laita on toisin. Potentiaalisten ostajien määrä on pieni. Kustannukset tulevat paljolti yhteiskunnan maksettaviksi.

Tutkimuskeskuksessa on monesti mietitty keinoja, joilla suurten sanakirjojen valmistumista voitaisiin laadusta tinkimättä jouduttaa. Silloin kun kirja on jo alkanut ilmestyä, kovin radikaaleja muutoksia ei voi enää tehdä; kirjan alku- ja loppupään on oltava samalla tavalla toimitettuja. Työmenetelmiä voi aina kuitenkin yrittää kehittää ja päällekkäisyyksiä karsia. Jo se, että saman katon alla on monia sanakirjahankkeita, tietää kustannussäästöjä. Tukitoiminnot voidaan keskittää, ja sanakirjoille voidaan räätälöidä sama sähköinen toimitusjärjestelmä.

Tietotekniikan kehitys on merkinnyt edistystä sanakirjatyössä. Useat manuaalisesti hoidetut työvaiheet ovat jääneet historiaan. Toimitustyössä syntyvän tekstin muokkaaminen on käynyt helpoksi. Tiedon etsimiselle ja materiaalin jatkokäsittelylle ovat avautuneet aivan uudet mahdollisuudet. Myös sanakirjan pohjana olevan materiaalin määrä on saattanut moninkertaistua, kun mukaan ovat tulleet sähköiset aineistot, tekstikorpukset. Ne ovat aarreaitta mutta samalla labyrintti, jonne voi eksyä ja jonne voi jäädä loukkuun.

Kehityksestä huolimatta sanakirjatyö edelleenkin on aivotyötä. Se on aineiston analysointia. Se on järkeilyä ja suunnittelua, etymologioiden selvittelyä, merkityksenselitteiden laatimista, sana-artikkelin kokonaisrakenteen hahmottamista, sopivien lause-esimerkkien etsimistä. Se on valitsemista, kokoamista ja karsimista.

***

Sanakirjat ovat keskeinen osa tutkimuskeskuksen työalaa. Keskuksen erityistehtäväksi on muodostunut sellaisten sanakirjojen tuottaminen, joihin yksityisillä kustantajilla ei ole mahdollisuuksia, mutta jotka ovat kansallisesti ja kulttuurisesti merkittäviä. Tavoitteet ovat siis muut kuin kaupalliset.

Selvimmin ei-kaupallisia ovat etäsukukielten sanakirjat. Vaikka niillä saattaa olla merkitystä kielensä olemassaolosta kamppaileville kansoille, ne ensisijaisesti palvelevat etymologian ja sukukielten tutkimusta.

Yksi keskuksen tutkija laatii parhaillaan Turussa Vogulin sanakirjaa. Vogulit ovat suomensukuinen kansa Uralin takana Lounais-Siperiassa. He asuvat hajallaan laajalla alueella. Nykyään kielenpuhujia on enää vain kolmisen tuhatta.

Se että Vogulin sanakirjaa tehdään juuri Suomessa, johtuu siitä, että sanakirjan pohjana oleva aineisto on suomalaisen tutkijan Artturi Kanniston keräämä ja Suomeen tuoma. Kannisto liikkui vogulien asuma-alueilla aivan 1900-luvun alkuvuosina. Hänen keräämänsä materiaali on arvokas ja ainutlaatuinen.  Monet vogulin murteista, joita Kannisto tallensi, ovat jo lakanneet olemasta.

Voguli on ollut niiden sukukielten joukossa, jotka ensimmäisinä ovat irronneet muusta kieliyhteisöstä omille teilleen. Tästä syystä sen merkitys esimerkiksi kielenpiirteiden ikäämisessä on tärkeä. Sana talvi voidaan todistaa useita tuhansia vuosia vanhaksi sillä perusteella, että sillä on äänteellinen vastine vogulissa ja eräissä muissa samaan aikaan irronneissa etäsukukielissä.

***

Joitakin viikkoja sitten avaruusluotain Stardust palasi maahan seitsemän vuotta kestäneeltä lennoltaan. Sen oli onnistunut kerätä kapseliinsa yli 4,5 miljardia vuotta vanhaa komeetta- ja avaruuspölyä. Tutkijat olivat innoissaan. He uskovat, että pölyhiukkasia analysoimalla saadaan tärkeää tietoa aurinkokuntamme synnystä.

Jotakin samaa kuin Stardustin kapselissa on Vogulin sanakirjassa. Sekin todennäköisesti sisältää tietoa, joka on peräisin hyvin kaukaa, ajalta, jolloin suomalais-ugrilainen kantakieli alkoi hajota ja jakautua omiksi tytärkielikseen.

Matti Vilppula

Puhe Kotuksen 30-vuotisjuhlassa 3.3.2006 Valkoisessa Salissa Helsingissä