Kotimaisten kielten keskuksen sanakirjojen esittelyt ja pääsy verkkosanakirjoihin.

Sitaatin matka aineistosta sanakirjaan

Vanhan kirjasuomen sanakirjassa ovat keskeisessä asemassa sitaatit Ruotsin vallan aikaisista julkaisuista. Tekstikatkelmat valaisevat kunkin sanan merkityksiä ja käyttötapoja sekä niiden muutoksia kahden ja puolen vuosisadan mittaan. Toimittajien keksimiä esimerkkejä sanakirjassa ei siis ole.

Valitessaan sitaatteja yksittäiseen sana-artikkeliin toimittaja pyrkii kokoamaan kattavan otoksen sanan käyttötavoista eri aikoina. Jos sana sisältyy vakiintuneisiin sanontatapoihin eli idiomeihin tai sananparsiin, tällaiset käytöt poimitaan myös mukaan.

Monenlaista aineistoa

Toimituksen käytössä on useanlaista aineistoa. Tärkeimpiä päivittäisessä työssä ovat noin 550 000 paperista sanalippua käsittävä arkisto sekä noin 3,5 miljoonaa sanetta eli yksittäistä sanaesiintymää käsittävä sähköinen korpus, josta voi tehdä erilaisia hakuja.

Lisäksi toimittajat hyödyntävät alkuperäisteoksia, niiden valokopioita sekä noin 5 miljoonan saneen digitoitua aineistoa, joka on käytettävissä kuvatiedostoina. Niistä ei pysty siis tekemään hakuja, mutta niistä voi tarkistaa sitaattien oikeinkirjoituksen sekä etsiä lisää kontekstia ja apua lyhyiden esimerkkikatkelmien tulkintaan.

Oleellinen esiin massasta

Sanaliput ovat toimittajalle ensisijainen aineisto, jota hän täydentää korpushauilla. Korpuksen käytön apuvälineenä toimittajalla on oman aakkosvälinsä korpussanelista, josta näkyvät aakkosvälin sanojen kaikki korpukseen sisältyvät ja eri kirjoitusasuiset taivutusmuodot lukumäärineen.

Kun esiintymiä on vähän, ne kannattaa hakea kaikki, mutta kun niitä on paljon, hakua kannattaa rajata. Olla-verbistä on korpuksessa satoja eri muotoja ja tuhansia yksittäisiä esiintymiä. Toimittaja tarvitsee myös luovuutta ennakoidessaan, millä kaikilla tavoilla työn alla olevaa sanaa on aikoinaan saatettu kirjoittaa; esimerkiksi o-alkuisia sanoja on kirjoitettu myös å-alkuisina.

Sanakirjaan otetaan mukaan myös sellaiset sanat, joista aineistossa on vain yksi esiintymä tai joiden käytöstä on tietoa vain vanhoissa sanakirjoissa. Varsinkin tällaisten ainokaisesiintymien merkityksestä voi olla vaikeaa saada varmuutta, mutta toimittaja joutuu usein muulloinkin selvittelemään sanan merkitystä monenlaisesta lähdekirjallisuudesta. Merkitysten selitteet pohjautuvat silti aina aineistoon itseensä, eivät vanhojen sanakirjojen tietoihin.