Siirry sisältöön
Haku

Nykysuomen sanalista


Kotimaisten kielten keskuksen Nykysuomen sanalista on Kielitoimiston sanakirjan hakusanoihin perustuva, päivitettävä sanalista. Siinä on yli satatuhatta taivutus- ja sanaluokkatiedoin varustettua sanaa.

Sanalista on ladattavissa alla olevasta linkistä:

Sanalista ei ole tyhjentävä tai normatiivinen luettelo suomen kielen sanoista. Sen on tarkoitus muun muassa toimia apuvälineenä suomen kieltä käsittelevien tietokoneohjelmien ja suomenkielisten käyttöliittymien kehitystyössä.

Sanalista on CSV-muodossa, ja merkistönä on UTF-8. Listaa päivitetään Kielitoimiston sanakirjan päivitysten yhteydessä, ja siihen voidaan tehdä muitakin muutoksia. Sanalista julkaistaan lisenssillä Creative Commons Nimeä 4.0 Kansainvälinen (CC BY 4.0).

Palaa otsikoihin

Sanatietueiden elementit

Sanatietue koostuu seuraavista tiedoista: 1) hakusana, 2) homonymia, 3) sanaluokka ja 4) taivutus.

1. Hakusanat

Hakusanat on poimittu Kielitoimiston sanakirjasta sellaisinaan. Hakusanoja koskevat muut tiedot löytyvät asianomaisista sana-artikkeleista. Tällaisia muita tietoja ovat muun muassa ääntämisohjeet, rinnakkaiset kirjoitusasut, käyttöalat, tyylisävyt, merkitykset, suositukset ja tyypilliset fraasi-ilmaukset, joissa sana esiintyy.

Erityisesti on huomattava, että sanan esiintyminen Nykysuomen sanalistassa ei tarkoita sen yleistä hyväksyttävyyttä kaikissa tilanteissa: sanan käyttöala voi olla esimerkiksi arkikielinen tai sen sävy halventava tai vanhahtava. Sanalle saatetaan myös suosittaa toisenlaista kirjotusasua. Joihinkin sanoihin liittyy tavaramerkki, ja sekin tieto on mainittu Kielitoimiston sanakirjassa esiintyvän sana-artikkelin yhteydessä.

2. Homonymia

Homonymia tarkoittaa toisiinsa liittymättömien sanojen satunnaista samannäköisyyttä (esim. kilo merkityksessä ’kimmellys’ ja kilo merkityksessä ’kilogramma’). Sanalistan homonymianumerot viittaavat järjestysnumeroihin, joilla Kielitoimiston sanakirjassa on merkitty homonyymiset hakusanat.

3. Sanaluokka

Sanaluokka on merkitty samoin kuin Kielitoimiston sanakirjassa. Sanaluokat ovat: 

  • substantiivi, adjektiivi, pronomini, numeraali (näitä kutsutaan yhdessä nomineiksi)
  • verbi (erikseen kieltoverbi ei)
  • adverbi, prepositio, postpositio, konjunktio, interjektio (näitä kutsutaan yhdessä partikkeleiksi)

Lisäksi on huomioitu seuraavat erikoistapaukset: 

  • niin kutsutut sulaumat adverbi + kieltoverbi (esim. miksei), alistuskonjunktio + kieltoverbi (esim. ettei), rinnastuskonjunktio + kieltoverbi (muttei)
  • yhdistelmä kieltoverbi + rinnastuskonjunktio (eikä)

Yhdellä sanalla voi olla useamman sanaluokan mukaista käyttöä, jolloin sanaluokat luetellaan pilkuin erotettuna (esim. alankomaalainen adjektiivi, substantiivi). Osa adverbeista ja muista partikkeleista on kiteytyneitä taivutusmuotoja (esim. rinnalla postpositio, adverbi; vrt. rinta substantiivi).

Kaikille sanoille ei ilmoiteta sanaluokkaa. Vailla sanaluokkaa ovat yhdyssanojen alkuosina esiintyvät hakusanat (esim. ammatti-, hehto-) ja eräät sanaliitot (esim. alla mainittu, alun alkaen).

4. Taivutustiedot

Taivutustiedoissa olevat numerot viittaavat sanan taivutustyyppeihin ja kirjaimet astevaihtelutyyppeihin. Taivutustyypit ja astevaihtelutyypit esitellään Kielitoimiston sanakirjan Lukuohjeissa (ks. Taivutustyyppitaulukko, Astevaihtelutaulukko). Taipuvien sanojen taivutustiedot annetaan samassa muodossa kuin itse sanakirjan artikkeleissa. Jotkut sanat taipuvat useammalla kuin yhdellä tavalla, jolloin vaihtoehdot on erotettu toisistaan pilkuin.

Jos adverbi tai muu vajaasti taipuva sana esiintyy useammassa kuin yhdessä paikallissijassa, muut muodot mainitaan olosijaisen muodon yhteydessä, esim. rinnalla (myös paikallissijamuodot rinnalta, rinnalle).

Yhdyssanoissa ei tavallisesti ole taivutustietoja, koska ne taipuvat perusosansa mukaisesti (esim. hyökyaalto taipuu kuten aalto). Yhdyssanaan on merkitty taivutustieto, jos perusosaa vastaavaa hakusanaa ei ole (esim. aikaansaava) tai jos se on homonyyminen (esim. tupajumi). Mikäli yhdyssubstantiivin määriteosa on adjektiivi, taivutusindeksillä 50 tai 51 osoitetaan, taipuuko adjektiivi substantiivin mukana (esim. isoäiti : isoäidin, ei isonäidin, mutta isovarvas : isonvarpaan tai isovarpaan).

Lisäksi käytetään kolmea erikoiskoodia:

99 = sana ei taivu tai taipuu vaillinaisesti

100 = sana on kirjoitettu väärin; oikeinkirjoitusohje löytyy sanan sana-artikkelista (esim. enään pitää olla: enää)

101 = sana on pronomini, jolla on epäsäännöllinen taivutus

Palaa otsikoihin

Esimerkki aineistosta

Hakusana Homonymia Sanaluokka Taivutustiedot
aakkonen
substantiivi38
hapero
adjektiivi, substantiivi 2
isovarvas
substantiivi51, 50
itse kukin
pronomini101
jottei
alistuskonjunktio + kieltoverbi 99
juhlaillallinen
substantiivi
jumi1substantiivi5
jumi2substantiivi5
vihanta
adjektiivi10*J, 9*J
vuotaa
verbi53*F, (54*F)
Palaa otsikoihin

Sanalistaan viittaaminen

Nykysuomen sanalista. Kotimaisten kielten keskus. Päivitetty 30.4.2024 [viitattu xx.xx.xxxx]. Saatavissa https://kaino.kotus.fi/lataa/nykysuomensanalista2024.csv

Sanalistan vuosiluku vastaa sen Kielitoimiston sanakirjan version julkaisuvuotta, josta aineisto on poimittu.

Palaa otsikoihin