Kotimaisten kielten keskuksen kieliaineistojen ja -arkistojen esittelyt ja pääsy sähköisiin aineistoihin.

Nykysuomen sana-aineistot

Nykysuomen sana-arkisto koostuu yli 5,5 miljoonan sanalipun kokoelmasta, jota käytetään ensisijaisesti sanakirjatyön tarpeisiin. Arkiston tiedot on koottu pääosin kirjallisista lähteistä: eri alojen tietokirjallisuudesta, kaunokirjallisuudesta sekä sanoma‑ ja aikakauslehdistä. Sanalipuissa on hakusanan lisäksi tekstikatkelma ja lähdetieto sekä usein myös tieto erikoisalasta. Sana-arkistoon sisältyy sekä paperisia että sähköisiä sanalippuja.

Paperiarkistosta sanatietokantaan

Nykysuomen sana-arkiston vanhin aineisto on vuosien 1880–1950 lähteistä kerätty noin 4,5 miljoonan sanalipun kokoelma, joka on koottu Nykysuomen sanakirjan (1951–1961) toimittamista varten. Vuonna 1950 ja sitä myöhemmin julkaistuista lähteistä sanalippuja on noin 700 000, ja

Sähköisiä sanalippuja on tehty vuoden 1984 lähteistä alkaen. Sähköinen sana-arkisto eli Nykysuomen sanatietokanta on vuoden 2015 alussa runsaan 200 000 sanalipun laajuinen.

Nykysuomen sanakirjan ilmestymisen jälkeen tietoja uusista sanoista on kerätty Suomen kielen perussanakirjan (1990–1994), CD-Perussanakirjan (1997) ja Kielitoimiston sanakirjan (2004–) tueksi. Sana-arkistoa käytetään myös kielenhuollon ja sanastontutkimuksen tarpeisiin.

Nykysuomen sanatietokantaa kartutetaan jatkuvasti. Nykyisin aineistoa kerätään ensisijaisesti sanoma- ja aikakauslehdistä.

Sanalistat

Aineistopalvelu Kainossa on käytettävissä kirjoitetun suomen kielen sanojen taajuuslista ja Nykysuomen sanalista.  Sähköisenä ovat myös vuosina 1951–1961 ilmestyneen Nykysuomen sanakirjan kaikki hakusanat sekä tieto hakusanan sanaluokasta ja taivutustyypistä. Tietueita on noin 210 000. Uudissanasto 80 -julkaisun hakusanat (noin 5 800 tietuetta) on koodattu samalla tavalla kuin Nykysuomen sanakirjan hakusanakorpuksessa. Kielitoimistossa laaditun Uudissanasto 80:n sanat ovat (50-), 60- ja 70-luvuilla syntyneitä sanoja, joita ei ole Nykysuomen sanakirjassa. (Valtaosa niistä on sittemmin otettu mukaan Suomen kielen perussanakirjaan.)

Sanalistojen käyttö on luvanvaraista.