Kotimaisten kielten keskuksen kieliaineistojen ja -arkistojen esittelyt ja pääsy sähköisiin aineistoihin.

Sana-aineistot

Kotimaisten kielten keskuksessa on laajat sanakokoelmat. Kokoelmissa on muun muassa suomen kielen murteita, vanhaa kirjasuomea ja slangia.

Suomen murteiden sana-arkisto

Sanakokoelmista suurimpia ovat Suomen murteiden sana-arkiston kokoelmat. Niihin on kerätty 1900-luvun alusta alkaen miljoonia sanatietoja.

Suomen murteiden sanakirjaa toimitetaan Suomen murteiden sana-arkiston kokoelmien perusteella. Sanakirjasta on ilmestynyt kahdeksan painettua osaa (a–kurvottaa). Nykyisin sanakirja ilmestyy verkossa.

Sananparsikokoelma

Suomen murteiden sana-arkistoon kuulunut sananparsikokoelma on luovutettu Kansallisarkistoon alkuvuonna 2016. Sananaparsikokoelma digitoidaan Kansallisarkistossa. Aineisto tulee käytettäväksi arkistolaitoksen digitaaliarkistossa sitä mukaa kun digitointi etenee. Digitointi etenee pitäjittäin.

Osa sananaparsista on korpusmuodossa. Ne ovat vapaasti käytettävissä Kotimaisten kielten keskuksen verkkosivuilla. Sananparsista korpusmuodossa ovat Alatornion, Enon, Evijärven, Hailuodon, Hausjärven, Isonkyrön, Joutsenon, Juvan, Kalannin, Kivennavan, Kuhmoisten, Kurkijoen, Laukaan, Loimaan, Nivalan, Nummen, Paltamon, Pälkäneen, Riistaveden, Rovaniemen, Ruoveden, Tyrvään, Ulvilan ja Valkealan kokoelmat. Kiuruveden kokoelmasta mukana on noin kolmannes.

Vanhan kirjasuomen sanat

Vanhan kirjasuomen sanakirjaa tehdään noin puoli miljoonaa sanalippua käsittävän aineiston pohjalta. Rinnakkaisaineistona käytetään nykyään myös sähköistä tekstikorpusta. Vanhan kirjasuomen sanakirjasta on ilmestynyt kaksi painettua osaa, aakkosväli a-k, nykyisin sanakirja ilmestyy verkossa.

Karjalan sanoja

Yli puoli miljoonaa sanalippua sisältävä Karjalan kielen sana-arkisto on digitoitu. Alkuperäinen aineisto on siirretty 2016 Itä-Suomen yliopistoon.

Slangisanat

Kotimaisten kielten keskus on ollut mukana keräämässä talteen Stadin slangin eli Helsingin perinteisen puhekielen aineistoa. Slangia on pyritty tallentamaan suhteellisen säännöllisesti viimeisten viidenkymmenen vuoden aikana.