Kotimaisten kielten keskuksen kieliaineistojen ja -arkistojen esittelyt ja pääsy sähköisiin aineistoihin.

Aineistojen avaaminen

Kotus edistää julkisten tietovarantojen avaamista digitoimalla kielitieteellisiä kokoelmiaan ja saattamalla niitä verkossa mahdollisimman avoimeen käyttöön.

Metatiedot

Kotuksen aineistojen metatietoja on seuraavissa palveluissa:

Lisensointi

Kotuksen nykyiset ja tulevat sähköiset kieliaineistot, jotka ovat julkisia ja joiden vapaata käyttöä lainsäädäntö tai sopimukset eivät rajoita, avataan julkisina tietovarantoina vapaasti käytettävinä, Creative Commons -lisenssillä lisensoituina ja koneluettavina. Ensisijaisesti käytetään JHS 189 -suosituksen mukaisesti Creative Commons Nimeä 4.0 -lisenssiä. Aiemmin Kotus on käyttänyt myös GNU- ja EUPL-lisenssejä. Lisäksi käytössä ovat CLARIN-lisenssit.

Tällä hetkellä ovat tarjolla seuraavat avoimet aineistot:

 • Itämerensuomalainen kielikartasto | AVAA | Creative Commons Nimeä 4.0
 • Karjalan kielen sanakirja | Kotus | Creative Commons Nimeä 4.0

 • Kettusen murrekartasto | AVAA | Creative Commons Nimeä 4.0
 • Lauseopin arkiston murrekorpus yhteistyössä Turun yliopiston Lauseopin arkiston kanssa | Korp | Creative Commons Nimeä-EiMuutoksia 4.0
 • Nykysuomen sanalista | Kotus | GNU LGPL, EUPL v. 1.1, Creative Commons Nimeä-EiMuutoksia 3.0
 • Paikannimikartasto | AVAA | Creative Commons Nimeä 4.0
 • Paikannimilaari | Kotus | Creative Commons Nimeä 4.0
 • Suomen kielen näytteitä  (SKN) -av-korpus | LAT | CLARIN PUB, Creative Commons Nimeä 4.0

 • Suomen murteiden sanakirjan levikkikartat | AVAA | Creative Commons Nimeä 4.0
 • Tasavallan presidenttien uudenvuodenpuheet | Korp | EUPL

 • Svenska ortnamn i Finland | AVAA | Creative Commons Nimeä 4.0
 • Vanhan kirjasuomen korpus | Korp | CLARIN PUB, EUPL v. 1.1


Edellä mainitut aineistot ovat käytettävissä seuraavien palvelujen kautta:

 • AVAA, opetus- ja kulttuuriministeriön Avoin tiede ja tutkimus -hankkeen (ATT) tarjoama CSC:n ylläpitämä avointen aineistojen julkaisualusta
 • Kotus, Kotuksen oma aineistopalvelu, jota on aiemmin kutsuttu Kainoksi
 • Korp, Kielipankin (Fin-Clarin) tarjoama CSC:n ylläpitämä tekstikorpusalusta
 • LAT, Kielipankin (Fin-Clarin)  tarjoama CSC:n ylläpitämä av-korpusalusta


Avointen sähköisten aineistojen lisäksi Kotus tarjoaa tutkimuskäyttöön luvanvaraisia aineistoja. Luvanvaraisuuden syynä on yleisimmin henkilösuoja.