Kotimaisten kielten keskuksen kieliaineistojen ja -arkistojen esittelyt ja pääsy sähköisiin aineistoihin.

Aineistojen avaaminen

Kotus edistää julkisten tietovarantojen avaamista digitoimalla kielitieteellisiä kokoelmiaan ja saattamalla niitä verkossa mahdollisimman avoimeen käyttöön.

Metatiedot

Kotuksen aineistojen metatietoja on seuraavissa palveluissa:

Lisensointi

Kotuksen nykyiset ja tulevat sähköiset kieliaineistot, jotka ovat julkisia ja joiden vapaata käyttöä lainsäädäntö tai sopimukset eivät rajoita, avataan julkisina tietovarantoina vapaasti käytettävinä, Creative Commons -lisenssillä lisensoituina ja koneluettavina. Ensisijaisesti käytetään JHS 189 -suosituksen mukaisesti Creative Commons Nimeä 4.0 -lisenssiä. Aiemmin Kotus on käyttänyt myös GNU- ja EUPL-lisenssejä. Lisäksi käytössä ovat CLARIN-lisenssit.

Tällä hetkellä ovat tarjolla seuraavat avoimet aineistot:

  • Itämerensuomalainen kielikartasto | AVAA | Creative Commons Nimeä 4.0
  • Karjalan kielen sanakirja | Kotus | Creative Commons Nimeä 4.0

  • Kettusen murrekartasto | AVAA | Creative Commons Nimeä 4.0
  • Lauseopin arkiston murrekorpus yhteistyössä Turun yliopiston Lauseopin arkiston kanssa | Korp | Creative Commons Nimeä-EiMuutoksia 4.0
  • Nykysuomen sanalista | Kotus | GNU LGPL, EUPL v. 1.1, Creative Commons Nimeä-EiMuutoksia 3.0
  • Paikannimikartasto | AVAA | Creative Commons Nimeä 4.0
  • Paikannimilaari | Kotus | Creative Commons Nimeä 4.0
  • Suomen kielen näytteitä  (SKN) -av-korpus | LAT | CLARIN PUB, Creative Commons Nimeä 4.0

  • Suomen murteiden sanakirjan levikkikartat | AVAA | Creative Commons Nimeä 4.0
  • Tasavallan presidenttien uudenvuodenpuheet | Korp | EUPL

  • Svenska ortnamn i Finland | AVAA | Creative Commons Nimeä 4.0
  • Vanhan kirjasuomen korpus | Korp | CLARIN PUB, EUPL v. 1.1


Edellä mainitut aineistot ovat käytettävissä seuraavien palvelujen kautta:

  • AVAA, opetus- ja kulttuuriministeriön Avoin tiede ja tutkimus -hankkeen (ATT) tarjoama CSC:n ylläpitämä avointen aineistojen julkaisualusta
  • Kotus, Kotuksen oma aineistopalvelu, jota on aiemmin kutsuttu Kainoksi
  • Korp, Kielipankin (Fin-Clarin) tarjoama CSC:n ylläpitämä tekstikorpusalusta
  • LAT, Kielipankin (Fin-Clarin)  tarjoama CSC:n ylläpitämä av-korpusalusta


Avointen sähköisten aineistojen lisäksi Kotus tarjoaa tutkimuskäyttöön luvanvaraisia aineistoja. Luvanvaraisuuden syynä on yleisimmin henkilösuoja.