Kotimaisten kielten keskuksen kieliaineistojen ja -arkistojen esittelyt ja pääsy sähköisiin aineistoihin.

Avoimet aineistot ja lisensointi

Kotus edistää julkisten tietovarantojen avaamista digitoimalla kielitieteellisiä kokoelmiaan ja saattamalla niitä verkossa mahdollisimman avoimeen käyttöön.

Metatiedot

Kotuksen aineistojen metatietoja on seuraavissa palveluissa:

Lisensointi

Kotuksen nykyiset ja tulevat sähköiset kieliaineistot, jotka ovat julkisia ja joiden vapaata käyttöä lainsäädäntö tai sopimukset eivät rajoita, avataan julkisina tietovarantoina vapaasti käytettävinä, Creative Commons -lisenssillä lisensoituina ja koneluettavina. Ensisijaisesti käytetään JHS 189 -suosituksen mukaisesti Creative Commons Nimeä 4.0 -lisenssiä. Aiemmin Kotus on käyttänyt myös GNU- ja EUPL-lisenssejä. Lisäksi käytössä ovat CLARIN-lisenssit.

Tällä hetkellä ovat tarjolla seuraavat avoimet aineistot:

  • Itämerensuomalainen kielikartasto | AVAA | Creative Commons Nimeä 4.0
  • Karjalan kielen sanakirja | Kotus | Creative Commons Nimeä 4.0

  • Kettusen murrekartasto | AVAA | Creative Commons Nimeä 4.0
  • Lauseopin arkiston murrekorpus yhteistyössä Turun yliopiston Lauseopin arkiston kanssa | Korp | Creative Commons Nimeä-EiMuutoksia 4.0
  • Nykysuomen sanalista | Kotus | GNU LGPL, EUPL v. 1.1, Creative Commons Nimeä-EiMuutoksia 3.0
  • Paikannimikartasto | AVAA | Creative Commons Nimeä 4.0
  • Paikannimilaari | Kotus | Creative Commons Nimeä 4.0
  • Suomen kielen näytteitä  (SKN) -av-korpus | LAT | CLARIN PUB, Creative Commons Nimeä 4.0

  • Suomen murteiden sanakirjan levikkikartat | AVAA | Creative Commons Nimeä 4.0
  • Tasavallan presidenttien uudenvuodenpuheet | Korp | EUPL
  • Svenska ortnamn i Finland | AVAA | Creative Commons Nimeä 4.0
  • Vanhan kirjasuomen korpus | Korp | CLARIN PUB, EUPL v. 1.1
  • Vanhan kirjasuomen sanakirja | Kotus | Creative Commons Nimeä 4.0

Edellä mainitut aineistot ovat käytettävissä seuraavien palvelujen kautta:

  • AVAA, opetus- ja kulttuuriministeriön Avoin tiede ja tutkimus -hankkeen (ATT) tarjoama CSC:n ylläpitämä avointen aineistojen julkaisualusta
  • Kotus, Kotuksen oma aineistopalvelu, jota on aiemmin kutsuttu Kainoksi
  • Korp, Kielipankin (Fin-Clarin) tarjoama CSC:n ylläpitämä tekstikorpusalusta
  • LAT, Kielipankin (Fin-Clarin)  tarjoama CSC:n ylläpitämä av-korpusalusta

Avointen sähköisten aineistojen lisäksi Kotus tarjoaa tutkimuskäyttöön luvanvaraisia aineistoja. Luvanvaraisuuden syynä on yleisimmin henkilösuoja.