Asiantuntijoiden kirjoituksia ajankohtaisista kielikysymyksistä. Laaja blogi- ja kolumniarkisto.

Vanhan kirjasuomen korpus


RIITTA PALKKI
Kotuksen korpuspäivä 15.12.2006

Vanha kirjasuomi on Ruotsin vallan aikaista kirjoitettua suomen kieltä. Ensimmäinen suomenkielinen kirja oli Agricolan ABC-kiria, ja aikakausi päättyi kielen murrokseen n. 1810. Kieli pohjautui lähinnä lounaismurteille.

Vanhan kirjasuomen korpuksessa on Ruotsin vallan aikana ilmestyneitä eri alojen teoksia, tuolta ajalta säilyneitä laajahkoja käsikirjoituksia, joista monet on myöhemmin painettu, sekä yksittäisiä almanakka- ja asetustekstejä, saarnoja ja runotekstejä. Mukana on Mikael Agricolan koko tuotanto ja samanaikaiset muiden tekijöiden evankeliumi- ja käsikirjasuomennokset. Myös ensimmäinen raamatunsuomennos ja Ruotsin vallan ajan tärkeimmät virsikirjat kuuluvat korpukseen. Muuta hengellistä kirjallisuutta ovat esim. ruumissaarnat. Mukana on myös tärkeimmät Ruotsin vallan aikana tehdyt lainsuomennokset ja satoja asetustekstejä. Muuta kirjallisuutta edustavat mm. Gananderin sadut, arvoitukset ja lääkintäoppaat.

Korpus on viimeisten kahdenkymmenen vuoden aikana tehty Kotuksessa Vanhan kirjasuomen sanakirjan (VKS) tarpeisiin. Korpuksen sisältö on sen mukainen. Siihen on koottu mahdollisimman monipuolinen kokoelma eri alojen kirjallisuutta, jotta korpus antaisi edustavan kuvan tuon ajan sanastosta. Korpuksen laajuus on tällä hetkellä lähes 3,5 miljoonaa sanaa jaettuna 12 eri hakemistoon.

Kerron seuraavassa lyhyesti vanhan kirjasuomen korpuksen sisällöstä  hakemisto hakemistolta. Myös muutama sana korpuksen koostamisesta on paikallaan. Fraktuuratekstit on tallennettu pääsääntöisesti kirjoittamalla ja antiikvatekstit skannaamalla. Muutamia tekstejä olemme saaneet näköispainokseen liitetyn ladotun tekstin ladontanauhoilta.

Palaa otsikoihin

Agricola

Mikael Agricolan teokset lävistettiin 1970-luvun alussa reikäkortteihin, ja saneista ajettiin aakkosellinen luettelo sekä kwic-indeksi. Kun Agricolan teoksista 1987 ilmestyi uusi näköispainos, sen neljäntenä osana julkaistiin ”selväkielinen” reikäkorteilta ajettu teksti. Sitä hyödynnettiin myös atk-korpuksen teossa. Suuri osa Agricolan teoksista on Raamatun tekstiä, julkaistiinhan Agricolan nimissä noin kaksi viidesosaa koko Raamatusta. Kaikkiin Raamatun teksteihin on raamatunkäännösten keskinäisen vertailun helpottamiseksi lisätty luku- ja jaenumerot. Raamatunkohtiin liittyvistä jälki- ja reunahuomautuksista merkinnät valitettavasti puuttuvat.
Palaa otsikoihin

Biblia

Vanhan kirjasuomen laajin yksittäinen korpusteksti on vuonna 1642 ilmestynyt ensimmäinen raamatunsuomennos. Teksti on pilkottu kymmeneksi tiedostoksi. Raamatunkohtiin liittyvät jälki- ja reunahuomautukset sekä sivujen ylälaidoissa olevat otsikkotekstit on sijoitettu siihen tiedostoon, mihin ne loogisesti kuuluvat. Raamatun tekstin kirjoitustyöhön saatiin apuraha Kordelinin Säätiöltä. Tämä Raamatun korpusteksti oli ensimmäistä kertaa yleisön selattavana suomalaisen Raamatun 350-vuotisjuhlavuoden näyttelyssä Kansallismuseossa 1992.

Esimerkkinä Agricolan ja Raamatun teksteistä jouluevankeliumin alku  sekä alkuperäisenä että korpustekstinä:

Katkelma jouluevankeliumista (Agricola). Kuva: Kotuksen arkisto.

Se tapactui sijs nijnä Peiuine / Ette Yxi Käsky wloskeui Keisarild Augustuselda / ette caiki Mailma piti * Werolisexi laskettaman .
[A-II-166-[Lk-2:1]]Ja teme weron Laskem9 oli ensimeine' / ia silloin tapactui coska Kyrenius oli Waldamies Ylitze Syrian maan . [A-II-166-[Lk-2:2]]
Ja menit itzecukin Caupungihins andaman heidens arwatta .

[A-II-166-[Lk-2:3]]

Katkelma jouluevankeliumista (v. 1642 Raamattu). Kuva: Kotuksen arkisto.

NIinä päiwinä käwi yxi käsky Keisarilda Augustuxelda / että caicki mailma piti werollisexi laskettaman . [B1-Lk-2:1-594d]
Ja tämä weron laskemus oli ensimäinen / joca tapahtui silloin cosca Kyrenius oli Maanherra Syrias . [B1-Lk-2:2-594d]
Ja cukin meni Caupungihins andaman idziäns arwatta . [B1-Lk-2:3-594d]

Palaa otsikoihin

Almanakat

Ensimmäinen suomenkielinen almanakka julkaistiin 1705. Sen jälkeen allakka onkin ilmestynyt säännöllisesti vuosittain. Korpushakemistossa almanakkojen tekstit ovat yhtenä tiedostona. Pääpaino on almanakkojen B-teksteillä, jotka sisältävät yleishyödyllisiä kirjoituksia milloin mistäkin aiheesta: pellavanviljelystä, pellon muokkauksesta, sotahistoriasta jne. Vain muutamia 1700-luvun alun almanakkoja on kirjoitettu kokonaan. Almanakkojen kalenteriosia voi selata Helsingin yliopiston kirjaston verkkosivuilla. Suuren osan almanakkateksteistä on kirjoittanut Metlan tutkija Seppo Oja. Hän on tallentanut myös lukuisan määrän muita vanhan kirjasuomen tekstejä ja luovuttanut ne meille korpukseen.

Almanakkanäyte on pellonviljelyn katekismuksesta, joka rakentuu kysymyksistä ja vastauksista:

Katkelma almanakasta vuodelta 1784. Kuva: Kotuksen arkisto.

6 Kysymys : Kutka siis owat ne rawinnon osat , kuin siemmen kaswaxensa waati ? [Alm1784-B2a]

Wastaus : Juuri ne samat , joista siemmen itse on , nimittäin : wesi , hieno mulda , suola ja öljy . [Alm1784-B2a]

Palaa otsikoihin

Björkqvist

Vehmaan kappalaisen Anders Björkqvistin laaja kaksiosainen Postilla Uskon harjoitus autuuteen on alun perin tallennettu 1800-luvun korpushankkeessa. Se on nyt siirretty vanhan kirjasuomen korpukseen, johon se ajallisesti kuuluu. Postilla on tervetullut lisä, sillä 1800-luvun alun tekstejä on ennestään varsin vähän.

Palaa otsikoihin

Frosterus

Juhana Abrahaminpoika Frosteruksen Hyödyllinen Huwitus Luomisen Töistä oli oikeastaan ensimmäinen suomenkielinen luonnontieteellinen teos. Kirjan kieli on ainutlaatuisen elävää; kirjoittaja oli ehkä 1700-luvun taitavin kynänkäyttäjä. Frosterus toimi kirkkoherrana Kajaanissa ja Sotkamossa, ja syntyään hän oli paltamolainen. Hän siis edusti aivan eri murrealuetta kuin suurin osa tuon ajan kynäniekoista.

Esimerkkinä kuvaus kamelista:

Katkelma Frosterukselta vuodelta 1791. Kuva: Kotuksen arkisto.

Kameli on korkiambi suurinda hewoista ; pitkän kaulansa kanda hän niinkuin jouhtenet , hänen seljäsänsä on mätäs ja kandaa 40 leiwiskän painon , laskeupi silloin polwillensa koska hänen päällensä kuorma sowitellan . [JAFro1791-47]Palaa otsikoihin

Ganander

Rantsilan kappalainen Kristfrid Ganander on vanhan kirjasuomen ajan tunnetuimpia kirjoittajanimiä. Hän oli yksi harvoista Ruotsin vallan ajan pohjalaisista kielimiehistä. Korpuksessa on lähes koko Gananderin tuotanto.

Gananderin tekstit ovat monipuolinen poikkileikkaus tuon ajan kirjallisuudesta. Mukana on mm. folkloristiikkaa (arvoitukset ja sadut). Arvoitukset on suurelta osin kerätty kansan keskuudesta. Sadut puolestaan ovat suurelta osin kansainvälistä faabeliperinnettä, monet peräisin aina Aisopokselta asti.

Huomattava osa Gananderin tuotantoa ovat valistusteokset, jotka alkavat soiden hyötykäyttöohjeista ja jatkuvat terveydenhoito- ja lääkitysohjeilla sekä ihmisille että eläimille. Nämä ”lääkärikirjat” perustuvat suurimmalta osin kansanlääkintään. Gananderin pääteos, suuri kolmiosainen sanakirja, puuttuu korpuksesta.

Esimerkkinä Gananderin tuotannosta on satu jalopeurasta ja rotasta. Huomatkaa lopussa oleva oppi – tällainen opetushan oli vanhojen faabeleiden olennainen osa.

Gananderin satu vuodelta 1784. Kuva: Kotuksen arkisto.

68 Satu . Yxi Jalopeura ja Rotta . [Gan1784-66]
Yxi Jalopeura oli joutunut langeta ja sisälle kietoua metsä-miesten juoniin ja pauloin , ja huusi yhtä Rotta joka meni siitä siwu , että hän tahtois olla niin hywä ja auttaa häntä werkosta , wakuutuxella , ettei hän koskaan tahdo unhottaa sitä hänelle osotettua hywä työtä . [Gan1784-66]
Rotta järsi ja puuri langan poikki ; ja kuin hän niin oli auttanut Jalopeuran irralle , anoi hän häneldä saadaxeen sen tytärtä waimoxeen waiwastaan . [Gan1784-66]
Jalopeura oli ylön jalo , että hän olis kieltänyt hänelle jotain : mutta se pahin oli , että juuri kuin se uusi puoliso piti astuman morsian-wuoteesehen , niin hän huomahtemata rookais jalallaan astua sulhasen päälle ja rusensi hänen kuoliaxi . [Gan1784-66]
Oppi . Täsä näytetään kuinga wäkewä yhden hywän luontoisen kijtollisuus on ; ja yhden järjettömän rakkauden hulluus , nijn myös se wiheljäisyys , kuin seuraa nijtä naimisia , kuin tapahtuu nijtten persoonain wälillä , jotka owat erinkaltaiset ja ei wertaiset . [Gan1784-67]

Palaa otsikoihin

Laki- ja asetustekstejä

Suurin vanhan kirjasuomen korpushakemistoista sisältää laki- ja asetustekstejä. Maan- ja kaupunginlainsuomennokset säilyivät Ruotsin vallan aikana pitkään vain käsikirjoituksina. Maanlaista tunnetaan kolme suomennosta (Herra Martin, Ljungo Tuomaanpojan ja Abraham Kollaniuksen) ja kaupunginlaista kaksi (Ljungo Tuomaanpojan ja Abraham Kollaniuksen). Suomentajat olivat kaikki eri murrealueilta, ja se näkyy myös teksteissä. Identifioimaton Herra Martti oli nähtävästi lounaissuomalainen, Ljungo Tuomaanpoika oli Kalajoen kirkkoherrana elämäntyönsä tehnyt pohjalainen ja Kollanius satakuntalainen Karkusta.

Martin nimellä kulkevasta maanlainsuomennoksesta tunnetaan useita käsikirjoituskoodekseja. Martti Rapola ja M. Nyholm julkaisivat Suomen kielen muistomerkkejä -sarjassa 1905 ns. Tukholman koodeksin (Codex B 96). Kollaniuksen suomennokset ilmestyivät Suomen kielen muistomerkkejä -sarjassa 1926 Martti Rapolan toimittamina. Ljungo Tuomaanpojan tekstit on julkaistu parikin kertaa. Ensimmäinen julkaisu oli Wilhelm Gabriel Laguksen käsialaa (jo vuonna 1852). Uudempi ja eksaktimpi oli Martti Ulkuniemen vuonna 1975 toimittama laitos. Korpustekstit on tallennettu skannaamalla näistä Suomen kielen muistomerkkien ja Ulkuniemen teksteistä. Maan- ja kaupunginlakeihin on merkitty joka virkkeeseen sivunumeron lisäksi lainkaari ja pykälä – näin mahdollistetaan tekstien keskinäinen vertailu.

Skannaamalla on sähköiseen muotoon saatu myös Kustavi Grotenfeltin 1912 julkaisema Acta Historica Fennica eli kokoelma suomenkielisiä historiallisia asiakirjoja Ruotsin vallan ajalta. Teoksesta on otettu korpukseen ne asiakirjat, joita ei ole VKS:n lähteinä alkuperäisteoksina. Nämä asiakirjat samoin kuin korpuksen valtava asetustekstikokoelma on ryhmitelty tiedostoiksi vuosisatojen mukaan. Asetuksia on yhteensä kuutisensataa. Suuren osan niistä on kirjoittanut ja luovuttanut meille Seppo Oja.

1688 julkaistiin ensimmäinen Ruotsin kirkkolain suomennos. Tekijä oli Paimion kirkkoherra Henrik Florinus. Kirkkolaista ilmestyi ruotsalaisen alkuperäisteoksen 300-vuotisjuhlan kunniaksi 1986 näköispainos, jonka loppuun ladottiin koko teksti antiikvalla. Tämä uudelleen ladottu teksti on korpuksen pohjana. 

Myös Georg Saloniuksen tekemä Ruotsin valtakunnan lain suomennos vuodelta 1759 on saatu korpukseen näköispainoksen perään kirjoitetusta nykykirjaimisesta tekstistä. Näköispainos ilmestyi 1984, alkuperäisen Sveriges Rikes Lag -teoksen 250-vuotisjuhlavuonna. Korpustiedostossa on mukana tekstiä myös vuonna 1808 ilmestyneestä Matthias Caloniuksen tarkistamasta suomennoksesta. Hakasulkeissa virkkeiden perässä ovat ne kohdat, joiden sananvalinta eroaa vuoden 1759 laitoksesta. Tämän lisän korpukseen on luovuttanut vanhan kirjasuomen tutkija professori Silva Kiuru.

Lakikorpuksen suurin puute on se, että Ruotsin valtakunnan lain ensimmäinen suomennos puuttuu. Tätä 1738 valmistunutta Samuel Forseenin suomennosta ei koskaan painettu, ja sen saaminen korpukseen edellyttäisi, että käytössä olisi vanhoja käsialoja sujuvasti lukeva tallentaja ja runsaasti aikaa.

Palaa otsikoihin

Laurentius Petri

Laurentius Petri Aboicus eli Tammelinus, Tammelan kirkkoherra, julkaisi 1658 historiatietoa sisältävän teoksen Ajan Tieto, Suomenmaan menoist ja vscost, erinomaisest Suomen Pispoist. Se on korpuksessa. Myös Petrin saarnoja on säilynyt painettuina. Niistä korpukseen ovat ehtineet saarna enkeleistä sekä synnintunnustuksesta ja siunauksesta pidettyjen saarnojen kokoelma.

Palaa otsikoihin

Lizelius

Antti Lizelius oli syntyjään tyrvääläinen. Hän toimi pappina Pöytyällä ja Mynämäellä. Lizelius tunnetaan kolmannen ja neljännen raamatunsuomennoksen tekijänä sekä ensimmäisen suomenkielisen sanomalehden toimittajana. Lizeliuksen Suomenkielisten Tieto-Sanomien sisältö oli varsin monipuolinen. Lehdestä toiseeen jatkuvien artikkelien aiheina ovat mm. ”Tiedustukset maanpiirin paikkakunnista” ja ”Suomenmaan alku-huoneenhallitus”. Mukana on myös runsaasti uutisaineistoa eri puolilta maailmaa.

Lizeliuksen Mynämäeltä ja Pöytyältä kirjoittamat kirkonkokousten pöytäkirjat on julkaistu myöhemmin painettuina, samoin Mynämäen kirkollisia oloja kuvaava Tiedustuskirja. Pöytyän kirkonkokousten pöytäkirjat ja Tiedustuskirja ovat korpuksessa. Tuon ajan kirkonkokoukset olivat kirjavia tilaisuuksia, joissa käsiteltiin lähes kaikkea, minkä vain voi katsoa kuuluvan seurakunnan toimialaan, ja näin myös pöytäkirjojen kieli oli varsin elävää.

Esimerkkinä Tieto-Sanomista pätkä Suomen maantietoa:

Katkelma Tieto-Sanomista vuodelta 1776. Kuva: Kotuksen arkisto.

6 . Uusi-Maa on 22 1/4 penikulmaa pitkä ja harwoisa paikoisa ei muuta kuin 5 . penikulmaa lewiä . [STS1776-188]
Sen Wapuna eli Ase on hopiainen Wenhe , kahden wirran wälillä , taiwan sinisesä Aukiasa : Kilpi on tawallisesti Greiwi-kunnan Kruunulla peitetty . [STS1776-188]

Palaa otsikoihin

Ruumissaarnoja ym.

1600- ja 1700-luvuilla pidettyjä suomenkielisiä ruumissaarnoja eli muistopuheita on säilynyt sekä yksittäisinä painettuina arkkeina että saarnakokoelmina. Ruumissaarnat jaettiin yleensä kahteen osaan. Toinen osa, joka on tyypillinen hartauspuhe, on kuin mitä tahansa tuon ajan hengellistä tekstiä. Toinen osa, ns. personalia, kertoo vainajan elämänvaiheista, ja on selvää, että sen sanasto poikkeaa varsinaisesta saarnasta. Saarnoja on korpuksessa yhteensä 27; lukuun sisältyy myös muutama muistoruno.
Palaa otsikoihin

Virret

Jaakko Finno julkaisi 1583 ensimmäisen suomalaisen virsikirjan. Virsikirjasta ilmestyi 1988 SKS:n kustantamana näköispainos, jonka lopussa oli nykykirjaimin ladottu teksti. Alkuperäisestä virsikirjasta ei ole säilynyt yhtään täydellistä kappaletta, ja teksti onkin osittain ladottu J. A. Cederbergin 1893 julkaiseman uuden laitoksen mukaan. Korpusteksti on tehty tästä ladotusta laitoksesta.

Myöhemmät tärkeät Ruotsin vallan aikaiset virsikirjat ovat 1605 ilmestynyt Hemminki Maskulaisen virsikirja ja vuoden 1701 Uusi Suomenkielinen Wirsi-Kirja, joka nykyään tunnetaan Vanhan virsikirjan nimellä. Näiden kahden virsikirjan korpustekstien pohjana on Tauno Väinölän vuonna 1995 julkaisema Vanhan virsikirjan 1800-luvun painoksiin perustuva teos. Saimme virsikirjan tekstin Väinölältä levykkeellä. Kirjasimme ensin tärkeimmät erot ensimmäiseen painokseen (vähän yli 30 kohtaa) ja ajoimme ne ohjelmallisesti tekstiin. Sen jälkeen teksti käytiin kohta kohdalta läpi ja tehtiin tarvittavat korjaukset. Näin hahmottui vanhan virsikirjan korpus.

Kaikki Hemmingin virsikirjan virret sisältyvät Vanhaan virsikirjaan. Niinpä ne poimittiin sieltä, ja jatkotoimet olivat sitten samat kuin Vanhan virsikirjan korpustyössä. Myöskään Hemmingin virsikirjasta ei ole säilynyt täydellistä kappaletta. Puuttuvat kohdat on täydennetty vuoden 1630 painoksesta.

Finnon ja Hemmingin virsikirjoissa ei ole virsien ja säkeistöjen numeroita. Korpustekstiin ne on lisätty keskinäisten vertailujen helpottamiseksi. Hyödyllinen apuneuvo on Väinölän teoksen lopussa oleva taulukko ”Vanhan virsikirjan virret aikaisemmissa ja myöhemmissä virsikirjoissa”.

Virsihakemistoon sisältyy myös Hemminki Maskulaisen suomentama Piae Cantiones -kokoelma.

Virsikirjaesimerkkinä on kaksi säkeistöä tutusta Lutherin jouluvirrestä, jonka Hemminki Maskulainen suomensi:

Hemminki Maskulaisen suomentama Lutherin jouluvirsi. Kuva: Kotuksen arkisto.

ENgel paimenill puhui sanoill näill : Sangen hyvän sanoman sanon teill / Ilon teille
ihanan ilmoitan / Qvin Jumalald julki teill suodhan . [Hemm1605-132:1-L5b]
Yx piltti piscu nuorucainen / Kyll caunucainen lapsucainen / On teille syndyn neidzest
nuorest / Teill ilox ijät sangen suurex . [Hemm1605-132:2-L5b]

Katkelma vanhasta virsikirjasta vuodelta 1701. Kuva: Kotuksen arkisto.


ENgel Paimenill puhui sanoill näill : Sangen hywän sanoman sanon teill / Ilon teill
ihanan ilmoitan / Cuin Jumalald julki teill suodan . [WK1701-121:1-147]
Yx pilti piscu nuorucainen / Kyll caunucainen lapsucainen / On teill syndyn Neitzest
nuorest / Teill ilox ijät sangen suurex . [WK1701-121:2-147]

Palaa otsikoihin

Tekstejä eri aloilta

Näin on otsikoitu vanhan kirjasuomen korpuksen heterogeenisin hakemisto. Hakemistossa on omina tiedostoinaan seitsemisenkymmentä eri tekstiä. Mukana on valistavia ja opettavaisia kirjasia, asetuksenomaisia tekstejä, kertovia runoja, onnittelu- ym. tilapäärunoja. Suuri osa on nimetty Varioiksi, mikä tarkoittaa, että tekijä on tuntematon. Myös osan tämän hakemiston teksteistä olemme saaneet Seppo Ojalta.

Vanhimmat tekstit ovat 1500-luvulta olevat jumalanpalveluselämään liittyvät käsikirja- ja messukäsikirjoitukset sekä evankeliumikirjan katkelma. Ne kaikki on myöhemmin painettu. E. N. Setälä ja K. B. Wiklund julkaisivat vuonna 1893 Suomen kielen muistomerkkejä -sarjan ensimmäisenä niteenä kirjan, jossa olivat rinnakkain kaikki suomenkieliset 1500-luvun käsikirja- ja messutekstit. Teoksessa oli A-tekstinä Agricolan käsikirja ja D-tekstinä Agricolan Messu. B-tekstinä oli tähän hakemistoon kuuluva Westhin teksti ja C-tekstinä ns. Upsalan käsikirja. Kirjan lopussa on vielä käsikirjan katkelmia sisältävä E-teksti. Nämä B-, C- ja E-tekstit on skannattu korpukseen. Näiden korpustekstien puute on se, että niissä ei ole minkäänlaista samat kohdat identifioivaa koodausta, joka helpottaisi vertailua. Upsalan evankeliumikirjan katkelma on skannattu Aarni Penttilän 1943 julkaisemasta teoksesta. Siihen on lisätty raamatunkohtaa ilmaisevat koodit.

Lähes puolet hakemiston teksteistä on arkipäivän (maalais)elämän opaskirjasia. On opastettu niin malmien sulattamista ja salpietarin keittämistä kuin eläinten sairauksien hoitoa ja hätäruoan valmistusta ja paljon paljon muuta. Eräänlaisia tapa- ja käyttäytymisoppaita on myös useita, niistä huomattavin Erasmus Rotterdamilaisen Cullainen kiria, Nuorucaisten Tapain sijwollisudest (suom. 1670). Onnittelurunoja on sepitetty niin kruununperijän syntymän ja avioliiton solmimisen kuin akateemisen opinnäytteen suorittamisen johdosta. Kertovista runoista suurin osa on jonkin yksittäisen sodan ja vaihtelevan sotaonnen kuvausta.

Oman maininnan ansaitsee Henrik Florinuksen sananlaskukokoelma Wanhain Suomalaisten Tawaliset ja Suloiset, Sananlascut (1702). Se sisältää yli 1500 sananlaskua. Sananlaskut on koottu kansan keskuudesta, ja myös niiden sanasto on paljolti kansanomaista. Pelkästään sanojen kirjallisia ensiesiintymiä kirjassa on noin 200.

Esimerkkinä joukko uni-sananlaskuja:

Florinuksen sananlasku vuodelta 1702. Kuva: Kotuksen arkisto.

Unda täynä macajan watza ; wilja wiriän watza . [Flor1702-D4b]
Unen Silmä sippuras ; wijna silmät killin callin . [Flor1702-D4b]
Uni culda on ; ei muu culda ole . Laiscan . [Flor1702-D4b]
Uni haucka / ehto haucka / nälkä haucka / aamu haucka . [Flor1702-D4b]
Uni päätä torcutta / martaus macautta / nälkä näppi sydändä . [Flor1702-D4b]

Sananlaskuryppään viimeisessä sananlaskussa on peräti neljä sanaa, joita ei aikaisemmin ole ollut kirjallisuudessa: torkuttaa, martaus, makauttaa ja näppiä.

Palaa otsikoihin

Vanhan kirjasuomen ortografiasta

Vanhan kirjasuomen kirjoitustapa poikkeaa paikoin hyvinkin paljon nykysuomesta. Syitä on lähinnä kaksi: oikeinkirjoituksen vakiintumattomuus ja vieraat vaikutukset. Korpuksen käyttäjän on perehdyttävä huolella oikeinkirjoitukseen, jos mieli saada haulla tuloksia. Otan yhden esimerkin. Vanhan kirjasuomen sanakirjassa on verbistä kääriä esimerkiksi seuraavanlaisia muotoja: kierittihin, kiäri, kiärityn, kärit, kareidt [a painovirhe], kääreit, kärittä, käritynä, käreit, käärin, käriuet jne. Kaikkia muotoja ja kirjoitusasuja ei mitenkään ole mahdollista saada esiin yhdellä eikä edes viidellä haulla, ja useidenkin hakujen teko vaatii hakijalta ortografian tuntemista. Oikeinkirjoitusopas on paikallaan. Paras vanhan kirjasuomen ortografian esitys on Laila Lehikoisen ja Silva Kiurun kirjassa Kirjasuomen kehitys (1989).
Palaa otsikoihin

Korpuksen koodaus

Muutama sana korpustekstien koodauksesta. Koneen rivinä on yleensä virke. Esim. vanhoissa asetusteksteissä on kuitenkin niin pitkiä virkkeitä, että niitä on jouduttu pätkimään. Raamatun tekstit ovat jakeittain ja virret säkeistöittäin. Paikannuskoodissa on yleensä mainittu teoksen tai tekijän nimen lyhenne ja ilmestymisvuosi, sen jälkeen mahdollinen raamatunluvun tai virren numero ja jae- tai säkeistönumero sekä sivunumero. Lakiteksteissä on lainkaaren lyhenne ja pykälänumero. Mitään muoto- tai lauseopillisia koodauksia korpusteksteissä ei ole. Muutamissa lähteissä, etenkin asetuksissa, saattaa vuosiluvun perässä olla kirjain (a, b, c jne.). Nämä merkinnät viittaavat VKS:n lähteisiin ja erottavat esim. saman vuoden asetukset toisistaan.
Palaa otsikoihin

Lopuksi

Vanhan kirjasuomen korpus sisältää tällä hetkellä siis lähes 3,5 miljoonaa sanaa. Puutteita on edelleen. Mainitsen tässä vain muutaman. Korpuksesta puuttuu kolme raamatunkäännöstä (Florinus 1685 ja Lizelius 1758 ja 1776) ja pari isoa Postillaa (Sorolainen 1621 ja 1625 sekä Wegelius 1747 ja 1749).

Lopuksi vielä kehotuksen sana suoraan Agricolan Rukouskirjan esipuheesta:

Katkelma Agricolan Rukouskirjasta. Kuva: Kotuksen arkisto.

Catzo / lue / etzi / ia tutki eij senwooxi Silmes puhke . [A-I-098]

Palaa otsikoihin