Asiantuntijoiden kirjoituksia ajankohtaisista kielikysymyksistä. Laaja blogi- ja kolumniarkisto, kysymyksiä ja vastauksia -osio, teemakoosteita.

Kuinka sanavirrat kulkevat vuosisatojen kuluessa paikasta toiseen

Ihmiset ovat aina halunneet tietää, mistä sanat tulevat, eikä ole mitään syytä olettaa, että kiinnostus sammuisi tulevan sadan vuoden aikana. Etymologian ammattilaiset tietävät, että samoja asioita kysytään yhä uudestaan: Mistä tulee umpimähkä? Mitä tarkoittaa pataluha? Sekä aiemmin hankitulla etymologisella tiedolla että uusilla tutkimustuloksilla on siis kysyntää jatkossakin.

Muutoskin on muutoksessa

Maailman muuttuessa uusia sanoja tarvitaan väistämättä, ja niitä voi syntyä monin eri tavoin.  Sananmuodostuksen perinteiset keinot ovat suffiksijohtaminen, yhdistäminen ja lainaaminen, mutta muitakin on olemassa. Nykyään on yleistä esimerkiksi slangijohtaminen (härkäpapuvalmiste > härkis), joka ei noudata tavanomaisen johtomorfologian sääntöjä. Tällaista on tietysti ollut ennenkin, mutta uutta on se, että laajalti käytössä olevia slangijohdoksia hyväksytään myös normitettuun yleiskieleen. Tämä suuntaus varmasti jatkuu, koska kieliyhteisön enemmistö ei ole tietoinen sananmuodostuksen säännöistä kielentutkijoiden tapaan. Kieliyhteisön merkitys korostuu jatkossa, koska julkaiseminen ja laajojen piirien tavoittaminen on viestintäkanavien kehittyessä yhä helpompaa.

Sen tapaiset uudissanat kuin kiky ja vihis muistuttavat siitä, että myös lyhennesanojen muodostaminen (kilpailukyky > kiky)  ja kontaminaatio eli risteyttäminen (vegaani ja lihis ’lihapiirakka’ > vihis) ovat tätä päivää. Tarkkailemalla nykyistä uudissanastoa avoimin silmin etymologi saa käsityksen siitä, mihin suuntaan sananmuodostuskeinot ovat muuttumassa ja millaisia selitysvaihtoehtoja uusien sanojen kohdalla voi pitää realistisina. Yleissääntönä voi joka tapauksessa edelleen pitää sitä, että uusi sanasto kytkeytyy jollakin tavoin entiseen, joko oman tai jonkin muun kielen sanastoon. Jos näin ei olisi, kieli muuttuisi käsittämättömäksi ja käyttökelvottomaksi.

Tietoverkot tietopankeiksi

Paljon uutta etymologista tietoa pystytään jo lähitulevaisuudessa tuottamaan pelkästään sillä, että olemassa olevat tietovarannot saatetaan sähköiseen muotoon ja linkitetään yhteen. Indoeurooppalaisen ja uralilaisen kielikunnan osalta etymologista tietoa on ehditty kartuttaa jo pitkään, ja kokemus osoittaa, että saman alueen kielissä sanaston kehitys kulkee pitkälti samaan suuntaan riippumatta siitä, ovatko kielet sukua vai eivät. Esimerkiksi suomen sanaston etymologioinnissa ruotsin sanastoa koskeva etymologinen tutkimus on arvokas tietolähde.

Ainakin väliaikaisiksi pullonkauloiksi muodostuvat ne kielet ja kielikunnat, joista etymologista tutkimusta ei toistaiseksi ole olemassa. Toisaalta uusien etymologiointimenetelmien kehittäminen ja niiden testaaminen jo ennestään tutkittujen kielten avulla antaa mahdollisuuden sulkea tutkimuksen piiriin myös aiemmin kartoittamattomia kielialueita. Nimenomaan suomen kielen etymologisen tutkimuksen kannalta tämä ongelma ei ole akuutti, koska suomea puhutaan hyvin tutkitun indouralilaisen saarekkeen sisällä. Sen ulkopuolelta tulevat sanat eivät todennäköisesti tule suoraan suomeen ja vain suomeen, vaan ne leviävät kielestä toiseen ja saavat etymologisen selityksen jo ennen kuin ne ehtivät suomeen asti.

Hyvä esimerkki on havaijin kielestä peräisin oleva, alkuaan ’nopeaa’ tarkoittava wiki, jota suomen kielen etymologiset sanakirjat eivät vielä tunne. Monestakin verkkolähteestä selviää helposti, että sanan on vuonna 1995 ottanut tietotekniikan terminä käyttöön yhdysvaltalainen ohjelmoija Ward Cunningham, joka tuolloin esitteli keksimänsä tietoverkossa toimivan yhteistyöohjelmiston.

Robottietymologit hommiin

Automaattinen tietojenkäsittely avaa etymologialle aivan uusia mahdollisuuksia. Laajojen aineistojen seulominen ja vertailu käy koneellisesti muutaman napin painalluksella, kunhan aineistot on saatu sähköiseen muotoon ja tutkija osaa täsmällisten komentojen muodossa määritellä, millaisia osumia niistä haetaan. Kun koneelle opettaa tarpeellisen määrän äännehistorian sääntöjä ja semantiikan tendenssejä, se seuloo esiin mahdollisia etymologisia rinnastuksia tutkijan arvioitaviksi minkä ikäisestä aineistosta tahansa.

Ohjelmointitaidot kuuluvat tulevaisuuden etymologin perusvalmiuksiin, ja hänen johtamansa tutkimusryhmä koostuu luotettavista ja väsymättömistä roboteista. Tutkijan työ on kuitenkin entistä haastavampaa, sillä aineiston tehokas seulonta paljastaa yksityiskohtia ja ristiriitoja, joita aiemmin käsityönä tehtävässä tutkimuksessa ei ole osattu ottaa huomioon. Tutkija joutuu päättämään, miten dataa preferoidaan missäkin tapauksessa. Niin paradoksaaliselta kuin se saattaa kuulostaa, etymologinen tutkimus tulee sitä helpommaksi, mitä vanhemmista kielenaineksista on kysymys. Tämä johtuu siitä, että huomioon otettavien faktojen määrä vähenee radikaalisti ajassa taaksepäin mentäessä. Tämä ei tarkoita tietenkään sitä, että selitykset olisivat parempia tai todennäköisemmin oikeita, mutta tutkimustehtävän suorittaminen on helpompaa, kun käsiteltäviä vaihtoehtoja on vähemmän.

Yksittäisestä yleiseen

Etymologin mielenkiinto on perinteisesti kohdistunut sanayksilöihin. Digitaalisessa maailmassa voidaan sanoja käsitellä suurempina joukkoina, ja sanoja koskeva etymologinen tieto voidaan yhdistää tietoon kielenulkoisen maailman tapahtumista. Tulevaisuudessa voidaan graafisesti havainnollistaa sitä, kuinka sanavirrat kulkevat vuosisatojen kuluessa paikasta toiseen ja miten ne korreloivat esimerkiksi muuttoliikkeiden, kauppakontaktien ja teknisten innovaatioiden leviämisen kanssa. Perinteisessä sanastontutkimuksessa kulttuurisanoja on pidetty erityisen mielenkiintoisina sen vuoksi, että niiden avulla voidaan saada tietoa entisaikoijen kulttuuri-innovaatioista ja kulttuurivirtauksista. Uuden teknologian avulla kuva voidaan kääntää myös toisin päin: kulttuuri-ilmiöiden leviämistä koskevan kielenulkoisen tiedon avulla voidaan tietoisesti tehdä oletuksia ja etsiä merkkejä sanaston muutoksista.  

Etymologian tutkimus ei koskaan ole ollut pelkkää lingvistiikkaa. Sanojen muodot, merkitykset ja esiintyminen eri kielissä ovat tutkimuksen lähtökohtana, mutta sanojen elämänkaaren kartoittamisessa tarvitaan aineksia myös kielen käytön eri tasoilta ja kielen ulkopuolelta, esimerkiksi tietoja historiasta, valtapolitiikasta, kulttuurivirtauksista, työvälineiden ja menetelmien kehittymisestä. Ihmiskieltä ei ole ilman ihmistä, joten myös tietoa ihmiskunnan ja ihmispopulaatioiden kehityksen eri vaiheista ja niihin vaikuttaneista tekijöistä tarvitaan etymologisen tutkimuksen tueksi.

Etymologiaa lähdetään tutkimaan ja sen tuloksia tarkastellaan yleensä jonkin tietyn kielen näkökulmasta, mutta itse tutkimus ei saa juuttua kielikeskeisyyteen. Sekä nyt että tulevaisuudessa suomen kielen historia ja suomen sanaston etymologinen tutkimus on nähtävä osana laajempaa kansainvälistä kokonaisuutta, jos sen halutaan olevan vähänkään realistista. Perinteisestä kansallisesta tieteestä tulee jatkossa yhä selvemmin kansainvälistä tiedettä, jolla on kansallinen merkitys.


KAISA HÄKKINEN

Kirjoittaja on eläkkeellä oleva Turun yliopiston suomen kielen professori.

Kirjoitus on osa ”Sanoin saavutettu” -sivustoa ja sen ”Sanoin saavutettavissa: 2117” -sivua. Sivusto kuuluu Suomi 100 -juhlavuoden ohjelmistoon.

Suomi 100
Klikkaamalla kuvaa pääseet Suomi 100 -juhlavuoden sivuille.