Utveckling av Focis korpustjänster
Samtidigt som språkforskarnas intresse för elektroniska textmaterial
(textkorpusar) ökar, håller korpusarnas användningsområde på att breddas.
Korpusarna kan användas inom textforskning, språkteknologi, datavetenskap etc.
I och med att korpusarna används allt mer och för nya ändamål ställs allt högre
kvalitetskrav på redigering och gränssnitt. För att kunna svara mot forskarnas
behov borde korpusarna vara stora, mångsidiga, väl kodade och försedda med
tillräcklig metainformation. Dessutom borde textsamlingarna vara både
diakroniskt och genremässigt täckande. Materialet bör vara lättåtkomligt, och
det ska vara lätt att använda det.
Focis roll inom den finländska korpusforskningen och korpusutvecklingen är
central. Det finländska språkforskarsamfundet väntar sig att
forskningscentralen utvecklar och erbjuder finskspråkiga korpusar. Korpusarna
kan inte förbättras om man inte samtidigt utvecklar verktygen för att producera
och använda korpusar. Forskningen i hur korpusar används måste också beaktas i
korpusarbetet. Vid Focis finns expertis inom lexikografi, textforskning,
datasystem och finskans syntax, vilket ger ett unikt underlag för långsidigt
korpusarbete.
År 2004 inleddes ett forskningsprojekt med uppgift att uppdatera Focis
korpustjänster. Projektet arbetar med att
- ta i bruk datamodeller och webbaserade användargränssnitt som utarbetats vid Focis och utveckla dessa vidare
- överföra existerande textmaterial till en form som motsvarar de nya modellerna
- bygga nya materialsamlingar utgående från de nya modellerna
Projektet pågår till slutet av 2007 och resulterar i en förnyad korpustjänst på
Focis. Projektet sysselsätter en forskare på heltid. Ansvarsperson för
projektet är Mikko Lounela.





