Urevi

Uralilaisten kielten etymologinen viitetietokanta Urevi

Etymologinen viitetietokanta opastaa etymologian tutkijat tiedon äärelle kertomalla, missä ja milloin mistäkin sanasta on kirjoitettu. Uralilaisten kielten etymologiseen viitetietokantaan Ureviin on koottu viitteitä kaikkien uralilaisten kielten sanoihin vuoden 2000 jälkeen ilmestyneestä historiallis-vertailevasta tutkimuskirjallisuudesta.

Kokoamisen olemme aloittaneet eräistä uralistiikan johtavista julkaisuista. Koossa on lähes 60 000 viitettä, mikä kattaa arviolta puolet kaikesta vuosina 2001–22 julkaistusta tutkimuksesta. Tietokanta on siis vielä kaukana täydellisestä ja monia hyvin tärkeitäkin tutkimuksia on vielä keräämättä. Alla on luettelo tietokantaan kerätystä kirjallisuudesta.

Eniten iloa Urevista on uralilaisten kielten sanastontutkijoille. Erityisesti toivon sen hyödyttävän vähemmistökielten etymologista tutkimusta, sillä useimmista niistä ei vielä ole laadittu etymologisia sanakirjoja.

Urevi on tältä sivulta ladattavana Excel-tiedostona kaikkien vapaasti hyödynnettävissä. Tulevaisuudessa Ureville on ehkä mahdollista tehdä oma hakusivu (käyttäjärajapinta), jonka avulla sen tietoja voi käyttää vaivattomammin.

Urevin ensimmäinen versio 22.2.2024

Viitteet olemme tähän mennessä keränneet julkaisuista AABLUS (Holopainen & Junttila 2022), Läänemeresoome tulemised (Lang 2018), SUST 256 (Bentlin 2009, vain hakusanat!), UH 11 (Uusiutuva uralilainen etymologia, 2018), Kallion (2019) ja Laakson (2022) juhlakirjat, FUF 58–67 (2004–22), FUM 32/33–41 (2010–18), KjK 2001–22, LU 54–58 (2018–22), SUSA 89–98 (2001–21), Virittäjä (2001–19) sekä Junttilan (2015), Holopaisen (2019) ja Metsärannan (2020) väitöskirjat.

Ensimmäiseen versioon olen tarkistanut viitteet julkaisusarakkeen mukaisessa aakkosjärjestyksessä KjK:n vuoden 2011 loppuun saakka. Tästä eteenpäin mukana on punaisella kirjoitettuja ongelmallisia kohtia, joita vähitellen korjaan. Viitteitä tarkistaessani täsmennän myös kieliluokituksia, poistan tarpeettomia rivejä (sanojen joukkoon joutuneita suffikseja, nimiä ym.) ja korjaan muita virheitä.

Sanan, etymologisen tutkimuksen perusyksikön, olen määritellyt tietokannassa varsin vapaasti, joten mukana on useita monisanaisia kiinteitä ilmauksia, sanaliittoja. Olen merkinnyt vihreällä taustalla ja lajitellut taulukon loppuun sellaiset lähteistä kerätyt useampisanaiset ilmaukset, joita ei mielestäni voi etymologian kannalta pitää sanaliittoina. Joittenkin luokitusta saatan vielä muuttaa ja joitakin poistaa taulukosta kokonaan.

Käyttöohjeita

Jokainen viite sisältää lähteen kirjoittajan antaman sanan kielitiedot, muodon ja merkityksen, lähteen bibliografiset tiedot (kirjoittaja, julkaisu, osa, sivunumerot) sekä nelitasoisen, yhtenäiseksi suunnitellun kieliluokituksen, joka sisältää tasot kielihaara, kieli, kielimuoto ja tarkennus. Kieliluokituksella on Urevissa oma välilehti.

Tiedostossa viitteet on järjestetty kieliluokituksen ja sanojen mukaan suomen kielen aakkosjärjestykseen. Lähteistä saatuja sanoja ei ole siirtokirjoitettu, joten Venäjällä puhuttavien kielten sanoja on haettava sekä latinalaisilla että kyrillisillä kirjoitettuina. Ortografista yhtenäistämistä on tehty ainoastaan liudennuksen merkinnän osalta (ť, t’, t ́ > t́ jne.; tämäkin on vielä kesken).

Excelin Aloitus-valikossa on Lajittele ja suodata / Mukautettu lajittelu -toiminto, jolla taulukon rivit voi järjestää missä tahansa muussakin järjestyksessä eri tietojen (sarakkeitten) mukaan. Kaksi oikeanpuolisinta saraketta kertovat viitteen ensimmäisen sivunnumeron ja sanan merkkimäärän, koska viitettä on usein tarpeen hakea näillä tiedoilla.

Keruuohjeita on taulukossa omalla välilehdellään.

Ureviin ei ole kerätty nimistöä. Nimistöntutkimus on muun sanaston tutkimuksesta eroava ala, jolla nykyään julkaistaan varsin paljon. Laajuutensa vuoksi olen jättänyt sen Urevin ulkopuolelle. Urevissa on kuitenkin puolisen tuhatta henkilön- ja paikannimiviitettä, jotka ovat tulleet keruun sivutuotteena mukaan. Niille on taulukossa erillinen välilehti.

Jos löydät tietokannasta virheitä tai puutteita tai haluat kysyä lisää, ota yhteyttä sähköpostilla! Otan myös mielelläni vastaan kehitys- ja täydennysehdotuksia.

Taustaa

Ureviin on kerätty viitteitä vuosien 2019–23 aikana Suomen vanhimman sanaston etymologisen verkkosanakirjan EVEn eräänlaisena sivuhankkeena ja paljolti vapaaehtoistyönä. Sitä tuki myös Saksan liittovaltion rahoittama Bofik-hanke. Vuosina 2022 ja 2023 Urevin keruuta ja järjestämistä rahoitti Helsingin yliopiston humanistis-yhteiskunnallinen instituutti HSSH. Virittäjän viitetiedot olemme saaneet Virittäjän toimitukselta.

Vuonna 2023 FM Alma Tuokko sovitti tähän mennessä kerätyt viitteet yhtenäiseksi taulukoksi ja valmisteli Ureviin kielten ja murteitten luokituksen. Vuoden 2024 alussa luokituksen kävi läpi ryhmä sanastontutkimuksen asiantuntijoita kukin parhaiten tuntemansa kielihaaran osalta.

Alkuvuodesta 2024 olemme hakeneet taas rahoitusta työryhmälle Urevin keruun jatkamiseen. Urevin tekemiseen voi kuitenkin osallistua edelleen myös vapaaehtoisena: olisi hienoa, jos vaikkapa alan tutkijat voisivat lisätä taulukkoon omia julkaisuitansa.

Tekijät ja lisenssi

Urevi-hankkeesta vastaa Santeri Junttila. Urevin tekoon ovat osallistuneet Sampsa Holopainen, Atte Huhtala, Kaisla Kaheinen, Juha Kuokkala, Eve Liivamägi, Niklas Metsäranta, Karl Pajusalu, Juho Pystynen, Tuuli Savela, Niklas Henrik Tonnätt, Alma Tuokko ja Susanna Virtanen.

Aineisto on julkaistu CC-BY-lisenssillä, https://creativecommons.org/licenses/by/4.0/deed.fi.