Liigu põhisisu juurde
Tagasi

Rahvusarhiivi aasta tegu aitab uurijatel kiiremini infoni jõuda

Rahvusarhiivi 2022. aasta teoks valisid kolleegid tekstituvastuse rakendamise, mis täidab kasutajate unistusi ja astub sammu lähemale tuleviku arhiivile, kus vana käsikirja lugemise oskus või koguni võõrkeele mõistmine ei ole enam uurimistöös takistuseks.

Ligi kahekümne aasta eest alanud digiteerimine on teinud enam nõutud arhiivimaterjalid kättesaadavaks uurija asukohast sõltumatult. Nüüd on üha rohkemates valdkondades abiks olev tehisintellekt toonud arhiivinduses kaasa järgmise murrangu: digipildiks saanud dokumentidelt on võimalik arvuti abil tekst välja lugeda ja dokumendi  sisu sellega otsitavaks muuta.

„Kasutasime selleks masinõppeplatvormi Transkribus, mis võimaldab igaühel arvutit vanu tekste lugema panna – pead talle vaid piisavalt lahti kirjutatud tekste õppimiseks ette andma ja saadki tekstituvastusmudeli luua ning seda teiste sarnaste dokumentide peal rakendada,“ kirjeldab projekti eestvedaja Sven Lepa.

Tihti võib jääda arhivaalis peituv detailsem info pealkirja taha varju. Nüüd on otsingu abil võimalik kiirelt leida seni pikemat allika läbitöötamist nõudnud teavet. „Iseäranis rõõmustavad sellise võimaluse üle genealoogid ja koduloouurijad, muutuvad ju nii hõlpsasti leitavaks ka kõik tekstis peituvad isiku- ja kohanimed,“ sõnas Lepa.

Esimese masinõppeprojekti käigus töötati läbi kolm allikate kollektsiooni, mis on kõigile huvilistele nüüd lehel https://www.ra.ee/transkribus otsingu abil ligipääsetavad: õigeusu koguduste sünnimeetrikad ehk sündide registrid, supliigid ehk palvekirjad rootsiaegsele Eestimaa kindralkubernerile ning Tartu linnavolikogu protokollid 20. sajandi esimesest poolest.