Rahvusarhiiv

Ava otsing

Tehisintellekti abil tuvastatud tekstide esitlus 18. oktoobril Tartus

Ootame huvilisi arhiivikasutuses murrangulise masinloetavuse ja tekstituvastuse projekti tulemuste avalikustamisele teisipäeval, 18. oktoobril kell 15 Rahvusarhiivi peahoones Tartus, Nooruse 3.

Avaldatav arhiiviaines on mitmekesine – üks esimesi masina poolt lahti loetud ja veebi paisatavaid allikakogumeid on omaaegsed Tartu linnavolikogu protokollid perioodist 1902–1940 (ca 8100 lehekülge). Perelooliste andmete kasutajaid saame aga rõõmustada õigeusu koguduste sünnimeetrikate (1838–1917, ca 200 000 kaadrit) masinloetavale kujule jõudmisega. Kolmanda dokumendiliigina avaldame rootsiaegsete supliikide ehk Eestimaa kindralkubernerile 17. sajandil saadetud palvekirjade lahtikirjutused (ca 43 000 kaadrit).

Tekstituvastuse tehniline rakendamine on teoks saanud tänu Transkribuse platvormile, mis võimaldab igaühel arvutit käsikirjalisi dokumente „lugema“ õpetada. Hea tulemuse saavutamiseks on vaja arvutile treeninguks anda piisavas koguses korrektselt lahti kirjutatud teksti, mille põhjal loodud tekstituvastusmudel suudab ajalooallikad digitud pildilt otsitavaks tekstiks muuta. Projekti juht Sven Lepa selgitab: “Arhiivi sügavustes on peidus palju põnevat, milleni jõudmine pole aga tihti kerge ülesanne. Tekstituvastus loob hoopis uued võimalused ajalooallikate kasutamiseks – kogu teave on vaid ühe otsingu kaugusel. Iseäranis rõõmustavad sellise võimaluse üle genealoogid ja koduloouurijad, muutuvad ju nii leitavaks ka kõik tekstis peituvad isiku- ja kohanimed.”

Riigiarhivaar Priit Pirsko näeb tekstituvastuse saabumises murrangut arhiivinduses: “Tehisintellekti kasutuselevõtt mitte ainult käsikirjalise teksti tuvastuseks, vaid edaspidi ka masintõlke kaasamisel on kindlasti järgmine revolutsiooniline pööre arhiivikasutuses pärast arhivaalide ja nende kirjelduste jõudmist veebi selle sajandi alguses.”

Esitlusel ütlevad tervitussõnad Tartu linnapea Urmas Klaas ja riigiarhivaar Priit Pirsko, masinõppe rakendamise kogemust ja tulemusi tutvustavad Sven Lepa ja Albert Ludwig Roine ning digitaalhumanitaaria tulevikku käsitleva visiooniettekande peab Tallinna ülikooli meediainnovatsiooni professor Indrek Ibrus.

Kõik huvilised on lahkelt oodatud!

Lähem teave: Tartu kasutusosakonna asejuhataja Sven Lepa, 738 7503, sven.lepa@ra.ee.