VOOZH about

URL: https://yle.fi/a/74-20210625

⇱ Tekoäly avaa hetkessä 1700-luvun koukeroisen käsialan – historian­tutkija ei silti voi luottaa siihen sokeasti | Varsinais-Suomi | Yle


Hyppää sisältöön
Hyppää sisältöön

Tekoälystä on yhä enemmän apua historiantutkimuksessa ja sukututkimuksessa. Kansallisarkisto on ottanut käyttöön ja kehittää erilaisia tekoälyyn perustuvia työkaluja.

Tuomiokirjahausta ja demovaiheen sisältöhausta löytyy jo miljoonia tiedostoja, ja aineistoa lisätään jatkuvasti. Tuomiokirjahakupalvelu on tiettävästi suurimpia käsinkirjoitetun aineiston hakupalveluja maailmanlaajuisesti.

Historiantutkija Veli Pekka Toropainen käyttää tekoälyä työssään, mutta ei anna sille liikaa valtaa.

– Haluan edelleen käteeni kirjan tai digitoidun kirjan, josta löydän myös pienet nyanssit, sanoo Toropainen.

Vaarana on, että tutkimus vääristyy, jos tekoälyyn luottaa liikaa.

– Eniten pelkään, että se köyhdyttää tutkimusta. Haetaan vain tietyillä hakusanoilla ja siitä materiaalista, joka löytyy netissä. Joskus jotkut sanat jäävät taitoksen väliin, joten silloin varsinkin täytyy katsoa alkuperäisteoksesta, kertoo Toropainen.

Tutkija Veli Pekka Toropainen on tilannut alkuperäislähteen käyttöönsä. Hän vertaa sen tekstiä tekoälyn tuottamaan kirjoitukseen. Kuva: Minna Rosvall / Yle

Vanhat käsialat pitää tunnistaa yhä

Vanha, koukeroinen käsiala muuttuu tekoälyn tekstintunnistustyökalulla hetkessä helposti luettavaksi. Silti tutkijoiden ja opiskelijoiden on tärkeää osata tulkita vanhoilla käsialoilla kirjoitettua tekstiä.

Veli Pekka Toropainen on käynyt läpi vaikeasti luettavia aineistoja koko tutkijanuransa ajan. Hän on perehtynyt erityisesti 1600- ja 1700-lukujen oikeushistoriaan.

– Yksi esimerkki on rangaistusmenetelmä nimeltään kujanjuoksu. Kujanjuokseita miehiä mainitaan varmasti lähteissä paljon enemmän ilman kyseistä sanaa.

Toropainen teki ensimmäisen väitöstutkimuksensa Turun yliopistossa turkulaista 1600-luvun porvarisnaisista. Tekeillä on toinen väitöstutkimus, nyt oikeustieteessä.

– Minulta on kysytty, kauhistuinko ja menikö kaikki tekemäni hukkaan, kun vastauksen saa nyt suoraan nappia painamalla. Ei se ihan niin mene, kertoo Toropainen.

Hän painottaa, että kaikki materiaali ei ole saatavissa netissä, vaan on tultava fyysisesti arkistoon. Tosin arkistot eivät ole enää niin usein auki kuin aiemmin, joten niihin ei välttämättä aina pääse.

Vuodelta 1788 olevan tekstin lukeminen ilman tekoälyä vaatii asiantuntemusta. Arkistokuva. Kuva: Minna Rosvall / Yle

Kansallisarkisto auttaa tutkijoita

Kansallisarkisto on kehittänyt jo muutamia vuosia tekoälyyn perustuvia tekstintunnistusapuvälineitä. Asiakirjat pitää aluksi digitoida.

Kansallisarkiston materiaalista on digitoitu noin viisi prosenttia, kertoo yksikön päällikkö Ilkka Jokipii Kansallisarkiston datatekoäly- ja sovelluskehitysyksiköstä.

Suunnitelmissa on, että kaikesta digitoidusta aineistosta voisi tehdä sisältöhakuja.

Palaute on ollut pääosin myönteistä.

– Jostakin kohdasta teksti on tunnistunut väärin, mutta emme lupaa sataprosenttista tulosta. Luotan historiantutkijoihin. He osaavat käyttää työkaluja lähdekriittisesti ja tarkistavat alkuperäislähteet.

Työntekijä Jouni Kakkonen digitoi vanhaa teosta Kansallisarkiston tiloissa. Arkistokuva. Kuva: Minna Rosvall / Yle

Kansallisarkisto myös auttaa tutkijoita todella laajojen aineistojen käsittelyssä.

– Pystyimme etsimään esimerkiksi laajan piikojen palkkariitoja koskevan oikeudenkäyntiaineiston tekoälyn avulla. Se olisi voinut viedä vuosien selailutyön tutkijalta, Jokipii sanoo.

Veli Pekka Toropainen tosin huomauttaa, että hän etsi tiedot piikojen palkkariidoista omaan pian julkaistavaan kirja-artikkeliinsa käymällä läpi koko alkuperäismateriaalin.

Sukututkijoille suurta apua tekoälystä

Tutkijantyönsä lisäksi Veli Pekka Toropainen opettaa sukututkijoita lukemaan asiakirjoja.

Sukututkijat löytävät tietoja esimerkiksi oman kotitilansa historiasta, mutta haluavat usein tietää myös ympäristön asioista.

– Tuomiokirjahaku sisältää oikeuden pöytäkirjojen lisäksi holhousasioita, kauppakirjoja, syytinkisopimuksia ja omaisuuden siirtämistä sukupolvelta toiselle. Sieltä voi lukea yhteisistä pitäjän asioista, kuten susien ajosta tai teiden kunnossapidosta.