Siirry suoraan sisältöön Siirry etusivulle

Postimuseo avaa dataa

Ritva Pulkkinen

Viime syksynä osa Postimuseon henkilöstöstä osallistui Open Knowledge Finland ry:n järjestämälle Datan avaajan mestarikurssille. Kurssi toteutettiin verkkopohjaisena Optima-alustalla, jossa osallistujat kustakin organisaatiosta muodostivat oman opiskeluryhmänsä. Postimuseosta seitsemän innokasta perehtyi datan avaamisen saloihin.

Ensisijaisesti julkishallinnon organisaatioille suunnatulla verkkokurssilla paneuduttiin muun muassa datan erilaisiin muotoihin ja julkaisualustoihin, avoimeen lisensointiin sekä datan avaamiseen liittyviin lakeihin ja säädöksiin. Koulutuksessa pohdittiin myös, mitä hyötyjä organisaatio tietoaineiston avaamisesta saa ja mitä esteitä siihen voi liittyä. Muisti- ja kulttuuriorganisaatioille ohjatut kurssit perustuvat samansuuntaiseen sisältöön.

Toimipaikkatietokanta avoimeksi

Sopivaksi avattavaksi aineistoksi päätyi pohdinnan jälkeen Postimuseon ylläpitämä toimipaikkatietokanta. Siinä on lähes kaikki Suomen, myös entisten alueiden, postitoimipaikat perustamisestaan lähtien eli varhaisimmillaan vuodesta 1638. Yleisölle avattavia tietoja ovat toimipaikan nimi, perustamisnimi, postinumero, mahdollinen perustamis- ja lakkauttamisajankohta (pvm) sekä toimipaikan hoitajat vuoteen 1916, mikä siis rajaa alle 100 vuotta vanhat henkilötiedot pois aineistosta. Tämä jättää osan postikonttorin hoitajia ulkopuolelle, mutta tarjoaa puolestaan tiedot Postin varhaishistorian kannalta kiinnostavista postimestareista, jotka lukeutuivat tuolloin paikkakuntansa merkkihenkilöihin. Postivirkamiehen työsuhde on periaatteessa julkinen tieto, mutta linjaus toimii varotoimenpiteenä siihen, ettei tiedon avaaminen antaisi mahdollisuutta eri tietokantojen tietoja yhdistelemällä rikkoa elossa olevan henkilön yksityisyyden suojaa.

Avattavan tiedon tulee olla standardoitua ja siksi joitakin tietokannassa olevia kenttiä jouduttiin jättämään projektin ulkopuolelle. Esimerkiksi tietoja toimipaikassa tapahtuneista muutoksista ei ainakaan vielä voida julkistaa, sillä ne ovat hyvin heterogeenisia ja sisältävät lisäksi henkilötietoja, erityisesti asiamiespostien osalta. Avattavissakin kentissä siivottavaa jäi, mikä oli iso ja pikkutarkka urakka. Runsas 6500 tietuetta käsittävä tietokanta jaettiin työryhmän kesken ja kukin sai noin tuhat toimipaikkaa hoitaakseen. Kaikkien kenttien sisältöä yhtenäistettiin, postinhoitajan toimikausi jaettiin kahdeksi kentäksi (alkamis- ja lopettamisaika) ja päivämäärien ilmaisu yhdenmukaistettiin ISO-standardin mukaiseksi.

Suomen postitoimipaikkatietokanta avattiin helmikuussa. Tietoaineisto on xml-muotoinen datapaketti, joka sijoitettiin kuvailutietojen kera Avoindata.fi -palveluun osoitteeseen https://www.avoindata.fi/data/fi/dataset/suomen-postitoimipaikat. Se on ”kaikkien vapaasti katseltavissa, ladattavissa, kopioitavissa, muokattavissa, jaettavissa ja käytettävissä missä tahansa lainmukaisessa toiminnassa ilman taloudellisia, juridisia, teknisiä, sosiaalisia tai käytännöllisiä rajoitteita”, kuten avoimen datan määritelmä kuuluu. Postimuseon aineisto julkaistaan CC BY 4.0 lisenssillä, mikä tarkoittaa, että sitä voi ladata ja hyödyntää kuka tahansa, kunhan aineiston alkuperäislähde mainitaan.

Ritva Pulkkinen informaatikko

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *

Takaisin ylös