fbpx

Paperiarkistojen digitoinnin 1-0-1

Onko organisaatiosi dokumentinhallinta kuin suoraan kuvasta? Alkaako ahdistaa kun täytyy lähteä etsimään materiaalia paperiarkiston syövereistä? Ei silti kannata antautua, koska tilanteelle voi – ja kannattaa – tehdä jotain.  Nykyinen lainsäädäntö antaa jo puitteet siihen, että paperiarkistosta pääsee eroon pysyvästi, kunhan sähköinen versiointi on tehty huolella. Ja tietenkin sähköiseen arkistointiin siirtymisessä on otettava tiettyjä seikkoja huomioon, jotta tieto on löydettävissä ja käytettävissä, sekä vastaa tietoturvavaatimuksia. Homma ei siis ole ihan yksinkertainen, muttei toisaalta lähimainkaan mahdoton. Laadin alle checklistin, jonka kanssa digitoinnissa pääsee alkuun, lisää tietoa kannattaa haalia sitten oman toimialan ja siihen vaikuttavien arkistointisäädösten mukaan.

Ihan alkuun täytyy muistaa, että hyvin suunniteltu on puoliksi tehty, ja digitointiprojektissa tämä pitää enemmän kuin paikkansa. Suunnitteluun kannattaa varata aikaa, ja on hyödyllistä suunnitella koko projekti alusta loppuun ennen varsinaisen työn aloittamista. Suunnanmuutosten tekeminen kesken matkan kun saattaa aiheuttaa runsaasti ylimääräistä työtä. Mutta lähdetään listaamaan, olen yrittänyt pitää jokaisen kohdan riittävän kaukana yksityiskohdista, niitä kun ei kannata lähteä viilaamaan yleistason blogiin…

Määrittele fyysinen arkisto

Mitä arkistossasi on? Siis ihan oikeasti. Minkälaisia erilaisia dokumenttityyppejä sieltä löytyy, ja kuinka paljon? Miksi niitä säilytetään, kuinka usein niitä tarvitaan? Mitkä dokumentit ovat sellaisia jotka voi suoraan hävittää, ja onko siellä jotain sellaista jota tarvitaan hyvin, hyvin harvoin. Tämä antaa myös yleiskuvan siitä, mitä hyötyjä digitoinnilla on saavutettavissa.

Aineiston jaottelu sähköiseen muotoon

Kun ensin on saatu selville, mikä on lähtötilanne, niin seuraavaksi määritellään maali. Eli toisinsanoen, minkälainen tiedostorakenne muodostetaan: esimerkiksi sopimukset ovat luonnollisesti jokainen oma tiedostonsa, sopimus.pdf. Sitten taas toisaalta monesti riittää, että vaikkapa jonkun tietyn vuoden koko hallinnollinen materiaali on samassa tiedostossa (hallinto2012.pdf), jolloin parhaimmillaan kokonaisia mappeja voidaan ajaa samaan tiedostoon, ilman että se aiheuttaa ongelmaa löydettävyyden kannalta. Tässä kannattaa myös muistaa ottaa huomioon tietoturva, ettei samaan tiedostoon mene sellaista materiaalia, jota ei voida kaikille näyttää.

Miten varmistetaan tiedon löydettävyys

Pohjautuuko tuleva sähköinen arkistointisi kansiorakenteeseen, vaiko metatietoihin? Ja miten tiedon löydettävyys varmistetaan molemmissa ratkaisuissa? Itse olen vannoutunut metatietojen kannattaja, koska niiden avulla saadaan asioita linkitettyä toisiinsa huomattavan tehokkaasti, mutta tietynlaisissa ympäristöissä kansiorakenne riittää myös. Tämä päätös on kriittinen työn kannalta, koska metatietojen syöttäminen jälkikäteen on sitten täysin ylimääräistä hommaa.

Ratkaisevin tekijä tässä päätöksessä on dokumenttien monimuotoisuus, otetaan lyhyt esimerkki: jos yrityksessäsi käsitellään vain asiakassopimuksia, niin ne voidaan laittaa ‘Asiakassopimukset’-kansioon, ja nimetä asiakasyrityksen mukaan, ja kaikki ovat tyytyväisiä. Mutta mitäpä jos samasta asiakkaasta muodostuu muitakin dokumentteja – tarjouksia, reklamaatioita, kehityssuunnitelmia jne. – niin miten niiden hallinnointi ja linkittäminen onnistuu? Onko hyödyllistä saada löydettyä kerralla kaikki ko. asiakkaaseen liittyvä aineisto, vai onko tarkoituksenmukaista etsiä ne yksitellen eri kansioista?

Varsinkin metatietoja mietittäessä homma meinaa välillä karata käsistä, halutaan poimia todella monta erilaista metatietoa yksittäisistä dokumenteista. Mikäpä siinä, jos se on tarkoituksenmukaista, mutta olennaista on keskittyä siihen, millä periaatteella hakua tehdään kun tietoa halutaan löytää: vaikka jaottelua olisi kiva tehdä kymmenellä eri parametrilla, niin jos tietoa haetaan käytännössä aina esim. asiakasnumeron ja dokumenttityypin mukaan, niin mitä virkaa muilla metatiedoilla on?
Sama pätee myös kansiorakenteeseen, ja tiedostojen sisältöön: miten tietoa haetaan nyt kun se on paperimuodossa? Jos tiedonhakupolku on se, että otetaan tietty kansio, ja etsitään sieltä oikean asiakkaan materiaali (ja tieto löytyy sillä tavoin riittävän helposti suhteessa siihen kuinka usein arkistohakuja tehdään), niin eikö saman polun voisi luoda myös sähköisesti? Yhdestä kansiosta tehdään yksi tiedosto, ja suoritetaan tiedoston sisältä hakua esimerkiksi automaattisen tekstintunnistuksen (OCR) pohjalta.

Monet nostavatkin tiedon löydettävyydestä puhuttaessa esiin tuon OCR-tekniikan, ja se luonnollisesti helpottaa asiaa huomattavasti. Kannattaa kuitenkin muistaa, että se ei ole automaattinen oikotie onneen, ja vaatii varsinkin skannaukselta riittävän laadukasta toteutusta. Ja jos jotain kriittistä tietoa kirjoitetaan käsin lomakkeisiin, niin nehän eivät sitten OCR:llä löydykkään. Mutta ehdottomasti kaikki skannattava materiaali kannattaa tehdä OCR-muotoiseksi.

Tietoturva sähköisessä arkistossa

Tätä hieman sivuttiin jo aiemmin, mutta nostetaan vielä uudestaan esille. Yrityksen sisäisen tietoturvan kannalta täytyy siis määritellä, kuka näkee ja mitä. Tarkoittaa siis sitä, että jaottelun täytyy olla tehty oikein, mitä tietoja on samoissa tiedostoissa, ja mitä dokumentteja samoissa kansioissa. Ja sen jälkeen määritellä käyttäjäoikeudet oikein. Perussettiä, mutta oli pakko mainita.

Mitä ulkoiseen tietoturvaan tulee, niin arkistoinnissa kannattaa ottaa huomioon missä arkisto fyysisesti sijaitsee, onko se omalla palvelimella vaiko pilvessä, ja miten sen varmuuskopiointi on hoidettu? Samoin miten pystytään reagoimaan ongelmatapauksissa, jos joihinkin dokumentteihin ei vaikka yhtäkkiä pääse käsiksi? Kannattaa miettiä palveluntarjoajaa tässä kohtaa ihan erikseen, ottaako arkiston esimerkiksi SaaS-palveluna.

Toteutus

Blogi on kirjoitettu siitä lähtökohdasta, että organisaatio hoitaa projektin itse. Toteutuksen osalta se tarkoittaa tietenkin resursseja: sekä laitteiston että ennen kaikkea työn osalta. Skannaus saattaa kuulostaa kovin kevyeltä projektilta, mutta kannattaa muistaa, että se pitää sisällään paljon muutakin kuin paperin laittamista skannerin syöttölaitteeseen. Aineisto täytyy lajitella ja esikäsitellä (poistaa klemmarit, niitit ym.), sekä itse skannauksen jälkeen syöttää metatiedot (jos niitä halutaan) / tallentaa oikeisiin kansioihin, nimetä tiedostot, sekä varmistaa tietojen oikeellisuus.
Yksi asia mikä saattaa monesti unohtua, on skannausta suorittavien työntekijöiden vaitiolovelvollisuuden korostaminen. He kun parhaimmillaan / pahimmillaan näkevät koko henkilöstön palkkaan ja sairauslomiin, sekä yrityksen hallinnollisiin asioihin liittyvät dokumentit. Näistä ei varmaankaan haluta juoruja kahvipöytäkeskusteluihin.

Laitteiston osalta täytyy ottaa huomioon, että millä laitteilla projektia viedään eteenpäin, ettei firman ainoa monitoimilaite ole koko ajan skannauskäytössä – silloin tulee väkisinkin keskeytyksiä sekä normityöhön että skannausprojektiin. Onko arkistossa suurkuvia, jolloin niitä varten tarvitaan erillinen skanneri? Ja riittävätkö laitteiden ominaisuudet esimerkiksi laadukkaaseen OCR-tunnistukseen?

Digitointi ei siis ole avaruustiedettä, mutta siinä on paljon huomioon otettavia asioita, joista ei voi tinkiä. Omaan toimialaan liittyviin arkistosäädöksiin pitää tietenkin myös tutustua, jotta on perillä mm. säilytysvelvollisuuksista, ettei tule hävitettyä aineistoa jota pitäisikin vielä säilyttää.

Erityisesti kolmeen asiaan kannattaa panostaa: laatu, laatu ja laatu. Jokaisessa työvaiheessa. Yhden vaiheen kun niin sanotusti vetää vihkoon, niin sitä on erittäin vaikeaa kompensoida laadukkaalla toteutuksella myöhemmin. Erinomainen skannauslaatu ei juuri hyödytä, jos tieto ei ole löydettävissä, ja päinvastoin.

Minuun saa ottaa yhteyttä, jos aiheen tiimoilta tarvitsee sparrailua tai herää kysymyksiä: teemu.vuorela@digitalofficecompany.fi / 040 678 3387, tai LinkedInin kautta viestimällä https://www.linkedin.com/in/teemu-vuorela/.

By |2018-09-17T11:57:06+00:00maaliskuu 14th, 2018|Yleinen|0 Comments