Siirry pääsisältöön

Aineistonhallinnan opas: Aineiston säilyttäminen

Miten aineistoa kannattaa säilyttää?

Aineiston säilyttämisessä ja sen suunnittelussa on tärkeä huomioida seuraavat näkökulmat:

  • Mihin aineistoa tallennetaan ja miten sitä hoidetaan?
  • Käyttöoikeudet (projektin aikana ja sen jälkeen)
  • Varmuuskopiointi
  • Versiohallinta
  • Nimeämiskäytännöt (datasetin nimi ei voi olla vain dataset)
  • Miten kansiorakenne ja/tai tietokanta rakennetaan?
  • Mitä tallennusformaatteja käytetään?
  • Mikä aineisto pitää tuhota jo projektin aikana?

Tutkimusaineistoa sisältävät tiedostot nimetään ja järjestetään kansioihin siten, että vältetään virheitä ja sekaannuksia aineistojen tulkinnassa ja käytössä. Lisäksi huomioidaan tutkimusaineiston jakamisen helppous eri toimijoiden kesken. Tavoitteena on myös taata tutkimusaineiston löydettävyys ja käytettävyys tarvittaessa vielä tutkimuksen jälkeenkin.

Tietoturvan varmistaminen on oleellinen osa tallentamista. Tietoturvan varmistaminen edellyttää muun muassa organisaation tietoturvaohjeistuksen noudattamista ja erilaisia teknisiä toimenpiteitä, joilla varmistetaan tiedon luottamuksellisuus.

Aineistojen organisointi ja dokumentointi

Tiedostojen organisointi ja nimeäminen

Systemaattinen aineistojen organisointi ja dokumentointi helpottavat hankkeen aineistojen löytymistä ja käyttöä hankkeen aikana ja luovat edellytykset aineistojen mahdolliselle jatkokäytölle.

  • Nimeämiskäytännöt on hyvä suunnitella ja sopia jo tutkimusaineiston keruun alkuvaiheessa
  • Nimeämisen tulee olla johdonmukaista ja selkeää
  • Nimien ei tule olla liian pitkiä kuin ei myöskään liian lyhyitä
  • Hyvä tiedostonimi on loogisesti jäsennetty ja se kertoo sisällöstä (esim. projektin/hankkeen nimi, aineiston nimi, tekijä, pvm vuosi-kk-pv, versionumero)
  • Käytä tarvittaessa lyhenteitä. Lyhenteiden merkitys tulee dokumentoida, jotta ne ymmärretään vielä pitkän ajan päästä.
  • Vältä erikoismerkkejä
     

Tiedostomuodon valinta

  • Tiedostomuoto/-formaatti kannattaa valita varhaisessa vaiheessa, jotta vältytään turhilta formaatinmuutoksilta
    • Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, vaan tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio tai äänenlaatu
  • Tiedostomuodon tulisi olla sellainen, jota voi käyttää mahdollisimman pitkään. Kokonaan ohjelmistoriippumattomia tallennusformaatteja ei kuitenkaan ole tarjolla.
  • Yleisiä tiedostoformaatteja, joita useimmat eri ohjelmistot tukevat:

Dokumentointi

Datan yhteyteen on hyvä tehdä erillinen readme.txt-tiedosto, jossa kokonaisuus ja dokumentointi on kuvailtu. Aineiston hyvällä dokumentoinnilla varmistetaan aineiston ymmärrettävyys. Dokumentoitavia asioita ovat mm.

  • Miten aineisto on kerätty
  • Miten sitä on käsitelty, kuka ja milloin
  • Käytetyt laitteet ja ohjelmistot
  • Muuttujat
  • Käytetyt koodit ja lyhenteet
  • Versiohallinta
  • Laadunvarmistusprosessit
  • Muu tieto, joka lisää aineiston ymmärrettävyyttä

Lisätietoa: Tietoarkisto: Aineistonhallinnan käsikirja - Aineiston kuvailu ja metadata

Tutkimusaineiston tietoturvallinen tallentaminen, avaaminen ja jakaminen

Tutkimusaineiston tallentamiseen, avaamiseen ja jakamiseen on tarjolla erilaisia vaihtoehtoja. Näistä osa on Turun ammattikorkeakoulun ylläpitämiä ja tukemia palveluita, osa taas on Turun ammattikorkeakoulun suosittelemia palveluita, joiden ylläpidosta ja tuesta vastaa CSC.

Sopivan palvelun valintaan vaikuttavat esim. millaista aineistoa tallennetaan, paljonko sitä on ja keiden pitää voida käsitellä sitä. Alla olevilla välilehdillä näet, mitä tutkimusaineistoille tarkoitettuja tallennusratkaisuja on tarjolla Turun AMK:n henkilökunnalle. Osa palveluista on Turun AMK:n hankkimia ja osan tarjoaa CSC kaikille korkeakoulutoimijoille.

CSC:n palvelut korkeakouluille

CSC tarjoaa kattavasti erilaisia digitaalisia ratkaisuja korkeakouluissa tehtävän tutkimus-, kehitys- ja opetustyön tueksi. Palveluiden käyttämiseksi pitää rekisteröityä My CSC -palveluun, mikä onnistuu Haka-tunnuksilla. Kun olet rekisteröitynyt palveluun, voit luoda projektin, jolle haet oikeutta sopivien CSC:n tarjoamien digitaalisten ratkaisuiden käyttöön. Voit tutustua tarkemmin My CSC -palvelun käyttöönottoon lukemalla CSC:n tarjoamat ohjeet. Sopivan digitaalisen ratkaisun valintaan ja käyttöönottoon liittyvissä kysymyksissä voit olla yhteydessä Turun AMK:n datatukeen (datasupport (at) turkuamk.fi). Lisäksi CSC tarjoaa tukea palveluihinsa liittyvissä kysymyksissä (servicedesk (at) csc.fi).

CSC tarjoaa ratkaisuja eri käyttötarkoituksiin eri tyyppisille aineistoille. Alla olevissa palveluissa esitellään näistä keskeisimmät. Palvelut on jaoteltu omiin taulukoihin sen mukaan, voiko niissä käsitellä arkaluonteisia henkilötietoja tai arkaluonteista/sensitiivistä dataa. Kaikki palvelut soveltuvat henkilötietojen käsittelyyn mutta arkaluonteisia henkilötietoja voi käsitellä vain arkaluonteisen datan käsittelyyn tarkoitetuissa ratkaisuissa.

CSC:n tallennuspalvelut löytyvät alta välilehdiltä CSC:n aineistopalvelut ja CSC:n palvelu arkaluonteiselle aineistolle.
 

Tietoturva

Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluonteisesta aineistosta. Tietoturvan varmistamiseen kuuluu aineiston tuhoutumisen, vahingoittumisen, muuttumisen tai varastamisen estäminen sekä pääsy- ja käyttöoikeuksien hallinta.

Myös varmuuskopiointi on osa tietoturvaa.

Eri tallennusratkaisuja

Turun AMK:n tallennusratkaisut henkilökunnalle Käyttötarkoitus Jakaminen Varmuuskopiointi Versionhallinta
Home (Z) Henkilökohtainen tallennustila, joka on käytettävissä vain Turun AMK:n verkossa Ei Kyllä Ei
Group (R) Tutkimusryhmille ja hankkeille tarkoitettu tallennustila, joka on käytettävissä vain Turun AMK:n verkossa Rajoituksin Kyllä Ei
B2DROP Ensisijaisesti TKI-hankkeissa syntyvien ja käsiteltävien aineistojen säilyttämiseen tarkoitettu, pilvipalvelupohjainen tallennustila. Kirjautuminen Haka-tunnuksilla. Tallennustilaa haetaan hankkeen tarpeisiin ottamalla yhteyttä osoitteeseen datasupport (at) turkuamk.fi. Kyllä (muille organisaation jäsenille) Ei Kyllä
Teams Ryhmille tarkoitettu pilvipohjainen tallennustila, joka on ensisijaisesti tarkoitettu ryhmän sisäiseen viestintään ja yhteisten dokumenttien työstämiseen. Kyllä Ei Kyllä
OneDrive Henkilökohtainen tallennustila, joka on ensisijaisesti tarkoitettu dokumenttien tallentamiseen, työstämiseen ja jakamiseen. Kyllä Ei Kyllä
CSC:n tarjoamat ratkaisut aineistojen
avaamiseen, tallentamiseen ja jakamiseen
Käyttötarkoitus Lisätietoa palvelusta
Fairdata IDA Turvallinen tallennuspalvelu erilaisille tutkimusaineistoille, joka soveltuu käytettäväksi TKI-hankkeen ollessa aktiivinen. Palvelu tukee tutkimusaineiston avaamista, sillä avattavaksi tarkoitettu aineisto voidaan jäädyttää ja säilyttää palvelussa hankkeen päätyttyä.  Fairdata IDA
Fairdata Qvain  Työkalu tutkimusaineistojen kuvailemiseen. Palvelussa voi kuvailla IDA-palveluun tallennettua aineistoa, mutta sitä voi käyttää myös muualle tallennettujen aineistojen kuvailemiseen. Kuvaillun tutkimusaineiston metatiedot saadaan näkyviin Fairdata Etsin-palvelussa. Qvain
Fairdata PAS Palvelu tutkimusaineistojen pitkäaikaissäilytykseen kymmenien ja jopa satojen vuosien ajan. Aineiston sopivuus palvelussa säilyttämiseen arvioidaan ennen päätöksen tekemistä pitkäaikaissäilytyksestä. PAS
cPouta Palvelu, jossa voi käyttää virtuaalikoneita, tallennustilaa ja suurteholaskentaa erilaisiin tarpeisiin. Mahdollistaa esimerkiksi palveluiden ja alustojen kehittämisen osana TKI-hankkeita. Infrastructure-as-a-service -tyyppinen tallennus- ja käsittely/laskentaympäristö. cPouta
Funet Filesender Selainpohjainen tiedonjakopalvelu, jota voi käyttää jopa satojen gigatavujen suuruisten tiedostojen siirtämiseen. Funet Filesender
CSC:n tarjoamat ratkaisut arkaluonteisen datan
tallentamiseen ja jakamiseen
Käyttötarkoitus Lisätietoa palvelusta
SD Services Tietoturvallinen palvelukokonaisuus arkaluonteisen datan tallentamiseen, jakamiseen ja analysointiin TKI-hankkeen jäsenten kesken. Soveltuu käytettäväksi tutkimuksen ollessa aktiivinen. SD Services
ePouta Korkeakoulun sisäverkkoon kytkettävä ratkaisu, joka tarjoaa mahdollisuuden käyttää virtuaalikoneita ja tallennustilaa arkaluonteiselle datalle. Infrastructure-as-a-service -tyyppinen tallennus- ja käsittely/laskentaympäristö. ePouta

Oppaasta

Tämä opas sisältää Turun AMK:n ohjeet aineistonhallinnasta.

Oppaan sisältö on päivitetty kokonaisuudessaan syksyllä 2024.

Oppaan käyttöoikeudet

   Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. Ei koske kuvia tai videoita, ellei erikseen mainittu.