Siirry pääsisältöön

Aineistonhallinnan opas: Aineiston säilyttäminen

Miten aineistoa kannattaa säilyttää?

Aineiston säilyttämisessä ja sen suunnittelussa on tärkeä huomioida seuraavat näkökulmat:

  • Mihin aineistoa tallennetaan ja miten sitä käsitellään?
  • Käyttöoikeudet (projektin aikana ja sen jälkeen)
  • Varmuuskopiointi
  • Versiohallinta
  • Nimeämiskäytännöt (datasetin nimi ei voi olla vain dataset)
  • Miten kansiorakenne ja/tai tietokanta rakennetaan?
  • Mitä tallennusformaatteja käytetään?
  • Mikä aineisto pitää tuhota projektin aikana tai sen jälkeen?

Tutkimusaineistoa sisältävät tiedostot tulee nimetä ja järjestää kansioihin niin, että vältetään virheitä ja sekaannuksia aineistojen tulkinnassa ja käytössä. Lisäksi huomioidaan tutkimusaineiston jakamisen helppous eri toimijoiden kesken. Tavoitteena on taata tutkimusaineiston löydettävyys ja käytettävyys tarvittaessa vielä projektin päättymisen jälkeen.

Tietoturvan varmistaminen on oleellinen osa tallentamista. Tietoturvan varmistaminen edellyttää muun muassa organisaation tietoturvaohjeistuksen noudattamista ja erilaisia teknisiä toimenpiteitä, joilla varmistetaan tiedon luotettava säilytys.

Aineistojen organisointi ja nimeäminen

Tiedostojen organisointi ja nimeäminen

Systemaattinen aineistojen organisointi ja dokumentointi helpottavat hankkeen aineistojen löytymistä ja käyttöä hankkeen aikana ja luovat edellytykset aineistojen mahdolliselle jatkokäytölle.

  • Nimeämiskäytännöt on hyvä suunnitella ja sopia jo tutkimusaineiston keruun alkuvaiheessa
  • Nimeämisen tulee olla johdonmukaista ja selkeää
  • Nimien ei tule olla liian pitkiä eikä liian lyhyitä
  • Hyvä tiedostonimi on loogisesti jäsennetty ja se kertoo sisällöstä (esim. projektin/hankkeen nimi, aineiston nimi, tekijä, pvm YYYY-MM-DD, versionumero)
  • Käytä tarvittaessa lyhenteitä. Lyhenteiden merkitys tulee dokumentoida, jotta ne ymmärretään vielä pitkän ajan päästä
  • Vältä erikoismerkkejä, käytä nimissä vain numeroita, kirjaimia, yhdysviivaa tai alaviivaa (-, _)
  • Älä käytä välilyöntejä

Voit varmistaa tiedostonimien ymmärrettävyyden kysymällä kollegalta ymmärtääkö hän pelkän nimen perusteella, mitä tiedosto sisältää.
 

Tiedostomuodon valinta

  • Tiedostomuoto/-formaatti kannattaa valita varhaisessa vaiheessa, jotta vältytään turhilta formaatinmuutoksilta
    • Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, vaan tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio tai äänenlaatu
  • Tiedostomuodon tulisi olla sellainen, jota voi käyttää mahdollisimman pitkään.
  • Yleisiä tiedostoformaatteja, joita useimmat eri ohjelmistot tukevat:

Kansiorakenne projektissa

Hyvin suunniteltu ja selkeästi nimetty kansiorakenne helpottaa tiedon organisointia ja tekee siitä helposti löydettävää. Intuitiivinen rakenne tarjoaa yleiskuvan projektin sisällöstä ja varmistaa, että sekä nykyiset että tulevat projektiryhmän jäsenet ymmärtävät, mitä tietoja on saatavilla.

Jotta kansiorakenne tukee projektin tarpeita parhaalla mahdollisella tavalla, sen suunnittelu tulee aloittaa jo projektin alkuvaiheessa. Johdonmukaisen kansiorakenteen soveltaminen kaikkiin projekteihin parantaa tiedonhallinnan tehokkuutta ja yhtenäisyyttä.

Alla olevista esimerkeistä voit tarvittaessa ottaa mallia ja valita omaan projektiisi sopivat alikansiot. Muista, että voit luoda myös käyttäjäkohtaisia alikansiota yleisten kansioiden lisäksi. Jos sinulla on useampi projekti käynnissä samanaikaisesti, yläkansio kannattaa nimetä projektin nimellä pelkän projekti-sanan sijaan.

Kansiorakenne-esimerkit (ja yksi varoittava)

projekti/
  raakadata/
  dokumentointi/
  prosessoitava_data/
    alikansio_1/
    alikansio_2/
  tuotokset/

project/
  code/                 code needed to go from input files to final results
  data/                 primary data
    raw/                raw data, never edit! 
    meta/
  doc/                  documentation of the study
  intermediate/         output files from intermediate analysis steps
  logs/                 logs from the different analysis steps
  notebooks/            notebooks that document your day-to-day work
  results/              output from workflows and analyses
    figures/
    reports/
    tables/
  scratch/              temporary files that can safely be deleted
  README.txt            file and folder description 

Varoittava esimerkki

Lähde: Story told in file names, PHD Comics, Copyright Jorge Cham.

Tutkimusaineiston tietoturvallinen tallentaminen, avaaminen ja jakaminen

Tutkimusaineiston tallentamiseen, avaamiseen ja jakamiseen on tarjolla erilaisia vaihtoehtoja. Näistä osa on Turun ammattikorkeakoulun ylläpitämiä ja tukemia palveluita, osa taas on Turun ammattikorkeakoulun suosittelemia palveluita, joiden ylläpidosta ja tuesta vastaa CSC.

Sopivan palvelun valintaan vaikuttavat esim. millaista aineistoa tallennetaan, paljonko sitä on ja keiden pitää voida käsitellä sitä. Alla olevilla välilehdillä näet, mitä tutkimusaineistoille tarkoitettuja tallennusratkaisuja on tarjolla Turun AMK:n henkilökunnalle. Osa palveluista on Turun AMK:n hankkimia ja osan tarjoaa CSC kaikille korkeakoulutoimijoille.

Tietoturva

Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluonteisesta aineistosta. Tietoturvan varmistamiseen kuuluu aineiston tahattoman tai tahallisen tuhoutumisen, vahingoittumisen, muuttumisen tai varastamisen estäminen sekä pääsy- ja käyttöoikeuksien hallinta.

Varmuuskopiointi on osa tietoturvaa, aineistosta kannattaa säilyttää useampi kuin yksi kopio, jotta et menetä kaikkea työtä, jos käsittelemäsi tiedosto tuhoutuu tahattomasti tai tahallisesti.

Lisätietoa: Tietoarkisto, Aineistonhallinnan käsikirja - Fyysinen säilytys - Tietoturva

CSC:n palvelut korkeakouluille

CSC tarjoaa kattavasti erilaisia digitaalisia ratkaisuja korkeakouluissa tehtävän tutkimus-, kehitys- ja opetustyön tueksi. Palveluiden käyttämiseksi pitää rekisteröityä My CSC -palveluun HAKA-tunnuksilla. Kun olet rekisteröitynyt palveluun, voit luoda projektin, jolle haet oikeuksia sopivien CSC:n tarjoamien digitaalisten ratkaisujen käyttöön. Voit tutustua tarkemmin My CSC -palvelun käyttöönottoon lukemalla CSC:n tarjoamat ohjeet. Sopivan digitaalisen ratkaisun valintaan ja käyttöönottoon liittyvissä kysymyksissä voit olla yhteydessä Turun AMK:n datatukeen datasupport (at) turkuamk.fi. Lisäksi CSC tarjoaa tukea palveluihinsa liittyvissä kysymyksissä osoitteessa servicedesk (at) csc.fi.

CSC tarjoaa ratkaisuja eri käyttötarkoituksiin eri tyyppisille aineistoille. Kaikki CSC:n palvelut soveltuvat henkilötietojen käsittelyyn, mutta arkaluonteisia henkilötietoja voi käsitellä vain arkaluonteisen datan käsittelyyn tarkoitetuissa palveluissa. CSC:n tallennuspalvelut löytyvät alta välilehdiltä CSC:n aineistopalvelut ja CSC:n palvelut arkaluonteiselle aineistolle.

Eri tallennusratkaisuja

Alla oleville välilehdille on taulukoitu keskeisimpiä tutkimusaineiston tallennuspaikkoja eri käyttötarkoituksia varten. Palvelut on jaoteltu omiin taulukoihin sen mukaan, voiko niissä käsitellä arkaluonteisia henkilötietoja tai arkaluonteista/sensitiivistä aineistoa.

Turun AMK:n tallennusratkaisut henkilökunnalle Käyttötarkoitus Jakaminen Varmuuskopiointi Versionhallinta
Home (Z) Henkilökohtainen tallennustila, joka on käytettävissä vain Turun AMK:n verkossa Ei Kyllä Ei
Group (R) Tutkimusryhmille ja hankkeille tarkoitettu tallennustila, joka on käytettävissä vain Turun AMK:n verkossa Rajoituksin Kyllä Ei
B2DROP Ensisijaisesti TKI-hankkeissa syntyvien ja käsiteltävien aineistojen säilyttämiseen tarkoitettu, pilvipalvelupohjainen tallennustila. Kirjautuminen Haka-tunnuksilla. Tallennustilaa haetaan lisää ottamalla yhteyttä osoitteeseen 
datasupport (at) turkuamk.fi.
Kyllä Ei Kyllä
Teams Ryhmille tarkoitettu pilvipohjainen tallennustila, joka on ensisijaisesti tarkoitettu ryhmän sisäiseen viestintään ja yhteisten dokumenttien työstämiseen. Kyllä Ei Kyllä
OneDrive Henkilökohtainen tallennustila, joka on ensisijaisesti tarkoitettu dokumenttien tallentamiseen, työstämiseen ja jakamiseen. Kyllä Ei Kyllä
CSC:n tarjoamat ratkaisut aineistojen
avaamiseen, tallentamiseen ja jakamiseen
Käyttötarkoitus Lisätietoa palvelusta
Fairdata IDA Turvallinen tallennuspalvelu erilaisille tutkimusaineistoille, joka soveltuu käytettäväksi TKI-hankkeen ollessa aktiivinen. Palvelu tukee tutkimusaineiston avaamista, sillä avattavaksi tarkoitettu aineisto voidaan jäädyttää ja säilyttää palvelussa hankkeen päätyttyä.  Fairdata IDA
Fairdata Qvain  Työkalu tutkimusaineistojen kuvailemiseen. Palvelussa voi kuvailla IDA-palveluun tallennettua aineistoa, mutta sitä voi käyttää myös muualle tallennettujen aineistojen kuvailemiseen. Kuvaillun tutkimusaineiston metatiedot saadaan näkyviin Fairdata Etsin-palvelussa. Qvain
Fairdata PAS Palvelu tutkimusaineistojen pitkäaikaissäilytykseen kymmenien ja jopa satojen vuosien ajan. Aineiston sopivuus palvelussa säilyttämiseen arvioidaan ennen päätöksen tekemistä pitkäaikaissäilytyksestä. PAS
cPouta Palvelu, jossa voi käyttää virtuaalikoneita, tallennustilaa ja suurteholaskentaa erilaisiin tarpeisiin. Mahdollistaa esimerkiksi palveluiden ja alustojen kehittämisen osana TKI-hankkeita. Infrastructure-as-a-service -tyyppinen tallennus- ja käsittely/laskentaympäristö. cPouta
Funet Filesender Selainpohjainen tiedonjakopalvelu, jota voi käyttää jopa satojen gigatavujen suuruisten tiedostojen siirtämiseen. Funet Filesender
CSC:n tarjoamat ratkaisut arkaluonteisen datan
tallentamiseen ja jakamiseen
Käyttötarkoitus Lisätietoa palvelusta
SD Services Tietoturvallinen palvelukokonaisuus arkaluonteisen datan tallentamiseen, jakamiseen ja analysointiin TKI-hankkeen jäsenten kesken. Soveltuu käytettäväksi tutkimuksen ollessa aktiivinen. SD Services
ePouta Korkeakoulun sisäverkkoon kytkettävä ratkaisu, joka tarjoaa mahdollisuuden käyttää virtuaalikoneita ja tallennustilaa arkaluonteiselle datalle. Infrastructure-as-a-service -tyyppinen tallennus- ja käsittely/laskentaympäristö. ePouta

Oppaasta

Tässä oppaassa on Turun AMK:n ohjeet aineistonhallinnasta.

Opas on päivitetty syksyllä 2024.

Oppaan käyttöoikeudet

   Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. Ei koske kuvia tai videoita, ellei erikseen mainittu.