Siirry pääsisältöön

Aineistonhallinnan opas: Aineiston säilyttäminen

Miten aineistoa kannattaa säilyttää?

Huomioi aineiston säilyttämisessä ja sen suunnittelussa seuraavat näkökulmat:

  • Mihin tallennat aineiston ja miten käsittelet sitä
  • Käyttöoikeudet (projektin aikana ja sen jälkeen)
  • Varmuuskopiointi
  • Versiohallinta
  • Nimeämiskäytännöt (datasetin nimi ei voi olla vain dataset)
    • Nimeä tiedostot niin, ettei niiden tulkinnassa synny virheitä tai sekaannuksia
  • Miten rakennat kansiorakenteen ja/tai tietokannan
    • Järjestä tiedostot selkeästi nimettyihin kansioihin, ettei niiden tulkinnassa synny virheitä tai sekaannuksia
  • Mitä tallennusformaatteja käytät
    • Käytä yleisiä tallennusformaatteja, joiden avaamiseen ei tarvita jotain tiettyä ohjelmaa, kuten Office-työkaluja
  • Mikä aineisto tai sen osa pitää tuhota projektin aikana tai sen jälkeen

Lisäksi kannattaa varmistaa, että tutkimusaineiston jakaminen eri toimijoiden kesken on mahdollisimman helppoa. Tavoitteena on taata tutkimusaineiston löydettävyys ja käytettävyys tarvittaessa vielä projektin päättymisen jälkeen.

Tietoturvan varmistaminen on oleellinen osa tallentamista. Tietoturvan varmistaminen edellyttää muun muassa organisaation tietoturvaohjeistuksen noudattamista ja erilaisia teknisiä toimenpiteitä, joilla varmistat tiedon luotettavan säilytyksen.

Aineistojen organisointi ja nimeäminen

Tiedostojen organisointi ja nimeäminen

Järjestelmällinen aineistojen organisointi ja dokumentointi helpottavat hankkeen aineistojen löytymistä ja käyttöä hankkeen aikana ja luovat edellytykset aineistojen mahdolliselle jatkokäytölle.

  • Suunnittele ja sovi nimeämiskäytännöt muiden kanssa jo ennen tutkimusaineiston kokoamista.
  • Nimeä tiedostot johdonmukaisesti ja selkeästi.
  • Nimet eivät saa olla liian pitkiä eikä liian lyhyitä.
  • Hyvä tiedostonimi on loogisesti jäsennetty ja se kertoo sisällöstä (esim. projektin/hankkeen nimi, aineiston nimi, tekijä, pvm YYYY-MM-DD, versionumero).
  • Käytä tarvittaessa lyhenteitä. Lyhenteiden merkitys tulee dokumentoida, jotta tiedät mitä ne tarkoittavat vielä pitkänkin ajan päästä.
  • Vältä erikoismerkkejä, käytä nimissä vain numeroita, kirjaimia, yhdysviivaa tai alaviivaa (-, _).
  • Älä käytä välilyöntejä.

Voit varmistaa tiedostonimien ymmärrettävyyden kysymällä kollegalta ymmärtääkö hän pelkän nimen perusteella, mitä tiedosto sisältää.
 

Tiedostomuodon valinta

  • Tiedostomuoto/-formaatti kannattaa valita varhaisessa vaiheessa, jotta vältyt turhilta formaatinmuutoksilta.
    • Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, vaan tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio tai äänenlaatu.
  • Tiedostomuodon tulisi olla sellainen, jota voi käyttää mahdollisimman pitkään.
  • Yleisiä tiedostoformaatteja, joita useimmat eri ohjelmistot tukevat:

Kansiorakenne projektissa

Hyvin suunniteltu ja selkeästi nimetty kansiorakenne helpottaa tiedon organisointia ja tekee siitä helposti löydettävää. Intuitiivinen rakenne tarjoaa yleiskuvan projektin sisällöstä ja varmistaa, että nykyiset ja tulevat projektiryhmän jäsenet ymmärtävät, mitä tietoja on saatavilla.

Aloita kansiorakenteen suunnittelu jo projektin alkuvaiheessa, jotta kansiorakenne tukee projektin tarpeita parhaalla mahdollisella tavalla. Johdonmukaisen kansiorakenteen käyttö kaikissa projekteissa parantaa tiedonhallinnan tehokkuutta ja yhtenäisyyttä.

Alla olevista esimerkeistä voit tarvittaessa ottaa mallia ja valita omaan projektiisi sopivat alikansiot. Muista, että voit luoda myös käyttäjäkohtaisia alikansiota yleisten kansioiden lisäksi. HUOM: Jos sinulla on useampi projekti käynnissä samanaikaisesti, yläkansio kannattaa nimetä projektin nimellä pelkän projekti-sanan sijaan.

Kansiorakenne-esimerkit (ja yksi varoittava)

projekti/
  raakadata/
  dokumentointi/
  prosessoitava_data/
    alikansio_1/
    alikansio_2/
  tuotokset/

project/
  code/                 code needed to go from input files to final results
  data/                 primary data
    raw/                raw data, never edit! 
    meta/
  doc/                  documentation of the study
  intermediate/         output files from intermediate analysis steps
  logs/                 logs from the different analysis steps
  notebooks/            notebooks that document your day-to-day work
  results/              output from workflows and analyses
    figures/
    reports/
    tables/
  scratch/              temporary files that can safely be deleted
  README.txt            file and folder description 

Varoittava esimerkki

Lähde: Story told in file names, PHD Comics, Copyright Jorge Cham.

Tutkimusaineiston tietoturvallinen tallentaminen, avaaminen ja jakaminen

Tutkimusaineiston tallentamiseen, avaamiseen ja jakamiseen on tarjolla erilaisia vaihtoehtoja Turun ammattikorkeakoulun henkilökunnalle. Näistä osa on Turun AMK:n ylläpitämiä ja tukemia palveluita, osa taas on Turun AMK:n suosittelemia palveluita, joiden ylläpidosta ja tuesta vastaa CSC.

Kun valitset sopivaa palvelua, mieti esimerkiksi millaista aineistoa tallennat, paljonko sitä on ja keiden pitää voida käsitellä sitä.

Tietoturva

Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluonteisesta aineistosta. Tietoturva on varmistettu, kun toimillasi estät aineiston tahattoman tai tahallisen tuhoutumisen, vahingoittumisen, muuttumisen tai varastamisen sekä hallinnoit pääsy- ja käyttöoikeuksia.

Varmuuskopiointi on osa tietoturvaa. Säilytä useampi kuin yksi kopio aineistosta eri paikoissa, jotta et menetä kaikkea työtä, jos käsittelemäsi tiedosto tuhoutuu tahattomasti tai tahallisesti.

Lisätietoa: Tietoarkisto, Aineistonhallinnan käsikirja - Fyysinen säilytys - Tietoturva

CSC:n palvelut korkeakouluille

CSC tarjoaa kattavasti erilaisia digitaalisia ratkaisuja korkeakouluissa tehtävän tutkimus-, kehitys- ja opetustyön tueksi. Palveluiden käyttämiseksi pitää rekisteröityä My CSC -palveluun HAKA-tunnuksilla. Kun olet rekisteröitynyt palveluun, voit luoda projektin, jolle haet oikeuksia sopivien CSC:n tarjoamien digitaalisten ratkaisujen käyttöön. Voit tutustua tarkemmin My CSC -palvelun käyttöönottoon lukemalla CSC:n tarjoamat ohjeet.

CSC tarjoaa ratkaisuja eri käyttötarkoituksiin eri tyyppisille aineistoille. Kaikki CSC:n palvelut soveltuvat henkilötietojen käsittelyyn, mutta arkaluonteisia henkilötietoja voi käsitellä vain arkaluonteisen datan käsittelyyn tarkoitetuissa palveluissa. CSC:n tallennuspalvelut löytyvät alta välilehdiltä CSC:n aineistopalvelut ja CSC:n palvelut arkaluonteiselle aineistolle.

Sopivan digitaalisen ratkaisun valintaan ja käyttöönottoon liittyvissä kysymyksissä voit olla yhteydessä Turun AMK:n datatukeen datasupport@turkuamk.fi. Lisäksi CSC tarjoaa tukea palveluihinsa liittyvissä kysymyksissä osoitteessa servicedesk@csc.fi.

Eri tallennusratkaisuja

Alla oleville välilehdille on taulukoitu keskeisimpiä tutkimusaineiston tallennuspaikkoja eri käyttötarkoituksia varten. Palvelut on jaoteltu omiin taulukoihin sen mukaan, voiko niissä käsitellä arkaluonteisia henkilötietoja tai arkaluonteista/sensitiivistä aineistoa. Osa palveluista on Turun AMK:n hankkimia ja osan tarjoaa CSC kaikille korkeakoulutoimijoille.

Turun AMK:n tallennustilapalveluja henkilökunnalle Käyttötarkoitus Jakaminen Varmuuskopiointi Versionhallinta
Home (Z) Henkilökohtainen tallennustila, joka on käytettävissä vain Turun AMK:n verkossa Ei Kyllä Ei
Group (R) Tutkimusryhmille ja hankkeille tarkoitettu tallennustila, joka on käytettävissä vain Turun AMK:n verkossa Rajoituksin Kyllä Ei
B2DROP Ensisijaisesti TKI-hankkeissa syntyvien ja käsiteltävien aineistojen säilyttämiseen tarkoitettu, pilvipalvelupohjainen tallennustila. Kirjautuminen Haka-tunnuksilla. Tallennustilaa haetaan lisää ottamalla yhteyttä osoitteeseen 
datasupport (at) turkuamk.fi.
Kyllä Ei Kyllä
Teams (Sharepoint) Ryhmille tarkoitettu pilvipohjainen tallennustila, joka on ensisijaisesti tarkoitettu ryhmän sisäiseen viestintään ja yhteisten dokumenttien työstämiseen. Kyllä Ei Kyllä
OneDrive Henkilökohtainen tallennustila, joka on ensisijaisesti tarkoitettu dokumenttien tallentamiseen, työstämiseen ja jakamiseen. Kyllä Ei Kyllä
CSC:n palveluja aineistojen
avaamiseen, tallentamiseen ja jakamiseen
Käyttötarkoitus Lisätietoa palvelusta
Fairdata IDA Yleisluonteinen säilytyspalvelu erilaisille tutkimusaineistoille. Palvelu tukee tutkimusaineiston avaamista, mutta myös suljettu tutkimusaineisto voidaan säilyttää palvelussa hankkeen päätyttyä.  Fairdata IDA
Fairdata Qvain  Työkalu tutkimusaineistojen kuvailemiseen. Palvelussa voi kuvailla IDA-palveluun tallennettua aineistoa, mutta sitä voi käyttää myös muualle tallennettujen aineistojen kuvailemiseen. Kuvaillun tutkimusaineiston metatiedot saadaan näkyviin Fairdata Etsin-palvelussa. Qvain
Fairdata PAS Palvelu tutkimusaineistojen pitkäaikaissäilytykseen kymmenien ja jopa satojen vuosien ajan. Aineiston sopivuus palvelussa säilyttämiseen arvioidaan ennen päätöksen tekemistä pitkäaikaissäilytyksestä. PAS
cPouta Palvelu, jossa voi käyttää virtuaalikoneita, tallennustilaa ja suurteholaskentaa erilaisiin tarpeisiin. Mahdollistaa esimerkiksi palveluiden ja alustojen kehittämisen osana TKI-hankkeita. Infrastructure-as-a-service -tyyppinen tallennus- ja käsittely/laskentaympäristö. cPouta
Funet Filesender Selainpohjainen tiedonjakopalvelu, jota voi käyttää jopa 300 gigatavun suuruisten tiedostojen siirtämiseen. Funet Filesender
CSC:n palveluja arkaluonteisen datan
tallentamiseen ja jakamiseen
Käyttötarkoitus Lisätietoa palvelusta
SD Services Tietoturvallinen palvelukokonaisuus arkaluonteisen datan tallentamiseen, jakamiseen ja analysointiin TKI-hankkeen jäsenten kesken. Soveltuu käytettäväksi tutkimuksen ollessa aktiivinen. SD Services
ePouta Ratkaisu, joka voidaan kytkeä korkeakoulun sisäiseen verkkoon, tarjoten projektille mahdollisuuden käyttää virtuaalikoneita ja tallennustilaa arkaluonteisille tiedoille. Infrastructure as a Service -tyyppinen tallennus- ja käsittely-/laskentaympäristö. ePouta

Oppaasta

Tässä oppaassa on Turun AMK:n ohjeet aineistonhallinnasta.

Opas on päivitetty syksyllä 2024.

Tutustu myös näihin oppaisiin

Oppaan käyttöoikeudet

   Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. Ei koske kuvia tai videoita, ellei erikseen mainittu.