Skip to main content

Avoin TKI-toiminta Turun AMK:ssa - aineistonhallinnan opas: Avoimuus TKI-projektin toteutuksessa

Avoimuuden hallinta TKI-projektin toteutusvaiheessa

Projektin aikana kertyy paljon erilaista dataa ja muuta aineistoa. Jos projektissa on mukana useita henkilöitä ja tahoja, aineiston organisointitavoista ja säilyttämisestä on sovittava kaikkien kesken. Aineistojen tallennusohjeet auttavat välttämään virheitä ja sekaannuksia sekä helpottavat aineiston jakamista eri toimijoiden kesken.

Hyvällä aineistojen organisoinnilla varmistat, että

  • aineistot ovat löydettävissä
  • aineistojen sisältö on ymmärrettävissä
  • käyttöoikeudet on määritelty
  • tietosuoja ja tietoturva ovat kunnossa.

Projektin avoimuuden periaatteisiin lukeutuvat myös avointen tutkimusmenetelmien ja avointen ohjelmistojen käyttäminen.

Tietosuoja

Henkilötietojen tietosuojaan kuuluvat ihmisten yksityiselämän suoja ja muut sitä turvaavat oikeudet henkilötietoja käsiteltäessä.

  • Henkilötietoja ei tule kerätä tarpeettomasti ja ne on suojattava asiattomalta käsittelyltä. Henkilötietojen keräämisen tarve ja laajuus tulee miettiä jo TKI-hankkeen valmisteluvaiheessa ja sisällyttää osaksi aineistonhallintasuunnitelmaa.
  • Mikäli tutkimusaineisto sisältää henkilötietoja, tulee sopia erikseen, ketkä ovat oikeutettuja tunnisteellisen aineiston käsittelyyn.

Henkilötietolain 14§:ssä säädetään siitä, miten henkilötietoja voi käyttää tutkimuksessa.

Arkaluonteisen tietoja ovat tiedot, jotka koskevat

  • rotua tai etnistä alkuperää
  • henkilön yhteiskunnallista, poliittista tai uskonnollista vakaumusta tai ammattiliittoon kuulumista
  • rikollista tekoa, rangaistusta tai muuta rikoksen seuraamusta
  • henkilön terveydentilaa, sairautta tai vammaisuutta taikka häneen kohdistettuja hoitotoimenpiteitä tai niihin verrattavia toimia henkilön seksuaalista suuntautumista tai käyttäytymistä
  • henkilön sosiaalihuollon tarvetta tai hänen saamiaan sosiaalihuollon palveluja, tukitoimia ja muita sosiaalihuollon etuuksia.

Arkaluonteista tietoa saa käsitellä vain Henkilötietolain 12 §:ssä määritellyissä tilanteissa, joihin sisältyy mm. sellaisten tietojen käsittely, joihin tutkittava on antanut suostumuksensa.

Tiedonlähteitä:

Tietosuojavaltuutetun toimisto

Henkilötietolaki 523/1999

Liittyykö tutkimukseesi ihmisiä?

Jessica Parland-von Essenin kirjoitus henkilötietojen ja arkaluonteisen tiedon käsittelystä.
Portti-verkkolehti 21.9.2016

Aineiston käsittelyssä ja hallinnassa huomioitavaa

TKI-aineistojen systemaattisessa hallinnassa tulee ottaa huomioon seuraavaa: 

 •Mihin tallennetaan?
•Miten luodaan hyvä kansiorakenne, miten kansiot nimetään?                            
•Miten tiedostot ja niiden eri versiot nimetään?
•Mitä tallennusformaatteja käytetään?
•Miten käyttöoikeudet hallinnoidaan, esim. projektin sisällä                                                  
•Miten varmistetaan tietosuoja?
•Miten varmuuskopiointi hoidetaan?
•Miten tarpeeton aineisto ja väliaikaistiedostot poistetaan?
•Miten TKI-hankkeen / tutkimusprosessin kulku ja työmenetelmät dokumentoidaan / avataan?

Aineistojen keruutapoja

  • Kvantitatiivisia aineistoja voidaan kerätä haastattelemalla, postikyselyinä, verkkokyselyinä, poimimalla tiedot erilaisista lähdedokumenteista tai mittaamalla.
  • Kvalitatiivinen aineisto kuten haastattelut, ryhmähaastattelut ja asiakas- ja asiointitilanteet kerätään yleensä tallentaen ne ääni- tai äänikuvatiedostoiksi. Kirjoitukset kerätään tavallisesti kirjoituspyyntöjen tai -kutsujen avulla sähköpostitse, maapostitse tai tarkoitusta varten luodun verkkosivuston kautta.
  • Virallisista dokumenteista saa nykyisin suuren osan suoraan verkosta, mutta osan dokumenteista saa vain erikseen pyytämällä tai anomalla lupaa niiden tutkimuskäyttöön.
  • Rekisteriaineistojen saaminen edellyttää lupamenettelyä. Ohjeita lupien hakemiseen saa Rekisteritutkimuksen tukikeskuksesta.
  • Tutkija tai projekti voi kerätä ja tallentaa aineiston itse, tai aineisto voidaan tilata joltain tiedonkeruu- tai haastatteluorganisaatiolta. Jos tutkimusprojekti päättää ostaa tiedonkeruun, tarjouspyyntö kannattaa lähettää usealle tiedonkeruuorganisaatiolle. Tarjouspyynnön laatimisessa voi ja kannattaa käyttää apuna tutkimusaineiston aineistonhallintasuunnitelmaa.

Lähde: Tietoarkisto: Aineistonhallinnan käsikirja: Aineistonhallinnan suunnittelu

TKI-prosessin dokumentointi

Projektin hyvällä dokumentoinnilla varmistetaan toistettavuus ja tiedonvälitys esim. projektin uusille työntekijöille.

ATT-hankkeen Datanhallintaoppaassa ohjeistetaan kirjaamaan muistiin:

  • käytetyt instrumentit ja laitteet
  • niiden kalibrointi ja eri muuttujien arvot
  • käytetyt koodit ja ohjelmistot
  • miten aineisto on kerätty
  • miten sitä on käsitelty, kuka ja milloin
  • muut prosessit
  • eri versioiden hallinta
  • laadunvarmistusprosessit

Tieteenalasta riippuen tähän on erilaisia käytäntöjä, joita kannattaa seurata. Datan yhteyteen kannattaa luoda readme.txt-tiedosto, jossa kokonaisuus ja dokumentointi on kuvailtu. Koodia voi tallentaa esimerkiksi sopivaan tietoarkistoon tai GitHubiin, jonne voi Zenodo-palvelun kautta saada DOI-tunnisteen.

TKI-projektin työmenetelmien avaaminen

Avoimessa tieteessä ja tutkimuksessa puhutaan ns. avoimen muistikirjan menetelmästä tai avoimesta tutkimuspäiväkirjasta (Open Notebook Science).  Tällä tarkoitetaan hankkeen aineistonkeruun, mittaustulosten yms. avaamista julkiseen tarkasteluun jo toteuttamisvaiheessa. Tavoitteena on hankkeen läpinäkyvyyden varmistaminen.

Avoimuutta voidaan toteuttaa mm. erilaisilla sosiaalisen median välineillä, kuten blogilla, esimerkki avoimesta tutkimusblogista: http://nmrlipids.blogspot.fi/

Käytännön työkaluina voi käyttää esim. myös web-sivuja. Dokumentteja voi jakaa lisäksi erilaisten pilvipalveluiden kautta.

Avoimia tutkimuspäiväkirjoja Zenodossa

Tiedon tallennusformaatit

Ohjelmistojen ja tiedostoformaattien jatkuva muuttuminen on haasteellista tiedon säilyttämisen näkökulmasta. Tallennusformaattien valintaan tulee kiinnittää huomiota, jotta aineiston käytettävyys säilyisi mahdollisimman pitkään. Kokonaan ohjelmistoriippumattomia tallennusformaatteja ei kuitenkaan ole tarjolla. Tiedon siirtäminen formaatista toiseen ei yleensä onnistu täydellisesti, jotain tietoa saattaa hävitä, esim. tekstin muotoilut, taulukoiden tietosisältö, kuvien resoluutio ja äänenlaatu.

Käytettävyyden varmistamiseksi on suositeltavaa tallentaa yksi tiedostokopio sellaisessa muodossa, joka on mahdollisimman yleisesti käytössä ja jota useimmat eri ohjelmistot tukevat. Tällaisia ovat esimerkiksi:

Teksti: .txt, .odt., .rtf, .csv, PDF/A, .html, .xml
Kuvat: jpeg, tiff
Video: MPEG-4 (.mp4)
Ääni:FLAC

Tietoturva

TKI-aineistojen tietoturva perustuu korkeakoulujen tietohallinnon järjestelmiin ja tietoturvaohjeistuksiin.

Tietoturvan varmistamiseen kuuluu aineiston tuhoutumisen, vahingoittumisen ja muuttumisen tai varastamisen estäminen aineiston käsittelyn ja säilytyksen aikana. Tietoturvaan sisältyy myös pääsy- ja käyttöoikeuksien hallinta.

Tietoturvasta huolehtiminen on tärkeää aina, mutta erityisen tärkeää se on silloin, kun on kyse arkaluontoisesta aineistosta.

Myös varmuuskopiointi on osa tietoturvaa. Säilyvyyden varmistamiseksi aineistot kannattaa tallentaa useaan eri paikkaan tai välineelle. Varsinaiset työ- ja varmuuskopiot on hyvä säilyttää erikseen.

 

 

Avoimet tutkimusmenetelmät

Tutkimusmenetelmiä ovat mallit, ohjelmistot, työvuot ym., joilla tutkimustuloksia tuotetaan. Avoimuuden periaatteiden tulee kattaa myös tutkimusympäristö (tutkimusvälineet, laitteet ja hyödynnetyt palvelut), koska vasta silloin tutkimus on tarpeeksi läpinäkyvää muiden arvioitavaksi ja hyödynnettäväksi. 

Sosiaalinen media tutkimusprosessin avaamisessa