Siirry pääsisältöön

Aineistonhallinnan opas: Aineiston käsittely

Mitä aineiston käsittelyllä tarkoitetaan?

Aineiston käsittely kattaa aineiston keräämisen ja analysoinnin. Tutkimuksen elinkaaren näkökulmasta aineiston käsittely tapahtuu pääasiassa tutkimuksen toteutusvaiheessa. Aineistoa voi joutua käsittelemään myös tutkimuksen päättymisen jälkeen, jos aineistoa esimerkiksi tarvitaan jatkotutkimuksessa.

Tutkimusmenetelmiä tarvitaan tutkimuksen toteuttamisessa ja tulosten aikaansaamisessa. Tutkimuksen toteutusvaiheen aikana on tavanomaista käyttää useita eri tutkimusmenetelmiä, esimerkiksi yksittäistä menetelmää aineiston keräämiseksi ja toista aineiston analysointiin.

Aineistonhallinta projektin toteutusvaiheessa

Tutkimuksen toteutusvaiheessa on hyvä pohtia, miten tutkimuksen kulku ja käytetyt tutkimusmenetelmät dokumentoidaan ja miten ne voitaisiin mahdollisesti jakaa avoimesti. Hyvällä dokumentoinnilla varmistetaan tutkimuksen laadukas toteutus, mikä helpottaa tulosten raportointia ja tiedonvälitystä myös tutkimuksen aikana esimerkiksi hankkeen uusille työntekijöille.

Tutkimuksen päätyttyä voi ilmetä tarve aineiston uudelleenkäytölle esimerkiksi hankevalmistelussa ja jatkotutkimuksen toteuttamisessa. Dokumentointi on edellytys uudelleenkäytölle. Erityisen arvokasta dokumentointi on silloin, jos tutkimustulokset pyritään varmistamaan toistamalla tutkimuksessa tehdyt kokeet.

Dokumentointi kannattaa tehdä muistiinpanojen, valokuvien yms. avulla ja tallentaa esimerkiksi seuraavat asiat:

  • Käytetyt instrumentit ja laitteet
  • Laitteiden kalibrointi ja eri muuttujien arvot
  • Käytetyt koodit ja ohjelmistot
  • Miten ja milloin aineisto on kerätty
  • Miten aineistoa on käsitelty, kuka ja milloin
  • Eri versioiden hallinta
  • Laadunvarmistusprosessit

Dokumentoinnissa kannattaa seurata oman tieteenalan käytäntöjä. Tutkimusaineiston yhteyteen voi luoda README-tiedoston, jossa kuvataan aineistokokonaisuus ja sen dokumentointi.

Readme-tiedostot

Tutkimusaineiston mukana tulee aina olla sen sisältöä kuvaava ja dokumentoiva README-tiedosto. Siinä kuvaillaan lyhyesti aineiston yleiset kuvailutiedot, joista voit myöhemmin muodostaa aineiston metatiedot. Readme-tiedosto kannattaa rakentaa niin, että se etenee loogisesti eikä sen sisällön ymmärtämiseen tarvitse tietää alasta tai projektista mitään muuta.

Alla on kaksi esimerkkitiedostoa, joista voit katsoa mallia projektikohtaisen ja aineistokohtaisen README-tiedoston tekoon.

PROJECT INFORMATION
  Study/project title*:

  Description*: <provide a short description of the study/project>

  Project period:

  Project funder:
  
Funding decision:
  Organisations:

  Principle Investigator*:

  Storage period*: <provide the end of the project data storage period>

  Link to data management plan:

FILES & FOLDERS
  Folder structure: <default: Code, Data, Doc, Temp. Add user folders if necessary>

  File naming conventions: <i.e. YYYYMMDD_datasetname_vX.X_revXX>

  File formats: <provide a list of all file formats present in this project>

THIS README FILE
  Date: <YYYY-MM-DD>

  Created by: <name>

GENERAL INFORMATION
  Dataset title*:

  Description*: <provide description of the dataset, steps used, content and purpose>
  
Licence and access*:
  Publication date*:

  Key words*:

  Authors*: <name and ORCID>

  Publisher*: <person or organization>

  Storage period*: <provide the end of the research data storage period>

  Persistent identifier: <if any>

FILES & FOLDERS
  Folder structure: <default: Code, Data, Doc, Scratch. Add user folders if necessary>

  File naming conventions: <i.e. YYYYMMDD_datasetname_vX.X_revXX>
  
File formats: <provide a list of file formats present in this dataset>

DATA COLLECTION
  Institutional catalog ID (if applicable):

  Date of data collection: <provide single date, range, or approximate date: <YYYY-MM-DD>

  Link to electronic lab book (codebook) where the following is described:

    Methods used for data collection (including references, documentation, links):
    
Geographic location of collection (if applicable):
    Experimental & environmental conditions of collection (if applicable):

    Standards and calibration for data collection (if applicable):

    Uncertainty, precision and accuracy of measurements (if applicable):

    Known problems & caveats (sampling, blanks, etc.):

    Codes or symbols used to record missing data with description (if applicable):
    Link to data dictionary
(if applicable):

THIS README FILE
  Date: <YYYY-MM-DD>

  Creator: <NAME>

Mitä tutkimusmenetelmien avaaminen tarkoittaa?

Tutkimusmenetelmien avaamisella pyritään lisäämään tutkimuksen laatua, läpinäkyvyyttä ja vaikuttavuutta. Tutkimusmenetelmä voi kattaa tutkimuksen eri vaiheet mukaan lukien tutkimusaineiston keräämisen, tutkimusympäristön dokumentoinnin ja tutkimukseen sisältyvän päättelyn. Tutkimusmenetelmä voidaan julkaista esimerkiksi vertaisarvioidulla alustalla.

Useimmiten tutkimusmenetelmien avoimuuteen voidaan soveltaa samoja FAIR-periaatteita kuin tutkimusaineiston avoimuuteen. Tutkimusmenetelmien löydettävyys (Findable), saavutettavuus (Accessible), yhteentoimivuus (Interoperable) ja uudelleenkäytettävyys (Reusable) tukee osaltaan tutkimusaineiston avoimuutta ja käyttöä uudessa tutkimuksessa tai innovaatioprojektissa. Lisäksi tutkimusmenetelmien avoimuutta voidaan tukea esimerkiksi avoimella lisensoinnilla.

Tutkimusmenetelmien avaaminen edellyttää niiden vastuullista hallintaa. Dokumentoinnilla on keskeinen rooli tutkimusmenetelmien vastuullisessa hallinnassa, minkä avulla oleelliset metodologiset vaiheet voidaan jäljittää. Lisäksi on tarpeen kiinnittää huomiota versiointiin ja varmuuskopiointiin.

Mitä ovat avoimet tutkimusinfrastruktuurit?

Tutkimusinfrastruktuurien avoimuus tukee Avoimen tieteen ja tutkimuksen periaatteiden mukaista toimintaa. Tutkimusinfrastruktuuri voi muodostua tutkimuksen kannalta oleellisista laitteista, tietokannoista, aineistoista ja palveluista. Ne mahdollistavat tutkimus-, kehitys- ja innovaatiotyön, joka ei välttämättä rajoitu korkeakoulukentän sisälle, vaan niitä voidaan hyödyntää myös muissa organisaatioissa innovaatioiden synnyttämiseen ja jakamiseen.

Hyödynnä valmiita tutkimusaineistoja

Kaikkea aineistoa ei välttämättä tarvitse kerätä itse. Sopivaa aineistoa voi olla jo tarjolla, esim. rekisteriaineistoja tai erilaisista data-arkistoista saatavilla olevaa avointa dataa, ks. esim. 

Etsin - Tutkimusaineistojen hakupalvelu (CSC)

Aila - Tietoarkiston hakupalvelu

Kansainvälisiä tutkimusaineistoarkistoja

Oppaasta

Tässä oppaassa on Turun AMK:n ohjeet aineistonhallinnasta.

Opas on päivitetty syksyllä 2024.

Lisätietoa tutkimusmenetelmistä ja -infrastruktuureista

FAIR-periaatteet

FAIR-periaatteet on kehitetty laajassa, kansainvälisessä tutkimusyhteistyössä ja ne julkaistiin vuonna 2016. FORCE11-ryhmittymä on osallistunut FAIR-periaatteiden kommentointiin ja jakaa tietoa niiden käyttöönoton tueksi. Niiden noudattamisesta on EU:n neuvoston linjaus ja opetus- ja kulttuuriministeriö on sitoutunut FAIR-periaatteisiin.

Tutkimusaineistojen ja -menetelmien avoimuuden linjaus

Tutkimusaineistojen ja -menetelmien avoimuuden linjaus julkaistaan kahdessa osassa. Ensimmäinen osalinjaus tutkimusdatan avoimesta saatavuudesta julkaistiin 2021 ja toinen osalinjaus tutkimusmenetelmien avoimen saatavuudesta julkaistiin 2023.

Tutkimusinfrastruktuurit

Suomen Akatemian sivusto tutkimusinfrastruktuureista ja niihin liittyvistä rahoitusmahdollisuuksista.

Oppaan käyttöoikeudet

   Tämä teos on lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -lisenssillä. Ei koske kuvia tai videoita, ellei erikseen mainittu.