Tutkimusaineistojen hallinta

by Eeva Marjatta Koponen last modified Aug 22, 2019 12:19 PM

Aineistonhallinnan suunnittelu on tärkeä osa tutkimuksen suunnittelua. Sen tarkoituksena on varmistaa, että tutkimusaineistojen suhteen noudatetaan hyvää tieteellistä käytäntöä ja että tutkimusaineisto ei vaarannu missään vaiheessa. Samalla pohditaan, onko aineiston jatkokäyttö mahdollista. Aineistonhallintasuunnitelma auttaa tietosuojaan, tietoturvaan, tekijänoikeuksiin ja aineiston avaamiseen liittyvien kysymysten huomioinnissa. Aineistonhallintasuunnitelma on yhä useammin myös tutkimusrahoituksen ehto.

Tutkimusaineistojen hallintaSisältö
DMP Tuuli DMP Tuulissa luot oman aineistonhallintasuunnitelmasi (DMP = data management plan). Kansalliset ohjeet aineistonhallinnan suunnitteluun löydät täältä.
Tutkimusaineistojen hallinnan käsikirja Yhteiskuntatieteellisen tietoarkiston kokoamat ohjeet asioista, joihin aineistonhallintasuunnitelmassa tulisi vastata.

Kun käytät valmiita tutkimusaineistoja

Katso Kirjastotuutorin Tutkimusmenetelmät ja tutkimusaineistot -sivun lopusta, mistä löydät näitä!

[Teksti tulossa]

Kun keräät oman tutkimusaineiston

Varaa riittävästi aikaa aineistonhallintasuunnitelmasi huolelliseen tekemiseen ennen aineiston keruuta. Mitään oikotietä tai ”yksinkertaistettua proseduuria” ei valitettavasti ole olemassa.

Aineistonhallintasuunnitelmassa kerrot

 • aineistostasi yleisesti
 • miten varmistat eettisten periaatteiden ja lainsäädännön noudattamisen
 • miten dokumentoit ja kuvailet (metatiedot) aineistosi
 • mihin tallennat ja varmuuskopioit aineistosi tutkimushankkeen aikana
 • aineiston avaamisesta, julkaisemisesta ja arkistoinnista tutkimushankkeen päätyttyä

Tuntuuko hankalalta? Opettele tekemään yliopiston suosituksen mukainen (lähde!) aineistonhallintasuunnitelma ohjatusti mm. opiskelijatovereidesi videoiden avulla LIB1DATA Aineistonhallinnan perusteet -verkkkokurssilla.

[Tekstiä tulossa]


Tietosuoja-asetus

EU:n tietosuoja-asetusta (GDPR) alettiin soveltaa 25.5.2018 lähtien. Tietosuoja-asetusta täydennetään kansallisella lailla. Tietosuoja-asetusta sovelletaan lähtökohtaisesti aina, kun käsitellään henkilötietoja. Henkilötietoja sisältävä aineisto voi olla esimerkiksi haastattelu- tai kyselyaineisto, jonka olet koonnut opinnäytettäsi varten.

Tietosuojan ensisijainen tarkoitus on suojella tutkittavia. Kun noudatat tietosuoja-asetusta ja siihen liittyviä lakeja, varmistat tutkittavien oikeuksien toteutumisen lisäksi oman oikeusturvasi.

Koska tutkimusdataan sisältyy usein erilaisia henkilötietoja ja henkilötunnisteita, tutkimusdatan keräämisessä, säilyttämisessä ja käytössä tulee noudattaa tiettyjä sääntöjä. Opiskele henkilötietojen käsittelyyn ja tietosuojaan liittyvät asiat Moodlesta Henkilötietojen käsittely tieteellisessä tutkimuksessa -kurssilla. Lisäksi lue opiskelijoille suunnattu ohje. Lisätietoa löydät Aineistonhallinnan käsikirjasta


Jos käsittelet henkilötietoja

Tarkista, onko saatavilla valmiita tutkimusaineistoja esimerkiksi Tietoarkiston tai Kielipankin kautta.

Jos keräät tutkimusaineiston itse, sinun tulee huomioida tietosuoja, tekijänoikeus, tietoturva sekä some-aineistojen osalta palveluiden käyttöehdot. Selvitä yhdessä ohjaajasi kanssa ennen aineistonkeruun aloittamista aineiston tutkimusluvat, henkilötietojen käsittelyyn liittyvät toimenpiteet ja toimenpiteiden dokumentointi.

Sisältääkö tutkimusaineistosi henkilötietoja? Mieti, onko aineisto mahdollista kerätä ilman minkäänlaista henkilötietojen käsittelyä: onko tarpeen kysyä esimerkiksi vastaajan ikää tai koulutustaustaa? Huomaa kuitenkin, että monessa tapauksessa itse kyselyn sisältöön liittyy henkilötietoja, esimerkiksi jos tutkimuksen aihe liittyy tutkittavan terveyteen tai uskomuksiin. Huomaa myös, että jos lähetät kyselyn postitse, tulet automaattisesti käsitelleeksi henkilötietoja (nimet, osoitteet).

Muista, että henkilötietoja sisältäviä tutkimusaineistoja on lupa tallentaa ainoastaan yliopiston suojatulle U-asemalle!


Kun käsittelet henkilötietoja:

1. Tee aineistonhallintasuunnitelma.

2. Tietosuojailmoitus eli tutkittavan informointi tehdään aina. Tietosuojailmoitus lähetetään tutkittaville sekä yliopiston tietosuojavastaavalle Riikka Valkoselle. Riskiarvio on osa tietosuojailmoitusta ja se kannattaa tehdä mahdollisimman aikaisessa vaiheessa. Lue lisää riskiarviosta.

3. Tutkimuksen alkuvaiheessa selvität tutkimusaineistolle tarvittavat luvat ja suostumukset (lisää alempana). Lupien kysyminen on osa tietosuojailmoitusta.

  • mitä tietoja olet keräämässä,
  • mihin tarkoitukseen keräät kyseisiä tietoja,
  • mitä mahdollista jatkokäyttöä kerätyillä tiedoilla on, käytätpä niitä itse toisessa julkaisussasi tai jos tallennat kerätyt aineistot johonkin arkistoon muiden tutkijoiden käytettäviksi.

4. Saatat tarvita eettisen ennakkoarvioinnin ihmistieteellisessä tutkimuksessa tutkittaville mahdollisesti koituvien haittojen tai riskien osalta:

Henkilötiedon määritelmä

 • EU:n tietosuoja-asetuksessa henkilötiedoksi määritellään ”kaikki tunnistettuun tai tunnistettavissa olevaan luonnolliseen henkilöön liittyvät tiedot (esimerkiksi nimi, henkilötunnus, kuva, biometrinen tai geneettinen tieto)". Esimerkiksi haastateltavan ääni on henkilötieto.
 • Tietoarkiston tietosuoja-asetusta vastaamaan päivitetyt henkilötietojen tunnisteellisuutta ja anonymisointia koskevat ohjeet. Anonymisointi on yksi asetuksessa mainittu mahdollisuus avata aineistot jatkokäyttäjille. Huomaa kuitenkin, että aito anonymisointi on haasteellista, sillä se tarkoittaa, että henkilö on peruuttamattomasti tunnistamattomissa. Pseudonymisointi puolestaan tarkoittaa esimerkiksi salanimien käyttämistä, eikä se tarjoa samanlaista suojaa kuin anonymisointi, sillä henkilöt ovat tyypillisesti edelleen välillisesti tunnistettavissa.

Erityiset henkilötietoryhmät

 • EU:n tietosuojalaissa puhutaan "erityisistä henkilötietoryhmistä", esimerkiksi etninen alkuperä, poliittiset mielipiteet, uskonnollinen tai filosofinen vakaumus, terveydentilaan ja seksuaalisuuteen liittyvät tiedot. Käytännössä kaikki henkilöt kuuluvat johonkin erityiseen henkilötietoryhmään.
 • Erillisten henkilötietojen käsittely edellyttää nimenomaista suostumusta tutkittavilta.
 • Tarvittaessa tee vaikutustenarviointi (DPIA) ennen tietojen käsittelyn aloittamista (ml. kerääminen).

Rekisterinpitäjä

 • Rekisterinpitäjä on yleensä tutkimuksen tekijä (myös opinnäytteiden tapauksessa). Rekisterinpitäjä vastaa muun muassa tietojen käyttötarkoitussidonnaisuudesta, minimoinnista ja oikeasuhtaisuudesta.

Tieteellisen tutkimuksen suostumukset ja luvat (Käsittelyperuste)

"Henkilötietojen käsittely tarkoittaa esimerkiksi henkilötietojen keräämistä, säilyttämistä, käyttöä, siirtämistä ja luovuttamista. Kaikki henkilötietoihin kohdistuvat toimenpiteet henkilötietojen käsittelyn suunnittelusta henkilötietojen poistamiseen ovat henkilötietojen käsittelyä." Tietosuoja.fi.

 • Käsittelyperuste: henkilötietoja ei saa käsitellä ilman laillista käsittelyperustetta. Mikä antaa sinulle luvan käsitellä henkilötietoja? Lähtökohtia:
  1. Esimerkiksi tutkittavan antama suostumus on käsittelyperuste – huomaa, että suostumuksen on oltava vapaaehtoinen, yksilöity, tietoinen ja yksiselitteinen tahdonilmaisu. Suostumus on peruttavissa milloin tahansa tutkimuksen aikana.
  2. Toinen esimerkki käsittelyperusteesta on henkilötietojen käsittely tieteellisen tai historiallisen tutkimuksen tai tilastoinnin tarkoituksia varten. Tällöin tulee tehdä vaikutustenarviointi. Huomaa, että tällöin on oltava erityisen hyvin perillä tutkittavien oikeuksista (esim. tutkittavia pitää joka tapauksessa informoida, mikäli suinkin mahdollista) ja oma toiminta on dokumentoitava huolellisesti.
  3. Erityisiä henkilötietoja käsiteltäessä pitää vedota sopivaan poikkeusperiaatteeseen.
 • Käsittelytarkoitus: mihin henkilötietoja käytetään? Henkilötiedot on minimoitava niin, että käsitellään vain oikeasti tarpeellisia henkilötietoja. Henkilötietojen käsittely on luvallista vain asianmukaista tarkoitusta varten.


Tutkimusasetelmaan ja -menetelmiin liittyvät asiat

 • Tutkimusasetelmaa ja tutkimusmenetelmiä miettiessäsi ota huomioon tutkimusaineistojen käyttöoikeudet ja tietosuoja: miten esität tutkimuskysymyksesi, millä menetelmällä keräät aineistosi? Esimerkiksi tutkittaville esitettävien kysymysten tulee olla käsittelytarkoituksen mukaiset (ei kysytä sellaista, mitä ei ole tarpeellista tietää).


Sosiaalisen median aineistot 

 • Yhtä yleistä ohjetta ei voida antaa.
 • Tarkista aina uusin versio tuottajan käyttöehdoista, esim. Facebookin osalta hankala ja jatkuvasti muuttuva tilanne.
 • Lisäksi pyydä aina esimerkiksi Facebookin tai keskustelupalstojen sisältöä tuottavien henkilöiden lupa heidän kirjoitustensa käyttämiseen tutkimustarkoituksiisi. Huomaa, että nimimerkin käyttäminen ei tarkoita, että keskustelupalstan sisältöä voisi käyttää ilman keskustelijoiden lupaa. Saatat syyllistyä tietosuojarikkomukseen, mikäli keräät tunnisteellisia tai välillisesti tunnistettavia henkilötietoja ihmisen sitä tietämättä.
 • Esimerkiksi Suomi24-keskustelupalstan kirjoitukset ovat laillisesti saatavilla Kielipankin kautta.

Huomaa, että vaikka saisit luvan analysoida jotain some-aineistoa, some-palvelun käyttöehdot saattavat kieltää aineiston tallentamisen ja arkistoinnin. Tällöin aineistosi on hyvin haavoittuvainen: aineisto tai yksittäinen puheenvuoro saatetaan poistaa palvelusta. Uhkana on siis aineiston eheyden ja luotettavuuden vaarantuminen tai koko aineiston menettäminen. Yksi tieteellisen tutkimuksen määritelmistä liittyy toistettavuuteen: tieteellisen tutkimuksen pitää olla toistettavissa, eikä se onnistu, jos aineistoa ei enää ole olemassa.


Mikä on julkista?

 • Sitaattioikeus pätee kaikkeen, mikä on julkista. Käytännössä tämä tarkoittaa, että voit ottaa suoran lainauksen esimerkiksi Twitter-viestistä. Tällöin mainitaan tekijä samalla tavalla kuin tekstisitaatissa.
 • Kaikki internetiin tuotettu materiaali ei ole julkista. Rajan vetäminen on vaikeaa ja tapauskohtaista.
 • Facebookin ja Instagramin osalta määrittely on erityisen haastavaa usein muuttuvien palvelun käyttöehtojen vuoksi.


Tutkimusaineistojen hallinnan periaatteet

Tutkimusaineistolla tarkoitetaan laajasti kaikkea, mitä syntyy tutkimusprosessin aikana. Tutkimusdataa on kaikki se informaatio, jota tarvittaisiin, jos tutkimus haluttaisiin toistaa, ja jota voidaan hyödyntää myöhemmässä tutkimuksessa (Sarah Jones, DCC).

Tee DMP Tuulin aineistonhallintasuunnitelma, niin näet, mitä kaikkea aineistonhallintaan liittyy! Aineistonhallintasuunnitelma auttaa tietosuojan toteuttamisessa. Zenodosta löydät aineistonhallintasuunnitelman kysymykset suomeksi: katso täältä.

Kuvaa aineistonhallintasuunnitelmassa ainakin
 • Mitä aineistoa aiot kerätä?
 • Miten aiot aineiston kerätä?
 • Miten tutkittavia informoidaan?
 • Miten turvataan tietosuoja?
 • Mitä ohjelmistoja käytetään aineiston käsittelyyn?
 • Miten aineiston käsittely dokumentoidaan?
 • Missä aineistoa säilytetään?
 • Mitä aineistolle tapahtuu tutkimuksen päätyttyä?

Tutkimusaineistojen elinkaari:

 •  Aineistojen tutkimus- ja käyttölupien lisäksi varmista ohjaajaltasi tutkimusaineistollesi tietoturvallinen säilytyspaikka.
  • Esimerkiksi pilvipalvelut eivät ole turvallisia, jos käytät tunnisteellisia tai välillisesti tunnisteellisia henkilötietoja.
  • Muista, että henkilötietoja sisältäviä tutkimusaineistoja on lupa tallentaa ainoastaan yliopiston suojatulle U-asemalle!
  • Aineiston siirtäminen kannattaa tehdä suojatussa verkossa, esimerkiksi VPN-yhteydellä. USB-tikulla siirtämistä tulee välttää.
  • Haastatteluiden tekemistä omalla puhelimella tulee välttää (tallentavat sisältöä usein automaattisesti pilvipalveluun). Käytä oikeaa nauhuria.


Jos teet tutkimusta ryhmässä tai hankkeessa:

 • Selvitä omat oikeutesi ja velvollisuutesi esimerkiksi tutkimusaineistojen käytön suhteen (esim. jos opiskelija tekee opinnäytteen yritykselle, onko opiskelijalle oikeus jatkokäyttää aineistoa?)
 • Huomioi myös julkaisueettiset periaatteet. Nekin määrittävät ryhmäläisten oikeuksia, esimerkkinä nimien kirjoitusjärjestys.

 

Filed under: