Foredrag om Big Data og forskningsetikk til møte i De Nasjonale Forskningsetiske Komiteene
Big Data eksplosjon
- Mengden av tilgjengelig data har eksplodert i løpet av de siste årene
 
- Data fra kunder og operasjoner fra internettkoblet enheter (mobile telefoner, GPS, bompasseringer, osv.) er kontinuerlig lagret
 
- «Big Data» betegner fenomenet hvor store datasett er fanget, lagret, aggregert og analysert i alle samfunnssektorer
 
1 zettabytes (ZB) = 1000exabytes (EB) = 1000000petabytes (PB) = 1000000000terabytes (TB) = 1000000000000gigabytes (GB) = 1000000000000000000000B
- Relasjonell eller noSQL(structured query language) data base: Big Table (Google), Cassandra (Facebook), HBase (open source)
 
- Distributed computing: Google File System eller Hadoop (Open source) + MapReduce
 
Big Data og samfunnsforskning
- Big data består ikke bare av store datasett og nye analytiske verktøy men innebærer en computational turn i måten forskningen er drevet på.
 
- Big Data gjør det mulig å analysere med kvantitative metoder flere sosiale objekter (eks: teskt mining)
 
- Big Data i forskning kan føre med seg illusjonen om at forskning er uavhengig av teorier og paradigmer
 
Big Data: Samfunnrisiko
- Big Data utgjør en enorm og rik mengde informasjon som kan analyseres ved hjelp av «data-mining» tekniker.
 
- Mulighet til å avdekke individers og gruppers atferdsmønstre
 
- Teknikker, som kan anvendes for målrettet reklame og markedsføring
 
Data mining av sosiale medier kan true ytringsfrihet og personvern:
- Både regjeringer og private selskaper kan overvåke og analysere kommunikasjon som foregår på sosiale medier
 - Aggregering av data på tvers av ulike brukerkonto (for eks: Google Gmail, Youtube, Chrome, Google+, osv.) øker mulighet til samle omfattende informasjon om en persons liv.
 
Big Data etiske utfordringer 
Personvern:
- Kontroll over personlig informasjon er vanskelig fordi dataene tilgjengelig på weben ikke er kontrollert av en bestemt organisasjon eller er i private regi (Facebook, Google, osv.) og brukeren har gitt fra seg rettighetene sine.Potensiell misbruk av data gjennom aggregering, mining, og salg av data.
 
- Eks: Analyse av metadata assosiert til et bilde i en sosial dating tjeneste som gir tilgang til personens livshistorie
 
Forskning:
- Hvilken status har «offentlig tilgengelige data» i sosiale medier, som for eksempel Twitter?
 
- Hvilke retningslinjer på hva som definere gode praksiser for forskning med webdata skal anvendes?
 
- I hvilken grad burde individene som blir forskningsobjekter (bloggere, twitterbrukere, osv.) samtykke til brukt av deres offentlig tilgjengelige data i forskning?
 
- Hvordan kan anonymitet garanteres?
 
Data Sift: Eksempel av sosiale medier data kommersialisering
- Bare sosiale medier firma (Facebook, Twitter, Google) har tilgang til store sosiale data som de fleste forskere ikke har tilgang til
 
- Forskerne i disse firmaene kan produsere forskning som resten av forskerne ikke kan…og denne typen forskning ikke la seg reproduseres eller evalueres
 
- Store data firma har ingen plikt eller ansvar til å gjøre sine data tilgjengelig for forsknings fellesskap
 
Konklusjon
- Big data fenomen er bare i startfasen
 
- Big data reiser flere nye etiske utfordringer, ikke minst for forskning
 
- Det er behov for en internasjonal tilnærming når det gjelder bruk av Big data i forskning ... Som garanterer personvern og som likestiller forskningsmiljøer
 



Ingen kommentarer:
Legg inn en kommentar