Big data er en unik dansk mulighed

Vi er midt i en vidensmæssig revolution, og Danmark har unikke muligheder. Omvæltningen hedder big data – gigantiske datamængder, der i dag giver os adgang til typer af information og viden, vi for få år siden ikke drømte om.

Vindmølleproducenten Vestas benytter big data til at beregne, hvor det er bedst at sætte vindmøller op, og hvordan møllerne skal konstrueres. Foto: Henning Bagger. Fold sammen
Læs mere
Foto: Henning Bagger

Vestas har forstået det. Vindmølleproducenten bruger millioner af vind- og vejrdata fra alverdens målestationer til at beregne, hvor det er bedst at sætte vindmøller op, og præcis hvordan de skal konstrueres for at modstå storme og udnytte vindens energi bedst muligt.

Og Coop har forstået det. Supermarkedskæden bruger data fra mere end en million kundekort til at beregne, hvor og hvornår varer sælger bedst til hvilke typer af kunder. De bruger informationerne til at vurdere, hvordan de kan øge salget af baby bleer, vaniljeis og olivenolie.

Big data er, som navnet siger, enorme mængder af data, som man først de senere år er blevet i stand til at indsamle og bearbejde, og for Danmark giver big data en helt særlig mulighed. Kombinationen af enestående danske dataregistre og en befolkning, der er helt fremme i feltet i brugen af internet og sociale medier til informationssøgning, handel, social kommunikation og kontakt med det offentlige, gør os i særlig grad klar til den nye data-drevne udvikling.

Registrene findes i Danmarks Statistik og bruges til hurtigt, billigt og effektivt at lave statistik. De står også til rådighed for forskere, der i mange år har været verdensmestre i registerbaseret forskning. Og så bruges de i stigende grad af ministerier, styrelser og kommuner til at planlægge og følge op på den førte politik.

Men hvad skal der til, for at vi alle kan få glæde af big data, for der er et enormt potentiale – både i forsknings- og forretningsøjemed – i at udnytte den viden, der ligger i de store mænger data. Men det er stadig et mindretal af danske virksomheder, der bruger big data, og samarbejdet mellem forskning og erhvervsliv skal intensiveres, for det er det samarbejde, der er nøglen til at få koblet de enorme private datamængder til de store registerdatabaser.

Fra borger- og forbrugerperspektivet gør den øgede anvendelse af data sikkerheds- og privacy-spørgsmål vigtigere end nogensinde. Den digitale tillid og en fortsat høj grad af datasikkerhed er fundamentet for at kunne udnytte mulighederne, så danske virksomheder, forskere og statistikere kan få glæde af den unikke danske position.

Næste skridt er at udnytte Danmarks særlige muligheder for at blive førende i forskning i og brugen af big data, og det er afgørende at få hul på dialogen om, hvordan forskere og virksomheder kan arbejde sammen samtidig med, at borgernes privatliv beskyttes. Det er baggrunden for den konference, som Københavns Universitets Samfundsvidenskabelige Fakultet, Danmarks Statistik og Dansk Industri holder om big data onsdag 9. september.

Big data kommer fra computerstyret produktion, sensorer, sociale medier, butikkernes kunder, trafik på hjemmesider, til lands, til vands og i luften, GPSer, tekster på internettet, digitale kameraer – fra alt det, mennesker foretager sig, hvor noget digitalt er involveret. En udvikling, der gør det muligt at samle, analysere, sammenligne og udnytte store mængder af data.

Virksomhederne bruger big data til at forstå kundernes ønsker og behov. Statistikbureauer i hele verden prøver kræfter med big data. Den offentlige sektor kan udvikles ved hjælp af big data. Og forskningen er i fuld fart på vej ind i en revolution, der kan løfte vores fælles vidensgrundlag til nye højder.

Silkeborg er en af de danske kommuner, der for alvor har fået øjnene op for potentialet i big data, blandt andet til at skabe en bedre tandpleje. Ved hjælp af BBR-registeret, Gallups livsstilsundersøgelser, sundhedsdata og geodata er kommunen ved at tegne et minutiøst kort over alle husstande ned til 100x100 meter felter. Det giver mulighed for at målrette den forebyggende indsats og placere nye tandlægeklinikker i de områder, hvor flest borgere har dårlige tænder.

Registerdata er et samfundsmæssigt gode, og forskningen skaber viden til samfundet. En vigtig forudsætning for den danske data-revolution er, at Danmark et af de lande i verden, hvor borgerne har størst tillid til hinanden, til virksomheder og til det offentlige.

Data fra de offentlige registre har været brugt til forskning siden slutningen af 1980´erne, og tilliden er grunden til, at forskere kan få adgang til så detaljerede data fra registrene. Der er informationer om borgere og virksomheder, der er enestående i international sammenhæng. Registrene er omfattende og rummer oplysninger om vores sundhed, uddannelsesforløb, arbejdsliv og familieforhold, og borgerne ved, at data opbevares betryggende hos Danmarks Statistik.

Med tilsvarende data fra danske virksomheder kan man følge borgernes indtjening, ansættelser, energiforbrug og forbrugsmønstre. Disse registre kan køres sammen, og det gør Danmark til noget helt særligt. Når forskere og myndigheder får adgang til registerdata, sker det altid i anonymiseret form, så ingen enkeltperson eller virksomhed kan identificeres. Det er en grundforudsætning for at opretholde den digitale tillid.

Det var politisk fremsynethed for op mod 50 år siden, der sørgede for Danmarks særligt gunstige situation. Loven om Danmarks Statistik i 1966 sikrede, at data i de (på det tidspunkt) kommende offentlige registre kunne blive et vigtigt grundlag for produktionen af billig statistik. De kunne erstatte dyre spørgeskemaundersøgelser, og de danske registerdata er blevet en guldgrube for forskere og analytikere – en væsentlig og uforudset sideeffekt.

De danske registerforskere løftede den samfunds- og sundhedsvidenskabelige forskning til et hidtil uset niveau. For eksempel har nobelpristageren i økonomi i 2010, Dale T. Mortensen, i samarbejde med danske forskere og ved hjælp af danske registerdata gennemført en række arbejdsmarkedsanalyser, der viste bevægelser ud og ind af arbejdsløshed. Big data kan skabe et tilsvarende løft, og Danmark har en række fordele i forhold til andre lande.

Forskere kan allerede kombinere big data med andre typer af data og få helt ny viden. Som for eksempel i forskningsprojektet Social Fabric, et samarbejde mellem Københavns Universitet og DTU, hvor 1.000 studerende har fået en smartphone, mod at forskerne indsamler anonymiserede oplysninger om blandt andet de unges fysiske og sociale færden: Hvem er deres venner, hvem mødes de med, hvem er de i læsegruppe med, kommer de til undervisningen, er de på Facebook i timerne osv. Via telefonernes Bluetooth kan man også se, hvor tæt de fysisk er på hinanden.

Når forskerne kobler disse data med oplysninger om studierne, kan de se betydningen af den sociale del af studielivet, for eksempel i forhold til karakterer og frafald på uddannelsen. Har de studerende, der flittigt møder op til forelæsning og læsegruppe, bedre odds for at gennemføre studiet end de, der læser hjemme på kollegieværelset? Og når forskerne kobler de sociale data til registrene, kan de se samspillet med elevernes sociale baggrund, sundhed, familieforhold, bopæl og skolegang i anonymiseret form, så ingen enkeltpersoner kan identificeres.

Registerdata har bragt os langt. Nu står vi over for det næste datamæssige gennembrud: Big data, og igen er der brug for politisk fremsynethed. For selvom der allerede findes en række eksempler på, at big data bruges af virksomheder, forskere og statistikere til at øge vores viden om samfundet, er der brug for en mere systematisk indsats, hvis Danmark skal bringe sig lige så langt i front i brugen af big data, som det er tilfældet med registerdata.

Det skal gøres nemt for forskere og virksomheder at samarbejde, og det skal sikres fra politisk hånd, at vi uddanner og kan tiltrække de rette talenter til at arbejde med data. Den indsats begynder med en dialog mellem de virksomheder, der producerer big data, de der gerne vil bruge big data til samfundsmæssig analyse og forskning, og de politikere og ledere, der kan anvende den nye viden, der skabes med big data. Det er den dialog, vi nu tager hul på med vores fælles konference.