Find vej i datadybet

Bag om projektet - sådan har vi gjort.

Googles servere i et datacenter i Pryor, Oklahoma. Fold sammen
Læs mere
Foto: GOOGLE HANDOUT
Lyt til artiklen

Vil du lytte videre?

Få et Digital Plus-abonnement og lyt videre med det samme.

Skift abonnement

Med Digital Plus kan du lytte til artikler. Du får adgang med det samme.

Indhold

Om data hentet via backup på telefon
Teledata
Data fra tekstbeskeder
Data fra kalender
Data fra løbeapp
Data fra email
Wifi fra telefon
Browser-historik
Bankdata
Foto
Facebook
SAS
Data fra Nemlig.com
Skat
Andre data
Sikkerhed i databehandlingen
Følgende står bag projektet

 

Generelt

Datasættene er hentet på forskellige måder. En del er indhentet ved, at Berlingske har skrevet en ansøgning på vegne af henholdsvis Sofie Carsten Nielsen eller Jens Joel, hvorefter politikerne har underskrevet ansøgningen og sendt dem til relevante myndigheder eller virksomheder. Når politikerne efterfølgende har fået udleveret datasættene, har vi hentet dem på Christiansborg eller i en enkelte tilfælde fået dem tilsendt. Andre data har vi hentet lokalt ved backups af Sofie Carsten Nielsen og Jens Joels iPhones eller computere. Det har været aftalen med begge, at de ikke måtte redigere rådata, før Berlingske fik dem udleveret. For flere af datasættenes vedkommende gælder det, at vi har indsamlet data fra perioder, der ligger flere måneder og endda år før, vi indgik aftalen med dem om dataprojektet.

 

Om data hentet via backup på telefon

Begge politikere har en Apple iPhone. Vi har foretaget en backup/sikkerhedskopi af politikernes telefoner med henblik på nærmere undersøgelse. Backup’en er efterfølgende åbnet via programmet iPhone Backup Extractor, som giver adgang til følgende struktur:

- En mappe med data/metadata fra de applikationer (apps, programmer), som enten er forudinstalleret eller hentet af telefonens bruger.
- En mappe, der udgør et bibliotek indeholdende en række database-filer, som understøtter en række grundlæggende funktioner ved iPhonen, herunder opkaldsdatabase, beskeddatabase og lignende.
- En mappe med medie-filer, herunder billeder og video gemt på telefonen.
- En mappe med filer, som indeholder grundlæggende oplysninger om, hvordan telefonens systemer er konfigureret, herunder brugerens tilpasninger af telefonen, f.eks. hvilke wifis, telefonen har været tilsluttet.

Specifikke filer i iPhone-backup’en har vi tilgået via Plist explorer og SQLite Database Browser.

Afgrænsning - om metadata Undersøgelsen af Sofie Carsten Nielsen og Jens Joels datasæt tager udgangspunkt i såkaldte metadata. Det vil sige, at vi har holdt fokus på de overordnede datasæt omtalt som metadata - af nogle også kaldet trafikdata i modsætning til pakkedata (med indhold). Med begrebet metadata menes f.eks. for en e-mail: data på afsender, modtager, tidspunkt for afsendelse og emnefelt. For SMS og telefonopkald: Hvem skriver/ringer til hvem hvornår og hvorfra (lokationspunkter). Det vil sige, at metadata ikke omfatter indholdet af en e-mail eller indholdet af en SMS. Vi har i dette projekt valgt at inkludere emnefeltet i en e-mail som metadata, selv om der har været en åben diskussion om, hvorvidt emnefeltet er metadata (streng taget er det jo indhold eller indikerer i hvert fald indhold). Hovedparten af de personer, vi har diskuteret metadata med, regner emnefeltet som metadata. Det samme gør internationale medier, se f.eks. The Guardian. Årsagen til, at vi fokuserer på metadata i dette projekt, er, at begrebet har tiltrukket sig stor opmærksomhed det seneste år. Afsløringerne om den amerikanske efterretningstjeneste NSA har netop cirklet om metadata, og både Det Hvide Hus og den amerikanske efterretningstjeneste har forsøgt at nedtone betydningen af metadata. Desuden har det rent journalistisk været mere interessant for os, hvad vi faktisk kunne udlede om Sofie Carsten Nielsen og Jens Joel ved at sortere og analysere deres data og dermed udlede mønstre, tendenser, rutiner og vaner. Mere udfordrende og mere relevant for overvågningsdebatten end at gå på jagt efter ét kontroversielt dokument. Sagt på en anden måde: Projektet undersøger, om alene mængden af deres data, mønstrene i deres data og konteksten i deres data kan bringe os tæt på personerne og måske endda potentielt bruges/misbruges. Det, overvågningsdebatten handler om. I enkelte tilfælde har vi efter aftale med Sofie Carsten Nielsen og Jens Joel anvendt et eksempel på eksempelvis en SMS, hvoraf der fremgår indhold. Dette har blot været et greb til at skabe forståelse og nærvær for brugerne, eksempelvis så man kan se et eksempel på en udvekslet SMS i Jens Joels overordnede statistik over udvekslede SMSer. Vores projekt har således ikke taget afsæt i, om vi kunne finde én skadelig SMS, men har fokuseret på SMS-mønstret.

Teledata

Oplysninger om data
Teledata for Jens Joel og Sofie Carsten Nielsen består af to dele for dem hver. De stammer begge fra deres folketingsmobil, der har abonnement hos TDC. TDC har udleveret en samlet liste over telefonsamtaler, SMS og dataforbrug samt en seperat sessionslog over brug af internet. Dataene er udleveret via TDC i elektronisk form og med password. Samtalelisten er afleveret i CSV-format bestående af 38 datakolonner. Hver kolonne repræsenterer en oplysning omkring en konkret telefonsamtale, en SMS eller dataforbrug.

Her er de vigtigste oplysninger, som er gemt i dataene
- Hvornår et opkald er foretaget
- Hvornår opkaldet slutter
- Hvis Jens Joel er den, der ringer op, så viser arket, hvem der bliver ringet til.
- Omvendt er det ikke muligt at se ud af arket, hvem der har ringet til Jens Joel, blot at samtalen har fundet sted.
- Oplysninger om, hvilken telemast Jens Joels telefon havde kontakt til, da et opkald/SMS blev foretaget, herunder mastens placering angivet, og i hvilken retning masten peger angivet med en numerisk værdi 0-360 (har betydning for dækningsområdet). Ved telefonsamtaler er der angivet, hvilken mast Jens Joels telefon havde kontakt til, når samtalen henholdsvis starter og slutter.

Vi har fået udleveret 12.300 teledata om Jens Joel og 19.003 teledata om Sofie Carsten Nielsen.

Sådan er data udleveret
TDC meddelte indledningsvist, at Berlingske ikke kun skulle have Sofie Carsten Nielsen og Jens Joels tilladelse til at få udleveret teledata. De skulle også have Folketingets tilladelse til, at TDC måtte udlevere Sofie Carsten Nielsen og Jens Joels teledata til politikerne selv. Begrundelsen var, at der var tale om erhvervsabonnementer med Folketinget som ejer. Både Jens Joel, Sofie Carsten Nielsen og Berlingske anmodede derfor Folketingets it-chef om, at han gav TDC grønt lys til at udlevere data. Det afviste han. Efter både Berlingske og de to folketingspolitikere havde talt med IT-chefen om at give grønt lys, bad it-chefen kammeradvokaten om at tage stilling til spørgsmålet. Da kammeradvokatens redegørelse lå klar, orienterede folketingets it-chef TDC om, at Folketingets administration ikke skulle involveres i dataansøgningerne yderligere. Herefter kunne Sofie Carsten Nielsen og Jens Joel igen anmode at få udleveret data. Berlingske kunne hente teledata hos politikerne den 24. januar 2014 - efter at have forsøgt at få dem siden august 2013.

Bearbejdelse af data
Geodata er konverteret fra UTM-format til decimal-længde- og breddegrader, fordi Google Maps kræver dette format.

Periode
Listen over telefonsamtaler, SMS og internetsessioner dækker perioden 15. juli 2013 til 15. januar 2014. Selve trækket er foretaget af TDC 17. januar og sidst bearbejdet 18. januar. Sessionsloggen er genereret 12. februar 2014 og dækker perioden fra og med 15. december til og med 31. december 2013.

Sådan bruges data
Vi har brugt teledata i grafikken over kort for begge politikere. Samt i grafikkerne for det udvalgte døgn hos dem begge. Vi har endnu ikke brugt de såkaldt sessionslogs.

Eksempel på teledata


Data fra tekstbeskeder

Oplysninger om data
Vi har foretaget en backup/sikkerhedskopi af politikernes telefoner. Backupen er efterfølgende åbnet via programmet iPhone Backup Extractor. IPhone har en samlet database, som indeholder SMS og iMessages (beskeder sendt via Apples eget beskedsystem som data). Der kan være slettet i beskederne hos de to folketingspolitikere.

Sådan er data udleveret
Via backup

Bearbejdelse af data
Data er ændret til csv-format, og derfra er der lavet beregninger på antallet af tekstbeskeder og en manuel oversættelse af telefonnumre for at identificere brugeren bag nummeret.

Periode
For Jens Joels vedkommende dækker perioden dækker den 1. august 2012 til den 22. november 2013 svarende til mere end 22.000 tekstbeskeder. For Sofie gælder perioden 21. september 2011 til 5. december 2013 og tæller mere end 14.000 tekstbeskeder.

Sådan bruges data
Data bruges til at vise, hvem der er de to politikeres tætteste kontakter på SMS. De bruges desuden i de to grafikker over 24 timer, hvor det fremgår, når de modtager eller sender en SMS. Det har en pointe, at der i de 24 timer både er taget data med fra SMS-backup og fra teledata fra TDC. De to datasæt supplerer hinanden og kan også vise, hvor der er “huller” i det andet datasæt. Teledata fra TDC indeholder ikke iMessages, da disse ikke er sendt over telenettet. Og datasættet for SMSer kan være ufuldstændigt, hvis der er slettet SMSer undervejs.

Etiske overvejelser
I Jens Joels grafik bringes en række eksempler på indholdet af SMSer for de tyve personer, han SMSer mest med. Eftersom der er tale om privat korrespondance, har Jens Joel ringet til de pågældende kontakter og informeret dem om, at de indgår i grafikken. De piger, Jens har datet i perioden, optræder anonymt.

Adgangen til Sofie og Jens SMSer har udløst flere etiske overvejelser, særligt i forhold til de tredjeparter, som har sendt og modtaget mails til og fra Sofie og Jens, men som ikke selv har givet samtykke til Berlingske. Vi har i videst muligt omfang forsøgt at forelægge tredjeparter omtalen af deres navn, især ved at lade Sofie og Jens kontakte de øvrige i første omgang. Hvis tredjeparter har afvist at blive omtalt, har vi selv kontaktet dem og ud fra deres argumenter foretaget en konkret afvejning mellem hensynet til deres privatliv på den ene side og væsentlighed og såkaldte gyldne kæder (graden af at være offentlige magthavere) på den anden side.

Data fra kalender

Oplysninger om data
Kalenderdata viser alle aftaler, der er knyttet til Jens Joels kalender. En kalender, der er knyttet til hans Outlook-mailboks i Folketinget. Der er ikke analyseret data på Sofie Carsten Nielsens kalender.

Sådan er data udleveret
Folketinget benytter en Microsoft-baseret e-mail-løsning, og vi har downloadet en total kopi af begge politikeres e-mail-databaser, som er gemt lokalt på deres udleverede pc’er.

Bearbejdelse af data
Kalenderen er åbnet via PST Viewer Pro. Data er bearbejdet via søgninger i materialet, som er blevet til en optælling af de møder, som Jens Joel var inviteret til.

Periode
Kalenderen dækker godt to år.

Sådan bruges data
Data bruges til en oversigt over, hvilke arbejdsopgaver Jens Joel har i Folketinget. Det er ikke ud fra Jens Joels data muligt at se, om han har deltaget i de møder, der er i hans kalender. Dette er noteret i grafikken.

Data fra løbeapp

Oplysninger om data
Programmet Runkeeper, som er downloadet på Sofie Carsten Nielsens iPhone, bruges som en hjælp til løbere, så de bl.a. kan følge hvor, hvor langt og hvor hurtigt de løber. For at kunne fungere effektivt gemmer programmet en omfattende datamængde om tidligere løbeture, faste ruter og lokationsdata i en database på telefonen.

Sådan er data udleveret
Vi har med tilladelse foretaget en backup/sikkerhedskopi af politikernes telefoner med henblik på nærmere undersøgelse.

Bearbejdelse af data
Runkeeper gemmer data i en database på iPhone. Denne database kan åbnes via SQLite Database Browser, og data kan herefter eksporteres ud til CSV-format. Tidsdata er konverteret fra UNIX-tid og lokationsdata er konverteret til et format til brug for Google Maps.

Periode
August 2012 til november 2013

Sådan bruges data
Data bruges til en grafik over Sofie Carsten Nielsens løberuter.

Berlingske har valgt kun at fremlægge de løbeture, Sofie Carsten Nielsen løber på rundt om Søerne i indre København. Hun har enkelte andre løberuter, men det klareste mønster ses i forhold til hendes mest benyttede rute rundt om søerne.

Eksempel på data

Data fra email

Oplysninger om data
Begge folketingspolitikere bruger primært deres folketings-e-mail. Derfor er der ikke nogen analyse af deres private mailbokse.

Sådan er data udleveret
Folketinget benytter en Microsoft-baseret e-mail-løsning, og vi har med tilladelse downloadet en total kopi af begge politikeres e-mail-databaser, som er gemt lokalt på deres udleverede pc’er. Kopien indeholder i princippet alle e-mails, som er blevet sendt eller modtaget fra den pågældende konto - indhold, vedhæftninger og metadata. Dog kan der fra de to politikeres side undervejs være slettet e-mails.

Bearbejdelse af data
For at kunne tilgå de backup af emails, som vi har foretaget, har vi benyttet PST Viewer Pro.

Der er efterfølgende lavet en manuel analyse af metadata for mails samt beregninger på antal mails fra enkeltindivider. Metadata betragtes i denne sammenhæng som oplysninger om blandt andet afsender/modtagere, tidspunkt og emnefelt.

Periode
Da både Sofie Carsten Nielsen og Jens Joel er valgt ind i 2011, dækker backuppen af mails fra september 2011 og godt to år frem.

Sådan bruges data
I Sofie Carsten Nielsens grafik bruges mails til at vise, hvilke personer hun oftest mailer med, og hvordan disse personer fordeler sig i grupper såsom folketingsmedlemmer, sekretariat, pressetjeneste osv. Det er her en pointe, at hendes top-60-netværk er en broget forsamling af folk, som stammer fra dels hendes tid som gruppeformand, formand for finansudvalget og dels som europa- og ligestillingsordfører.

I Jens Joels grafik bruges mails til at vise, hvordan metadata kan afsløre, hvilke netværk og kaffeklubber han er en del af.

Etiske overvejelser 
Adgangen til Sofie og Jens' arbejdsmails har udløst flere etiske overvejelser, særligt i forhold til de tredjeparter, som har sendt og modtaget mails til og fra Sofie og Jens, men som ikke selv har givet samtykke til Berlingske. Vi har i videst muligt omfang forsøgt at forelægge tredjeparter omtalen af deres navn, især ved at lade Sofie og Jens kontakte de øvrige i første omgang. Hvis tredjeparter har afvist at blive omtalt, har vi selv kontaktet dem og ud fra deres argumenter foretaget en konkret afvejning mellem hensynet til deres privatliv på den ene side og væsentlighed og såkaldte gyldne kæder (graden af at være offentlige magthavere) på den anden side.

Wifi fra telefon

Oplysninger om data
For at understøtte brugen af wifi-netværk husker iPhones, hvilke netværk en telefon har været på, medmindre man aktivt beder telefonen glemme netværket. Dermed bliver det lettere for brugeren at koble på et tidligere anvendt netværk.

Sådan er data udleveret
Vi har med tilladelse foretaget en backup/sikkerhedskopi af politikernes telefoner med henblik på nærmere undersøgelse. Backuppen er efterfølgende åbnet via programmet iPhone Backup Extractor. Oplysninger om netværk gemmes i en system-fil på telefonen, som kan aflæses separat fra telefonen.

Bearbejdelse af data
Wifi-data har vi analyseret via wigle.net, som ved hjælp af brugerne indsamler oplysninger om blandt andet wifis kloden rundt, herunder omtrentlige geografiske placeringer. Analysen er isoleret set behæftet med en vis usikkerhed, men andre datakilder understøtter resultaterne.

Periode
Februar 2012 til december 2013

Sådan bruges data
Wifis findes gemt i både Jens Joels og Sofie Carsten Nielsens backups. Men vi har kun brugt dem i Sofie Carsten Nielsens tilfælde, hvor wifi i en række tilfælde afslører, hvilke lande hun har besøgt.

Etiske overvejelser
Tidligere var det muligt at søge op imod f.eks. Googles databaser over wifis og deres placeringer, men Google forhindrer pt dette, og det ville have krævet, at vi havde udført såkaldt MAC spoofing for at kunne tilgå Googles database. Vi har vurderet, at det ikke var nødvendigt for at illustrere værdien af wifi-data, ligesom brug af denne teknik ville have rejst en række etiske spørgsmål omkring digitalt identitetstyveri.

Eksempel på data


Browser-historik

Oplysninger om data
Browserhistorik er den historik, der viser, hvilke hjemmesider en computer har besøgt.

Sådan er data udleveret
Vi har med tilladelse foretaget en kopi af begge politikeres browser-historik fra deres arbejds-pc’er. Historikken rummer oplysninger om, hvilke hjemmesider der er besøgt, hvornår de er besøgt og de pågældende siders titler. Som i tilfældet med e-mail, så kan der være redigeret i historikken undervejs, således at den ikke nødvendigvis afspejler politikernes internetvaner fuldstændigt. Vi har dog valgt kun at bruge Jens’ data.

Bearbejdelse af data
Vi har tjekket, hvilke hjemmesider der er besøgt.

Periode
Browserhistorikken dækker over perioden 8. oktober 2013 til 14. november 2013.

Både Jens Joel og Sofie Carsten Nielsen var begge i forvejen informeret om, at de ikke måtte slette browserhistorik. Alligevel var det gemte antal besøgte hjemmesider ikke specielt højt. Browserne har med stor sandsynlighed været sat op, så der alene gemmes oplysninger for et vist tidsrum eller antal besøg.

Sådan bruges data
Browser-historikken ses kun i Jens Joels grafik, hvor den viser samtlige besøgte sites i ovenstående periode.

Eksempel på data

 

Bankdata

Oplysninger om data
Vi har med tilladelse fået adgang til et træk på begge politikeres banktransaktioner for en aftalt periode. Trækket indeholder følgende oplysninger om en given transaktion:

- Dato/tid
- Beløb
- Tekst
- Funktion (dankortautomat, pengeautomat, Visa)
- Oplysninger om forretning, herunder adresse

Sådan er data udleveret
Jens Joel har Arbejdernes Landsbank. Sofie Carsten Nielsen havde på daværende tidspunkt Basisbank. Begge banker ville først have betaling for arbejdet, da det krævede ekstra arbejde at finde ud af, præcist hvor købene var foretaget, sådan som Berlingske ønskede at få at vide. Begge banker gik til sidst med til at udlevere det gratis til Jens Joel og Sofie Carsten Nielsen. Jens Joels oplysninger er afhentet personligt i bankens hovedkvarter. Sofie Carsten Nielsens oplysninger er udleveret elektronisk med kode.

Bearbejdelse af data
Berlingske har inddelt deres forbrug i kategorier, der skal gøre det lettere at forstå deres købemønster. For eksempel restauranter, værtshuse, indkøb i Folketinget osv.

Periode
For Sofie Carsten Nielsens vedkommende gælder perioden den 27. marts 2013 til 31. august 2013. For Jens’ vedkommende gælder perioden 3. september 2012 til 30. august 2013.

Sådan bruges data
Forbrugs-oplysningerne bruges blandt andet i grafikkerne, hvor henholdsvis Jens Joel og Sofie Carsten Nielsen følges i 14 dage. Det indgår også i grafikken over de 24 timer for dem begge. Og de danner grundlag for grafikken om forbrug. Vi har valgt at fjerne indkøb købt på nettet på det kort, hvor Sofie følges i 14 dage. Oplysninger kan nemlig ikke placere hende geografisk. Der fremgår der et enkelt køb på Sofies 14 dages-grafik. Her fremgår det, at Sofie Carsten Nielsen skulle have købt ind i “Rokkedysse Jordbær,” der geolokaliseres til Værløse. Men et opkald til gården viser, at købet er foretaget hos gårdens stand ved Torvehallerne i København. Det forklarer det lynhurtigere spring til Værløse fra København i hendes grafik.

 

Foto

Oplysninger om data
De fleste digitale kameraer/smartphones benytter sig af Exif-data. Exifdata knytter sig til et billede og indeholder en række metadata om billedet, som kan variere fra kamera til kamera. Metadata kan inkludere det tidspunkt, et billede er taget, oplysninger om kameraets indstillinger, beskrivelser samt geolokation. Geolokation kan være hentet direkte fra f.eks. en smartphones GPS, hvis funktionen er slået til. Hvor funktionen på Jens Joels telefon er slået fra, har Sofie Carsten Nielsen i en længere periode benyttet sin iPhones gps i forbindelse med det indbyggede kamera. Det vil sige, at det i hendes tilfælde er muligt at se, hvor et givet billede er taget henne og hvornår og dermed kortlægge dele af hendes færden i en given periode.

Sådan er data udleveret
Vi har med tilladelse foretaget en backup/sikkerhedskopi af politikernes telefoner med henblik på nærmere undersøgelse. Backuppen er efterfølgende åbnet via programmet iPhone Backup Extractor.

Periode
Sofie Carsten Nielsens foto dækker perioden 22. september 2011 til 4. december 2013. Jens Joels fotos gælder perioden 16. september 2012 til 21. november 2013.

Sådan bruges data
Vi har i grafikken kun valgt at bruge fotos i den feature, hvor vi følger hende i 14 dage.

Etiske overvejelser
Vi har kun anvendt fotos efter aftale med Sofie Carsten Nielsen og Jens Joel. Dette er sket for ikke unødigt at krænke tredjepart.

Eksempel på data

Facebook

Oplysninger om data
Facebook lagrer en række oplysninger om brugeren, som ikke umiddelbart er tilgængelige for brugeren, medmindre man downloader en egentlig kopi af brugerens profil. Denne profil gemmer alle oplysninger om handlinger, man måtte have foretaget sig. For eksempel gemmer den informationer om, hvilke reklamer der er klikket på, og hvilke navne man tidligere har kaldt sig, hvis man har valgt at skifte navn. Der har været heftige debatter i Europa om, hvorvidt Facebook udleverer alle oplysninger om sine brugere i det særlige træk fra brugerprofilen. Borgerrettighedsgrupper har anført, at Facebook reelt ligger inde med langt flere data om brugeren.

Sådan er data udleveret
Jens Joel og Sofie Carsten Nielsen har begge via Facebook downloadet en kopi af deres egne data, som Facebook stiller til rådighed. Begge politikere har efterfølgende overdraget deres data til Berlingskes journalister. Du kan downloade dine egne data og læse mere om indholdet her.

Bearbejdelse af data
Manuel gennemgang af de enkelte mapper, som Facebook har gemt på henholdsvis Sofie Carsten Nielsen og Jens Joel.

Periode
Der er tilsyneladende tale om hele den periode, som henholdsvis Sofie Carsten Nielsen og Jens Joel har haft en Facebook-profil.

Sådan bruges data
For Sofie var der en langt flere oplysninger om blandt andre, hvem hun ikke havde besvaret venneanmodninger fra, og hvem hun havde skjult fra nyheds-feeden. Vi valgte derfor at fokusere udelukkende på Sofie Carsten Nielsens data her, hvorfor der ikke er lavet en grafik over Jens Joels data.

Etiske overvejelser
Der fremgår af Sofie Carsten Nielsens data en lang række navne, som hun ikke har svaret på venneanmodninger fra eller skjult fra nyhedsfeed. Berlingske har vurderet, at dette ikke vil være en krænkelse og ikke vil påkrævet at oplyse disse personer om, at de fremgår i grafikken.

SAS

Oplysninger om data
SAS lagrer en række oplysninger om deres kunder. Herunder tid og sted for destination, flynumre, betalingsoplysninger osv.

Sådan er data udleveret
Forespørgslen sendte Sofie Carsten Nielsen og Jens Joel skriftligt. Materialet blev leveret med post. Berlingske spørgsmål til data ville SAS ikke besvare, selv om Jens Joel og Sofie Carsten Nielsen havde givet fuldmagt. SAS ønsker udelukkende at besvare spørgsmål om data fra de to personer, der havde ønsket om indsigt.

Bearbejdelse af data
Data blev leveret i papir og det var ikke muligt at få i elektronisk form. Data er derfor gennemgået manuelt.

Periode
Perioden dækker for Sofie Carsten Nielsens vedkommende flyrejser 31. marts 2009 ti den 29. april 2013. Trækket er sendt den 25. oktober 2013 og dækker 12 rejser.

Perioden dækker for Jens Joel Nielsens vedkommende flyrejser fra den 19. oktober 2011 til den 10. september 2013. Trækket er sendt den 25. oktober og dækker 65 flyrejser.

Sådan bruges data
Data bruges til at vise, at det er muligt at genskabe Jens’ præcise rejser rundt i hele verden med detaljer helt ned til til flynummer og ankomsttidspunkt. Sofie har ikke i perioden haft hverv, som har sendt hende på lange ture i udlandet. Hendes data fra SAS var derfor mindre interessante.

Nej, ikke til oplysningerne fra SAS. Der er desuden forsøgt indsamlet data for de to politikeres private rejser med andre selskaber. Norwegian for Jens Joel - kunne kun oplyse, at Jens Joel var registreret med to rejser i hhv. juli 2012 og februar 2013. resten af detaljerne kunne Berlingske trods flere henvendelser ikke få adgang til.

Trods langstrakte og talrige mail-udvekslingerne lykkedes det aldrig at få udleveret oplysninger om Sofie Carsten Nielsens flyrejser fra Air France.

Data fra Nemlig.com

Oplysninger om data
Nemlig.com bevarer lister over de varer, som brugeren oftest har købt. Disse varer kan findes, hvis der logges ind på profilen. Sofie Carsten Nielsen bruger nemlig.com, det gør Jens Joel ikke.

Sådan er data udleveret
Sofie Carsten Nielsen gav Berlingske adgang til at tage en kopi af listerne over de mest købte varer.

Bearbejdelse af data
Optælling af data. Data er delt op i økologisk og ikke-økologiske varer.

Periode
Ukendt

Sådan bruges data
Data bruges til at give et indtryk af Sofies forbrug af dagligvarer.

Eksempel på data


Skat

Oplysninger om data
Skat har leveret oplysninger, der er lagret flere år tilbage på henholdsvis Sofie Carsten Nielsen og Jens Joel.

Hvordan har vi fået udleveret dem
Sofie Carsten Nielsen og Jens Joel har fået oplysningerne fra Skat.

Oplysninger om data
Udleveret delvist i TIF-format. Vi har bearbejdet disse data uden brug af edb.

Hvilken periode har vi fået
Tilsyneladende hele deres liv.

Sådan bruges de i grafikken
Skatteoplysningerne bruges i grafikken over blå bog

Andre data

Oplysninger om data
Der er søgt visse former for statiske data. Det gælder blandt andet ansøgninger til politi og RKI. Hverken Jens Joel eller Sofie Carsten Nielsen er registreret hos RKI. Det har RKI besvaret begge politikeres ansøgninger om indsigt med. Politiet i Østjylland har lavet en “person-sag-søgning” som viser, hvorledes Jens Joel er registreret i deres system. Politiet i Københavns Kommune har leveret en liste over, hvorledes Sofie Carsten Nielsen er registreret i deres system.

Sådan bruges de i grafikken
De statiske data fra politi og RKI bruges i blå bog

Sikkerhed i databehandlingen

Det har været centralt for projektet at gå så langt som muligt for at sikre de data, som Berlingske har fået udleveret.

Størstedelen af arbejdet er foregået på computere, som er blevet renset, inden vi gik i gang med projektet. Computerne har efterfølgende ikke haft adgang til internettet for at forhindre uvedkommende adgang eller risikoen for en utilsigtet lækage, ligesom der er blevet truffet en stribe andre forholdsregler for at sikre det højst mulige sikkerhedsniveau. Det forhøjede sikkerhedsniveau kombineret med de store og meget forskelligartede datatyper har gjort projektet til en usædvanligt stor, logistisk udfordring. At indsamle, aflæse, bearbejde og præsentere data fra en lang række vidt forskellige virksomheder har ikke overraskende vist sig at være en kompleks opgave rent teknisk. Hver virksomhed har groft sagt sin egen tilgang til håndtering af data, hvilket i de fleste tilfælde har krævet specielle programmer for at kunne bearbejde disse data. Desuden har vi i vid udstrækning været afskåret fra at benytte online-baserede tjenester, men kun har kunnet benytte lokalt installeret software. For at gøre projektet operationelt, har vi af en række årsager benyttet Excel som en slags basis-værktøj.

Følgende står bag projektet

Dataene er indsamlet, analyseret og bearbejdet af:
Journalist Eva Jung
Journalist Lars Nørgaard Pedersen
Journalist Jesper Woldenhof

Universet på b.dk er designet og udviklet af:
Interaktiv designer Zoran Todorovic

Desuden har følgende bidraget undervejs: 
Fotograf Mads Nissen
Fotograf Linda Kastrup
Fotograf Ditte Faber
Fotograf Kasper Palsnov
Udvikler Thomas Carlsen
Sitemanager Michael Juul Christoffersen
Grafiker Henrik Kiær
Grafiker Trine Jørgensen
Nina Delfour, Berlingske Research
Anne-Sofie Sadolin, Berlingske Research
Josefine Boel Rasmussen, Berlingske Research
Philip Sune Dam, Berlingske Research
Morten Marthedal, Berlingske Research
Jakob Stræde, Berlingske Research