Syntetiske data
Det ligger store verdier i gode data, men av personvernshensyn er ofte tilgangen begrenset. Ofte ender bedrifter opp med datasett som ikke er gyldige og derfor ikke klarer å gi ønsket innsikt.
Syntetiske testdata forbedrer data og sikrer en GDPR-sikker prosess ved å etterligne og anonymisere faktiske data.
/Bilde%20av%20dame%20og%20mann%20som%20sitter%20ved%20et%20vindu.jpg?width=1280&height=1000&name=Bilde%20av%20dame%20og%20mann%20som%20sitter%20ved%20et%20vindu.jpg)
Drømmer dere om verdifulle testdata?
Syntetiske Data er generert av en maskinlæringsmodell som er trent opp på reelle data. De syntetiske dataene vil dermed oppføre seg som de originale dataene, men uten noen personlig identifiserende informasjon. Det er heller ikke mulig å re-identifisere personer, da dette er kunstig konstruerte data og ikke bare anonymiserte data.
Riktig håndtering av personvern er imidlertid bare den første av flere fordeler ved å ta i bruk Syntetiske Data.
Syntetiske testdata er:

GDPR-vennlige data, generert av en modell og kan ikke knyttes til personer

Økt datakvalitet og bedre datagrunnlag enn rene produksjonsdata

Tilgjengeliggjøring av data som åpner for innsikt som før var utilgjengelig av personvernshensyn

Bedre sikkerhet fordi dataen ikke er re-identifiserbar, så den kan brukes uten risiko
Slik gjør vi det:
1. Kartlegge
Vi kartlegger eksisterende system og finner syntetiseringsbehovet.2. Anonymisere
Vi fjerner alle identifiserende felter. I tillegg fjernes sjeldne tilfeller som kan være gjenkjennelige og lette å knytte til person.3. Syntetisere
Anonymiseringen er enkel å re-identifisere, så vi trener en maskinlæringsmodell som generer kunstige data basert på anonymisert data.4. Tilgjengeliggjøre
De syntetiske dataene tilgjengeliggjøres i systemene der de skal brukes.5. Oppdatere
Data endres fort, så statiske data utdateres fort. Derfor oppdateres de syntetiske dataene daglig, på en realistisk måte.Kundecase:
Sikre testdata for NAV, som ivaretar personvern
Syntetiske testdata handler om å tilby realistiske og omfattende testdata, uten å gå på akkord med personopplysningsloven. Å bruke produksjonsdata til testing er problematisk, spesielt etter implementering av GDPR. Dette gjelder også for NAV som er avhengig av gode testdata som ivaretar sikkerheten til kontaktene.
Vi har bygget et prisvinnende syntetisk testdatamiljø hos NAV.
/Mann%20sitter%20og%20smiler.jpg?width=800&height=800&name=Mann%20sitter%20og%20smiler.jpg)
Ta kontakt med oss om syntetiske testdata
Nicolai Svendsen
Salgsdirektør, twoday
Torstein Ødegard
COO, twoday Avento
torstein.odegard@twoday.com
966 29 911