Fake it till you make it: introductie tot synthetische data
Het kan verleidelijk zijn om 'echte' gegevens te gebruiken, maar volgens de GDPR is dat geen goed idee als het gaat om persoonsgegevens. Helaas kan het testen of debuggen van software moeilijker zijn zonder volledige toegang tot alle onderliggende gegevens. Een synthetische dataset kan een goede oplossing zijn: het genereren van fictieve vervangende gegevens, die de structuur en verdeling van de oorspronkelijke gegevens nabootsen.
Joachim Ganseman, onderzoeker in het Smals Research team, gaf hierover een presentatie op de 19de editie van Devoxx Belgium. Dit Java-evenement, dat elk jaar de gemeenschap van ontwikkelaars samenbrengt, vond plaats in Antwerpen van 10 tot 14 oktober 2022.
Bekijk de video van de uiteenzetting. U kan ook terecht op de blog van het onderzoeksteam.