Interview 24 september 2020

Roel van Endhoven, data-engineer

Een computer duizenden verzoeken van burgers inhoudelijk laten verwerken. Of miljarden metingen van satellieten toegankelijk maken in een database. Roel van Endhoven is als data-engineer bij Rijkswaterstaat altijd op zoek naar een manier om nóg sneller en slimmer de gewenste informatie te verwerken. Zo zet hij tekstmining in om berichten bij de juiste deskundige af te leveren.

‘Als kind was ik al bezig met data. Dat begon met videospelletjes op 5-jarige leeftijd. Mijn vader had eens een fruitautomaat gebouwd in de programmeertaal BASIC. Dat was mijn kennismaking met programmeren. Fáscinerend. Op de middelbare school kregen we een grafische rekenmachine. Daar kon je ook op programmeren. Nou, dat was echt mijn ding. Voor mij stond het dan ook vast dat ik ICT ging studeren.’

Het snijvlak van software engineering én data-science

‘Bij Rijkswaterstaat heb ik voor mijn afstuderen een data-scienceproject gedaan. Mijn stagebegeleider vroeg of ik wilde solliciteren bij Rijkswaterstaat. Ik zag dat ze op zoek waren naar een data-engineer. Een prachtige positie omdat je juist op het raakvlak werkt tussen software engineering, dat ik zo interessant vind, én data-science. Ik wilde uiteindelijk ook graag mezelf meer richting de data-science ontwikkelen, maar zonder het contact met software engineering te verliezen. Dat bleek mogelijk.’

Optimalisatie van satellietmetingen

‘Anderhalf jaar geleden ben ik hier begonnen. Ik werkte eerst aan de optimalisatie van een database voor satellietmetingen. Dan praat je over miljarden metingen die in een database gaan. Die data moet je dan daar heel snel uit kunnen halen, als je bijvoorbeeld inzoomt op een kaartje. Zodat je alle punten ziet waarvan die satelliet metingen heeft. Dat was een grote optimalisatieklus die we supersnel voor elkaar hebben gekregen. De juiste 10.000 punten uit de miljarden metingen in de database halen binnen twee tiende seconde: dat is mooi werk.’

‘Miljarden satellietmetingen toegankelijk maken in een database is mooi werk’

Menselijke interactie blijft nodig

In de wereld van machine learning en text mining zijn er verschillende manieren om informatie te verwerken, vertelt Roel. ‘Met supervised learning label je een berg bestaande zienswijzen met categorieën. Voor de hoofdonderwerpen kun je vervolgens een machine learning model trainen. Dit model kan dan voor nieuwe teksten een categorie voorspellen op basis van de geleerde teksten.’De andere vorm is unsupervised, vervolgt hij. ‘Je geeft de computer dan instructies mee om gelijkende teksten te zoeken of onderwerpen te vinden in de tekst. Maar dit heeft als nadeel dat het resultaat ambigu kan zijn en een menselijke actie nodig is. Je kunt als Rijksoverheid niet de hele besluitvorming uit de computer trekken. Deze vorm is ondersteunend voor de besluitvorming, maar zeker niet leidend.’

Inhoudelijk heb je legio mogelijkheden

En er zijn veel ontwikkelingsmogelijkheden. Dat maakt het werk leuk. Maar niet alleen dat: je hebt met veel verschillende mensen contact. Met de vele civieltechnische projecten spreek je bijvoorbeeld regelmatig met assetmanagers en platformbeheerders aan de kant van de informatievoorziening. Je kunt natuurlijk voor een klein bedrijf websites gaan maken, maar dit is gewoon veel interessanter.’

Wil jij ook aan de slag bij Rijkswaterstaat?

Bekijk alle ICT-vacatures