
Tijdmaker in beeld: Jesse van Oort over large language models
Dit is de tijd waarin innovatie cruciaal is. TNO’ers drukken hun stempel op ónze tijd. Deze tijdmakers zijn gedreven professionals die elke dag opnieuw grenzen verleggen. Zij ontwikkelen innovatieve oplossingen op het gebied van gezondheid, duurzaamheid, digitalisering en veiligheid. In deze serie brengen we onze tijdmakers in beeld. Jesse van Oort is scientist innovator en data-acquisitielead GPT-NL bij TNO.
Sinds begin 2024 houdt hij zich bezig met GPT-NL: een Nederlands taalmodel dat stoelt op transparantie en Europese waarden. Daarbij werkt hij intensief samen met de SURF en het Nederlands Forensisch Instituut.
Kunstmatige intelligentie
Kunstmatige intelligentie ontwikkelt zich razendsnel van belofte naar gamechanger. Grote taalmodellen, zoals Open AI, vatten teksten samen, vertalen, programmeren en herschrijven zelfs beleid. Handig voor zorg, overheid, onderwijs en bedrijfsleven. Tegelijk ontstaat ongemak: bijna alle grote modellen komen van Amerikaanse of Chinese tech-bedrijven. Die blijven gesloten over hun data en werking, en dringen diep door in organisaties zonder dat duidelijk is wat er binnen dat model gebeurt. Jesse: “Die onduidelijkheid voelt niet goed als het gaat om kritieke infrastructuur of wanneer je werkt met gevoelige gegevens. Daarom bouwen we aan een betrouwbaar alternatief large language model (LLM).”
Onafhankelijkheid versterken
Jesse legt uit hoe zo’n LLM werkt: “In de kern voorspelt het welk woord waarschijnlijk volgt op de woorden ervoor. Het model leert dat door enorme hoeveelheden tekst te verwerken. Het idee is: als je het model maar genoeg voedt, weet dat uiteindelijk ‘alles’. Maar teksten bevatten ‘biases’, nepnieuws, fouten, auteursrechtelijk materiaal en soms persoonsgegevens. En wij willen geen model dat het hele internet heeft ingeslikt, maar een systeem dat zorgvuldig met gegevens omgaat.”
Met GPT-NL bieden de ontwikkelpartners een alternatief dat betrouwbaarheid en dataveiligheid centraal zet. “We zorgen dat data zo veel mogelijk binnen organisaties blijven, terwijl het model documenten en databronnen met elkaar verbindt. Zo behoud je strategische autonomie, vergroot je de controle én voldoe je vanaf het begin aan Europese regels zoals de AI Act en de AVG. Met GPT-NL versterkt Nederland zijn eigen kennis, technologie en onafhankelijkheid op het gebied van taalmodellen.”
Verantwoorde digitalisering
Mogelijke afnemers uit bijvoorbeeld de overheid, zorg of educatieve sector kunnen het model gebruiken voor het optimaliseren van interne processen en oplossen van maatschappelijke opgaven. “Doordat GPT-NL geen allesomvattend wereldmodel wordt, blijft het compacter en energiezuiniger. Dat past bij Europese ambities rond duurzame en ver antwoorde digitalisering.” Die maatschappelijke ambitie sluit ook aan bij wat Jesse persoonlijk belangrijk vindt.
“Bij TNO – dat, niet in de eerste plaats, niet winst gedreven is – is er ruimte om nieuwe projecten te ontwikkelen in onder andere duurzame ICT en verantwoorde AI. Ik heb als persoonlijke ambitie om een zo positief mogelijke bijdrage te leveren aan de samenleving. TNO stelt mij in staat dat te verwezenlijken.”

“Bij TNO is er ruimte om nieuwe projecten te ontwikkelen in onder andere duurzame ICT en verantwoorde AI. Ik heb als persoonlijke ambitie om een zo positief mogelijke bijdrage te leveren aan de samenleving. TNO stelt mij in staat dat te verwezenlijken.”
Data verzamelen: een intensief traject
Hoe ontwikkel je zo’n model in de praktijk? Jesse: “We begonnen in het voorjaar van 2024 en dachten eind dat jaar wel een werkend model te hebben. Maar het verzamelen van datasets en de juridische zorgvuldigheid daaromheen kostte veel meer tijd. Want welke teksten gebruik je voor een eerlijk model? En hoe weet je zeker dat je die data mag inzetten? Bovendien zien veel organisaties hun data als waardevol privé-bezit. Soms moet je ze overtuigen dat die waarde pas echt tot bloei komt als je die data bundelt. Door transparante afspraken te maken en door te laten zien dat je niet zomaar data van internet schraapt, verdien je geleidelijk hun vertrouwen.”
Om het proces te stroomlijnen richtten de ontwikkelaars een content board op met publieke en private partijen. “We stelden concrete vragen als: welke rechten behouden data-eigenaren? Waarvoor mag het model worden gebruikt? Hoe delen we eventuele inkomsten?”
Mijlpaal
Een grote mijlpaal afgelopen jaar was het sluiten van de samenwerkingsovereenkomst met NDP Nieuwsmedia, de koepel van bijna alle grote Nederlandse nieuwsmedia. Jesse: “Daardoor kregen we in één keer toegang tot een archief met 25 jaar aan journalistieke artikelen. Kwalitatief sterke Nederlandse teksten die enorm helpen bij het bouwen van een betrouwbaar model. Dat deze partijen hun data met ons willen delen, laat zien dat het anders kan.”
Het team bouwde daarnaast een uitgebreide curatiepipeline. “Alle data gaan langs juridische controles, door kwaliteitsfilters en systemen die persoonsgegevens versleutelen of verwijderen. Je krijgt data nooit helemaal schoon, maar we weten waar de risico’s zitten en hebben daarvoor passende maatregelen genomen.”
Ambitie
Jesse werkt intussen verder aan GPT-NL. Waar staat het model over twee jaar? “Dan is dit het ‘go-to’-model voor organisaties die hoge eisen stellen aan transparantie en betrouwbaarheid. Dat zou veel betekenen voor de Nederlandse AI-sector: kennis en infrastructuur blijven in eigen land, talent ontwikkelt zich hier, en Europa krijgt een concreet voorbeeld van hoe generatieve AI óók kan zijn: gebaseerd op publieke waarden, zorgvuldigheid en vertrouwen.”
Neem contact met ons op
Laat je verder inspireren
Tijdmaker in beeld: Mia Jukić


Tijdmaker in beeld: Irena van Klaveren


Tijdmaker in beeld: de tech van Iris Kerkhof voel je op je huid


Hoe meet je iets wat altijd verandert? De uitdaging van het evalueren van generatieve AI


Balans tussen scepsis en blind vertrouwen: kritisch denken als sleutel tot verantwoorde én effectieve inzet van GenAI


