Leren van beperkte datasets

Optimale AI-algoritmen zijn afhankelijk van zeer grote hoeveelheden representatieve trainingsdata. Dit kunnen 100 miljoen items zijn. Echter is deze hoeveelheid data simpelweg niet beschikbaar. Beperkte datasets kunnen echter tot onbetrouwbare resultaten leiden. Het is daarom belangrijk om algoritmes te ontwikkelen die hier iets aan kunnen doen.

Interesse in een samenwerking?

AI en beperkte datasets

Contact

Wij bieden verschillende methoden aan om effectief om te gaan met kleine datasets. Dit zijn onder meer transfer learning, online leren en het gebruik van high-fidelity modellen om gesimuleerde data te genereren. Dit alles vermindert de behoefte aan trainingsdata.

De uitdagingen van kleine datasets aangaan

Moderne machine learning algoritmes hebben miljoenen parameters die sterk voorspellende waarden bieden als ze getraind zijn met grote datasets. Helaas presteren ze veel slechter als ze getraind zijn met kleine datasets. Vaak zijn er echter slechts kleine datasets beschikbaar als trainingsdata. Bovendien is het verkrijgen van voldoende data moeilijk, tijdrovend en duur. Ook zijn er wettelijke en ethische beperkingen aan de hoeveelheid data. In zeldzame gevallen kan het zelfs onmogelijk zijn om voldoende data te verkrijgen.

Het gebruik van AI-toepassingen op kleine datasets, brengt risico's met zich mee voor de betrouwbaarheid en de prestaties. Er kan ook een vertekening optreden. Dit brengt tal van uitdagingen met zich mee:

1. Het ontwikkelen van effectieve algoritmes met kleine datasets die betrouwbaar, onbevooroordeeld en veilig zijn.

2. Het combineren van kleine datasets met bestaande op modellen gebaseerde benaderingen.

3. Omgaan met het probleem van ontbrekende data en onbetrouwbare en veranderende databronnen.

Kleine en beperkte datasets zijn sterk vertegenwoordigd in de domeinen van artificiële  intelligentie in de gezondheidszorg, predictive maintenance en autonome voertuigen.

Klamer Schutte, Lead Scientist

De technologie van het leren van kleine en beperkte datasets stelt ons in staat om gebruik te maken van de voordelen van de huidige ontwikkelingen. Bijvoorbeeld het gebruik van artificiële intelligentie, zonder dat we onbetaalbaar grote  inspanningen nodig hebben.

Leren van beperkte en kleine datasets - Wat biedt TNO?

  • We ontwikkelen transfer learning, waardoor het het mogelijk is om gebruik te maken van reeds beschikbare maar minder representatieve data.
  • We ontwikkelen actief en online leren dat gebruik maakt van de beschikbaarheid van schaarse domeinexpertise om alleen essentiële voorbeelden te annoteren.
  • We vullen kleine datasets aan door gebruik te maken van bestaande high-fidelity modellen om gesimuleerde trainingsdata te genereren.
  • Door de integratie van domeinkennis, modelgebaseerd redeneervermogen en geautomatiseerd leren, verminderen we de behoefte aan trainingsdata.
TNO Insights

Artificial Intelligence voor veilige infrastructuur

04 februari 2019
Wanneer moet je onderhoud plegen aan een brug? Hoe lang blijft een dijk betrouwbaar? Artificial Intelligence (AI) kan de kwaliteit van controle over grote bouwwerken verhogen zonder dat de kosten aanzienlijk... Lees verder
Uitdagingen

VOLG TNO OP SOCIAL MEDIA

blijf op de hoogte van ons laatste nieuws, vacatures en activiteiten

Op TNO.nl maken we gebruik van cookies. De daarin opgeslagen informatie kan bij een volgend bezoek weer naar onze servers teruggestuurd  worden.