Wat is machine learning, hoe verschilt het van klassieke software, en waarom heb je hier als niet-techneut iets aan?
In klassieke software programmeer je regels: “als bedrag > 10.000, vraag akkoord van manager”. In machine learning leer je een systeem patronen herkennen uit voorbeelden, in plaats van regels expliciet op te schrijven. Dat klinkt subtiel, maar de gevolgen zijn enorm.
Het verschil in één zin
Klassieke software volgt regels die jij hebt opgeschreven. Machine learning leert regels die jij niet hoeft op te schrijven.
De drie smaken
Supervised learning
Je geeft het model voorbeelden met het juiste antwoord erbij. Tienduizenden facturen met label “fraude” of “geen fraude”. Honderdduizenden e-mails met “spam” of “geen spam”. Het model leert het patroon en kan daarna nieuwe gevallen classificeren. Dit is verreweg het meest gebruikt in het bedrijfsleven.
Unsupervised learning
Geen labels. Het model zoekt zelf structuur in de data, bijvoorbeeld groepen klanten die op elkaar lijken (segmentatie). Bruikbaar voor verkenning en als opmaat naar gerichtere analyses.
Reinforcement learning
Het model leert door te proberen en feedback te krijgen. Dit zit achter game-AI, robotica en de fijnafstemming van moderne taalmodellen (RLHF). In dagelijks kantoorwerk kom je dit zelden zelf tegen.
Wat is een model eigenlijk?
Een model is geen kristallen bol. Het is een verzameling getallen - vaak miljoenen of miljarden - die samen een functie vormen: invoer in, voorspelling uit. Tijdens training worden die getallen aangepast totdat de voorspellingen op bekende voorbeelden goed genoeg zijn. Daarna kan het model nieuwe invoer aan.
Hoe meer en betere data, hoe beter het model. Maar méér data heeft afnemende meeropbrengst. Op een gegeven moment win je niets meer zonder ook de architectuur of features te verbeteren.
Waar wordt het écht gebruikt?
- Fraudedetectie bij banken - duizenden transacties per seconde scoren.
- Aanbevelingssystemen bij webshops, streamingdiensten en nieuwssites.
- Voorspellen van vraag en voorraad in retail en logistiek.
- Beeldanalyse in de zorg (radiologie, pathologie) - vaak ondersteunend, niet beslissend.
- Tekstclassificatie: van klantmails routeren tot juridische documenten triëren.
Wat zijn de valkuilen?
Een model leert wat in de data zit. Als je data scheef is, wordt je model scheef (zie ons artikel over bias). Als je data oud is, voorspelt je model de wereld van gisteren. En als je doel verkeerd is gedefinieerd, lost het model glansrijk het verkeerde probleem op.
Een berucht voorbeeld: een ziekenhuis trainde een model om patiënten met longontsteking te triëren. Het model adviseerde astmapatiënten naar huis te sturen - omdat astmapatiënten in de data minder vaak overleden. Niet omdat hun longontsteking milder was, maar omdat ze direct intensieve zorg kregen. Het model leerde het verkeerde patroon.
Vier vragen die je nu kunt stellen
- Welk probleem proberen we eigenlijk op te lossen - en is dat exact wat we het model laten optimaliseren?
- Waar komt de data vandaan, en wie zit erin (en wie niet)?
- Hoe meten we “goed”? Per subgroep, of alleen gemiddeld?
- Wat doen we als het model fout zit - wie controleert, wie corrigeert?
Wie deze vier vragen routineus stelt, voorkomt meer schade dan een team van consultants. Onze AI-cursus oefent dit met casussen uit verschillende sectoren - geen wiskunde vereist.