Machine learning draait om het maken van mathematische modellen die patronen kunnen herkennen in data. Deze modellen kunnen we daarna gebruiken om voorspellingen te doen of beslissingen te nemen. Laten we de belangrijkste onderdelen van machine learning algoritmes bekijken:
Data
Alle machine learning begint met data. Dit zijn de voorbeelden die we gebruiken om het model te trainen. De data bevat situaties waarvan we de uitkomst al kennen. Bijvoorbeeld foto’s van katten en honden, met labels die aangeven of het een kat of hond is. Hoe meer relevante voorbeelden we hebben, hoe beter het model meestal werkt. De data moet schoon en compleet zijn, met alle info die het model nodig heeft.
Model
Het model verwijst naar de wiskundige formules die we gebruiken om patronen in de data te vinden. Bijvoorbeeld een neuraal netwerk of beslissingsboom. Complexere modellen met meer parameters, zoals diepe neurale netwerken, kunnen ingewikkeldere patronen leren, maar hebben ook meer data nodig. Het kiezen van het juiste model is cruciaal.
Trainen
Trainen betekent dat we de instellingen van het model steeds een beetje aanpassen om de voorspellingen te verbeteren, op basis van de voorbeelden. Meestal gebruiken we hiervoor optimalisatie-algoritmes. Na elke trainingsstap kijkt het model waar het mis ging, en past het zich aan om de fout kleiner te maken.
Generaliseren
Een getraind ML-model is alleen nuttig als het ook goed werkt op nieuwe data. Dit heet generaliseren. Als een model te specifiek getraind is op de voorbeelden, zal het slecht generaliseren. Dit noemen we overfitting. Goede generalisatie kan bereikt worden met genoeg representatieve trainingsdata, regulatie en het testen op een validatieset.
De juiste mix van data, modelarchitectuur en training is cruciaal om een nauwkeurig ML-model te bouwen dat robuust genoeg is om goed te werken op nieuwe data. Het zijn fundamentele concepten die elke ML-expert moet begrijpen!