Begeleid leren is het type machinaal leren waarbij machines worden getraind met behulp van goed 'gelabelde' trainingsgegevens, en op basis van die gegevens voorspellen machines de output. De gelabelde gegevens betekenen dat sommige invoergegevens al zijn getagd met de juiste uitvoer.
Bij begeleid leren werken de trainingsgegevens die aan de machines worden verstrekt als supervisor die de machines leert de output correct te voorspellen. Het past hetzelfde concept toe als een student leert onder begeleiding van de leraar.
Begeleid leren is een proces waarbij zowel invoergegevens als correcte uitvoergegevens aan het machine learning-model worden geleverd. Het doel van een begeleid leeralgoritme is om zoek een mappingfunctie om de invoervariabele (x) in kaart te brengen met de uitvoervariabele (y) .
In de echte wereld kan begeleid leren worden gebruikt Risicobeoordeling, beeldclassificatie, fraudedetectie, spamfiltering , enz.
Hoe begeleid leren werkt?
Bij begeleid leren worden modellen getraind met behulp van een gelabelde dataset, waarbij het model leert over elk type gegevens. Zodra het trainingsproces is voltooid, wordt het model getest op basis van testgegevens (een subset van de trainingsset) en wordt vervolgens de output voorspeld.
De werking van begeleid leren kan eenvoudig worden begrepen aan de hand van het onderstaande voorbeeld en diagram:
Stel dat we een dataset hebben met verschillende soorten vormen, waaronder vierkant, rechthoek, driehoek en veelhoek. De eerste stap is nu dat we het model voor elke vorm moeten trainen.
- Als de gegeven vorm vier zijden heeft en alle zijden gelijk zijn, wordt deze gelabeld als a Vierkant .
- Als de gegeven vorm drie zijden heeft, wordt deze gelabeld als a driehoek .
- Als de gegeven vorm zes gelijke zijden heeft, wordt deze gelabeld als zeshoek .
Nu, na de training, testen we ons model met behulp van de testset, en de taak van het model is om de vorm te identificeren.
De machine is al getraind in alle soorten vormen en wanneer hij een nieuwe vorm vindt, classificeert hij de vorm op basis van een aantal zijden en voorspelt hij de uitkomst.
Stappen die betrokken zijn bij begeleid leren:
- Bepaal eerst het type trainingsgegevensset
- Verzamel/verzamel de gelabelde trainingsgegevens.
- Splits de trainingsgegevensset in training dataset, testdataset en validatiedataset .
- Bepaal de invoerfuncties van de trainingsgegevensset, die voldoende kennis moeten hebben zodat het model de uitvoer nauwkeurig kan voorspellen.
- Bepaal het geschikte algoritme voor het model, zoals een ondersteuningsvectormachine, een beslissingsboom, enz.
- Voer het algoritme uit op de trainingsgegevensset. Soms hebben we validatiesets nodig als controleparameters, die de subset vormen van trainingsdatasets.
- Evalueer de nauwkeurigheid van het model door de testset aan te bieden. Als het model de juiste output voorspelt, betekent dit dat ons model accuraat is.
Soorten begeleide machine learning-algoritmen:
Begeleid leren kan verder worden onderverdeeld in twee soorten problemen:
1. Regressie
Regressie-algoritmen worden gebruikt als er een relatie bestaat tussen de invoervariabele en de uitvoervariabele. Het wordt gebruikt voor het voorspellen van continue variabelen, zoals weersvoorspellingen, markttrends, enz. Hieronder staan enkele populaire regressie-algoritmen die onder begeleid leren vallen:
- Lineaire regressie
- Regressiebomen
- Niet-lineaire regressie
- Bayesiaanse lineaire regressie
- Polynomiale regressie
2. Classificatie
Classificatie-algoritmen worden gebruikt wanneer de uitvoervariabele categorisch is, wat betekent dat er twee klassen zijn, zoals Ja-Nee, Man-Vrouw, Waar-onwaar, enz.
Spamfiltering,
- Willekeurig bos
- Beslissingsbomen
- Logistieke regressie
- Ondersteuning van vectormachines
Opmerking: we zullen deze algoritmen in latere hoofdstukken in detail bespreken.
Voordelen van begeleid leren:
- Met behulp van begeleid leren kan het model de output voorspellen op basis van eerdere ervaringen.
- Bij begeleid leren kunnen we een exact idee krijgen van de klassen van objecten.
- Het begeleide leermodel helpt ons verschillende problemen uit de echte wereld op te lossen, zoals: fraudedetectie, spamfiltering , enz.
Nadelen van begeleid leren:
- Modellen voor begeleid leren zijn niet geschikt voor het omgaan met complexe taken.
- Begeleid leren kan de juiste output niet voorspellen als de testgegevens verschillen van de trainingsgegevensset.
- De training vergde veel rekentijd.
- Bij begeleid leren hebben we voldoende kennis nodig over de klassen van objecten.