Een machine learning-model wordt gedefinieerd als een wiskundige weergave van de output van het trainingsproces. Machine learning is de studie van verschillende algoritmen die automatisch kunnen verbeteren door ervaring en oude gegevens en het model kunnen bouwen. Een machine learning-model is vergelijkbaar met computersoftware die is ontworpen om patronen of gedrag te herkennen op basis van eerdere ervaringen of gegevens. Het leeralgoritme ontdekt patronen in de trainingsgegevens en voert een ML-model uit dat deze patronen vastlegt en voorspellingen doet op basis van nieuwe gegevens.
Laten we een voorbeeld bekijken van het ML-model waarbij we een app maken om de emoties van de gebruiker te herkennen op basis van gezichtsuitdrukkingen. Het maken van een dergelijke app is dus mogelijk door middel van Machine Learning-modellen, waarbij we een model zullen trainen door afbeeldingen van gezichten in te voeren met verschillende emoties erop. Wanneer deze app wordt gebruikt om de stemming van de gebruiker te bepalen, leest hij alle ingevoerde gegevens en bepaalt vervolgens de stemming van elke gebruiker.
Daarom kunnen we in eenvoudige bewoordingen zeggen dat a machine learning-model is een vereenvoudigde weergave van iets of een proces. In dit onderwerp bespreken we verschillende machine learning-modellen en hun technieken en algoritmen .
Wat is een Machine Learning-model?
Machine Learning-modellen kunnen worden opgevat als een programma dat is getraind om patronen in nieuwe gegevens te vinden en voorspellingen te doen. Deze modellen worden weergegeven als een wiskundige functie die verzoeken in de vorm van invoergegevens aanneemt, voorspellingen doet over invoergegevens en vervolgens als reactie hierop een uitvoer levert. Eerst worden deze modellen getraind op basis van een reeks gegevens, en vervolgens krijgen ze een algoritme om over gegevens te redeneren, het patroon uit feedgegevens te extraheren en van die gegevens te leren. Zodra deze modellen zijn getraind, kunnen ze worden gebruikt om de onzichtbare dataset te voorspellen.
Er zijn verschillende soorten machine learning-modellen beschikbaar op basis van verschillende bedrijfsdoelen en datasets.
Classificatie van Machine Learning-modellen:
Op basis van verschillende bedrijfsdoelen en datasets zijn er drie leermodellen voor algoritmen. Elk machine learning-algoritme nestelt zich in een van de drie modellen:
- Leren onder toezicht
- Ongecontroleerd leren
- Versterkend leren
Begeleid leren is verder onderverdeeld in twee categorieën:
- Classificatie
- Regressie
Leren zonder toezicht is ook onderverdeeld in de onderstaande categorieën:
- Clustering
- Verenigingsregel
- Dimensionaliteitsreductie
1. Machine learning-modellen onder toezicht
Supervised Learning is het eenvoudigste machine learning-model om te begrijpen, waarbij invoergegevens trainingsgegevens worden genoemd en een bekend label of resultaat als uitvoer hebben. Het werkt dus volgens het principe van input-output-paren. Het vereist het creëren van een functie die kan worden getraind met behulp van een trainingsdataset, en deze vervolgens wordt toegepast op onbekende gegevens en enige voorspellende prestaties levert. Begeleid leren is taakgebaseerd en wordt getest op gelabelde datasets.
We kunnen een begeleid leermodel implementeren voor eenvoudige problemen uit het echte leven. We hebben bijvoorbeeld een dataset bestaande uit leeftijd en lengte; Vervolgens kunnen we een begeleid leermodel bouwen om de lengte van de persoon te voorspellen op basis van zijn of haar leeftijd.
Modellen voor begeleid leren worden verder onderverdeeld in twee categorieën:
Regressie
Bij regressieproblemen is de output een continue variabele. Enkele veelgebruikte regressiemodellen zijn als volgt:
a) Lineaire regressie
Lineaire regressie is het eenvoudigste machine learning-model waarin we één uitvoervariabele proberen te voorspellen met behulp van een of meer invoervariabelen. De weergave van lineaire regressie is een lineaire vergelijking, die een reeks invoerwaarden (x) en voorspelde uitvoer (y) combineert voor de reeks invoerwaarden. Het wordt weergegeven in de vorm van een lijn:
Y = bx + c.
Het belangrijkste doel van het lineaire regressiemodel is het vinden van de best passende lijn die het beste bij de gegevenspunten past.
Lineaire regressie wordt uitgebreid tot meervoudige lineaire regressie (vind een vlak dat het beste past) en polynomiale regressie (vind de best passende curve).
b) Beslisboom
gimp opslaan als jpeg
Beslisbomen zijn de populaire machine learning-modellen die kunnen worden gebruikt voor zowel regressie- als classificatieproblemen.
Een beslisboom gebruikt een boomachtige structuur van beslissingen, samen met hun mogelijke gevolgen en uitkomsten. Hierin wordt elk intern knooppunt gebruikt om een test op een attribuut weer te geven; elke tak wordt gebruikt om de uitkomst van de test weer te geven. Hoe meer knooppunten een beslisboom heeft, hoe nauwkeuriger het resultaat zal zijn.
Het voordeel van beslisbomen is dat ze intuïtief en gemakkelijk te implementeren zijn, maar dat ze niet nauwkeurig zijn.
Beslisbomen worden veel gebruikt operationeel onderzoek, met name op het gebied van beslissingsanalyse en strategische planning , en vooral op het gebied van machinaal leren.
c) Willekeurig bos
Random Forest is de ensemble-leermethode, die bestaat uit een groot aantal beslisbomen. Elke beslissingsboom in een willekeurig bos voorspelt een uitkomst, en de voorspelling met de meerderheid van de stemmen wordt als de uitkomst beschouwd.
Een willekeurig bosmodel kan worden gebruikt voor zowel regressie- als classificatieproblemen.
Voor de classificatietaak wordt de uitkomst van het willekeurige bos uit de meerderheid van de stemmen gehaald. Terwijl bij de regressietaak de uitkomst wordt ontleend aan het gemiddelde of gemiddelde van de voorspellingen die door elke boom worden gegenereerd.
d) Neurale netwerken
Neurale netwerken vormen een subset van machinaal leren en worden ook wel kunstmatige neurale netwerken genoemd. Neurale netwerken bestaan uit kunstmatige neuronen en zijn ontworpen op een manier die lijkt op de structuur en werking van het menselijk brein. Elk kunstmatig neuron is verbonden met vele andere neuronen in een neuraal netwerk, en zulke miljoenen verbonden neuronen creëren een geavanceerde cognitieve structuur.
Neurale netwerken bestaan uit een meerlaagse structuur, die één invoerlaag, één of meer verborgen lagen en één uitvoerlaag bevat. Omdat elk neuron verbonden is met een ander neuron, worden gegevens van de ene laag naar de andere neuron van de volgende lagen overgedragen. Ten slotte bereiken gegevens de laatste laag of uitvoerlaag van het neurale netwerk en genereren uitvoer.
Neurale netwerken zijn afhankelijk van trainingsgegevens om te leren en hun nauwkeurigheid te verbeteren. Een perfect getraind en nauwkeurig neuraal netwerk kan gegevens echter snel clusteren en een krachtige machine learning- en AI-tool worden. Een van de bekendste neurale netwerken is Het zoekalgoritme van Google.
Classificatie
Classificatiemodellen zijn het tweede type technieken voor begeleid leren, die worden gebruikt om conclusies te trekken uit waargenomen waarden in de categorische vorm. Het classificatiemodel kan bijvoorbeeld identificeren of de e-mail spam is of niet; een koper zal het product kopen of niet, enz. Classificatie-algoritmen worden gebruikt om twee klassen te voorspellen en de output in verschillende groepen te categoriseren.
Bij classificatie wordt een classificatiemodel ontworpen dat de dataset in verschillende categorieën classificeert, en aan elke categorie wordt een label toegewezen.
Er zijn twee soorten classificaties in machine learning:
Enkele populaire classificatie-algoritmen zijn zoals hieronder:
a) Logistieke regressie
Logistieke regressie wordt gebruikt om de classificatieproblemen bij machinaal leren op te lossen. Ze lijken op lineaire regressie, maar worden gebruikt om de categorische variabelen te voorspellen. Het kan de uitkomst voorspellen in Ja of Nee, 0 of 1, Waar of Onwaar, etc. In plaats van de exacte waarden te geven, geeft het echter de probabilistische waarden tussen 0 en 1.
b) Ondersteuning van vectormachine
Support vector machine of SVM is het populaire machine learning-algoritme, dat veel wordt gebruikt voor classificatie- en regressietaken. Het wordt echter specifiek gebruikt om classificatieproblemen op te lossen. Het belangrijkste doel van SVM is het vinden van de beste beslissingsgrenzen in een N-dimensionale ruimte, die datapunten in klassen kan scheiden, en de beste beslissingsgrens staat bekend als Hyperplane. SVM selecteert de extreme vector om het hypervlak te vinden, en deze vectoren staan bekend als ondersteuningsvectoren.
c) Naïeve Bayes
Naïve Bayes is een ander populair classificatie-algoritme dat wordt gebruikt bij machinaal leren. Het wordt zo genoemd omdat het gebaseerd is op de stelling van Bayes en de naïeve (onafhankelijke) aanname tussen de kenmerken volgt, die wordt gegeven als:
Elke naïeve Bayes-classificator gaat ervan uit dat de waarde van een specifieke variabele onafhankelijk is van enige andere variabele/kenmerk. Bijvoorbeeld als een vrucht moet worden geclassificeerd op basis van kleur, vorm en smaak. Zo geel, ovaal en zoet wordt herkend als mango. Hier is elk kenmerk onafhankelijk van andere kenmerken.
2. Machine learning-modellen zonder toezicht
Machine learning-modellen zonder toezicht implementeren het leerproces dat tegengesteld is aan leren onder toezicht, wat betekent dat het model kan leren van de ongelabelde trainingsdataset. Op basis van de ongelabelde dataset voorspelt het model de output. Met behulp van onbewaakt leren leert het model zelf verborgen patronen uit de dataset, zonder enige supervisie.
Modellen voor onbewaakt leren worden voornamelijk gebruikt om drie taken uit te voeren, namelijk:
Clustering is een leertechniek zonder toezicht waarbij de datapunten worden geclusterd of in verschillende clusters worden ingedeeld op basis van overeenkomsten en verschillen. De objecten met de meeste overeenkomsten blijven in dezelfde groep en hebben geen of zeer weinig overeenkomsten met andere groepen.
Clusteralgoritmen kunnen op grote schaal worden gebruikt in verschillende taken, zoals Beeldsegmentatie, statistische gegevensanalyse, marktsegmentatie , enz.
Enkele veelgebruikte Clustering-algoritmen zijn dat wel K-betekent Clustering, hiërarchische Clustering, DBSCAN , enz.
Associatieregelleren is een leertechniek zonder toezicht, die interessante relaties tussen variabelen binnen een grote dataset vindt. Het belangrijkste doel van dit leeralgoritme is om de afhankelijkheid van het ene data-item van een ander data-item te vinden en die variabelen dienovereenkomstig in kaart te brengen, zodat het maximale winst kan genereren. Dit algoritme wordt voornamelijk toegepast in Marktmandanalyse, mijnbouw van webgebruik, continue productie , enz.
Enkele populaire algoritmen voor het leren van associatieregels zijn dat wel Apriori-algoritme, Eclat, FP-groei-algoritme.
Het aantal kenmerken/variabelen dat in een dataset aanwezig is, staat bekend als de dimensionaliteit van de dataset, en de techniek die wordt gebruikt om de dimensionaliteit te verminderen staat bekend als de dimensionaliteitsreductietechniek.
Hoewel meer gegevens nauwkeurigere resultaten opleveren, kan dit ook de prestaties van het model/algoritme beïnvloeden, zoals problemen met overfitting. In dergelijke gevallen worden technieken voor dimensionaliteitsreductie gebruikt.
' Het is een proces waarbij de dataset met hogere dimensies wordt omgezet in een dataset met kleinere dimensies, waarbij ervoor wordt gezorgd dat deze vergelijkbare informatie oplevert .'
Verschillende methoden voor het verminderen van de dimensionaliteit, zoals zoals PCA (Principal Component Analysis), Singular Value Decomposition, enz.
Versterkend leren
Bij versterkend leren leert het algoritme acties voor een gegeven reeks toestanden die tot een doeltoestand leiden. Het is een op feedback gebaseerd leermodel dat feedbacksignalen opvangt na elke toestand of actie door interactie met de omgeving. Deze feedback werkt als beloning (positief voor elke goede actie en negatief voor elke slechte actie), en het doel van de agent is om de positieve beloningen te maximaliseren om zijn prestaties te verbeteren.
Het gedrag van het model bij versterkend leren is vergelijkbaar met menselijk leren, aangezien mensen dingen leren door ervaringen als feedback en interactie hebben met de omgeving.
Hieronder staan enkele populaire algoritmen die onder versterkend leren vallen:
Het doel is om het beleid te leren dat de AI-agent kan helpen de beste actie te ondernemen om de beloning onder een specifieke omstandigheid te maximaliseren. Het bevat Q-waarden voor elk toestand-actiepaar die de beloning aangeven voor het volgen van een bepaald toestandspad, en het probeert de Q-waarde te maximaliseren.
Machine Learning-modellen trainen
Zodra het Machine learning-model is gebouwd, wordt het getraind om de juiste resultaten te verkrijgen. Om een machine learning-model te trainen, heb je een enorme hoeveelheid voorbewerkte gegevens nodig. Voorbewerkte gegevens betekent hier gegevens in gestructureerde vorm met gereduceerde nulwaarden, enzovoort. Als we geen voorbewerkte gegevens leveren, is de kans groot dat ons model vreselijk presteert.
Hoe kies je het beste model?
In het bovenstaande gedeelte hebben we verschillende machine learning-modellen en algoritmen besproken. Maar een zeer verwarrende vraag die bij elke beginner kan opkomen is: 'welk model moet ik kiezen?'. Het antwoord is dus dat het vooral afhangt van de zakelijke vereisten of projectvereisten. Daarnaast hangt het ook af van de bijbehorende attributen, de omvang van de beschikbare dataset, het aantal features, de complexiteit, etc. In de praktijk is het echter aan te raden om altijd te beginnen met het eenvoudigste model dat op het specifieke model kan worden toegepast. probleem op te lossen en vervolgens geleidelijk de complexiteit te vergroten en de nauwkeurigheid te testen met behulp van parameterafstemming en kruisvalidatie.
Verschil tussen Machine Learning-model en algoritmen
Een van de meest verwarrende vragen onder beginners is: zijn machine learning-modellen en algoritmen hetzelfde? Omdat deze twee termen in verschillende gevallen in machine learning en data science door elkaar worden gebruikt.
Het antwoord op deze vraag is Nee, en het machine learning-model is niet hetzelfde als een algoritme. Op een eenvoudige manier kan een ML-algoritme is als een procedure of methode die op gegevens draait om daaruit patronen te ontdekken en het model genereren. Tegelijkertijd is een Het machine learning-model is als een computerprogramma dat output genereert of voorspellingen doet . Meer specifiek: wanneer we een algoritme met gegevens trainen, wordt het een model.
Machine Learning Model = Model Data + Prediction Algorithm