Machine learning is een subset van AI, waarmee de machine automatisch kan leren van gegevens, de prestaties kan verbeteren op basis van ervaringen uit het verleden en voorspellingen kan doen . Machine learning bevat een reeks algoritmen die op een enorme hoeveelheid gegevens werken. Gegevens worden aan deze algoritmen gevoerd om ze te trainen, en op basis van training bouwen ze het model en voeren ze een specifieke taak uit.
Deze ML-algoritmen helpen bij het oplossen van verschillende bedrijfsproblemen, zoals regressie, classificatie, prognoses, clustering en associaties, enz.
Op basis van de methoden en manier van leren is machinaal leren onderverdeeld in hoofdzakelijk vier typen, namelijk:
- Begeleid machinaal leren
- Machine learning zonder toezicht
- Semi-onder toezicht machinaal leren
- Versterkend leren
In dit onderwerp geven we een gedetailleerde beschrijving van de soorten Machine Learning, samen met hun respectievelijke algoritmen:
1. Begeleid machinaal leren
Zoals de naam al doet vermoeden, Begeleiden van machinaal leren is gebaseerd op toezicht. Het betekent dat we bij de begeleide leertechniek de machines trainen met behulp van de 'gelabelde' dataset, en op basis van de training voorspelt de machine de output. Hier specificeren de gelabelde gegevens dat sommige invoer al aan de uitvoer zijn toegewezen. Nog kostbaarder kunnen we zeggen; eerst trainen we de machine met de invoer en de bijbehorende uitvoer, en vervolgens vragen we de machine om de uitvoer te voorspellen met behulp van de testdataset.
Laten we begeleid leren begrijpen met een voorbeeld. Stel dat we een invoergegevensset hebben met afbeeldingen van katten en honden. Dus eerst zullen we de machine training geven om de afbeeldingen te begrijpen, zoals de vorm en grootte van de staart van katten en honden, vorm van de ogen, kleur, hoogte (honden zijn groter, katten zijn kleiner), enz. Na voltooiing van de training voeren we de afbeelding van een kat in en vragen we de machine om het object te identificeren en de output te voorspellen. Nu is de machine goed getraind, zodat hij alle kenmerken van het object zal controleren, zoals hoogte, vorm, kleur, ogen, oren, staart, enz., en zal ontdekken dat het een kat is. Het wordt dus in de categorie Cat geplaatst. Dit is het proces waarbij de machine de objecten identificeert in Supervised Learning.
Het belangrijkste doel van de techniek van begeleid leren is om de invoervariabele (x) in kaart te brengen met de uitvoervariabele (y). Enkele praktische toepassingen van begeleid leren zijn dat wel Risicobeoordeling, fraudedetectie, spamfiltering, enz.
Categorieën van begeleid machinaal leren
Machine learning onder toezicht kan worden onderverdeeld in twee soorten problemen, die hieronder worden weergegeven:
a) Classificatie
Classificatie-algoritmen worden gebruikt om de classificatieproblemen op te lossen waarbij de uitvoervariabele categorisch is, zoals ' Ja of Nee, Man of Vrouw, Rood of Blauw, etc . De classificatie-algoritmen voorspellen de categorieën die in de dataset aanwezig zijn. Enkele praktijkvoorbeelden van classificatie-algoritmen zijn dat wel Spamdetectie, e-mailfiltering, enz.
Hieronder vindt u enkele populaire classificatie-algoritmen:
b) Regressie
Regressie-algoritmen worden gebruikt om regressieproblemen op te lossen waarbij er een lineair verband bestaat tussen invoer- en uitvoervariabelen. Deze worden gebruikt om continue outputvariabelen te voorspellen, zoals markttrends, weersvoorspellingen, enz.
Hieronder vindt u enkele populaire regressie-algoritmen:
Voor- en nadelen van begeleid leren
Voordelen:
10 van 100
- Omdat begeleid leren werkt met de gelabelde dataset, kunnen we een exact idee krijgen van de klassen van objecten.
- Deze algoritmen zijn nuttig bij het voorspellen van de output op basis van eerdere ervaringen.
Nadelen:
- Deze algoritmen zijn niet in staat complexe taken op te lossen.
- Het kan de verkeerde output voorspellen als de testgegevens verschillen van de trainingsgegevens.
- Het trainen van het algoritme vergt veel rekentijd.
Toepassingen van begeleid leren
Hieronder vindt u enkele veelvoorkomende toepassingen van begeleid leren:
Java converteert tekenreeks naar geheel getal
Bij beeldsegmentatie worden Supervised Learning-algoritmen gebruikt. In dit proces wordt beeldclassificatie uitgevoerd op verschillende beeldgegevens met vooraf gedefinieerde labels.
Ook in de medische wereld worden onder toezicht staande algoritmen gebruikt voor diagnosedoeleinden. Dit wordt gedaan door gebruik te maken van medische beelden en in het verleden gelabelde gegevens met labels voor ziektetoestanden. Met een dergelijk proces kan de machine een ziekte voor de nieuwe patiënten identificeren.
2. Machine learning zonder toezicht
Onbegeleid leren g verschilt van de techniek van begeleid leren; zoals de naam al doet vermoeden, is er geen toezicht nodig. Het betekent dat bij ongecontroleerd machinaal leren de machine wordt getraind met behulp van de ongelabelde dataset, en dat de machine de output zonder enige supervisie voorspelt.
Bij onbewaakt leren worden de modellen getraind met de gegevens die niet geclassificeerd of gelabeld zijn, en het model handelt zonder toezicht op die gegevens.
Het belangrijkste doel van het onbewaakte leeralgoritme is om de ongesorteerde dataset te groeperen of te categoriseren op basis van de overeenkomsten, patronen en verschillen. Machines krijgen de opdracht om de verborgen patronen uit de invoergegevensset te vinden.
Laten we een voorbeeld nemen om het beter te begrijpen; Stel dat er een mand met fruitafbeeldingen is, en we voeren deze in het machine learning-model in. De afbeeldingen zijn totaal onbekend voor het model en de taak van de machine is om de patronen en categorieën van de objecten te vinden.
Dus nu zal de machine de patronen en verschillen ontdekken, zoals kleurverschillen en vormverschillen, en de uitvoer voorspellen wanneer deze wordt getest met de testgegevensset.
Categorieën van machinaal leren zonder toezicht
Leren zonder toezicht kan verder worden onderverdeeld in twee typen, die hieronder worden weergegeven:
1) Clustering
De clustertechniek wordt gebruikt wanneer we de inherente groepen uit de gegevens willen vinden. Het is een manier om de objecten in een cluster te groeperen, zodat de objecten met de meeste overeenkomsten in één groep blijven en minder of geen overeenkomsten hebben met de objecten van andere groepen. Een voorbeeld van het clusteralgoritme is het groeperen van klanten op basis van hun koopgedrag.
Enkele van de populaire clusteralgoritmen worden hieronder gegeven:
2) Associatie
Associatieregelleren is een leertechniek zonder toezicht, die interessante relaties tussen variabelen binnen een grote dataset vindt. Het belangrijkste doel van dit leeralgoritme is om de afhankelijkheid van het ene data-item van een ander data-item te vinden en die variabelen dienovereenkomstig in kaart te brengen, zodat het maximale winst kan genereren. Dit algoritme wordt voornamelijk toegepast in Marktmandanalyse, mijnbouw van webgebruik, continue productie , enz.
Enkele populaire algoritmen voor het leren van associatieregels zijn dat wel Apriori-algoritme, Eclat, FP-groei-algoritme.
Voor- en nadelen van onbewaakt leeralgoritme
Voordelen:
- Deze algoritmen kunnen worden gebruikt voor ingewikkelde taken in vergelijking met de bewaakte taken, omdat deze algoritmen werken op de niet-gelabelde dataset.
- Algoritmen zonder toezicht verdienen de voorkeur voor verschillende taken, omdat het verkrijgen van de ongelabelde dataset eenvoudiger is in vergelijking met de gelabelde dataset.
Nadelen:
- De uitvoer van een algoritme zonder toezicht kan minder nauwkeurig zijn omdat de gegevensset niet is gelabeld en algoritmen niet eerder zijn getraind met de exacte uitvoer.
- Werken met Unsupervised learning is moeilijker omdat het werkt met de niet-gelabelde dataset die niet aansluit bij de output.
Toepassingen van onbewaakt leren
3. Semi-begeleid leren
Semi-supervised learning is een type machine learning-algoritme dat tussen supervised en unsupervised machine learning ligt . Het vertegenwoordigt de tussenweg tussen begeleide (met gelabelde trainingsgegevens) en onbewaakte leeralgoritmen (zonder gelabelde trainingsgegevens) en gebruikt de combinatie van gelabelde en niet-gelabelde datasets tijdens de trainingsperiode.
A Hoewel semi-gesuperviseerd leren het midden houdt tussen begeleid en niet-gesuperviseerd leren en werkt op basis van gegevens die uit een paar labels bestaan, bestaat het meestal uit ongelabelde gegevens. Omdat labels duur zijn, hebben ze voor bedrijfsdoeleinden mogelijk weinig labels. Het is compleet anders dan begeleid en ongecontroleerd leren, omdat ze gebaseerd zijn op de aan- en afwezigheid van labels.
Om de nadelen van begeleid leren en onbewaakte leeralgoritmen te ondervangen, wordt het concept van semi-begeleid leren geïntroduceerd. . Het belangrijkste doel van semi-gesuperviseerd leren is om effectief gebruik te maken van alle beschikbare gegevens, in plaats van alleen gelabelde gegevens zoals bij begeleid leren. In eerste instantie worden soortgelijke gegevens geclusterd samen met een onbewaakt leeralgoritme, en verder helpt het om de ongelabelde gegevens in gelabelde gegevens te labelen. De reden hiervoor is dat gelabelde data een relatief duurdere acquisitie is dan ongelabelde data.
We kunnen deze algoritmen voorstellen met een voorbeeld. Bij begeleid leren staat een student onder toezicht van een instructeur thuis en op de universiteit. Als die leerling bovendien hetzelfde concept zelf analyseert zonder enige hulp van de instructeur, valt dit onder leren zonder toezicht. Bij semi-gesuperviseerd leren moet de student zichzelf herzien nadat hij hetzelfde concept heeft geanalyseerd onder begeleiding van een instructeur op de universiteit.
Voor- en nadelen van semi-begeleid leren
Voordelen:
- Het algoritme is eenvoudig en gemakkelijk te begrijpen.
- Het is zeer efficiënt.
- Het wordt gebruikt om de nadelen van begeleide en niet-gesuperviseerde leeralgoritmen op te lossen.
Nadelen:
- De resultaten van iteraties zijn mogelijk niet stabiel.
- We kunnen deze algoritmen niet toepassen op gegevens op netwerkniveau.
- De nauwkeurigheid is laag.
4. Versterkend leren
Reinforcement learning werkt op basis van een op feedback gebaseerd proces, waarbij een AI-agent (een softwarecomponent) automatisch zijn omgeving verkent door te raken en volgen, actie te ondernemen, te leren van ervaringen en zijn prestaties te verbeteren. Agent wordt beloond voor elke goede actie en wordt gestraft voor elke slechte actie; Daarom is het doel van een versterkingsleermiddel om de beloningen te maximaliseren.
Bij versterkend leren zijn er geen gelabelde gegevens zoals leren onder toezicht, en agenten leren alleen van hun ervaringen.
Het versterkende leerproces is vergelijkbaar met dat van een mens; Een kind leert bijvoorbeeld verschillende dingen door ervaringen in zijn dagelijks leven. Een voorbeeld van versterkend leren is het spelen van een spel, waarbij het spel de omgeving is, de bewegingen van een agent bij elke stap toestanden definiëren en het doel van de agent is om een hoge score te behalen. Agent ontvangt feedback in termen van straf en beloning.
Vanwege de manier van werken wordt versterkend leren op verschillende gebieden toegepast, zoals Speltheorie, Operatieonderzoek, Informatietheorie, multi-agentsystemen.
Een versterkend leerprobleem kan worden geformaliseerd met behulp van Markov-beslissingsproces (MDP). Bij MDP heeft de agent voortdurend interactie met de omgeving en voert hij acties uit; bij elke actie reageert de omgeving en genereert een nieuwe toestand.
touwtje eraan
Categorieën van versterkend leren
Versterkend leren wordt hoofdzakelijk onderverdeeld in twee soorten methoden/algoritmen:
Real-world gebruiksscenario's van versterkend leren
RL-algoritmen zijn erg populair in gamingtoepassingen. Het wordt gebruikt om bovenmenselijke prestaties te verkrijgen. Sommige populaire spellen die RL-algoritmen gebruiken, zijn dat wel AlphaGO En AlphaGO Nul .
Het artikel 'Resource Management with Deep Reinforcement Learning' liet zien hoe u RL op de computer kunt gebruiken om automatisch bronnen te leren en te plannen om op verschillende taken te wachten om de gemiddelde taakvertraging te minimaliseren.
RL wordt veel gebruikt in robotica-toepassingen. Robots worden gebruikt in de industriële en productiesector, en deze robots worden krachtiger gemaakt door versterkend leren. Er zijn verschillende industrieën die hun visie hebben op het bouwen van intelligente robots met behulp van AI en Machine learning-technologie.
Text-mining, een van de geweldige toepassingen van NLP, wordt nu geïmplementeerd met behulp van Reinforcement Learning van het bedrijf Salesforce.
Voor- en nadelen van versterkend leren
Voordelen
- Het helpt bij het oplossen van complexe problemen uit de echte wereld die moeilijk met algemene technieken kunnen worden opgelost.
- Het leermodel van RL is vergelijkbaar met het leren van mensen; vandaar dat de meest nauwkeurige resultaten kunnen worden gevonden.
- Helpt bij het behalen van resultaten op lange termijn.
Nadeel
- RL-algoritmen hebben niet de voorkeur voor eenvoudige problemen.
- RL-algoritmen vereisen enorme gegevens en berekeningen.
- Te veel versterkend leren kan leiden tot een overdaad aan toestanden, wat de resultaten kan verzwakken.
De vloek van de dimensionaliteit beperkt het leren van versterking voor echte fysieke systemen.