logo

Machine learning zonder toezicht

In het vorige onderwerp hebben we gesuperviseerd machinaal leren geleerd, waarbij modellen worden getraind met behulp van gelabelde gegevens onder toezicht van trainingsgegevens. Maar er kunnen veel gevallen zijn waarin we geen gelabelde gegevens hebben en de verborgen patronen uit de gegeven dataset moeten vinden. Om dit soort gevallen op het gebied van machinaal leren op te lossen, hebben we dus onbewaakte leertechnieken nodig.

Wat is onbegeleid leren?

Zoals de naam al doet vermoeden, is onbewaakt leren een machine learning-techniek waarbij modellen niet worden gesuperviseerd met behulp van trainingsdatasets. In plaats daarvan vinden modellen zelf de verborgen patronen en inzichten uit de gegeven gegevens. Het kan worden vergeleken met leren dat plaatsvindt in het menselijk brein terwijl je nieuwe dingen leert. Het kan worden gedefinieerd als:

parseint java
Unsupervised learning is een vorm van machinaal leren waarbij modellen worden getraind met behulp van een ongelabelde dataset en zonder toezicht op die gegevens mogen reageren.

Ongecontroleerd leren kan niet rechtstreeks worden toegepast op een regressie- of classificatieprobleem, omdat we, in tegenstelling tot begeleid leren, over de inputgegevens beschikken, maar niet over de overeenkomstige outputgegevens. Het doel van onbegeleid leren is om vind de onderliggende structuur van de dataset, groepeer die gegevens op basis van overeenkomsten en representeer die dataset in een gecomprimeerd formaat .

Voorbeeld: Stel dat het onbewaakte leeralgoritme een invoerdataset krijgt met afbeeldingen van verschillende soorten katten en honden. Het algoritme is nooit getraind op de gegeven dataset, wat betekent dat het geen idee heeft van de kenmerken van de dataset. De taak van het onbewaakte leeralgoritme is om de beeldkenmerken zelf te identificeren. Een onbewaakt leeralgoritme zal deze taak uitvoeren door de beeldgegevensset in groepen te clusteren op basis van overeenkomsten tussen afbeeldingen.

Begeleiden van machinaal leren

Waarom gebruik maken van onbewaakt leren?

Hieronder staan ​​enkele belangrijke redenen die het belang van onbegeleid leren beschrijven:

  • Leren zonder toezicht is nuttig voor het vinden van nuttige inzichten uit de gegevens.
  • Leren zonder toezicht lijkt veel op de manier waarop een mens leert denken door zijn eigen ervaringen, waardoor hij dichter bij de echte AI komt.
  • Leren zonder toezicht werkt op ongelabelde en ongecategoriseerde gegevens, waardoor leren zonder toezicht belangrijker wordt.
  • In de echte wereld beschikken we niet altijd over invoergegevens met de bijbehorende uitvoer, dus om dergelijke gevallen op te lossen hebben we onbewaakt leren nodig.

Werking van onbewaakt leren

De werking van onbewaakt leren kan worden begrepen aan de hand van het onderstaande diagram:

Begeleiden van machinaal leren

Hier hebben we ongelabelde invoergegevens genomen, wat betekent dat deze niet zijn gecategoriseerd en dat er ook geen overeenkomstige uitvoer wordt gegeven. Nu worden deze ongelabelde invoergegevens naar het machine learning-model gevoerd om deze te trainen. Ten eerste zal het de onbewerkte gegevens interpreteren om de verborgen patronen uit de gegevens te vinden en vervolgens geschikte algoritmen toepassen, zoals k-means clustering, beslissingsboom, enz.

smtp-internetprotocol

Zodra het geschikte algoritme is toegepast, verdeelt het algoritme de dataobjecten in groepen op basis van de overeenkomsten en verschillen tussen de objecten.

Soorten onbewaakt leeralgoritmen:

Het onbewaakte leeralgoritme kan verder worden onderverdeeld in twee soorten problemen:

Begeleiden van machinaal leren
    Clustering: Clustering is een methode om de objecten in clusters te groeperen, zodat objecten met de meeste overeenkomsten in een groep blijven en minder of geen overeenkomsten hebben met de objecten van een andere groep. Clusteranalyse vindt de overeenkomsten tussen de gegevensobjecten en categoriseert deze op basis van de aan- en afwezigheid van die overeenkomsten.Vereniging: Een associatieregel is een leermethode zonder toezicht die wordt gebruikt om de relaties tussen variabelen in de grote database te vinden. Het bepaalt de set items die samen in de dataset voorkomen. Associatieregel maakt marketingstrategie effectiever. Mensen die bijvoorbeeld een X-artikel kopen (bijvoorbeeld een brood), zijn ook geneigd om een ​​Y-artikel (boter/jam) te kopen. Een typisch voorbeeld van een associatieregel is de marktmandanalyse.

Opmerking: we zullen deze algoritmen in latere hoofdstukken leren.

Algoritmen voor onbewaakt leren:

Hieronder vindt u de lijst met enkele populaire leeralgoritmen zonder toezicht:

    K-betekent clustering KNN (k-dichtstbijzijnde buren) Hiërarchische clustering Onregelmatigheidsdetectie Neurale netwerken Principecomponentenanalyse Onafhankelijke componentanalyse Apriori-algoritme Singuliere waarden ontbinding

Voordelen van leren zonder toezicht

  • Ongecontroleerd leren wordt gebruikt voor complexere taken in vergelijking met begeleid leren, omdat we bij onbewaakt leren geen gelabelde invoergegevens hebben.
  • Leren zonder toezicht verdient de voorkeur, omdat het gemakkelijker is om ongelabelde gegevens te verkrijgen in vergelijking met gelabelde gegevens.

Nadelen van leren zonder toezicht

  • Leren zonder toezicht is intrinsiek moeilijker dan leren onder toezicht, omdat het geen overeenkomstige resultaten oplevert.
  • Het resultaat van het onbewaakte leeralgoritme kan minder nauwkeurig zijn omdat invoergegevens niet zijn gelabeld en algoritmen de exacte uitvoer niet van tevoren kennen.