logo

Machine learning-algoritmen

Machine learning-algoritmen zijn computermodellen waarmee computers patronen kunnen begrijpen en voorspellingen kunnen doen of oordelen kunnen vellen op basis van gegevens zonder de noodzaak van expliciete programmering. Deze algoritmen vormen de basis van de moderne kunstmatige intelligentie en worden gebruikt in een breed scala aan toepassingen, waaronder beeld- en spraakherkenning, natuurlijke taalverwerking, aanbevelingssystemen, fraudedetectie, autonome auto’s etc.

Dit Machine learning-algoritmen artikel behandelt alle essentiële algoritmen van machine learning, zoals Ondersteuning van vectormachine, besluitvorming, logistieke regressie, naïeve bayees-classificator, willekeurig bos, k-mean clustering, versterkend leren, vector, hiërarchische clustering, xgboost, adaboost, logistiek, enz.



Soorten machine learning-algoritmen

Er zijn drie soorten machine learning-algoritmen.

  1. Leren onder toezicht
    • Regressie
    • Classificatie
  2. Ongecontroleerd leren
  3. Versterkend leren

Soorten machine learning-algoritmen

1. Begeleid leeralgoritme

Leren onder toezicht is een type machine learning-algoritmen waarbij we een gelabelde dataset hebben gebruikt om het model of de algoritmen te trainen. Het doel van het algoritme is om een ​​mapping te leren van de invoergegevens naar de uitvoerlabels, waardoor het voorspellingen of classificaties kan maken op basis van nieuwe, onzichtbare gegevens.

Begeleide Machine Learning-algoritmen

  1. Lineair model:
    • Regressie
      • Gewone kleinste kwadratenregressie
      • Eenvoudige lineaire regressie
      • Meerdere lineaire regressie
      • Polynomiale regressie
      • Orthogonale Matching Pursuit (OMP)
      • Bayesiaanse regressie
      • Kwantielregressie
      • Isotone regressie
      • Stapsgewijze regressie
      • Regressie met de kleinste hoek (LARS)
    • Classificatie:
    • Regularisatie :
      • Lasso (L1-regularisatie)
      • Ridge (L2-regularisatie)
        • Ridge-regressie
        • Ridge-classificator
      • Elastisch net
      • LARS Lasso
  2. K-dichtstbijzijnde buren (KNN):
    • Brute Force-algoritmen
    • Ball Tree- en KD Tree-algoritmen
    • Classificator K-dichtstbijzijnde buren (KNN).
    • K-Nearest Neighbours (KNN) Regressor
  3. Ondersteuning van vectormachines:
    • Ondersteuning van vectormachines Regressor
    • Verschillende kernelfuncties in SVM
  4. Stochastische gradiëntdaling
    • Stochastische Gradient Descent Classifier
    • Stochastische Gradient Descent Regressor
    • Verschillende verliesfuncties in SGD
  5. Beslissingsboom:
    • Beslisboomalgoritmen
      • Iteratieve Dichotomiser 3 (ID3) algoritmen
      • C5. Algoritmen
      • Classificatie- en regressiebomenalgoritmen
    • Beslissingsboomclassificatie
    • Regressor van de beslissingsboom
  6. Ensemble-leren:
    • Opzakken (Bootstrap-aggregatie)
    • Stimuleren
      • AdaBoost
      • XGBoost
      • KatBoost
      • Gradiëntverhogende machines (GBM)
      • LichtGBM
    • Stapelen
  7. Generatief model
    • Naïeve Bayes
      • Gaussiaanse naïeve Bayes
      • Multinomiale naïeve Bayes
      • Bernoulli Naïeve Bayes
    • Gaussiaanse processen
      • Gaussiaanse procesregressie (GPR)
      • Gaussiaanse procesclassificatie (GPC)
    • Gaussiaanse discriminantanalyse
      • Lineaire discriminantanalyse (LDA)
      • Kwadratische discriminantanalyse (QDA)
    • Bayesiaanse geloofsnetwerken
    • Verborgen Markov-modellen (HMM's)
  8. Tijdreeksvoorspellingen:
    • Visualisatie en analyse van tijdreeksen:
      • Tijdreekscomponenten: trend, seizoensinvloeden en ruis
      • Ontledingstechnieken voor tijdreeksen
      • Seizoensaanpassing en differentiatie
      • Autocorrelatie en gedeeltelijke autocorrelatiefuncties
      • Uitgebreide Dickey-Fuller-test
      • Seizoensgebonden ontleding van tijdreeksen (STL-ontleding)
      • Box-Jenkins-methodologie voor ARIMA-modellen
    • Tijdreeksvoorspellingsalgoritmen:
      • Voortschrijdend gemiddelde (MA) en gewogen voortschrijdend gemiddelde
      • Exponentiële afvlakkingsmethoden (eenvoudig, dubbel en drievoudig)
      • Autoregressieve (AR) modellen
      • voortschrijdend gemiddelde (MA) modellen
      • Autoregressieve Integrated Moving Average (ARIMA)-modellen
      • Seizoensgebonden ontleding van tijdreeksen door Löss (STL)
      • Seizoensgebonden autoregressieve geïntegreerde voortschrijdend gemiddelde (SARIMA) modellen
      • ARIMAX- en SARIMAX-modellen
  9. Techniek voor het reduceren van de dimensionaliteit onder toezicht:
    • Lineaire discriminantanalyse (LDA)

Sommige van de begeleide machine learning-algoritmen kunnen met een kleine aanpassing worden gebruikt voor zowel classificatie als regressie

  • Multiclass- en multioutput-algoritmen:
    • Classificatie met meerdere klassen
      • OneVsRest-classificatie
    • Classificatie met meerdere labels
    • Regressie met meerdere uitgangen

Statistieken voor classificatie- en regressie-algoritmen:

  • Regressiestatistieken:
    • Gemiddelde kwadratische fout (MSE)
    • Root mean kwadratische fout (RMSE)
    • Gemiddelde absolute fout (MAE)
    • R-kwadraat
    • Aangepast R-kwadraat
  • Classificatiestatistieken:
  • Kalibratie van de waarschijnlijkheid
    • Kalibratiecurven
    • Een classificator kalibreren

Kruisvalidatietechniek:

  • K-voudige kruisvalidatie
  • Gestratificeerde k-voudige kruisvalidatie
  • Laat één-uit-kruisvalidatie achterwege
  • Shuffle-gesplitste kruisvalidatie
  • Kruisvalidatie van tijdreeksen

Optimalisatietechniek:

  • Gradiënt afdaling
    • Stochastische gradiëntdaling
    • Mini-batch gradiëntdaling
    • Op momentum gebaseerde gradiëntdaling
  • Op Newton gebaseerde optimalisatietechnieken
    • Het algoritme van Newton
    • Quasi-Newton-methoden (BFGS, L-BFGS)
    • Geconjugeerde verloop
  • Lokale zoekoptimalisatietechnieken
    • Bergbeklimmen
    • Tabu-zoekopdracht

2. Ongecontroleerd leeralgoritme

Ongecontroleerd leren is een type machine learning-algoritmen waarbij de algoritmen worden gebruikt om de patronen, structuur of relatie binnen een dataset te vinden met behulp van een niet-geëtiketteerde dataset. Het onderzoekt de inherente structuur van de gegevens zonder vooraf gedefinieerde categorieën of labels.

Machine learning-algoritmen zonder toezicht

  • Clustering
    • Centroid-gebaseerde methoden
    • Op distributie gebaseerde methoden
    • Op connectiviteit gebaseerde methoden
      • Hiërarchische clustering
        • Agglomeratieve clustering
        • Verdeeldheidwekkende clustering
      • Affiniteitsvoortplanting
    • Op dichtheid gebaseerde methoden
      • DBSCAN (op dichtheid gebaseerde ruimtelijke clustering van toepassingen met ruis)
      • OPTICS (bestelpunten om de clusterstructuur te identificeren)
  • Associatieregel Mijnbouw
    • Apriori-algoritme
    • FP-groei (frequente patroongroei)
    • ECLAT (Equivalence Class Clustering en bottom-up Lattice Traversal)
  • Onregelmatigheidsdetectie:
    • Z-score
    • Lokale uitbijterfactor (LOF)
    • Isolatie Bos
  • Dimensionaliteitsreductietechniek:
    • Hoofdcomponentenanalyse (PCA)
    • t-gedistribueerde stochastische buurinbedding (t-SNE)
    • Niet-negatieve matrixfactorisatie (NMF)
    • Onafhankelijke Component Analyse (ICA)
    • Factoren analyse
    • Latente Dirichlet-toewijzing (LDA)
    • Isomap
    • Lokaal lineaire inbedding (LLE)
    • Latente semantische analyse (LSA)

3. Versterkend leren

Versterkend leren is een soort machine learning-algoritmen waarbij een agent opeenvolgende beslissingen leert nemen door interactie met zijn omgeving. De agent ontvangt de feedback in de vorm van prikkels of straffen op basis van zijn acties. Het doel van de agent is om met vallen en opstaan ​​optimale tactieken te ontdekken die de cumulatieve beloningen in de loop van de tijd maximaliseren. Versterkend leren wordt vaak toegepast in scenario's waarin de agent moet leren navigeren door een omgeving, games spelen, robots besturen of oordelen vellen in onzekere situaties.

Linux-opdrachten die

Versterkend leren

  • Modelgebaseerde methoden:
    • Markov-beslissingsprocessen (MDP's)
    • Bellman-vergelijking
    • Waarde-iteratie-algoritme
    • Boom zoeken in Monte Carlo
  • Modelvrije methoden:
    • Op waarden gebaseerde methoden:
      • Q-Leren
      • SAUS
      • Monte Carlo-methoden
    • Beleidsgebaseerde methoden:
      • VERSTERK algoritme
      • Acteur-criticus algoritme
    • Acteur-criticusmethoden
      • Asynchrone voordeelacteur-criticus (A3C)

Lijst met populaire machine learning-algoritmen

Hier is een lijst met de top 10 van populairste Machine Learning-algoritmen.

1. Lineaire regressie

Lineaire regressie is een eenvoudig algoritme dat wordt gebruikt om de lineaire relatie tussen invoerkenmerken en een continue doelvariabele in kaart te brengen. Het werkt door een lijn aan de gegevens te koppelen en deze lijn vervolgens te gebruiken om nieuwe waarden te voorspellen.

2. Logistieke regressie

Logistische regressie is een uitbreiding van lineaire regressie die wordt gebruikt voor classificatietaken om de waarschijnlijkheid in te schatten dat een instantie tot een specifieke klasse behoort.

3. SVM (ondersteuningsvectormachine)

SVM's zijn begeleide leeralgoritmen die classificatie- en regressietaken kunnen uitvoeren. Het vindt een hypervlak dat klassen het beste scheidt in de featureruimte.

4. KNN (K-dichtstbijzijnde buur)

KNN is een niet-parametrische techniek die zowel voor classificatie als voor regressie kan worden gebruikt. Het werkt door de k datapunten die het meest op een nieuw datapunt lijken te identificeren en vervolgens het label van het nieuwe datapunt te voorspellen met behulp van de labels van die datapunten.

5. Beslisboom

Beslisbomen zijn een soort begeleide leertechniek die zowel voor classificatie als voor regressie kan worden gebruikt. Het werkt door de gegevens in steeds kleinere groepen te segmenteren totdat elke groep met een hoge mate van nauwkeurigheid kan worden geclassificeerd of voorspeld.

6. Willekeurig bos

Willekeurige bossen zijn een soort ensemble-leermethode waarbij gebruik wordt gemaakt van een reeks beslissingsbomen om voorspellingen te doen door voorspellingen van individuele bomen samen te voegen. Het verbetert de precisie en veerkracht van afzonderlijke beslissingsbomen. Het kan worden gebruikt voor zowel classificatie- als regressietaken.

7. Naïeve Bayes

Naive Bayes is een probabilistische classificator gebaseerd op de stelling van Bayes die wordt gebruikt voor classificatietaken. Het werkt door aan te nemen dat de kenmerken van een datapunt onafhankelijk van elkaar zijn.

8. PCA (analyse van hoofdcomponenten)

PCA is een dimensionaliteitsreductietechniek die wordt gebruikt om gegevens naar een lager-dimensionale ruimte te transformeren, terwijl zoveel mogelijk variantie behouden blijft. Het werkt door de richtingen in de gegevens te vinden die de meeste variatie bevatten, en vervolgens de gegevens op die richtingen te projecteren.

9. Apriori-algoritmen

Apriori-algoritme is een traditionele dataminingtechniek voor het minen van associatieregels in transactionele databases of datasets. Het is ontworpen om verbanden en patronen bloot te leggen tussen zaken die regelmatig samen voorkomen in transacties. Apriori detecteert frequente itemsets, dit zijn groepen items die samen voorkomen in transacties met een bepaald minimaal ondersteuningsniveau.

10. K-betekent clustering

K-Means-clustering is een leerbenadering zonder toezicht die kan worden gebruikt om gegevenspunten te groeperen. Het werkt door k clusters in de gegevens te vinden, zodat de gegevenspunten in elke cluster zoveel mogelijk op elkaar lijken en tegelijkertijd zo verschillend mogelijk blijven van de gegevenspunten in andere clusters.

Ontdek de fundamentele concepten die machine learning aansturen door de top 10 algoritmen , zoals lineaire regressie, beslissingsbomen en neurale netwerken.

Machine Learning-algoritme – Veelgestelde vragen

1. Wat is een algoritme in Machine Learning?

Machine learning-algoritmen zijn technieken gebaseerd op statistische concepten waarmee computers van gegevens kunnen leren, patronen kunnen ontdekken, voorspellingen kunnen doen of taken kunnen voltooien zonder de noodzaak van expliciete programmering. Deze algoritmen worden grofweg ingedeeld in de drie typen: begeleid leren, leren zonder toezicht en versterkend leren.

2. Wat zijn soorten machinaal leren?

Er zijn grofweg drie soorten machine learning:

  • Gecontroleerd algoritme
  • Ongecontroleerd algoritme
  • Versterkingsalgoritme

3. Welk ML-algoritme is het beste voor voorspellingen?

De ideale machine learning-methode voor voorspellingen wordt bepaald door a aantal criteria , inclusief de aard van het probleem, het type gegevens en de unieke vereisten. Support Vector Machines, Random Forests en Gradient Boosting-benaderingen zijn populair voor voorspellingsworkloads. De selectie van een algoritme moet daarentegen gebaseerd zijn op het testen en evalueren van het specifieke probleem en de dataset die voorhanden is.

4. Wat zijn de 10 populaire leeralgoritmen?

Hieronder vindt u de lijst met de 10 meest gebruikte Machine Learning (ML)-algoritmen:

  1. Lineaire regressie
  2. Logistieke regressie
  3. SVM (ondersteuningsvectormachine)
  4. KNN (K-dichtstbijzijnde buur)
  5. Beslissingsboom
  6. Willekeurig bos
  7. Naïeve Bayes
  8. PCA (analyse van hoofdcomponenten)
  9. Apriori-algoritmen
  10. K-betekent clustering