logo

Hypothesetesten begrijpen

Het testen van hypothesen omvat het formuleren van aannames over populatieparameters op basis van steekproefstatistieken en het rigoureus evalueren van deze aannames aan de hand van empirisch bewijsmateriaal. Dit artikel werpt licht op het belang van het testen van hypothesen en de cruciale stappen die daarbij betrokken zijn.

Wat is het testen van hypothesen?

Hypothesetesten is een statistische methode die wordt gebruikt om een ​​statistische beslissing te nemen op basis van experimentele gegevens. Het testen van hypothesen is in feite een veronderstelling die we maken over een populatieparameter. Het evalueert twee elkaar uitsluitende uitspraken over een populatie om te bepalen welke bewering het beste wordt ondersteund door de steekproefgegevens.



Voorbeeld: U zegt dat de gemiddelde lengte in de klas 30 jaar is, of dat een jongen groter is dan een meisje. Dit zijn allemaal aannames waar we van uitgaan, en we hebben een statistische manier nodig om deze te bewijzen. We hebben een wiskundige conclusie nodig, ongeacht wat we aannemen dat waar is.

Hypotheses definiëren

  • Nulhypothese (H 0 ): In de statistiek is de nulhypothese een algemene verklaring of standaardpositie dat er geen verband bestaat tussen twee gemeten gevallen of geen verband tussen groepen. Met andere woorden, het is een basisaanname of gemaakt op basis van de probleemkennis.
    Voorbeeld : De gemiddelde productie van een bedrijf bedraagt ​​50 eenheden/dag H0:  mu= 50.
  • Alternatieve hypothese (H 1 ): De alternatieve hypothese is de hypothese die wordt gebruikt bij het testen van hypothesen en die in strijd is met de nulhypothese.
    Voorbeeld: De productie van een bedrijf is niet gelijk aan 50 eenheden/per dag, d.w.z. H1:  mu N vijftig.

Sleutelbegrippen voor het testen van hypothesen

  • Mate van belang : Het verwijst naar de mate van significantie waarin we de nulhypothese accepteren of verwerpen. 100% nauwkeurigheid is niet mogelijk voor het aanvaarden van een hypothese, dus selecteren we daarom een ​​significantieniveau dat doorgaans 5% bedraagt. Normaal gesproken wordt dit aangegeven met alfaen over het algemeen is het 0,05 of 5%, wat betekent dat uw uitvoer met 95% zekerheid een soortgelijk resultaat in elk monster moet opleveren.
  • P-waarde: De P-waarde , of berekende waarschijnlijkheid, is de waarschijnlijkheid dat de waargenomen/extreme resultaten worden gevonden wanneer de nulhypothese (H0) van een door het onderzoek gegeven probleem waar is. Als uw P-waarde kleiner is dan het gekozen significantieniveau, verwerpt u de nulhypothese, d.w.z. accepteert u dat uw steekproef beweert de alternatieve hypothese te ondersteunen.
  • Teststatistiek: De teststatistiek is een numerieke waarde die wordt berekend op basis van steekproefgegevens tijdens een hypothesetest en die wordt gebruikt om te bepalen of de nulhypothese moet worden verworpen. Het wordt vergeleken met een kritische waarde of p-waarde om beslissingen te nemen over de statistische significantie van de waargenomen resultaten.
  • Kritische waarde : De kritische waarde in de statistiek is een drempel- of afkappunt dat wordt gebruikt om te bepalen of de nulhypothese bij een hypothesetest moet worden verworpen.
  • Graden van vrijheid: Vrijheidsgraden worden geassocieerd met de variabiliteit of vrijheid die men heeft bij het schatten van een parameter. De vrijheidsgraden zijn gerelateerd aan de steekproefomvang en bepalen de vorm.

Waarom gebruiken we hypothesetoetsen?

Het testen van hypothesen is een belangrijke procedure in de statistiek. Bij het testen van hypothesen worden twee elkaar uitsluitende populatie-uitspraken geëvalueerd om te bepalen welke bewering het meest wordt ondersteund door steekproefgegevens. Als we zeggen dat de bevindingen statistisch significant zijn, dankzij het testen van hypothesen.

Eenzijdige en tweezijdige test

Eénzijdige test richt zich op één richting, groter of kleiner dan een gespecificeerde waarde. Een eenzijdige toets gebruiken wij wanneer er op basis van voorkennis of theorie een duidelijke richtingsverwachting bestaat. Het kritieke gebied bevindt zich slechts aan één kant van de distributiecurve. Als de steekproef in dit kritieke gebied valt, wordt de nulhypothese verworpen ten gunste van de alternatieve hypothese.



Eenzijdige test

Er zijn twee soorten eenzijdige tests:

  • Linkszijdige (linkszijdige) test: De alternatieve hypothese stelt dat de werkelijke parameterwaarde kleiner is dan de nulhypothese. Voorbeeld: H0​: mu geq 50en H1:
  • en H1: mu>50

Tweezijdige test

Een tweezijdige test houdt rekening met beide richtingen, groter dan en kleiner dan een gespecificeerde waarde. We gebruiken een tweezijdige test als er geen specifieke richtingsverwachting is en we een significant verschil willen detecteren.

Voorbeeld: H0: in=50 en H1: mu 
eq 50



Wat zijn type 1- en type 2-fouten bij het testen van hypothesen?

Bij het testen van hypothesen Type I- en Type II-fouten zijn twee mogelijke fouten die onderzoekers kunnen maken bij het trekken van conclusies over een populatie op basis van een steekproef van gegevens. Deze fouten houden verband met de beslissingen die worden genomen met betrekking tot de nulhypothese en de alternatieve hypothese.

  • Type I-fout: Wanneer we de nulhypothese verwerpen, ook al was die hypothese waar. Type I-fout wordt aangegeven met alpha( alfa).
  • Type II-fouten: Wanneer we de nulhypothese aanvaarden, maar deze is onjuist. Type II-fouten worden aangegeven met beta( èta).


Nulhypothese is waar

De nulhypothese is onjuist

Nulhypothese is waar (accepteren)

Correcte beslissing

Type II-fout (fout-negatief)

Alternatieve hypothese is waar (verwerpen)

als anders Java

Type I-fout (fout-positief)

Correcte beslissing

Hoe werkt het testen van hypothesen?

Stap 1: Definieer nul- en alternatieve hypothesen

Formuleer de nulhypothese ( H_0), wat geen effect vertegenwoordigt, en de alternatieve hypothese ( H_1​), wat een effect of verschil suggereert.

We identificeren eerst het probleem waarover we een aanname willen doen, waarbij we in gedachten houden dat onze aannames met elkaar in tegenspraak moeten zijn, ervan uitgaande dat Normaal verdeelde gegevens.

Stap 2 – Kies het significantieniveau

Selecteer een significantieniveau ( alfa), doorgaans 0,05, om de drempel voor het verwerpen van de nulhypothese te bepalen. Het biedt validiteit aan onze hypothesetest en zorgt ervoor dat we over voldoende gegevens beschikken om onze beweringen te onderbouwen. Meestal bepalen we voorafgaand aan de test ons significantieniveau. De p-waarde is het criterium dat wordt gebruikt om onze significantiewaarde te berekenen.

Stap 3 Verzamel en analyseer gegevens.

Verzamel relevante gegevens door middel van observatie of experimenten. Analyseer de gegevens met behulp van geschikte statistische methoden om een ​​teststatistiek te verkrijgen.

Stap 4: Teststatistiek berekenen

De gegevens voor de tests worden geëvalueerd. In deze stap zoeken we naar verschillende scores op basis van de kenmerken van de gegevens. De keuze van de teststatistiek hangt af van het type hypothesetest dat wordt uitgevoerd.

Er zijn verschillende hypothesetests, elk geschikt voor verschillende doeleinden om onze test te berekenen. Dit kan een zijn Z-test , Chi-kwadraat , T-test , enzovoort.

  1. Z-test : Als populatiegemiddelden en standaardafwijkingen bekend zijn. Z-statistiek wordt vaak gebruikt.
  2. t-test : Als standaarddeviaties van de populatie onbekend zijn. en de steekproefomvang klein is, dan is de t-teststatistiek geschikter.
  3. chikwadraattoets : Chi-kwadraattoets wordt gebruikt voor categorische gegevens of voor het testen van de onafhankelijkheid in kruistabellen
  4. F-test : F-test wordt vaak gebruikt bij variantieanalyse (ANOVA) om varianties te vergelijken of de gelijkheid van gemiddelden tussen meerdere groepen te testen.

We hebben een kleinere dataset, dus een T-test is geschikter om onze hypothese te testen.

T-statistiek is een maatstaf voor het verschil tussen de gemiddelden van twee groepen in verhouding tot de variabiliteit binnen elke groep. Het wordt berekend als het verschil tussen de steekproefgemiddelden gedeeld door de standaardfout van het verschil. Het wordt ook wel de t-waarde of t-score genoemd.

Stap 5 – Teststatistieken vergelijken:

In deze fase beslissen we waar we de nulhypothese moeten accepteren of verwerpen. Er zijn twee manieren om te beslissen waar we de nulhypothese moeten accepteren of verwerpen.

Methode A: Kritische waarden gebruiken

Als we de teststatistiek en de getabelleerde kritische waarde vergelijken die we hebben,

  • Als Teststatistiek>Kritische waarde: Verwerp de nulhypothese.
  • Als Teststatistiek≤Kritische waarde: Kan de nulhypothese niet verwerpen.

Opmerking: Kritische waarden zijn vooraf bepaalde drempelwaarden die worden gebruikt om een ​​beslissing te nemen bij het testen van hypothesen. Om te bepalen kritische waarden voor het testen van hypothesen verwijzen we doorgaans naar een statistische verdelingstabel, zoals de normale verdeling of t-verdelingstabellen die daarop zijn gebaseerd.

Methode B: P-waarden gebruiken

We kunnen ook tot een conclusie komen met behulp van de p-waarde,

  • Als de p-waarde kleiner is dan of gelijk is aan het significantieniveau, d.w.z. ( pleqalfa), verwerp je de nulhypothese. Dit geeft aan dat het onwaarschijnlijk is dat de waargenomen resultaten louter door toeval zijn ontstaan, wat bewijs levert ten gunste van de alternatieve hypothese.
  • Als de p-waarde groter is dan het significantieniveau, d.w.z. ( pgeqalfa), slaagt u er niet in de nulhypothese te verwerpen. Dit suggereert dat de waargenomen resultaten consistent zijn met wat zou worden verwacht onder de nulhypothese.

Opmerking : De p-waarde is de waarschijnlijkheid dat een teststatistiek wordt verkregen die even extreem of extremer is dan de teststatistiek die in de steekproef wordt waargenomen, ervan uitgaande dat de nulhypothese waar is. Om te bepalen p-waarde voor het testen van hypothesen verwijzen we doorgaans naar een statistische verdelingstabel, zoals de normale verdeling of t-verdelingstabellen die daarop zijn gebaseerd.

Stap 7 - Interpreteer de resultaten

Eindelijk kunnen we ons experiment afsluiten met methode A of B.

Teststatistiek berekenen

Om onze hypothese over een populatieparameter die we gebruiken te valideren statistische functies . We gebruiken de z-score, p-waarde en significantieniveau (alfa) om bewijs te leveren voor onze hypothese normaal verdeelde gegevens .

1. Z-statistieken:

Wanneer populatiegemiddelden en standaarddeviaties bekend zijn.

z = frac{ar{x} - mu}{frac{sigma}{sqrt{n}}}

waar,

  • alk{x}is het steekproefgemiddelde,
  • μ vertegenwoordigt het populatiegemiddelde,
  • σ is de standaardafwijking
  • en n is de grootte van het monster.

2. T-statistieken

T-test wordt gebruikt wanneer n<30,

t-statistiekberekening wordt gegeven door:

t=frac{x̄-Μ}{s/sqrt{n}}

waar,

  • t = t-score,
  • x̄ = steekproefgemiddelde
  • μ = populatiegemiddelde,
  • s = standaardafwijking van het monster,
  • n = steekproefomvang

3. Chikwadraattest

Chi-kwadraattest voor categorische onafhankelijkheidsgegevens (niet-normaal verdeeld) met behulp van:

chi^2 = som frac{(O_{ij} - E_{ij})^2}{E_{ij}}

waar,

  • O_{ij}is de waargenomen frequentie in de cel {ij}
  • i,j zijn respectievelijk de rijen- en kolommenindex.
  • E_{ij}is de verwachte frequentie in de cel {ij}, berekend als:
    frac{{	ext{{Rijtotaal}} 	imes 	ext{{Kolomtotaal}}}}{{	ext{{Totaal aantal waarnemingen}}}}

Voorbeeld van het testen van hypothesen uit het echte leven

Laten we het testen van hypothesen onderzoeken met behulp van twee situaties uit het echte leven:

Geval A: D Heeft een nieuw medicijn invloed op de bloeddruk?

Stel je voor dat een farmaceutisch bedrijf een nieuw medicijn heeft ontwikkeld waarvan zij denken dat het de bloeddruk effectief kan verlagen bij patiënten met hypertensie. Voordat ze het medicijn op de markt brengen, moeten ze een onderzoek uitvoeren om de impact ervan op de bloeddruk te beoordelen.

Gegevens:

  • Vóór behandeling: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Na behandeling: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

Stap 1 : Definieer de hypothese

  • Nulhypothese : (H0)Het nieuwe medicijn heeft geen effect op de bloeddruk.
  • Alternatieve hypothese : (H1)Het nieuwe medicijn heeft effect op de bloeddruk.

Stap 2: Definieer het significantieniveau

Laten we het significantieniveau op 0,05 beschouwen, wat aangeeft dat de nulhypothese wordt verworpen.

Als het bewijs suggereert dat er minder dan 5% kans is dat de resultaten worden waargenomen vanwege willekeurige variatie.

Stap 3 : Bereken de teststatistiek

Gebruik makend van gepaarde T-test analyseer de gegevens om een ​​teststatistiek en een p-waarde te verkrijgen.

De teststatistiek (bijvoorbeeld T-statistiek) wordt berekend op basis van de verschillen tussen bloeddrukmetingen vóór en na de behandeling.

t = m/(s/√n)

Waar:

  • M = gemiddelde van het verschil, d.w.z X na, X voor
  • S = standaardafwijking van het verschil (d), d.w.z D i ​= X na, i X voor,
  • N = steekproefomvang,

dan is m= -3,9, s= 1,8 en n= 10

wij berekenen de T-statistiek = -9 op basis van de formule voor gepaarde t-test

Stap 4: Zoek de p-waarde

De berekende t-statistiek is -9 en vrijheidsgraden df = 9, je kunt de p-waarde vinden met behulp van statistische software of een t-verdelingstabel.

dus p-waarde = 8,538051223166285e-06

Stap 5: Resultaat

  • Als de p-waarde kleiner dan of gelijk is aan 0,05, verwerpen de onderzoekers de nulhypothese.
  • Als de p-waarde groter is dan 0,05, slagen ze er niet in de nulhypothese te verwerpen.

Conclusie: Omdat de p-waarde (8,538051223166285e-06) kleiner is dan het significantieniveau (0,05), verwerpen de onderzoekers de nulhypothese. Er is statistisch significant bewijs dat de gemiddelde bloeddruk vóór en na de behandeling met het nieuwe medicijn verschillend is.

Python-implementatie van het testen van hypothesen

Laten we hypothesetesten uitvoeren met Python, waarbij we testen of een nieuw medicijn de bloeddruk beïnvloedt. Voor dit voorbeeld gebruiken we een gepaarde T-test. We gebruiken de scipy.stats> bibliotheek voor de T-toets.

We zullen ons eerste echte probleem implementeren via Python,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Uitgang:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

In het bovenstaande voorbeeld duiden de resultaten, gegeven de T-statistiek van ongeveer -9 en een extreem kleine p-waarde, op een sterk argument om de nulhypothese te verwerpen bij een significantieniveau van 0,05.

  • De resultaten suggereren dat het nieuwe medicijn, de nieuwe behandeling of de interventie een significant effect heeft op het verlagen van de bloeddruk.
  • De negatieve T-statistiek geeft aan dat de gemiddelde bloeddruk na de behandeling aanzienlijk lager is dan het veronderstelde populatiegemiddelde vóór de behandeling.

Zaak B : Cholesterolniveau in een populatie

Gegevens: Er wordt een steekproef van 25 personen genomen en hun cholesterolgehalte wordt gemeten.

Cholesterolwaarden (mg/dl): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 205, 210, 192, 205, 198, 205, 210, 192, 205.

Populatiegemiddelde = 200

Populatiestandaardafwijking (σ): 5 mg/dL (gegeven voor dit probleem)

Stap 1: Definieer de hypothese

  • Nulhypothese (H 0 ): Het gemiddelde cholesterolgehalte in een populatie is 200 mg/dl.
  • Alternatieve hypothese (H 1 ): Het gemiddelde cholesterolgehalte in een populatie verschilt van 200 mg/dl.

Stap 2: Definieer het significantieniveau

Omdat de richting van de afwijking niet wordt gegeven, gaan we uit van een tweezijdige toets, en op basis van een normale verdelingstabel kunnen de kritische waarden voor een significantieniveau van 0,05 (tweezijdig) worden berekend via de z-tabel en zijn ongeveer -1,96 en 1,96.

Stap 3 : Bereken de teststatistiek

De teststatistiek wordt berekend met behulp van de z-formule MET = (203,8 - 200) / (5 div sqrt{25})en we krijgen dienovereenkomstig, MET =2,039999999999992.

Stap 4: Resultaat

Omdat de absolute waarde van de teststatistiek (2,04) groter is dan de kritische waarde (1,96), verwerpen we de nulhypothese. En concludeer dat er statistisch significant bewijs is dat het gemiddelde cholesterolgehalte in de bevolking anders is dan 200 mg/dl

Python-implementatie van het testen van hypothesen

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>max>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Uitgang:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Beperkingen van het testen van hypothesen

  • Hoewel het een nuttige techniek is, biedt het testen van hypothesen geen alomvattend inzicht in het onderwerp dat wordt bestudeerd. Zonder de complexiteit of de hele context van de verschijnselen volledig weer te geven, concentreert het zich op bepaalde hypothesen en statistische significantie.
  • De nauwkeurigheid van de resultaten van het testen van hypothesen is afhankelijk van de kwaliteit van de beschikbare gegevens en de geschiktheid van de gebruikte statistische methoden. Onnauwkeurige gegevens of slecht geformuleerde hypothesen kunnen tot onjuiste conclusies leiden.
  • Als analisten uitsluitend vertrouwen op het testen van hypothesen, kunnen ze significante patronen of relaties in de gegevens over het hoofd zien die niet worden vastgelegd in de specifieke hypothesen die worden getest. Deze beperking onderstreept het belang van het complementeren van het testen van hypothesen met andere analytische benaderingen.

Conclusie

Het testen van hypothesen vormt een hoeksteen van de statistische analyse, waardoor datawetenschappers door onzekerheden kunnen navigeren en geloofwaardige conclusies kunnen trekken uit voorbeeldgegevens. Door systematisch nul- en alternatieve hypothesen te definiëren, significantieniveaus te kiezen en gebruik te maken van statistische tests kunnen onderzoekers de geldigheid van hun aannames beoordelen. Het artikel verduidelijkt ook het kritische onderscheid tussen Type I- en Type II-fouten, waardoor een uitgebreid inzicht wordt geboden in het genuanceerde besluitvormingsproces dat inherent is aan het testen van hypothesen. Het praktijkvoorbeeld van het testen van het effect van een nieuw medicijn op de bloeddruk met behulp van een gepaarde T-test toont de praktische toepassing van deze principes aan en onderstreept het belang van statistische nauwkeurigheid bij datagestuurde besluitvorming.

Veelgestelde vragen (FAQ's)

1. Wat zijn de 3 soorten hypothesetoetsen?

Er zijn drie soorten hypothesetoetsen: rechtszijdig, linkszijdig en tweezijdig. Rechtszijdige tests beoordelen of een parameter groter is, linkszijdige als deze kleiner is. Bij tweezijdige tests wordt gecontroleerd op niet-directionele verschillen, groter of kleiner.

2.Wat zijn de 4 componenten van het testen van hypothesen?

Nulhypothese ( H_o): Er is geen effect of verschil.

Alternatieve hypothese ( H_1): Er is een effect of verschil.

Mate van belangrijkheid ( alfa): Risico om de nulhypothese te verwerpen terwijl deze waar is (type I-fout).

Teststatistiek: numerieke waarde die waargenomen bewijs tegen de nulhypothese vertegenwoordigt.

3.Wat is het testen van hypothesen in ML?

Statistische methode om de prestaties en validiteit van machine learning-modellen te evalueren. Test specifieke hypothesen over modelgedrag, bijvoorbeeld of kenmerken voorspellingen beïnvloeden en of een model goed generaliseert naar onzichtbare gegevens.

4.Wat is het verschil tussen Pytest en hypothese in Python?

Pytest is bedoeld voor een algemeen testframework voor Python-code, terwijl Hypothesis een op eigenschappen gebaseerd testframework voor Python is, gericht op het genereren van testgevallen op basis van gespecificeerde eigenschappen van de code.