Tegenstrijdig zoeken is een zoektocht waarbij we het probleem onderzoeken dat zich voordoet wanneer we proberen vooruit te plannen op de wereld en andere actoren plannen tegen ons maken.
- In eerdere onderwerpen hebben we de zoekstrategieën bestudeerd die alleen verband houden met één enkele agent die tot doel heeft de oplossing te vinden, die vaak wordt uitgedrukt in de vorm van een reeks acties.
- Maar er kunnen situaties zijn waarin meer dan één agent in dezelfde zoekruimte naar de oplossing zoekt, en deze situatie doet zich meestal voor tijdens het spelen van games.
- De omgeving met meer dan één agent wordt genoemd als omgeving met meerdere agenten , waarin elke agent een tegenstander is van een andere agent en tegen elkaar speelt. Elke agent moet rekening houden met de actie van een andere agent en het effect van die actie op zijn of haar prestaties.
- Dus, Zoekopdrachten waarbij twee of meer spelers met tegenstrijdige doelen dezelfde zoekruimte voor de oplossing proberen te verkennen, worden vijandige zoekopdrachten genoemd, ook wel bekend als Games. .
- Games worden gemodelleerd als een zoekprobleem en een heuristische evaluatiefunctie, en dit zijn de twee belangrijkste factoren die helpen bij het modelleren en oplossen van games in AI.
Soorten games in AI:
Deterministisch | Kans beweegt | |
---|---|---|
Perfecte informatie | Schaken, Dammen, ga, Othello | Backgammon, monopolie |
Onvolmaakte informatie | Slagschepen, blinden, boter-kaas-en-eieren | Bridge, poker, scrabble, nucleaire oorlog |
Voorbeeld: Backgammon, Monopoly, Poker, enz.
Opmerking: in dit onderwerp bespreken we deterministische spellen, een volledig waarneembare omgeving, nulsom en waar elke agent afwisselend handelt.
Nulsomspel
- Zero-sum games zijn vijandige zoektochten waarbij sprake is van pure concurrentie.
- In het nulsomspel wordt de winst of het verlies aan nut van elke agent precies gecompenseerd door het verlies of de winst aan nut van een andere agent.
- De ene speler van het spel probeert één enkele waarde te maximaliseren, terwijl de andere speler deze probeert te minimaliseren.
- Elke zet van één speler in het spel wordt een ply genoemd.
- Schaken en boter-kaas-en-eieren zijn voorbeelden van een nulsomspel.
Zero-sum game: ingebed denken
Het Zero-sum-spel omvatte ingebed denken waarbij één agent of speler probeert uit te vinden:
- Wat moeten we doen.
- Hoe de zet te beslissen
- Hij moet ook aan zijn tegenstander denken
- De tegenstander denkt ook na over wat hij moet doen
Elk van de spelers probeert de reactie van zijn tegenstander op zijn acties te achterhalen. Dit vereist ingebed denken of achterwaarts redeneren om de spelproblemen in AI op te lossen.
Formalisering van het probleem:
Een game kan worden gedefinieerd als een soort zoekopdracht in AI die kan worden geformaliseerd uit de volgende elementen:
Spelboom:
Een spelboom is een boom waarbij de knooppunten van de boom de spelstatussen zijn en de randen van de boom de bewegingen van spelers. De spelboom omvat de beginstatus, de actiefunctie en de resultaatfunctie.
Voorbeeld: Tic-Tac-Toe-spelboom:
De volgende afbeelding toont een deel van de spelboom voor het boter-kaas-en-eieren-spel. Hieronder volgen enkele belangrijke punten van het spel:
- Er zijn twee spelers MAX en MIN.
- Spelers hebben een afwisselende beurt en beginnen met MAX.
- MAX maximaliseert het resultaat van de spelboom
- MIN minimaliseert het resultaat.
Voorbeeld uitleg:
- Vanaf de begintoestand heeft MAX 9 mogelijke zetten als hij als eerste begint. MAX plaats x en MIN plaats o, en beide spelers spelen afwisselend totdat we een bladknooppunt bereiken waar een speler er drie op een rij heeft of alle vierkanten gevuld zijn.
- Beide spelers berekenen elk knooppunt, minimax, de minimax-waarde die het best haalbare nut is tegen een optimale tegenstander.
- Stel dat beide spelers goed op de hoogte zijn van de boter-kaas-en-eieren en het beste spel spelen. Elke speler doet zijn best om te voorkomen dat een andere speler wint. MIN treedt in het spel op tegen Max.
- Dus in de spelboom hebben we een laag Max, een laag MIN, en elke laag heet as Laag . Max plaatst x, daarna zet MIN o om te voorkomen dat Max wint, en dit spel gaat door tot het eindknooppunt.
- Hierin wint MIN, MAX wint, of het is gelijkspel. Deze spelboom is de hele zoekruimte van mogelijkheden waarin MIN en MAX afwisselend boter-kaas-en-eieren spelen en om de beurt spelen.
Daarom werkt de vijandige zoektocht naar de minimax-procedure als volgt:
- Het doel is om de optimale strategie voor MAX te vinden om het spel te winnen.
- Het volgt de aanpak van Diepte-eerst zoeken.
- In de spelboom kan een optimaal bladknooppunt op elke diepte van de boom verschijnen.
- Verspreid de minimax-waarden naar de boom totdat het terminalknooppunt wordt ontdekt.
In een gegeven spelboom kan de optimale strategie worden bepaald op basis van de minimax-waarde van elk knooppunt, die kan worden geschreven als MINIMAX(n). MAX gaat het liefst naar een staat van maximale waarde en MIN gaat liever naar een staat van minimale waarde, en dan: