Bot Divin corrigé (plus performant)
This commit is contained in:
@@ -2,14 +2,14 @@ package fr.iut_fbleau.Bot;
|
|||||||
|
|
||||||
import fr.iut_fbleau.Avalam.*;
|
import fr.iut_fbleau.Avalam.*;
|
||||||
import fr.iut_fbleau.GameAPI.*;
|
import fr.iut_fbleau.GameAPI.*;
|
||||||
|
|
||||||
import java.util.*;
|
import java.util.*;
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Bot "Divin" (alpha-beta + évaluateur pondéré).
|
* Bot expert utilisant l'algorithme Alpha-Beta pour le jeu Avalam.
|
||||||
* * Idée :
|
* * Idée :
|
||||||
* - Utilise l'algorithme Alpha-Beta pour anticiper les coups.
|
* - Explore l'arbre des coups possibles jusqu'à une profondeur donnée.
|
||||||
* - Évalue les plateaux non terminaux en accordant plus d'importance aux tours hautes.
|
* - Utilise l'élagage Alpha-Beta pour optimiser la recherche.
|
||||||
|
* - Évalue les positions selon le contrôle des tours et leur hauteur.
|
||||||
*/
|
*/
|
||||||
public class DivineBot extends AbstractGamePlayer {
|
public class DivineBot extends AbstractGamePlayer {
|
||||||
|
|
||||||
@@ -18,58 +18,46 @@ public class DivineBot extends AbstractGamePlayer {
|
|||||||
/** Joueur contrôlé par ce bot (PLAYER1 ou PLAYER2). */
|
/** Joueur contrôlé par ce bot (PLAYER1 ou PLAYER2). */
|
||||||
private final Player me;
|
private final Player me;
|
||||||
|
|
||||||
/** Profondeur maximale de recherche avant évaluation. */
|
/** Profondeur maximale de recherche (cut-off). */
|
||||||
private final int maxDepth;
|
private final int maxDepth;
|
||||||
|
|
||||||
/** Générateur aléatoire pour choisir parmi les meilleurs coups équivalents. */
|
/** Générateur aléatoire pour départager les coups de même valeur. */
|
||||||
private final Random rng = new Random();
|
private final Random rng = new Random();
|
||||||
|
|
||||||
// Constructeur
|
// Constructeur
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Construit le bot Divine.
|
* Construit un bot DivineBot.
|
||||||
*
|
* * @param p joueur contrôlé par ce bot
|
||||||
* @param p joueur contrôlé par ce bot
|
* @param maxDepth profondeur maximale de recherche
|
||||||
* @param maxDepth profondeur de l'arbre de recherche
|
|
||||||
*/
|
*/
|
||||||
public DivineBot(Player p, int maxDepth) {
|
public DivineBot(Player p, int maxDepth) {
|
||||||
super(p);
|
super(p);
|
||||||
this.me = p;
|
this.me = p;
|
||||||
this.maxDepth = Math.max(1, maxDepth);
|
this.maxDepth = 2;
|
||||||
}
|
}
|
||||||
|
|
||||||
// Méthodes
|
// Méthodes
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Méthode principale de décision du bot.
|
* Méthode appelée par GameAPI : le bot doit choisir le meilleur coup possible.
|
||||||
* Explore le premier niveau de l'arbre et lance les appels Alpha-Beta.
|
* * @param board copie sûre de l'état de jeu (IBoard)
|
||||||
* * @param board état actuel du jeu
|
* @return le coup choisi (AbstractPly) ou null si aucun coup n'est possible
|
||||||
* @return le meilleur coup calculé (AbstractPly)
|
|
||||||
*/
|
*/
|
||||||
@Override
|
@Override
|
||||||
public AbstractPly giveYourMove(IBoard board) {
|
public AbstractPly giveYourMove(IBoard board) {
|
||||||
|
|
||||||
if (board == null || board.isGameOver()) return null;
|
if (board == null || board.isGameOver()) return null;
|
||||||
|
|
||||||
List<AbstractPly> moves = listMoves(board);
|
List<AbstractPly> moves = listMoves(board);
|
||||||
if (moves.isEmpty()) return null;
|
int bestValue = Integer.MIN_VALUE;
|
||||||
|
|
||||||
boolean isMax = board.getCurrentPlayer() == me;
|
|
||||||
|
|
||||||
int bestValue = isMax ? Integer.MIN_VALUE : Integer.MAX_VALUE;
|
|
||||||
List<AbstractPly> bestMoves = new ArrayList<>();
|
List<AbstractPly> bestMoves = new ArrayList<>();
|
||||||
|
|
||||||
int alpha = Integer.MIN_VALUE;
|
|
||||||
int beta = Integer.MAX_VALUE;
|
|
||||||
|
|
||||||
for (AbstractPly m : moves) {
|
for (AbstractPly m : moves) {
|
||||||
IBoard next = board.safeCopy();
|
IBoard next = board.safeCopy();
|
||||||
next.doPly(m);
|
next.doPly(m);
|
||||||
|
// On calcule la valeur du plateau après ce coup
|
||||||
|
int value = alphaBeta(next, maxDepth - 1, Integer.MIN_VALUE, Integer.MAX_VALUE);
|
||||||
|
|
||||||
// Appel récursif pour évaluer la suite du coup
|
|
||||||
int value = alphaBeta(next, maxDepth - 1, alpha, beta);
|
|
||||||
|
|
||||||
if (isMax) {
|
|
||||||
if (value > bestValue) {
|
if (value > bestValue) {
|
||||||
bestValue = value;
|
bestValue = value;
|
||||||
bestMoves.clear();
|
bestMoves.clear();
|
||||||
@@ -77,125 +65,94 @@ public class DivineBot extends AbstractGamePlayer {
|
|||||||
} else if (value == bestValue) {
|
} else if (value == bestValue) {
|
||||||
bestMoves.add(m);
|
bestMoves.add(m);
|
||||||
}
|
}
|
||||||
alpha = Math.max(alpha, bestValue);
|
|
||||||
} else {
|
|
||||||
if (value < bestValue) {
|
|
||||||
bestValue = value;
|
|
||||||
bestMoves.clear();
|
|
||||||
bestMoves.add(m);
|
|
||||||
} else if (value == bestValue) {
|
|
||||||
bestMoves.add(m);
|
|
||||||
}
|
}
|
||||||
beta = Math.min(beta, bestValue);
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
// Retourne un coup au hasard parmi les meilleurs ex-aequo
|
|
||||||
return bestMoves.get(rng.nextInt(bestMoves.size()));
|
return bestMoves.get(rng.nextInt(bestMoves.size()));
|
||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Algorithme récursif de recherche avec élagage Alpha-Beta.
|
* Fonction récursive Alpha-Beta pour évaluer l'arbre de décision.
|
||||||
|
* * @param board état actuel du plateau
|
||||||
|
* @param depth profondeur restante à explorer
|
||||||
|
* @param alpha borne inférieure
|
||||||
|
* @param beta borne supérieure
|
||||||
|
* @return la valeur de l'évaluation
|
||||||
*/
|
*/
|
||||||
private int alphaBeta(IBoard board, int depth, int alpha, int beta) {
|
private int alphaBeta(IBoard board, int depth, int alpha, int beta) {
|
||||||
|
if (board.isGameOver()) {
|
||||||
// Cas de base : fin de partie ou limite de profondeur atteinte
|
|
||||||
if (board.isGameOver()) return terminalValue(board);
|
|
||||||
if (depth == 0) return evaluate(board);
|
|
||||||
|
|
||||||
boolean isMax = board.getCurrentPlayer() == me;
|
|
||||||
|
|
||||||
List<AbstractPly> moves = listMoves(board);
|
|
||||||
if (moves.isEmpty()) {
|
|
||||||
return evaluate(board);
|
|
||||||
}
|
|
||||||
|
|
||||||
if (isMax) {
|
|
||||||
int best = Integer.MIN_VALUE;
|
|
||||||
for (AbstractPly m : moves) {
|
|
||||||
IBoard next = board.safeCopy();
|
|
||||||
next.doPly(m);
|
|
||||||
|
|
||||||
int val = alphaBeta(next, depth - 1, alpha, beta);
|
|
||||||
best = Math.max(best, val);
|
|
||||||
alpha = Math.max(alpha, best);
|
|
||||||
|
|
||||||
if (alpha >= beta) break; // Coupure Beta
|
|
||||||
}
|
|
||||||
return best;
|
|
||||||
} else {
|
|
||||||
int best = Integer.MAX_VALUE;
|
|
||||||
for (AbstractPly m : moves) {
|
|
||||||
IBoard next = board.safeCopy();
|
|
||||||
next.doPly(m);
|
|
||||||
|
|
||||||
int val = alphaBeta(next, depth - 1, alpha, beta);
|
|
||||||
best = Math.min(best, val);
|
|
||||||
beta = Math.min(beta, best);
|
|
||||||
|
|
||||||
if (alpha >= beta) break; // Coupure Alpha
|
|
||||||
}
|
|
||||||
return best;
|
|
||||||
}
|
|
||||||
}
|
|
||||||
|
|
||||||
/**
|
|
||||||
* Calcule la valeur de l'état final (Victoire / Défaite).
|
|
||||||
*/
|
|
||||||
private int terminalValue(IBoard board) {
|
|
||||||
Result r = board.getResult();
|
Result r = board.getResult();
|
||||||
if (r == null) return 0;
|
|
||||||
|
|
||||||
if (r == Result.DRAW) return 0;
|
if (r == Result.DRAW) return 0;
|
||||||
|
|
||||||
boolean botIsP1 = (me == Player.PLAYER1);
|
boolean p1Wins = (r == Result.WIN);
|
||||||
// Si le bot gagne, valeur positive élevée, sinon valeur négative
|
boolean amIP1 = (me == Player.PLAYER1);
|
||||||
return ((r == Result.WIN) == botIsP1) ? 100000 : -100000;
|
return (p1Wins == amIP1) ? 10000 : -10000;
|
||||||
|
}
|
||||||
|
|
||||||
|
if (depth == 0) return evaluate(board);
|
||||||
|
|
||||||
|
// Si c'est à moi de jouer, je maximise. Sinon, je minimise.
|
||||||
|
boolean isMax = (board.getCurrentPlayer() == me);
|
||||||
|
int best = isMax ? Integer.MIN_VALUE : Integer.MAX_VALUE;
|
||||||
|
|
||||||
|
for (AbstractPly m : listMoves(board)) {
|
||||||
|
IBoard next = board.safeCopy();
|
||||||
|
next.doPly(m);
|
||||||
|
int val = alphaBeta(next, depth - 1, alpha, beta);
|
||||||
|
|
||||||
|
if (isMax) {
|
||||||
|
best = Math.max(best, val);
|
||||||
|
alpha = Math.max(alpha, best);
|
||||||
|
} else {
|
||||||
|
best = Math.min(best, val);
|
||||||
|
beta = Math.min(beta, best);
|
||||||
|
}
|
||||||
|
if (alpha >= beta) break;
|
||||||
|
}
|
||||||
|
return best;
|
||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Heuristique évoluée pour Avalam :
|
* Heuristique spécifique à Avalam.
|
||||||
* Calcule un score basé sur le contrôle des tours et leur hauteur.
|
* Valorise le contrôle des tours, avec un bonus pour les tours de hauteur 5 (verrouillées).
|
||||||
* Les tours de hauteur 5 sont prioritaires car elles sont bloquées.
|
* * @param board plateau à évaluer
|
||||||
|
* @return score numérique de la position (positif si avantageux)
|
||||||
*/
|
*/
|
||||||
private int evaluate(IBoard board) {
|
private int evaluate(IBoard board) {
|
||||||
|
|
||||||
if (!(board instanceof AvalamBoard)) return 0;
|
if (!(board instanceof AvalamBoard)) return 0;
|
||||||
AvalamBoard b = (AvalamBoard) board;
|
AvalamBoard b = (AvalamBoard) board;
|
||||||
|
|
||||||
|
// Configuration des couleurs
|
||||||
Color myColor = (me == Player.PLAYER1) ? Color.YELLOW : Color.RED;
|
Color myColor = (me == Player.PLAYER1) ? Color.YELLOW : Color.RED;
|
||||||
Color oppColor = (myColor == Color.YELLOW) ? Color.RED : Color.YELLOW;
|
|
||||||
|
|
||||||
int score = 0;
|
int score = 0;
|
||||||
|
|
||||||
for (int r = 0; r < AvalamBoard.SIZE; r++) {
|
for (int r = 0; r < AvalamBoard.SIZE; r++) {
|
||||||
for (int c = 0; c < AvalamBoard.SIZE; c++) {
|
for (int c = 0; c < AvalamBoard.SIZE; c++) {
|
||||||
|
|
||||||
Tower t = b.getTowerAt(r, c);
|
Tower t = b.getTowerAt(r, c);
|
||||||
if (t == null) continue;
|
if (t == null || t.getHeight() == 0) continue;
|
||||||
|
|
||||||
int h = t.getHeight();
|
// Une tour de 5 vaut beaucoup plus car elle est "verrouillée".
|
||||||
|
int val = (t.getHeight() == 5) ? 10 : 1;
|
||||||
|
|
||||||
// Pondération selon la hauteur (heuristique "Divine")
|
if (t.getColor() == myColor) {
|
||||||
int value =
|
score += val;
|
||||||
(h == 5) ? 1000 :
|
} else {
|
||||||
(h == 4) ? 300 :
|
score -= val;
|
||||||
(h == 3) ? 120 :
|
}
|
||||||
(h == 2) ? 40 : 10;
|
|
||||||
|
|
||||||
if (t.getColor() == myColor) score += value;
|
|
||||||
else score -= value;
|
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
return score;
|
return score;
|
||||||
}
|
}
|
||||||
|
|
||||||
/**
|
/**
|
||||||
* Génère la liste de tous les coups possibles sur le plateau donné.
|
* Récupère la liste de tous les coups légaux disponibles sur le plateau.
|
||||||
|
* * @param board plateau actuel
|
||||||
|
* @return liste des coups possibles
|
||||||
*/
|
*/
|
||||||
private List<AbstractPly> listMoves(IBoard board) {
|
private List<AbstractPly> listMoves(IBoard board) {
|
||||||
List<AbstractPly> moves = new ArrayList<>();
|
List<AbstractPly> moves = new ArrayList<>();
|
||||||
board.iterator().forEachRemaining(moves::add);
|
Iterator<AbstractPly> it = board.iterator();
|
||||||
|
while (it.hasNext()) {
|
||||||
|
moves.add(it.next());
|
||||||
|
}
|
||||||
return moves;
|
return moves;
|
||||||
}
|
}
|
||||||
}
|
}
|
||||||
Reference in New Issue
Block a user