Búsqueda Adversarial

“The best move is the one your opponent least wants you to make.”

En los módulos 13 y 14 resolvimos problemas donde un solo agente controla cada decisión: encontrar un camino en un laberinto, navegar un grafo ponderado, resolver el puzzle de 8 piezas. El entorno era inerte — esperaba pacientemente mientras buscábamos. En este módulo el entorno responde: un oponente toma decisiones activamente para frustrar las nuestras. Este cambio convierte la búsqueda de caminos en búsqueda de estrategias. Los tres ejemplos del módulo — tic-tac-toe, Nim y ajedrez — ilustran cómo un mismo marco formal escala desde juegos de bolsillo hasta los sistemas de IA más estudiados de la historia.

Contenido

Sección	Tema	Idea clave
15.1	Juegos como búsqueda	7 componentes formales, árbol de juego, tic-tac-toe y Nim
15.2	Tipos de juegos	Suma cero, información perfecta, por qué importa para los algoritmos
15.3	Minimax	DFS con propagación de valores; Nim(1,2) completo
15.4	Poda alfa-beta	Misma respuesta, menos trabajo; Nim(2,3)
15.5	Juegos complejos	Límite de profundidad, eval, nim-sum XOR, ajedrez

Materiales y flujo de trabajo

Paso	Material	Colab	Descripción
1	15.1 Juegos como búsqueda	—	7 componentes formales, árbol de juego, tic-tac-toe y Nim
2	15.2 Tipos de juegos	—	Suma cero, información perfecta, taxonomía
3	Notebook 01 — Juegos y árboles		Construir y visualizar árboles de juego para tic-tac-toe y Nim
4	15.3 Minimax	—	DFS con propagación de valores, traza Nim(1,2)
5	15.4 Poda alfa-beta	—	Misma respuesta, menos trabajo; análisis de eficiencia
6	Notebook 02 — Minimax y alpha-beta		Implementar y comparar minimax vs alpha-beta paso a paso
7	15.5 Juegos complejos	—	Límite de profundidad, eval, nim-sum, ajedrez
8	Notebook de aplicación (elige uno)	—	Exploración profunda en un dominio concreto

Notebooks de aplicación

Elige uno de los siguientes:

Notebook	Tema	Colab
03 — Tic-tac-toe	Agente completo: minimax vs random vs alpha-beta, función eval, extensión 4×4
04 — Nim y teoría de juegos	Minimax → patrón XOR → Sprague-Grundy

Objetivos de aprendizaje

Al terminar este módulo podrás:

Modelar un juego de dos jugadores usando los 7 componentes formales y mapearlos a ejemplos concretos
Distinguir juegos suma-cero de no-suma-cero y explicar por qué esa distinción importa para el diseño de algoritmos
Implementar minimax recursivo y trazar su ejecución completa en Nim(1,2)
Explicar la conexión entre minimax y DFS: misma estructura, distinto propósito al retroceder
Implementar alpha-beta y demostrar que produce la misma decisión que minimax con menos nodos expandidos
Calcular el ahorro de alpha-beta con distintos tipos de ordenamiento de movimientos
Diseñar una función de evaluación para un juego con árbol demasiado grande para minimax exacto
Clasificar cualquier juego dado en la taxonomía y seleccionar el algoritmo adecuado

Prerrequisitos

Concepto	Módulo
DFS, estructura recursiva, complejidad $O(b^m)$, espacio $O(b \cdot m)$	13 — Búsqueda Simple
Heurísticas $h(n)$, funciones de evaluación aproximadas, IDA*	14 — Búsqueda Informada

Mapa conceptual

graph TD
    A["Módulo 13: DFS"] --> B["Minimax: DFS + propagación de valores"]
    C["Módulo 14: Heurísticas h(n)"] --> D["eval(s): función de evaluación"]
    C2["Módulo 14: IDA*"] --> E["Minimax iterativo"]
    B --> F["Alpha-beta: minimax + poda"]
    B --> G["Nim: árbol completo, 12 nodos"]
    F --> H["Ordenamiento de movimientos → más poda"]
    B --> I["Tic-tac-toe: anatomía"]
    G --> J["Nim-sum XOR: la fórmula que Minimax descubre"]
    J --> K["'Ajedrez no tiene XOR → necesita eval(s)'"]
    D --> K
    E --> L["Juegos complejos: límite de profundidad"]
    K --> L

Cómo ejecutar el script de imágenes

cd clase/15_adversarial_search
python3 lab_adversarial_search.py

Dependencias: numpy, matplotlib (ver requirements.txt).