Temario del Curso

30 clases organizadas en 4 fases.


Fase 1: Fundamentos (Clases 1-11)

# Tema Descripción
1 Introducción e Historia Definición de inteligencia, arco histórico de la IA, paradigmas
2 Agents y Environments Abstracción central: percibir → decidir → actuar, framework PEAS
3 Lógica Razonamiento con certeza, lógica proposicional, inferencia
4 Computación Límites computacionales, Turing machines, P vs NP
5 Probabilidad Razonamiento bajo incertidumbre, desiderata de Jaynes, Bayes
6 Fat Tails Cuando fallan los supuestos: LLN, CLT, distribuciones fat-tail
7 Information Theory I Entropy, surprise, conditional entropy
8 Information Theory II KL divergence, cross-entropy, principio MDL
9 Optimización Landscapes, gradient descent, convexity, Lagrangian
10 Taxonomía de Predicción Marco de 5 dimensiones para organizar métodos predictivos
11 Decision Theory Expected utility, axiomas de racionalidad, value of information

Fase 2: Inference y Search (Clases 12-18)

# Tema Descripción
12 Causality Structural causal models, do-calculus, confounding
13 Bayesian Inference Actualización de creencias, Bayesian networks, d-separation
14 Monte Carlo Methods Sampling para aproximar expectativas, importance sampling
15 Informed Search Heuristics, algoritmo A*, admissibility
16 Adversarial Search Game trees, minimax, alpha-beta pruning
17 Simulation-Based Planning Monte Carlo Tree Search, rollouts
18 Classical Planning Representación STRIPS, forward planning

Fase 3: Sequential y Strategic Decisions (Clases 19-24)

# Tema Descripción
19 Constraints y Local Search CSPs, propagation, hill climbing, simulated annealing
20 Markov Models y HMMs Markov property, chains, forward y Viterbi algorithms
21 MDPs I Definición, Bellman equation, policies
22 MDPs II Value iteration, policy iteration, policy extraction
23 Game Theory I Normal form, dominant strategies, Nash equilibrium
24 Game Theory II Repeated games, folk theorem, torneo de Axelrod

Fase 4: Learning y RL (Clases 25-30)

# Tema Descripción
25 Learning Theory Generalization, bias-variance tradeoff, regularization
26 Neural Networks Perceptron, multilayer networks, backpropagation
27 RL I Exploration vs exploitation, bandits, ε-greedy, UCB
28 RL II Temporal difference, Q-learning, SARSA
29 RL III Function approximation, DQN, policy gradients
30 Síntesis Integración del curso, selección de métodos, fronteras