El Robot Pensante y los Desiderata
¿Qué requisitos debe cumplir un sistema de razonamiento bajo incertidumbre?
El Robot de Jaynes
Jaynes propone un experimento mental: imaginemos un robot que debe razonar sobre el mundo.
Este robot:
- Recibe información (proposiciones que pueden ser verdaderas o falsas)
- Debe asignar grados de plausibilidad a diferentes hipótesis
- No tiene intuición ni emociones — solo sigue reglas
Pregunta clave: ¿Qué reglas debe seguir?
El punto no es construir un robot real, sino preguntarnos: ¿qué reglas de razonamiento son las correctas?
Los Desiderata
Jaynes establece que nuestro robot debe cumplir tres requisitos fundamentales, llamados desiderata:
Desideratum I: Representación por Números Reales
Los grados de plausibilidad se representan mediante números reales.
¿Por qué?
- Necesitamos poder comparar: “A es más plausible que B”
- Los números reales permiten ordenamiento total
- Permiten operaciones matemáticas
Convención:
- Mayor número = mayor plausibilidad
- Usaremos el rango $[0, 1]$ donde:
- $0$ = imposible (certeza de falsedad)
- $1$ = cierto (certeza de verdad)
- Valores intermedios = grados de plausibilidad
Desideratum II: Correspondencia Cualitativa con el Sentido Común
El razonamiento del robot debe corresponder cualitativamente con el razonamiento humano sensato.
Esto significa:
a) Si la plausibilidad de A aumenta, y la de “A implica B” permanece constante, entonces la plausibilidad de B debe aumentar (o al menos no disminuir).
Ejemplo: Si me vuelvo más seguro de que “va a llover”, y sigo creyendo que “si llueve, el suelo se moja”, entonces debo volverme más seguro de que “el suelo se mojará”.
b) Si tenemos más información que hace A más plausible, nuestra asignación debe reflejar eso.
El robot no puede tener “corazonadas” contradictorias — debe ser sensato.
Desideratum III: Consistencia
El robot debe ser consistente en tres sentidos:
a) Consistencia estructural: Si una conclusión puede alcanzarse por múltiples caminos, todos deben dar el mismo resultado.
Ejemplo: $P(A \cap B) = P(B \cap A)$ — el orden no importa.
b) Consistencia lógica: El robot debe usar toda la información relevante, no solo parte de ella.
c) Consistencia bajo cambio de representación: Dos problemas equivalentes deben tener la misma respuesta, sin importar cómo se formulen.
Lo Que NO Son los Desiderata
Nota que los desiderata no especifican:
- ❌ Qué fórmulas usar
- ❌ Qué valor asignar a qué proposición
- ❌ Ningún axioma específico de probabilidad
Los desiderata son requisitos de racionalidad, no reglas específicas.
Lo notable es que de estos requisitos generales se derivan las reglas de probabilidad.
El Teorema de Cox
En 1946, Richard Cox demostró un teorema fundamental:
Teorema de Cox: Si un sistema de razonamiento plausible satisface los desiderata, entonces sus reglas deben ser isomorfas a las reglas de probabilidad.
“Isomorfas” significa que pueden no verse idénticas, pero son matemáticamente equivalentes (quizás con un cambio de escala).
Implicación profunda: Las reglas de probabilidad no son una elección arbitraria entre muchas posibles — son la única elección consistente.
Derivación Informal
¿Cómo se llega de los desiderata a las reglas? Aquí un esbozo:
Paso 1: La regla del producto
Queremos: ¿cómo se relaciona $P(A \cap B | C)$ con $P(A|C)$ y $P(B|C)$?
Por el Desideratum II (sentido común):
- La plausibilidad de “$A$ Y $B$” depende de:
- Qué tan plausible es $B$ dado $C$
- Qué tan plausible es $A$ dado que $B$ y $C$ son verdaderos
Esto sugiere una forma funcional: $$P(AB|C) = f(P(A|BC), P(B|C))$$
Por el Desideratum III (consistencia):
- La función $f$ debe ser asociativa y conmutativa en cierto sentido
- El análisis funcional muestra que $f$ debe ser el producto
Resultado: $$P(AB|C) = P(A|BC) \cdot P(B|C)$$
Paso 2: La regla de la suma
Queremos: ¿cómo se relaciona $P(A|C)$ con $P(\neg A|C)$?
Por el Desideratum II:
- Si $A$ se vuelve más plausible, $\neg A$ debe volverse menos plausible
- Hay una relación funcional: $P(\neg A|C) = g(P(A|C))$
Por el Desideratum III (consistencia):
- Aplicando la relación dos veces: $P(A|C) = g(g(P(A|C)))$
- Esto impone restricciones fuertes sobre $g$
Resultado: $$P(A|C) + P(\neg A|C) = 1$$
Resumen de Resultados
De los desiderata se derivan:
| Regla | Fórmula | Origen |
|---|---|---|
| Producto | $P(AB|C) = P(A|BC) \cdot P(B|C)$ | Consistencia + Sentido común |
| Suma | $P(A|C) + P(\neg A|C) = 1$ | Consistencia + Sentido común |
| Bayes | Se deriva de aplicar producto dos veces | Consecuencia |
La Lección Profunda
No elegimos las reglas de probabilidad porque son convenientes.
Las reglas de probabilidad son inevitables si queremos:
- Razonar con grados de plausibilidad
- Ser consistentes
- Corresponder con el sentido común
Cualquier otro sistema de “razonamiento plausible” o:
- Viola algún desideratum
- Es equivalente a probabilidad (quizás disfrazado)
Conexión con IA
Un agente inteligente ES este robot:
- Recibe observaciones del ambiente
- Debe actualizar sus creencias
- Debe ser consistente
Los desiderata son requisitos de diseño para cualquier agente racional.
┌─────────────────────────────────────────────────┐
│ AGENTE RACIONAL │
├─────────────────────────────────────────────────┤
│ Entrada: Observaciones, conocimiento previo │
│ Proceso: Actualización de creencias │
│ Requisitos: Los desiderata de Jaynes │
│ Resultado: Las reglas de probabilidad │
│ Salida: Decisiones bajo incertidumbre │
└─────────────────────────────────────────────────┘
Resumen
| Concepto | Descripción |
|---|---|
| Robot de Jaynes | Agente ideal que razona con plausibilidades |
| Desideratum I | Grados de plausibilidad como números reales |
| Desideratum II | Correspondencia con sentido común |
| Desideratum III | Consistencia (estructural, lógica, representacional) |
| Teorema de Cox | Los desiderata implican las reglas de probabilidad |
Siguiente: Probabilidad como Lógica Extendida →