D1: Fuente del Conocimiento Estructural

D1: Fuente del Conocimiento Estructural

Las 5 Dimensiones Ortogonales

No existe UNA forma correcta de categorizar los métodos de predicción. Pero existe una forma útil: pensar en 5 ejes independientes que caracterizan cualquier enfoque. Cada método es un punto en este espacio 5-dimensional. La magia desaparece cuando puedes nombrar las coordenadas.

Método = (D1: Fuente del Conocimiento Estructural,
          D2: Interpretación de Probabilidad,
          D3: Objetivo Matemático,
          D4: Arquitectura de Variables,
          D5: Supuesto Inductivo)

Las dimensiones son ortogonales: puedes elegir cualquier combinación de opciones en cada eje. Un método deductivo puede ser bayesiano o frequentist. Un método inductivo puede tener arquitectura causal o plana. Las combinaciones son (casi) libres.


Dimensión 1: Fuente del Conocimiento Estructural

“In theory, theory and practice are the same. In practice, they are not.”

Antes de los datos, está la pregunta: ¿qué sabes ya?

Pregunta clave: “¿De dónde viene la estructura del modelo?”

Hay dos caminos para saber algo del mundo. El primero dice: pienso, luego predigo. El segundo dice: observo, luego generalizo. Esta es quizás la dimensión más fundamental. Antes de hablar de algoritmos o matemáticas, debemos preguntarnos: ¿qué sabemos (o creemos saber) sobre el problema antes de ver los datos?

Tipo Descripción Ejemplos Situación real
Deductivo La estructura viene de teoría/axiomas previos a los datos Modelos físicos, DSGE en economía, sistemas expertos Simulación de vuelo: ecuaciones de aerodinámica definen el modelo, datos solo validan
Inductivo La estructura emerge de patrones en los datos ML clásico, Deep Learning, clustering Recomendador de Netflix: no hay “teoría de gustos”, solo patrones en millones de usuarios
Híbrido Teoría provee esqueleto, datos ajustan parámetros Calibración económica, Physics-Informed NNs, Bayesian con priors informativos Modelo macroeconómico: teoría dice que consumo depende de ingreso esperado, datos calibran elasticidades

Deductivo vs Inductivo

Enfoque Deductivo: “La teoría primero”

En el enfoque deductivo, la estructura del modelo existe antes de ver cualquier dato. Viene de:

  • Leyes físicas (Newton, Maxwell, termodinámica)
  • Axiomas económicos (optimización de agentes, equilibrio de mercados)
  • Lógica formal (reglas de inferencia, ontologías)

Flujo deductivo:

flowchart LR
    A["Axiomas / Teoría"] --> B["Modelo Matemático"]
    B --> C["Predicciones"]
    C --> D["Datos validan / refutan"]

Características:

  • El modelo puede existir sin datos (ej: ecuaciones de Einstein existían antes de confirmarlas)
  • Los datos sirven para validar o refutar, no para descubrir estructura
  • Alta interpretabilidad: cada término tiene significado teórico
  • Puede fallar si la teoría está equivocada

Las ecuaciones de Navier-Stokes describen fluidos. No las “aprendimos” de datos — las derivamos de principios de conservación (masa, momento, energía). Un simulador de clima usa estas ecuaciones; los datos solo calibran condiciones iniciales.

Un modelo DSGE parte de supuestos: hogares maximizan utilidad, firmas maximizan ganancias, mercados se equilibran. De estos axiomas se derivan ecuaciones (Euler, Phillips). La estructura está fijada; los datos solo determinan valores de parámetros como elasticidades.


Enfoque Inductivo: “Los datos primero”

En el enfoque inductivo, la estructura emerge de los patrones en los datos. No hay teoría previa que dicte la forma funcional.

Flujo inductivo:

flowchart LR
    A["Datos"] --> B["Buscar patrones"]
    B --> C["Modelo que ajusta"]
    C --> D["Predicciones"]

Características:

  • Sin datos, no hay modelo
  • El modelo “descubre” relaciones que no conocíamos
  • Puede encontrar patrones no lineales, interacciones complejas
  • Riesgo: puede encontrar patrones espurios (correlación sin causación)
  • Menor interpretabilidad: ¿qué significa el peso 0.73 en la capa 5?

No existe una “teoría de gustos cinematográficos” que diga que si te gusta X, te gustará Y. El sistema observa millones de usuarios, encuentra patrones (gente que vio A también vio B), y los explota. La estructura (qué factores importan) emerge de los datos.

No hay axiomas que digan “un gato tiene orejas puntiagudas y bigotes”. La red neuronal ve millones de imágenes etiquetadas y aprende features discriminativas. Nadie programó qué buscar.


Enfoque Híbrido: “Lo mejor de ambos mundos”

El enfoque híbrido combina conocimiento teórico con aprendizaje de datos. La teoría provee el esqueleto, los datos ajustan los detalles.

Flujo híbrido:

flowchart LR
    A["Teoría parcial"] --> B["Estructura con 'huecos'"]
    B --> C["Datos llenan huecos"]
    C --> D["Modelo completo"]

Variantes del enfoque híbrido:

Variante Qué provee la teoría Qué proveen los datos
Calibración Forma funcional completa Valores de parámetros
Physics-Informed NN Restricciones (ej: conservación de energía) Función de aproximación
Priors informativos Distribución a priori sobre parámetros Actualización posterior
Modelos semi-paramétricos Parte paramétrica (teoría) Parte no-paramétrica (datos)

Un modelo macroeconómico tiene la forma: C = f(Y, r, θ) donde:

  • La teoría dice que Consumo © depende de Ingreso (Y) y tasa de interés ®
  • La forma funcional f viene de optimización de hogares
  • Pero el parámetro θ (elasticidad) no lo dice la teoría
  • Los datos determinan θ mediante match de momentos (ej: ajustar para que el modelo reproduzca la volatilidad observada del PIB)

Quieres predecir el flujo de calor en un material. Sabes que debe satisfacer la ecuación de calor ($\partial T/\partial t = \alpha \nabla^2 T$). En lugar de solo minimizar error de predicción, agregas un término al loss que penaliza violar la ecuación. La red aprende una función que:

  1. Ajusta los datos observados
  2. Respeta la física conocida

El caso de la calibración económica (expandido)

La calibración es el ejemplo canónico de enfoque híbrido en ciencias sociales:

flowchart TD
    subgraph TEORIA ["TEORÍA (Deductivo)"]
        T1["Hogares maximizan utilidad"]
        T2["Firmas maximizan ganancias"]
        T3["Mercados se equilibran"]
        T1 --> EC["Ecuaciones estructurales (Euler, Phillips, etc.)"]
        T2 --> EC
        T3 --> EC
    end

    subgraph DATOS ["DATOS (Inductivo)"]
        D1["Series de tiempo del PIB"]
        D2["Inflación observada"]
        D3["Tasas de interés"]
        D1 --> MOM["Momentos empíricos (media, varianza, corr)"]
        D2 --> MOM
        D3 --> MOM
    end

    EC --> CAL["CALIBRACIÓN: encontrar θ tal que momentos del modelo ≈ momentos de los datos"]
    MOM --> CAL
    CAL --> RESULT["Modelo calibrado (estructura teórica + parámetros empíricos)"]

La teoría te dice qué variables se relacionan y cómo (funcionalmente). Los datos te dicen los valores numéricos de los parámetros.

Nota importante: DSGE vs Calibración

Es común confundir estos términos porque suelen aparecer juntos, pero son cosas distintas:

Concepto ¿Qué es? Dimensión
DSGE Un tipo de modelo (estructura basada en teoría micro: agentes optimizando, equilibrio general) D1 (Deductivo) + D4 (Arquitectura de grafo/ecuaciones)
Calibración Una técnica de estimación (elegir parámetros para reproducir momentos observados) D5 (Supuesto inductivo)
flowchart LR
    subgraph DSGE_EST ["DSGE puede estimarse con:"]
        A1["Calibración"]
        A2["Maximum Likelihood"]
        A3["Bayesiano"]
        A4["GMM (Momentos Generalizados)"]
    end
    subgraph CAL_APLICA ["Calibración puede aplicarse a:"]
        B1["DSGE"]
        B2["Modelos de agentes"]
        B3["Simulaciones físicas"]
        B4["Cualquier modelo con parámetros libres"]
    end

En otras palabras: DSGE es el “qué” (qué modelo usas), calibración es el “cómo” (cómo estimas sus parámetros).


Atrapar una pelota

Un niño de 5 años puede atrapar una pelota en el aire. No sabe física. No calcula trayectorias parabólicas ni resuelve ecuaciones diferenciales. Simplemente ha lanzado y atrapado pelotas cientos de veces. Su cerebro aprendió el patrón. Esto es inductivo.

Un ingeniero de la NASA calcula exactamente dónde caerá un satélite. Usa las leyes de Newton, la resistencia del aire, la rotación de la Tierra. Nunca ha “practicado” con satélites cayendo — deriva la respuesta de principios físicos. Esto es deductivo.

¿Quién predice mejor? El niño falla si le lanzas algo que nunca ha visto — un frisbee, una pluma. El ingeniero puede predecir objetos que nunca ha observado, pero necesita conocer todas las fuerzas involucradas. Puede que el niño no pueda predecir a priori pero es capaz de atrapar la pelota, el ingeniero puede ser capaz de predecir a priori pero incapaz de atrapar la pelota.

No tienen que ser excluyentes, pueden ser híbridos.


Intuición resumida

  • Deductivo: “Sé cómo funciona el mundo; los datos confirman”
  • Inductivo: “No sé cómo funciona; los datos me lo dirán”
  • Híbrido: “Tengo una idea aproximada; los datos la refinan”

¿Cuándo usar cada uno?

Situación Enfoque recomendado
Tienes teoría sólida y bien establecida Deductivo
No hay teoría, solo datos abundantes Inductivo
Teoría parcial + necesitas generalizar Híbrido
Datos escasos pero conocimiento experto Híbrido (priors)
Necesitas interpretabilidad/explicabilidad Deductivo o Híbrido
Solo importa precisión predictiva Inductivo

Anterior: El problema fundamental | Siguiente: Incertidumbre y objetivo (D2 + D3) →