Esperanza y Momentos

Momento	Nombre	Significado
$E[X]$	Primer momento	Centro (media)
$E[(X-\mu)^2]$	Segundo momento central	Dispersión (varianza)
$E[(X-\mu)^3]/\sigma^3$	Asimetría (skewness)	¿Distribución simétrica?
$E[(X-\mu)^4]/\sigma^4$	Curtosis	¿Colas pesadas?

Covarianza

La covarianza mide cómo dos variables varían juntas.

Definición

$$\text{Cov}(X, Y) = E[(X - \mu_X)(Y - \mu_Y)]$$

Fórmula Alternativa

$$\text{Cov}(X, Y) = E[XY] - E[X]E[Y]$$

Interpretación

Valor	Significado
$\text{Cov}(X,Y) > 0$	X e Y tienden a moverse juntas
$\text{Cov}(X,Y) < 0$	X e Y tienden a moverse en direcciones opuestas
$\text{Cov}(X,Y) = 0$	Sin relación lineal (pero pueden ser dependientes)

Propiedades

$$\text{Cov}(X, X) = \text{Var}(X)$$

$$\text{Cov}(X, Y) = \text{Cov}(Y, X)$$

$$\text{Cov}(aX, bY) = ab \cdot \text{Cov}(X, Y)$$

Correlación

La correlación es la covarianza normalizada.

Definición

$$\rho_{XY} = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}$$

Propiedades

$-1 \leq \rho \leq 1$
$\rho = 1$: Relación lineal positiva perfecta
$\rho = -1$: Relación lineal negativa perfecta
$\rho = 0$: Sin correlación lineal

Correlación vs Independencia

Independientes → $\rho = 0$ (no correlacionadas)
$\rho = 0$ → NO implica independencia

Ejemplo: $Y = X^2$ donde $X \sim \text{Uniform}(-1, 1)$

$\text{Cov}(X, Y) = 0$ (simétrico)
Pero X e Y son completamente dependientes

Varianza de una Suma (General)

Para cualquier X e Y (no necesariamente independientes):

$$\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y) + 2\text{Cov}(X, Y)$$

Caso especial: Si son independientes, $\text{Cov}(X,Y) = 0$, recuperamos: $$\text{Var}(X + Y) = \text{Var}(X) + \text{Var}(Y)$$

Esperanza Condicional

La esperanza condicional es el valor esperado dado cierta información.

Definición

$$E[X|Y=y] = \sum_x x \cdot P(X=x|Y=y)$$

La Ley de la Esperanza Total

$$E[X] = E[E[X|Y]]$$

En palabras: El promedio de los promedios condicionales es el promedio total.

Aplicaciones

En IA: Funciones de Pérdida

El riesgo esperado es:

$$R(h) = E[L(h(X), Y)]$$

Donde $L$ es la función de pérdida.

En Decisiones: Valor Esperado

$$\text{Valor de acción } a = E[\text{recompensa}|a]$$

En Estadística: Estimadores

Un estimador $\hat{\theta}$ es insesgado si:

$$E[\hat{\theta}] = \theta$$

Resumen

Concepto	Fórmula	Significado
Esperanza	$E[X] = \sum x \cdot P(x)$	Centro de la distribución
Varianza	$\text{Var}(X) = E[(X-\mu)^2]$	Dispersión
Desv. estándar	$\sigma = \sqrt{\text{Var}(X)}$	Dispersión en unidades originales
Covarianza	$\text{Cov}(X,Y) = E[(X-\mu_X)(Y-\mu_Y)]$	Co-variación
Correlación	$\rho = \text{Cov}(X,Y)/(\sigma_X \sigma_Y)$	Covarianza normalizada [-1, 1]

Propiedades Clave

Esperanza es lineal: $E[aX + bY] = aE[X] + bE[Y]$
Varianza escala al cuadrado: $\text{Var}(aX) = a^2\text{Var}(X)$
Para independientes: $\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y)$

Anterior: Teorema de Bayes ←

Volver al índice: Índice →