El trabajo de Judea Pearl sobre la causalidad se trata de agregar estadísticas clásicas (inferencia de leyes de probabilidad sobre datos observados), la inferencia de leyes de probabilidad sobre hechos hipotéticos (hechos hipotéticos).
Hay una clara distinción entre [math] P (Y | X = x) [/ math], que se refiere a la ley de [math] Y [/ math] obtenida después de filtrar los datos observados, y [math] P (Y | do (X = x)) [/ math], que pregunta por la ley de [math] Y [/ math] bajo la hipótesis contrafactual de que [math] X [/ math] ha sido forzado a tomar el valor [math] x [/ math].
A primera vista, la única forma de abordar [math] P (Y | do (X = x)) [/ math] es realizar experimentos. Obligue a [math] X [/ math] para tomar el valor [math] x [/ math] para alguna sub-muestra de la población, independientemente de cualquier otra variable relevante que pueda impactar [math] X [/ math] y observar distribución de [math] Y [/ math] en esta submuestra.
Aquí es donde el trabajo de Judea Pearl es el más sorprendente. Suponiendo que los datos siguen un gráfico causal (que especifica un modelo de ecuación estructural subyacente), hay situaciones en las que puede calcular [math] P (Y | do (X = x)) [/ math] únicamente en base a los datos observados :
- ¿Hay sabios en todos los campos de la vida? ¿Hay sabios en la guerra como Napoleón y en negocios como Rockefeller? ¿O son los sabios solo en STEM?
- ¿Cómo se explica un impulso temporal de las capacidades cognitivas?
- Hipotéticamente, ¿qué pasaría si los científicos demostraran que algunos grupos de población tienen una capacidad cognitiva basada en la genética más baja que otros grupos?
- ¿Cómo se manifiesta la disonancia cognitiva en ti personalmente?
- ¿Cuál es la intersección de la informática y la neurociencia?
- Si [math] S [/ math] es un subconjunto de las variables que “bloquean” todas las rutas causales desde [math] Y [/ math] a [math] X [/ math] (rutas de puerta trasera), entonces puede escribir ( teorema de puerta trasera): [math] P (Y | do (X = x)) = \ sum_s P (Y | S = s, X = x) P (S = s | X = x) $$ [/ math]
- Si [math] M [/ math] es un subconjunto de las variables que “bloquean” todas las rutas causales desde [math] X [/ math] a [math] Y [/ math] (rutas frontales), entonces puede escribir ( teorema de la puerta frontal): [math] P (Y | do (X = x)) = \ sum_m P (M = m | X = x) \ sum_ {x ‘} P (Y | X = x’, M = m) P (X = x ‘) [/ math]
- Si [math] X [/ math] bloquea todos los caminos causales desde [math] S [/ math] a [math] Y [/ math], entonces puede usar [math] S [/ math] como variable instrumental para calcular [math] E (Y | do (X = x)) [/ math] bajo algunos supuestos de linealidad pesados
Recomiendo este video para familiarizarse con el tema:
Algunas lecturas introductorias: si la correlación no implica causalidad, entonces ¿qué significa?
Lecturas más avanzadas: clases 21–25 de http://www.stat.cmu.edu/~cshaliz…