¿Cuál es el trabajo de Judea Pearl sobre la causalidad en pocas palabras?

El trabajo de Judea Pearl sobre la causalidad se trata de agregar estadísticas clásicas (inferencia de leyes de probabilidad sobre datos observados), la inferencia de leyes de probabilidad sobre hechos hipotéticos (hechos hipotéticos).

Hay una clara distinción entre [math] P (Y | X = x) [/ math], que se refiere a la ley de [math] Y [/ math] obtenida después de filtrar los datos observados, y [math] P (Y | do (X = x)) [/ math], que pregunta por la ley de [math] Y [/ math] bajo la hipótesis contrafactual de que [math] X [/ math] ha sido forzado a tomar el valor [math] x [/ math].

A primera vista, la única forma de abordar [math] P (Y | do (X = x)) [/ math] es realizar experimentos. Obligue a [math] X [/ math] para tomar el valor [math] x [/ math] para alguna sub-muestra de la población, independientemente de cualquier otra variable relevante que pueda impactar [math] X [/ math] y observar distribución de [math] Y [/ math] en esta submuestra.

Aquí es donde el trabajo de Judea Pearl es el más sorprendente. Suponiendo que los datos siguen un gráfico causal (que especifica un modelo de ecuación estructural subyacente), hay situaciones en las que puede calcular [math] P (Y | do (X = x)) [/ math] únicamente en base a los datos observados :

  • Si [math] S [/ math] es un subconjunto de las variables que “bloquean” todas las rutas causales desde [math] Y [/ math] a [math] X [/ math] (rutas de puerta trasera), entonces puede escribir ( teorema de puerta trasera): [math] P (Y | do (X = x)) = \ sum_s P (Y | S = s, X = x) P (S = s | X = x) $$ [/ math]
  • Si [math] M [/ math] es un subconjunto de las variables que “bloquean” todas las rutas causales desde [math] X [/ math] a [math] Y [/ math] (rutas frontales), entonces puede escribir ( teorema de la puerta frontal): [math] P (Y | do (X = x)) = \ sum_m P (M = m | X = x) \ sum_ {x ‘} P (Y | X = x’, M = m) P (X = x ‘) [/ math]
  • Si [math] X [/ math] bloquea todos los caminos causales desde [math] S [/ math] a [math] Y [/ math], entonces puede usar [math] S [/ math] como variable instrumental para calcular [math] E (Y | do (X = x)) [/ math] bajo algunos supuestos de linealidad pesados

Recomiendo este video para familiarizarse con el tema:

Algunas lecturas introductorias: si la correlación no implica causalidad, entonces ¿qué significa?

Lecturas más avanzadas: clases 21–25 de http://www.stat.cmu.edu/~cshaliz…