Estadística General

¿Asociación entre Divorcios y Consumo de Margarina?

Correlaciones Espurias

Se tCorrelacion Espuriarata de la falacia Cum hoc ergo propter hoc  que se comete al inferir que dos o más eventos están conectados causalmente porque se dan juntos.

En estadística, una relación espuria o correlación espuria, es una relación matemática en la cual dos acontecimientos no tienen conexión lógica, aunque se puede implicar que la tienen debido a un tercer factor no considerado denominado «factor de confusión” o sólo ocurre por azar.

La relación espuria da la impresión de la existencia de un vínculo apreciable entre dos grupos que es inválido cuando se examina objetivamente.

Por ejemplo, supongamos que queremos estudiar la asociación entre alcoholismo y muerte más temprana, diseñamos un estudio donde recolectamos estas dos variables de cada individuo y observamos que efectivamente los que consumen alcohol mueren más temprano.

Posiblemente las personas alcohólicas puedan tener un nivel socio económico diferente, o llevar un tipo de vida menos saludable (fumar, tener menor actividad física, alimentación menos saludable, etc.) estos otros factores podrían distorsionar los resultados de la asociación en cualquier dirección.

A estas variables se las denomina confusoras o factores de confusión, son terceras variables asociadas a la variable respuesta (outcome) y el factor de exposición, y no intervienen en la cadena causal entre el factor de exposición y el outcome.

Con lo cual deberíamos tener en cuenta en el diseño de nuestro estudio controlar estas otras variables que podrían estar asociadas a la sobrevida y también al alcoholismo para evitar sesgos de confusión.

Una correlación espuria clásica es que en verano aumentan las ventas de helados y los asesinatos. Ambas aparecen como correlacionadas, pero es obvio que ninguna causa la otra, probablemente el calor del verano pueda estar asociada a ambas mostrando esta falsa correlación.

Un punto fundamental a tener en cuenta, es que dos variables estén correlacionadas no significa necesariamente que exista una relación de causalidad.

Tampoco que dos variables tengan un comportamiento similar en el tiempo implica que exista una relación causal.

Sin ir más lejos, un estudiante de criminología de la Escuela de Leyes de la Universidad de Harvard Tyler Vigen, diseñó un sistema informático que busca en grandes conjuntos de datos patrones de correlación y publica en su sitio miles de correlaciones espurias.

“Una de las reglas de oro de la estadística es que una correlación no implica causalidad”

Para finalizar, podemos decir que la correlación es simétrica mientras que la Causalidad es asimétrica como en un análisis de regresión donde la variable respuesta depende de los valores de las variables independientes donde el investigador definió una relación causal al determinar cuál es la variable dependiente.