domingo, 2 de abril de 2023

 

Como evitar ser engañado por los datos

Todas las semanas aparecen datos y cifras en redes sociales y medios de comunicación que llaman poderosamente la atención en la política, ciencias sociales, y hasta las ciencias de la vida, estas falsas noticias fácilmente se vuelven tendencia y se llenan de visitas por lo espectacular de sus implicaciones hasta que personas inteligentes las analizan y aclaran que todo se trata de sesgos estadísticos, aunque los datos son verdaderos. Y es que dependiendo como se agrupan los datos y el tamaño de estos se puede conseguir las conclusiones que la persona quiere o necesita en el caso de algunos políticos, es por eso que durante el análisis de datos tenemos que tener en cuenta diferentes variables, hipótesis, diferentes herramientas y enfoques y conocer los mas importantes sesgos o paradojas estadísticas.

Una paradoja importante que todos debemos conocer es la paradoja de Simpson que ocurre cuando al analizar grupos de datos de forma conjunta se producen resultados diferentes o contrarios que al analizarlos por subgrupos. Esto ocurre porque existe una (o más de una) variable confusora, es decir, un factor oculto o invisible que tiene mucho peso dentro de los datos y desequilibra la balanza cuando estos se analizan de forma agregada, llevando a resultados engañosos. Por ello, es necesario dividir los datos en subgrupos para poder analizarlos según las variables de confusión y sin que los resultados nos induzcan a error.

En la siguiente grafica se puede engañosamente que hay mas muertes en las personas que usan cinturón de seguridad, pero el ejemplo aplica también para las Fake News que muestran que hay mas muertes en las personas vacunadas para Covid 19, y en todo tipo de comparaciones engañosas en todo tipo de cosas desde efectividad de planes políticos, hasta medicamentos, cirugías, hospitales, programas de salud pública, o planes de gobierno. ¡Todo presidente es mejor que el anterior! (con un buen equipo de estadísticos) Revise en siguiente ejemplo ilustrativo donde cada mes mueren mas los que usan cinturon de seguridad por que?


Recuerde, tenga en cuenta siempre que es muy importante cómo se agrupan los datos cuando los grupos no son homogéneos, la existencia de variables de confusión, analizar cada grupo por separado e ir más allá de los datos, comprender el contexto, encontrar por qué los datos se presentan de esta manera, etc.