Como evitar ser engañado por los datos
Todas las semanas aparecen datos y
cifras en redes sociales y medios de comunicación que llaman poderosamente la
atención en la política, ciencias sociales, y hasta las ciencias de la vida,
estas falsas noticias fácilmente se vuelven tendencia y se llenan de visitas
por lo espectacular de sus implicaciones hasta que personas inteligentes las
analizan y aclaran que todo se trata de sesgos estadísticos, aunque los datos
son verdaderos. Y es que dependiendo como se agrupan los datos y el tamaño de
estos se puede conseguir las conclusiones que la persona quiere o necesita en
el caso de algunos políticos, es por eso que durante el análisis de datos
tenemos que tener en cuenta diferentes variables, hipótesis, diferentes
herramientas y enfoques y conocer los mas importantes sesgos o paradojas
estadísticas.
Una paradoja importante que todos
debemos conocer es la paradoja de Simpson que ocurre cuando al analizar grupos
de datos de forma conjunta se producen resultados diferentes o contrarios que
al analizarlos por subgrupos. Esto ocurre porque existe una (o más de una)
variable confusora, es decir, un factor oculto o invisible que tiene mucho peso
dentro de los datos y desequilibra la balanza cuando estos se analizan de forma
agregada, llevando a resultados engañosos. Por ello, es necesario dividir los
datos en subgrupos para poder analizarlos según las variables de confusión y
sin que los resultados nos induzcan a error.
En la siguiente grafica se puede engañosamente que hay
mas muertes en las personas que usan cinturón de seguridad, pero el ejemplo
aplica también para las Fake News que muestran que hay mas muertes en las
personas vacunadas para Covid 19, y en todo tipo de comparaciones engañosas en
todo tipo de cosas desde efectividad de planes políticos, hasta medicamentos,
cirugías, hospitales, programas de salud pública, o planes de gobierno. ¡Todo
presidente es mejor que el anterior! (con un buen equipo de estadísticos) Revise en siguiente ejemplo ilustrativo donde cada mes mueren mas los que usan cinturon de seguridad por que?
Recuerde, tenga en cuenta siempre
que es muy importante cómo se agrupan los datos cuando los grupos no son
homogéneos, la existencia de variables de confusión, analizar cada grupo por
separado e ir más allá de los datos, comprender el contexto, encontrar por qué
los datos se presentan de esta manera, etc.