La Paradoja de Simpson es una situación común que surge en las estadísticas que es contraintuitiva y hace que muchas personas malinterpreten los datos.
Supongamos que estamos tratando de medir la efectividad de un maestro (por ejemplo, la Sra. Brown), al observar los puntajes en los exámenes de cambio de los estudiantes a los que enseñó durante varios años.
Durante el primer año, diga que ella enseña a 10 estudiantes desfavorecidos (defina de la forma que desee) y 90 estudiantes regulares. Supongamos que al final del período, el puntaje promedio de las pruebas estandarizadas para los estudiantes desfavorecidos es de 400 y el puntaje de las pruebas estandarizadas para los estudiantes regulares es de 600.
Estos son puntajes relativamente buenos, por lo que la escuela decide asignar a la Sra. Brown más estudiantes desfavorecidos. Durante el año 2, diga que la Sra. Brown enseña a 50 estudiantes desfavorecidos y 50 estudiantes regulares. Supongamos que al final del período, el puntaje promedio de las pruebas estandarizadas para los estudiantes desfavorecidos es de 450 y el puntaje de las pruebas estandarizadas para los estudiantes regulares es de 650.
- ¿Cuáles son algunos hechos interesantes o sorprendentes sobre los antiguos egipcios?
- ¿Cuáles son algunas nuevas empresas interesantes en la cadena de suministro / logística?
- ¿Qué tan rápido podría uno hacer un ciclo en el vacío?
- ¿Cuáles son algunos comandos Unix menos conocidos pero útiles? ¿Qué hace el comando y por qué es útil?
- ¿Qué prácticas de construcción de nidos emplean las aves para asegurar que sus nidos estén bien anclados?
Tenga en cuenta que dentro de ambos grupos (los estudiantes desfavorecidos y los estudiantes regulares), los puntajes estandarizados AUMENTARON . ¡Esta maestra está mejorando!
Sin embargo, debido a que las personas burocráticas tienen muy poco tiempo, solo miran los puntajes promedio de la clase de la Sra. Brown. En el año 1, el promedio es .1 * 400 + .9 * 600 = 580. Durante el año 2, el promedio es .5 * 450 + .5 * 650 = 550. Por lo tanto, el puntaje promedio Disminuyó por 30 puntos! Llegan a la conclusión de que a la Sra. Brown le está yendo peor (y tomar las medidas apropiadas, por ejemplo, disminuir su salario).
Año \ Estudiantes en desventaja Regular Promedio
1 400 600 580
2 450 650 550
La paradoja de Simpson es que cuando se combinan varios grupos de datos (los puntajes de las pruebas de los estudiantes desfavorecidos y regulares), los datos combinados pueden mostrar la tendencia inversa como cada uno de los grupos individuales. Podemos ver por qué este es el caso anterior: los estudiantes de segundo año están mucho más inclinados hacia aquellos que están en desventaja y por lo tanto tienen calificaciones más bajas.
Por lo tanto, a menudo es impreciso sacar conclusiones sobre los resúmenes de datos sin considerar la composición de los mismos.
Para más información: la paradoja de Simpson y http://math.gliyanet.com/probabi…