¿Cuáles son algunos consejos de análisis de datos?

“Analizar datos se trata de contar historias”.

Este es mi mayor aprendizaje de la profesora de Física Mara Prentiss, mi asesora en Harvard, cuando estaba haciendo una investigación de Física con ella, que involucra la simulación y el análisis de gran cantidad de datos experimentales.

Confiar en las decisiones de historias anecdóticas es peligroso, pero basar las decisiones en números simples sin interpretación no tiene sentido.

Como en una historia, un artículo de investigación científica no documenta cronológicamente todo lo que sucedió y continúa. De manera similar, un buen informe de análisis de datos en la industria, en lugar de tirar sin pensar todos los números a la mesa, selecciona el dato que más vale la pena leer y desentraña los datos para explicar por qué. Y, por supuesto, la visualización ayuda a contar historias.

Con esta mentalidad de cómo se ve el entregable, cuando se realiza el análisis, eso significa: no piense en revisar una lista de verificación (obtenga la media, obtenga el valor de p, obtenga la gráfica, listo). Piénsalo como una historia de detectives y profundiza: ¿por qué? ¿Se te pueden ocurrir algunas explicaciones plausibles? Cuando lo haces, ¿qué otros datos pueden corroborar esta teoría? ¿Qué datos pueden eliminar esta explicación?

Intente trazar cosas, si no puede, aprenda más sobre visualizaciones de datos.

Conozca sus datos y asegúrese de que estén limpios (es decir, los campos están normalizados y se pueden analizar). También es importante asegurarse de tener suficientes datos para ejecutar el análisis.

Y también comienza el análisis basado en lo que estás tratando de responder. Mucha gente comienza a analizar los datos sin otro propósito que el hecho de que es interesante.

Finalmente, muestre / reporte los datos de una manera que sea fácil de entender y asegúrese de que sea procesable.

No comience su análisis hasta que entienda completamente sus datos.
No comience a escribir su código hasta que tenga una idea clara de lo que quiere hacer.
Siempre limpie sus datos primero.
Hacer tramas para visualizarlo.