¿Cuál sería una buena precisión de predicción si estuviera prediciendo algo que es subjetivo para un individuo?

Uno debe tener datos reales observados para esta elección subjetiva, sí o no, junto con otros metadatos asociados con el usuario que puedan ser relevantes en el momento de la elección.

Luego, uno tiene que extraer los datos con técnicas de big data para descubrir e identificar los metadatos de usuario asociados con la elección subjetiva.

La elección subjetiva podría ser multiestatal o incluso un conjunto de rangos. El resultado de sí / no es un caso degenerado.

Uno debe tener una hipótesis sobre qué metadatos de usuario es posiblemente relevante. La edad, la ubicación, la educación, el sexo, los ingresos, el estado del trabajo, el historial de compras anteriores, etc., por ejemplo, son grandes posibilidades para vender productos. Al final, debe utilizar los datos a los que tiene acceso y esperar que pueda descubrir una tendencia fuertemente correlativa.

El problema de la selección es si obtiene los datos, si los datos son ruidosos y si infringen las leyes de privacidad.

Un par de puntos clave.

Los grandes jugadores como Google y Amazon conocen una gran cantidad de hábitos personales de las personas, y sus actividades en línea se registran. La privacidad se está convirtiendo en un mito, especialmente si estas empresas comparten datos. Estas empresas se encuentran en una posición única con respecto a sus datos de usuario utilizando técnicas de big data para crear modelos de comportamiento de usuario predictivos para fines comerciales.

Big data encuentra correlaciones. No encuentra causalidad. Esto no es realmente un problema porque el modelo predicativo derivado del análisis de big data suele ser un buen modelo.