Uno debe tener datos reales observados para esta elección subjetiva, sí o no, junto con otros metadatos asociados con el usuario que puedan ser relevantes en el momento de la elección.
Luego, uno tiene que extraer los datos con técnicas de big data para descubrir e identificar los metadatos de usuario asociados con la elección subjetiva.
La elección subjetiva podría ser multiestatal o incluso un conjunto de rangos. El resultado de sí / no es un caso degenerado.
Uno debe tener una hipótesis sobre qué metadatos de usuario es posiblemente relevante. La edad, la ubicación, la educación, el sexo, los ingresos, el estado del trabajo, el historial de compras anteriores, etc., por ejemplo, son grandes posibilidades para vender productos. Al final, debe utilizar los datos a los que tiene acceso y esperar que pueda descubrir una tendencia fuertemente correlativa.
- ¿Todo en el futuro se equilibrará en el trabajo?
- ¿Cuáles son varias formas de predecir una variable continua?
- ¿Algún astrólogo, en cualquier parte del mundo, predijo la caída en los precios del crudo de $ 112 en junio de 2014 a $ 65 en diciembre de 2014?
- ¿Cuál es la predicción 2015 para Scorpios?
- ¿Cuánto tiempo más será el dólar estadounidense la moneda de reserva del mundo?
El problema de la selección es si obtiene los datos, si los datos son ruidosos y si infringen las leyes de privacidad.
Un par de puntos clave.
Los grandes jugadores como Google y Amazon conocen una gran cantidad de hábitos personales de las personas, y sus actividades en línea se registran. La privacidad se está convirtiendo en un mito, especialmente si estas empresas comparten datos. Estas empresas se encuentran en una posición única con respecto a sus datos de usuario utilizando técnicas de big data para crear modelos de comportamiento de usuario predictivos para fines comerciales.
Big data encuentra correlaciones. No encuentra causalidad. Esto no es realmente un problema porque el modelo predicativo derivado del análisis de big data suele ser un buen modelo.