¿Cuál es la mejor manera de comenzar a aprender Big Data para desarrolladores de Java?

Java es, por supuesto, ahora propiedad de Oracle, uno de los defensores de Big Data. Pero Big Data es el intento de los gigantes de la tecnología de construir una participación dominante en la información, un campo más amplio que, como su nombre indica, tiene algo de ciencia, matemáticas y estadísticas (si ve estadísticas como separadas de las matemáticas) en la mezcla.

La programación es algo con lo que está familiarizado y no es un gran salto tomar su experiencia en Java y aplicarla a Python (que sugeriría sobre R). Mira en las extensas bibliotecas y cosas como Sci-Kit Learn. Comience aquí: Introducción a Python para Data Science

También en el aspecto tecnológico, los principios detrás de Hadoop y tecnologías similares son importantes y se mueven a partir de las bases de datos estructuradas comunes en las aplicaciones Java. Hortonworks tiene algunos consejos para mudarse de Java: Cómo comenzar en Data Science – Hortonworks

Pero el verdadero aprendizaje viene del lado de la ciencia. Debe comprender los conceptos detrás del aprendizaje automático y, idealmente, las redes neuronales y el aprendizaje profundo. Un buen lugar para comenzar es con el curso de Andrew Ng Coursera sobre Aprendizaje automático: Página en coursera.org

También hay una serie de cursos de migración acelerada. En DataScience Oxford recibimos a S2DS, que se especializa en convertir a los científicos en científicos de datos: ciencia a ciencia de datos. Curso similar existe para los programadores. Sin embargo, pueden ser costosos y la mayor parte del trabajo está cubierto en línea.

Una nota final es que la dataciencia no es mucho más difícil de lo que estás acostumbrado en Java si tienes una mentalidad matemática y las perspectivas de carrera son buenas, bien pagadas e interesantes. ¡Ve a por ello!

En la búsqueda de Big Data, primero aprenda estos conceptos de qué es Big-Data. Tratar de entender; ¿Cuáles son los problemas con la industria de big data? Luego, acérquese a seguir en esta secuencia. La comprensión de la necesidad de almacenamiento de datos fue otro elemento opcional, que puede ser beneficioso para comprender la necesidad de los marcos a continuación. Esta fue mi secuencia, y me ayudó en la ganancia exponencial,

  • Hadoop
  • Colmena y zookeeper
  • Cerdo
  • Chispa

No soy un chico experimentado pero todavía puedo dar algunas sugerencias que conozco

Opción 1: autoaprendizaje

Puede aprender de coursera, ML por Andrew Ng Baidu, Stanford es un buen curso para aprender ML

Opción 2: impartir cursos en algunas empresas de consultoría que ofrezcan oportunidades laborales

Espero eso ayude