Esta es la cuarta entrega de la serie de videotutoriales sobre BigData. En esta ocasión lo que vamos a ver es la migración desde la versión 1.6 de los ejemplos del tercer video a la versión 2.0 de Spark.
Así que trabajaremos con el API de SQL, que es en el que se basan los videos anteriores.
Estos cambios para aplicaciones Java tienen su cierto trabajo ya que hay un API que desaparece. concretamente es el DataFrame.
En esta ocasión os quiero dejar un vídeo de una reseña, o más bien opinión de un libro que he utilizado para aprender sobre Apache Spark.
El libro se llama Spark in Action.
Probablemente sea el libro más flojo de la línea de In Action que tengo. Yo lo achaco a que el tratar con cierta profundidad una herramienta tan extensa es complicado de hacer en un único libro.
De todas maneras me parece un libro muy indicado para la gente que quiera introducirse en el mundo de Spark y del BigData.
Cada vez va tomando mas importancia todos los temas relacionados con el BigData.
En el canal de Youtube he subido tres videos dedicados al desarrollo BigData con Spark.
Son vídeos muy básicos para poder hacerse una idea de los que supone desarrollar una aplicación BigData con Spark.
En el primer video se cubre la parte de instalación de las herramientas necesarias, siendo estas la máquina virtual de Java, el JBoss Developer Studio y las dependencias necesarias para desarrollar el proyecto con Maven.
El segundo video trata sobre la instalación del sistema de ficheros distribuido HDFS. Este sistema de ficheros es parte de Hadoop y es el típico sistema de ficheros de las soluciones BigData.
Y por último, y quizá mas interesante ya que se ve código, es el tercero. En el que se cubren cinco ejemplos.
Lectura de un fichero en formato csv y escritura del mismo en formato JSON
Filtrado de datos utilizando select, si selects de SQL
Filtrado de datos utilizando el API de Spark
Escritura de datos en ElasticSearch
Escritura de datos en HDFS
Entre el ejemplo tercero y el cuarto se explica la instalación de docker y la ejecución de un elasticSearch dockerizado.
Si os gustan los vídeos no dudeis en darle al Like y subscribiros al canal.
Utilizamos cookies para asegurar que damos la mejor experiencia al usuario en nuestro sitio web. Si continúa utilizando este sitio asumiremos que está de acuerdo.Estoy de acuerdoLeer más