Descripción del curso

¿Aún no dominas el mundo del Big Data? Con este curso no solo comprenderás los conceptos en los que se basa el Big Data, sino que además haremos un viaje por muchas de sus herramientas, usándolas de manera práctica y con ejemplos reales.


¿Qué voy a aprender? ¿Cuáles son los objetivos del curso?

  • Con este curso vas a aprender a manejar la herramienta de Apache Hadoop y todo su ecosistema. Conocerás también como administrar un cluster, y la integración existente entre cada una de las herramientas.
  • Comenzaremos realizando una breve introducción al mundo del big data, y los conceptos fundamentales en los que se basa, para luego, pisar el acelerador y ver en profundidad cada uno de ellos.
  • En primer lugar nos centraremos en los módulos que conforman el core de Apache Hadoop, estos son, el HDFS, el YARN y los procesos Map Reduce. Partiremos de la base, y profundizaremos tanto en sus aspectos de configuración, como en la implementación de algoritmos.
  • Luego, pasaremos a estudiar otras herramientas que se encuentran dentro del ecosistema, como pueden ser Apache Hive, Apache Pig o Apache Spark, para finalizar hablando sobre el reporting. En un mundo lleno de datos como el que vivimos, la presentación de los datos es realmente importante, y es aquí donde el reporting juega un papel esencial.
  • Durante el curso, iremos realizando prácticas en cada módulo, todas ellas supervisadas y corregidas por el profesor, de forma que al final del mismo tengamos un resultado final, un proyecto real.
  • Por último, seréis ustedes mismos los que os enfrentaréis a un problema, el cual debéis resolver usando todas las herramientas vistas en el curso. Por supuesto, para este trabajo final contaréis con la ayuda y tutorización del profesor.
  • La meta de este curso es que hacernos conocedores de todas las herramientas Big Data que tenemos disponibles, haciéndolo no solo de manera teórica, sino práctica, y aplicando los conocimientos adquiridos en un proyecto real.

Conocimientos necesarios

Este curso está pensado para aquellas personas que, aún teniendo un perfil técnico, nunca han tenido la oportunidad de adentrarse en el mundo del Big Data.

  • Conocimientos básicos de SQL.
  • Conocimientos básicos de programación.

 

Materiales y programas necesarios

  • Ordenador con al menos 10 GB de RAM.
  • Virtual Box
  • Navegador recomendado Chrome