Descripción
Este curso teórico e introductorio trata de proporcionar los conceptos y habilidades necesarias para que los asistentes conozcan las características de Hadoop como implementación de los conceptos de Big Data, que posibilidades ofrece y a qué casos de uso se puede aplicar.
Se introduce al asistente en los conceptos fundamentales de la plataforma, se explican las herramientas más importantes del ecosistema de Hadoop y que utilidades se puede esperar de ellas.
Objetivos
Este curso está dirigido a ingenieros, desarrolladores o personal de dirección, que quieran obtener una imagen clara de qué es Big data y Hadoop, qué pueden esperar de esta plataforma y de que forma puede ayudarles en su trabajo diario.
Contenidos del curso
Introducción a Big Data (aprox. 1 hora)
- Arquitectura de datos
- Data warehouse/Data Marts.
- Batch processing: reporting
- Data lakes
- Data pipelines
- Escalabilidad y paralelismo
- Analytics on demand
- Analíticas en tiempo real
- Análisis predictivo
Ingesta/Captura de datos (aprox. 2,5 horas)
- Adquisición de varios orígenes
- Streaming de datos
- Bases de datos SQL/NoSQL
- Ficheros y formatos
- Web
- Almacenamiento HDFS
- Almacenamiento de streams
- Inmutabilidad de datos (hot/warm/cold)
Procesamiento y análisis distribuido (aprox. 2 horas)
- Motores distribuidos: MapReduce, Spark, Apache Impala
- Batch analytics/reporting: Hive, Spark
- Interactive analytics: Apache Impala, Spark
- CRealtime analytics (alertas, dashboards)
- Storm
- Spark streaming
Machine learning (aprox. 1,5 horas)
- Modelos predictivos
- Supervisados:
- Clasificación
- Regresión logística
- No supervisados
- Clustering
- Big data e Inteligencia artificial
- Deep Learning
- Redes neuronales
Acceso y reporting (aprox. 1 hora)
- Herramientas de visualización
- Tableau, QlickView...
- Python Notebooks, CDSW
- Tratamiento, visualización y análisis de grafos
- Big data y geolocalización
Gestión de proyectos big data (aprox. 1 hora)
- Soluciones on-premise, cloud e híbridas
- Calidad del dato
- Gobernanza del dato
- Metodologías ágiles aplicadas a la gestión de proyectos Big data
Herramientas (aprox. 1 hora)
- Factores de selección de herramientas
- Ecosistema de Hadoop y Spark
- Otras herramientas
Información general
Curso de Introducción a Big Data
Big Data
Presencial | Learning virtual class
Sin certificación