Duración

2 días

Descripción

Este curso teórico e introductorio trata de proporcionar los conceptos y habilidades necesarias para que los asistentes conozcan las características de Hadoop como implementación de los conceptos de Big Data, que posibilidades ofrece y a qué casos de uso se puede aplicar.

Se introduce al asistente en los conceptos fundamentales de la plataforma, se explican las herramientas más importantes del ecosistema de Hadoop y que utilidades se puede esperar de ellas.

Objetivos

Este curso está dirigido a ingenieros, desarrolladores o personal de dirección, que quieran obtener una imagen clara de qué es Big data y Hadoop, qué pueden esperar de esta plataforma y de que forma puede ayudarles en su trabajo diario.

Contenidos del curso

Introducción a Big Data (aprox. 1 hora)

  • Arquitectura de datos
  • Data warehouse/Data Marts.
  • Batch processing: reporting
  • Data lakes
  • Data pipelines
  • Escalabilidad y paralelismo
  • Analytics on demand
  • Analíticas en tiempo real
  • Análisis predictivo

Ingesta/Captura de datos (aprox. 2,5 horas)

  • Adquisición de varios orígenes
  • Streaming de datos
  • Bases de datos SQL/NoSQL
  • Ficheros y formatos
  • Web
  • Almacenamiento HDFS
  • Almacenamiento de streams
  • Inmutabilidad de datos (hot/warm/cold)

Procesamiento y análisis distribuido (aprox. 2 horas)

  • Motores distribuidos: MapReduce, Spark, Apache Impala
  • Batch analytics/reporting: Hive, Spark
  • Interactive analytics: Apache Impala, Spark
  • CRealtime analytics (alertas, dashboards)
    • Storm
    • Spark streaming

Machine learning (aprox. 1,5 horas)

  • Modelos predictivos
  • Supervisados:
    • Clasificación
    • Regresión logística
  • No supervisados
    • Clustering
  • Big data e Inteligencia artificial
    • Deep Learning
    • Redes neuronales

Acceso y reporting (aprox. 1 hora)

  • Herramientas de visualización
    • Tableau, QlickView...
  • Python Notebooks, CDSW
  • Tratamiento, visualización y análisis de grafos
  • Big data y geolocalización

Gestión de proyectos big data (aprox. 1 hora)

  • Soluciones on-premise, cloud e híbridas
  • Calidad del dato
  • Gobernanza del dato
  • Metodologías ágiles aplicadas a la gestión de proyectos Big data

Herramientas (aprox. 1 hora)

  • Factores de selección de herramientas
  • Ecosistema de Hadoop y Spark
  • Otras herramientas

Información general

Área formativa

Curso de Introducción a Big Data

Fabricante

Big Data

Metodología

Presencial | Learning virtual class

Certificación

Sin certificación

 

¿TIENES DUDAS? PREGÚNTANOS

    He leído y acepto la del sitio y las condiciones de tratamiento de mis datos de carácter personal

     

     

    Fecha Hora Ubicación Precio
    No hay convocatoria programada. Por favor, consúltanos sobre próximas fechas y precio para esta formación.

    ¿Necesitas Ayuda?

    Consúltanos si necesitas información de nuestros cursos o masters.

     

    Contacta con Core Networks