Duración

4 días - 21 horas

Descripción

Apache HBase es una base de datos NoSQL, distribuida y escalable para proyectos de Big Data sobre Hadoop. HBase puede almacenar datos en tablas masivas que consistan en miles de millones de filas y millones de columnas, sirviendo los datos a múltiples usuarios prácticamente en tiempo real, proveyendo a las aplicaciones, acceso rápido y aleatorio a los datos en modo lectura/escritura.
Este curso de cuatro días permite a los asistentes aprender a almacenar y acceder a cantidades masivas de datos multi-estructuradas, así como, procesar cientos de miles de operaciones por segundo.

Objetivos

A través de las clases del instructor y los ejercicios prácticos, los alumnos aprenderán:
• Casos de uso y cuándo utilizar HBase, Hadoop y RDBMS
• Uso de la Shell de HBase para la manipulación directa de tablas
• Diseño óptimo de los esquemas de HBase para el almacenamiento y recuperación de datos de forma eficiente
• Cómo conectar a HBase utilizando el API de Java para insertar y obtener datos en tiempo real
• Mejores prácticas para identificar y resolver cuellos de botella en el rendimiento

Contenidos del curso

Introducción

Introducción a Hadoop y HBase

• Introducción a Hadoop
• Componentes de Hadoop
• Qué es HBase?
• Por qué utilizar HBase?
• Fortalezas de HBase
• HBase en producción
• Debilidades de HBase

Tablas en HBase

• Conceptos de HBase
• Fundamentos de tablase en HBase
• Pensando sobre el diseño de tablas

La shell de HBase

• Creando tablas con la shell de HBase
• Trabajando con tablas
• Trabajando con datos de tablas

Fundamentos de la arquitectura de HBase

• Regiones HBase
• Arquitectura cluster de HBase
• HBase y la localización de los datos en HDFS

Diseño de esquemas HBase

• Consideraciones generales del diseño
• Diseño de aplicación céntrica
• Diseño de claves en filas HBase
• Otras características de tablas HBase

Acceso básico a los datos con la API de HBase

• Opciones de acceso a los datos HBase
• Creación y eliminación de tablas HBase
• Obtención de datos con Get
• Obtención de datos con Scan
• Insertando y actualizando datos
• Eliminando datos

Más características avanzadas de la API de HBase

• Filtrado con Scans
• Mejores prácticas
• Coprocesadores de HBase

 

Escritura en HBase

• Como HBase escribe datos
• Compactación
• Split

Lectura en HBase

• Cómo HBase lee datos
• Cache de bloques para lectura

Tuning para el rendimiento en HBase

• Consideraciones sobre la familia de columnas
• Consideraciones en el diseño de esquemas
• Configuración del sistema de caché
• Tratando con series de tiempo y datos secuenciales
• Preparticionado de regiones

Administración de HBase y gestión del cluster

• Demonios HBase
• Consideraciones de Zookeeper
• Alta disponibilidad en HBase
• Utilización del balanceador de HBase
• Arreglando tablas con hbck
• Seguridad en HBase

Replicación y backup en HBase

• Replicación en HBase
• Backup en HBase
• MapReduce y cluster HBase

Uso de Hive e Impala con HBase

• Utilización de Hive e Impala con HBase

Conclusión

Apéndice A: Acceso a datos con Python y Thrift

• Uso de Thrift
• Trabajando con tablas
• Obteniendo y añadiendo datos
• Escaneado de datos
• Eliminación de datos
• Contadores
• Filtros

Apéndice B: OpenTSDB


Información extra

¿A quién está dirigido?

Este curso está diseñado para desarrolladores y administradores que quieran utilizar HBase.

Pre-requisitos

Conocimientos básicos de Java. Experiencia con bases de datos y análisis de datos es recomendable.

No se requieren conocimientos previos de Apache Hadoop, pero haber tomado el curso Cloudera Developer Training for Spark and Hadoop previamente ofrece una excelente base  para esta formación.

Información general

Área formativa

Cloudera Desarrollador

Fabricante

Cloudera

Metodología

Presencial

Certificación

Sin certificación

Garantía juvenil

 

¿TIENES DUDAS? PREGÚNTANOS

He leído y acepto la del sitio y las condiciones de tratamiento de mis datos de carácter personal

 

 

Fecha y precios de nuestros cursos

Fecha Horario de impartición Ubicación Precio por alumno Previsto en fecha
16 Sep 2019
De 15.30 a 19.50h De Lunes a Viernes
Core Madrid
1360€ + IVA
02 Dec 2019
De 9.00 a 14.15h
Core Madrid
1360€ + IVA

¿Necesitas Ayuda?

Consúltanos si necesitas información de nuestros cursos o masters.

 

Contacta con Core Networks