Duración

4 días - 21 horas

Descripción

Este curso está indicado para desarrolladores e ingenieros de datos que quieran indexar datos en Hadoop para realizar consultas más potentes en tiempo real.

Los participantes aprenderán a obtener mayor valor de sus datos mediante la integración de Cloudera Search en aplicaciones externas.

Cloudera Search trae full-text, consulta interactiva e indexación escalable y flexible a Hadoop y a un Hub de datos empresarial. Potenciado por Apache SoIr, Search aporta escalabilidad y confiabilidad a una nueva generación de consultas integradas y multi-carga.

Objetivos

A través de la impartición desarrollada por el instructor y ejercicios prácticos interactivos, los participantes navegarán a través del ecosistema Hadoop aprendiendo temas como:

  • Cómo realizar indexación de lotes de datos almacenados en HDFS y HBase
  • Cómo realizar indexaciones de flujos de datos cercano a tiempo real con Flume
  • Indexación de contenido en múltiples lenguajes y formatos de ficheros
  • Procesar y transformar datos entrantes con Morphlines
  • Crear un interfaz de usuario para tu índice usando Hue
  • Integrar Cloudera Search con aplicaciones externas
  • Mejorar la experiencia con Search mediante el uso de características como faceting, highlighting, spelling correction

Contenidos del curso

Introducción

 Introducción a Cloudera Search

  • ¿Qué es Cloudera Search?
  • Características de ayuda
  • Casos de uso
  • Arquitectura básica

Realización de consultas básicas

  • Ejecutando una consulta en el Admin UI
  • Sintaxis básica
  • Técnicas de equivalencias aproximadas
  • Control de resultados

Escribiendo consultas más potentes

  • Relevancias y filtros
  • Analizadores de consultas
  • Funciones
  • Búsqueda geoespacial
  • Faceting

Preparación para indexar documentos

  • Visión general del proceso de indexación
  • Comprender Morphlines
  • Generando ficheros de configuración
  • Diseño de esquema
  • Gestión de recopilación

Indexación de lotes de datos HDFS con MapReduce

  • Visión general del proceso de indexación de lotes HDFS
  • Usando la herramienta de indexación MapReduce
  • Pruebas y resolución de problemas

 Indexación cercana a tiempo real con Flume

  • Visión general del proceso de indexación cercana a tiempo real
  • Introducción a Apache Flume
  • Como realizar una indexación cercana a tiempo real con Flume
  • Pruebas y resolución de problemas

Indexación de datos Hbase con Lily

  • Qué es Apache Hbase?
  • Indexación de lotes en Hbase
  • Indexación de tablas Hbase cercana a tiempo real

Indexación de datos en otros lenguajes y formatos

  • Tipos de campos y cadenas de análisis
  • Palabras raíz, mapeo de caracteres y soporte de lenguaje
  • Esquema y soporte de análisis en la Admin UI
  • Metadata y extracción de contenido con Apache Tika
  • Tipos de indexación de ficheros binarios con SoIrCell

Mejorando la calidad y rendimiento de Search

  • Como entregar resultados relevantes
  • Ayudar a los usuarios a encontrar información
  • Rendimiento de las consultas y resolución de problemas

 Construyendo interfaces de usuario en Search

  • Visión general de Search UI
  • Construyendo un interfaz de usuario con HUE
  • Integrando Search con aplicaciones customizadas

Consideraciones para la implementación

  • Planeando la implementación
  • Determinando las necesidades de hardware
  • Visión general de seguridad
  • Agrupación de alias

Conclusión


Información extra

¿A quién está dirigido?

Este curso está dirigido a desarrolladores e ingenieros de datos con al menos familiaridad básica en Hadoop y experiencia programando en un lenguaje de propósito general como Java, C, C++, Perl o Python.

Pre-requisitos

Los participantes deberán sentirse cómodos en el manejo de líneas de comando de Linux y ser capaces de realizar tareas básicas como crear y borrar directorios, visualizar y cambiar permisos en ficheros, ejecutar scripts y examinar ficheros resultantes. No se requiere experiencia previa en Apache SoIr o Cloudera Search, ni tampoco en Hbase o SQL.

Información general

Área formativa

Cloudera Desarrollador

Fabricante

Cloudera

Metodología

Presencial

Certificación

Sin certificación

Garantía juvenil

 

¿TIENES DUDAS? PREGÚNTANOS

He leído y acepto la del sitio y las condiciones de tratamiento de mis datos de carácter personal

 

 

Fecha Hora Ubicación Precio
No hay convocatoria programada. Por favor, consúltanos sobre próximas fechas y precio para esta formación.

¿Necesitas Ayuda?

Consúltanos si necesitas información de nuestros cursos o masters.

 

Contacta con Core Networks