Duración

5 días - 30 horas

Descripción

El curso trata de proporcionar los conceptos y habilidades necesarias para que los alumnos puedan desarrollar aplicaciones distribuidas para el análisis de datos con Python y Spark, que forma parte del conjunto de herramientas del ecosistema Big Data. El alumno puede conocer y practicar con los módulos como Streaming, SQL, GraphX o MLib.

Objetivos

Este curso está dirigido principalmente a desarrolladores, sobre todo para aquellos que tengan conocimientos y experiencia sobre el lenguaje de programación Python.

Contenidos del curso

  1. Machine learning como campo de la IA
    • Acotando AI
    • Machine learning vs Deep learning
    • ML y Big Data
    • Rol del científico de datos
    • Fases en ML
    • Datos y DataSets
    • Selección de características o features
    • Dimensiones etiquetas atributos
    • Método supervisado y no supervisado
    • Modelos en ML

 

  1. Entrada y salida con Python
    • Trabajando con archivos
    • Manipulación de datos
    • Networking: operaciones

 

  1. Distribución de paquetes
    • Concepto de package
    • Instalación con pip
    • Anaconda
    • Formato Wheel

 

  1. Numpy y Scipy
    • Qué son y para que sirven
    • NumPy datatypes
    • NumPy character codes
    • n-dimensional arrays: operaciones

 

  1. Plotting con Python
    • Librerías más populares
    • Matplotlib: configuración
    • Modificar colores y líneas
    • Mostrar varios valores de forma simultanea
    • Establecer límites y rejilla
    • Agregar etiquetas, leyenda
    • Controlar el formato gráfico
    • Controlar el estilo de línea
    • Control de la escala: ticks
    • Tipos de gráficos y su uso

 

  1. Pandas
    • Qué es y para que sirve
    • Las series: operaciones
    • Los DataFrames: operaciones
    • Carga de datos en Dataframes
    • NumPy y Pandas

 

  1. Algoritmos Machine learning
    • Algortimos Machine Learning supervisados
    • Algortimos Machine Learning no supervisados
    • Elegir el algortimo correcto
    • Ciclos de vida en el desarrollo de Machine Learning
    • Clasificando con k-Nearest Neighbors (SL)
    • Algortimo k-Nearest Neighbors
    • La tasa de error
    • Arboles de decisión (SL)
    • Usando arboles de decisión
    • Random Forests
    • Naive Bayes Classifier (SL)
    • Clasificación de documentos con Naive Bayes
    • Learning Type no supervisado: Clustering
    • K-Means Clustering (UL)
    • K-Means Clustering in a Nutshell
    • Analisis de regresión
    • Tipos de regresión
    • Modelo de regresión simple linear
    • Linear Regression Illustration
    • Least-Squares Method (LSM)
    • LSM Assumptions
    • Adaptando modelos de regresiónn linear en R
    • Ejemplo de uso de la función R's lm()
    • Ejemplo de uso de lm() con un Data Frame
    • Regresión logística
    • Regresión vs Clasificación
    • Análisis de Time-Series
    • Descomponiendo Time-Series

 

 

 

Información general

Área formativa

Cursos de Analista de Datos en Big Data

Fabricante

Big Data

Metodología

Presencial | Learning virtual class

Certificación

Sin certificación

 

¿TIENES DUDAS? PREGÚNTANOS

    He leído y acepto la del sitio y las condiciones de tratamiento de mis datos de carácter personal

     

     

    Fecha Hora Ubicación Precio
    No hay convocatoria programada. Por favor, consúltanos sobre próximas fechas y precio para esta formación.

    ¿Necesitas Ayuda?

    Consúltanos si necesitas información de nuestros cursos o masters.

     

    Contacta con Core Networks