Descripción
El curso trata de proporcionar los conceptos y habilidades necesarias para que los alumnos puedan desarrollar aplicaciones distribuidas para el análisis de datos con Python y Spark, que forma parte del conjunto de herramientas del ecosistema Big Data. El alumno puede conocer y practicar con los módulos como Streaming, SQL, GraphX o MLib.
Objetivos
Este curso está dirigido principalmente a desarrolladores, sobre todo para aquellos que tengan conocimientos y experiencia sobre el lenguaje de programación Python.
Contenidos del curso
- Machine learning como campo de la IA
- Acotando AI
- Machine learning vs Deep learning
- ML y Big Data
- Rol del científico de datos
- Fases en ML
- Datos y DataSets
- Selección de características o features
- Dimensiones etiquetas atributos
- Método supervisado y no supervisado
- Modelos en ML
- Entrada y salida con Python
- Trabajando con archivos
- Manipulación de datos
- Networking: operaciones
- Distribución de paquetes
- Concepto de package
- Instalación con pip
- Anaconda
- Formato Wheel
- Numpy y Scipy
- Qué son y para que sirven
- NumPy datatypes
- NumPy character codes
- n-dimensional arrays: operaciones
- Plotting con Python
- Librerías más populares
- Matplotlib: configuración
- Modificar colores y líneas
- Mostrar varios valores de forma simultanea
- Establecer límites y rejilla
- Agregar etiquetas, leyenda
- Controlar el formato gráfico
- Controlar el estilo de línea
- Control de la escala: ticks
- Tipos de gráficos y su uso
- Pandas
- Qué es y para que sirve
- Las series: operaciones
- Los DataFrames: operaciones
- Carga de datos en Dataframes
- NumPy y Pandas
- Algoritmos Machine learning
- Algortimos Machine Learning supervisados
- Algortimos Machine Learning no supervisados
- Elegir el algortimo correcto
- Ciclos de vida en el desarrollo de Machine Learning
- Clasificando con k-Nearest Neighbors (SL)
- Algortimo k-Nearest Neighbors
- La tasa de error
- Arboles de decisión (SL)
- Usando arboles de decisión
- Random Forests
- Naive Bayes Classifier (SL)
- Clasificación de documentos con Naive Bayes
- Learning Type no supervisado: Clustering
- K-Means Clustering (UL)
- K-Means Clustering in a Nutshell
- Analisis de regresión
- Tipos de regresión
- Modelo de regresión simple linear
- Linear Regression Illustration
- Least-Squares Method (LSM)
- LSM Assumptions
- Adaptando modelos de regresiónn linear en R
- Ejemplo de uso de la función R's lm()
- Ejemplo de uso de lm() con un Data Frame
- Regresión logística
- Regresión vs Clasificación
- Análisis de Time-Series
- Descomponiendo Time-Series
Información general
Área formativa
Cursos de Analista de Datos en Big Data
Fabricante
Big Data
Metodología
Presencial | Learning virtual class
Certificación
Sin certificación