Download Módulo 1: Big Data to increase your Business Opportunities

Document related concepts
no text concepts found
Transcript
Módulo 1: Big Data to increase your Business Opportunities (10 h)
Objetivos
- Introducción
- Toma de decisiones
- Business Intelligence
- Evolución del Big Data
¿Qué es Big Data?
- Evolución de la Gestión de Datos
- Definición de Big Data
- Arquitectura de Gestión de Big Data
- Rendimiento de la Arquitectura
- Analítica Tradicional y Avanzada
- Casos de Uso
Módulo 2: Big Data Architecture (60h)
Sesión 2: Hadoop, el motor de la evolución
- Introducción a Hadoop y HDFS
- Arquitectura Hadoop, Introducción a MapReduce
Sesión 3: Modelo de programación de procesamiento distribuido
- API MapReduce
- Programación avanzada con MapReduce
Sesión 4: Ecosistema de Hadoop
- Herramientas de adquisición de información: Sqoop, Flume
- Otras heramientas del ecosistema Hadoop: Hue y Oozie
- Análisis de la información con SQL: Apache Hive
- Procesamiento de la información: Apache Pig
Sesión 5: La evolución del procesamiento en memoria
- Introducción a Apache Spark
- Programación avanzada con Spark
Sesión 6: La evolución del procesamiento en memoria
- Procesamiento de datos en tiempo real: Spark Streaming
- Análisis de la información con SQL: Spark SQL
Sesión 7: Almacenamiento en base de datos NoSQL
- Introducción al almacenamiento NoSQL: MongoDB, Hbase, Cassandra y Neo4J
- Almacenamiento orientado a columnas (Hbase)
- Almacenamiento orientado a grafos (Neo4J)
Módulo 3: Business Analytics (70 horas)
Sesión 10: Análisis de la información I
- Pasos a seguir en un estudio estadístico
- Introducción a la programación en R
- Programación en R con fines estadísticos
- Integración de R en Big Data
Sesión 11: Análisis de la información II
- Introducción a la programación con Python
- Programación en Python con fines estadísticos
- Integración de Python en Big Data
- Data Discovery con la herramienta TIBCO Spotfire.
Sesión 12: Integración de R y Python en Big Data
- Map Reduce con R y Python en Hadoop
- Map Reduce y UDFs con R y Python en Hive
- R y Python en Spark: SparkR y PySpark
Sesión 13: Big Data Analytics con Spark MLlib
- Aprendizaje automatico: conceptos y aplicaciones
- El proceso del KDD
- Selección y transformación de datos
- Aprendizaje automático y evaluación
Sesión 14: Big Text Data Analytics con Spark MLlib
- Tareas de clasificación de texto y aplicaciones
- Representación de textos
- Reducción de la dimensionalidad
- Aprendizaje y evaluación
Sesión 15: Herramientas Microsoft
- Power BI Microsoft
- Excel
Sesión 16: Herramientas Microsoft
- Power BI Microsoft
- Excel
Módulo 4: Proyecto final de máster (60h)