Download Módulo 1: Big Data to increase your Business Opportunities
Document related concepts
no text concepts found
Transcript
Módulo 1: Big Data to increase your Business Opportunities (10 h) Objetivos - Introducción - Toma de decisiones - Business Intelligence - Evolución del Big Data ¿Qué es Big Data? - Evolución de la Gestión de Datos - Definición de Big Data - Arquitectura de Gestión de Big Data - Rendimiento de la Arquitectura - Analítica Tradicional y Avanzada - Casos de Uso Módulo 2: Big Data Architecture (60h) Sesión 2: Hadoop, el motor de la evolución - Introducción a Hadoop y HDFS - Arquitectura Hadoop, Introducción a MapReduce Sesión 3: Modelo de programación de procesamiento distribuido - API MapReduce - Programación avanzada con MapReduce Sesión 4: Ecosistema de Hadoop - Herramientas de adquisición de información: Sqoop, Flume - Otras heramientas del ecosistema Hadoop: Hue y Oozie - Análisis de la información con SQL: Apache Hive - Procesamiento de la información: Apache Pig Sesión 5: La evolución del procesamiento en memoria - Introducción a Apache Spark - Programación avanzada con Spark Sesión 6: La evolución del procesamiento en memoria - Procesamiento de datos en tiempo real: Spark Streaming - Análisis de la información con SQL: Spark SQL Sesión 7: Almacenamiento en base de datos NoSQL - Introducción al almacenamiento NoSQL: MongoDB, Hbase, Cassandra y Neo4J - Almacenamiento orientado a columnas (Hbase) - Almacenamiento orientado a grafos (Neo4J) Módulo 3: Business Analytics (70 horas) Sesión 10: Análisis de la información I - Pasos a seguir en un estudio estadístico - Introducción a la programación en R - Programación en R con fines estadísticos - Integración de R en Big Data Sesión 11: Análisis de la información II - Introducción a la programación con Python - Programación en Python con fines estadísticos - Integración de Python en Big Data - Data Discovery con la herramienta TIBCO Spotfire. Sesión 12: Integración de R y Python en Big Data - Map Reduce con R y Python en Hadoop - Map Reduce y UDFs con R y Python en Hive - R y Python en Spark: SparkR y PySpark Sesión 13: Big Data Analytics con Spark MLlib - Aprendizaje automatico: conceptos y aplicaciones - El proceso del KDD - Selección y transformación de datos - Aprendizaje automático y evaluación Sesión 14: Big Text Data Analytics con Spark MLlib - Tareas de clasificación de texto y aplicaciones - Representación de textos - Reducción de la dimensionalidad - Aprendizaje y evaluación Sesión 15: Herramientas Microsoft - Power BI Microsoft - Excel Sesión 16: Herramientas Microsoft - Power BI Microsoft - Excel Módulo 4: Proyecto final de máster (60h)