Download Presentación de PowerPoint
Document related concepts
no text concepts found
Transcript
BIG DATA ANALYTICS Sesiones: Sábados 8, 15, 22 y 29 de octubre Horario: 9 a 14 hrs. Sede: Facultad de Ciencias UNAM Información: Contacto personal: 5528256572 info@saxsa.com.mx Oficina: 5570902513 5570901068 Costo: Público en general: $14,000.00 Comunidad UNAM: $ 8,000.00 Detalle del TEMARIO Fundamentos de SQL Spark Creación de Data Frames en el Shell de Spark, con Scala y PySpark Creación y ejecución de queries con el DataFrame API Y Spark SQL con Scala y Python Creación de estructuras Apache Parquet con Scala y Python Spark Avanzado Creación de aplicaciones auto-suficientes con SBT y MAVEN Ejecución en un ambiente distribuido en Spark con Scala Ejecución en un ambiente distribuido en Spark con Python Spark Streaming Creación de mecanismos de Data streaming con Spark Streaming en Scala y Python Pre-requisitos para la extracción de torrentes de datos con Apache Spark Extracción de datos en streaming y su almacenamiento en repositorios del Hadoop HDFS Obtención de Tweets con Spark Streaming Filtrado de Tweets por temas específicos y almacenamiento en Hadoop HDFS Análisis de Tweets con SQL Spark Algoritmos de Aprendizaje Automatizado (ML) Introducción al Aprendizaje Automatizado (Machine Learning) Introducción a las técnicas de Sistemas de Recomendación Instrumentación de un Sistema de Recomendación con Scala y Python Introducción a los sistemas de análisis de textos LSA (Latent Semantic Analysis) Instrumentación de un sistema Big Data de análisis de textos LSA con Spark MLlib en Scala y Python Visualización de datos Visualización con bibliotecas de los lenguajes R y Python Visualización de grandes volúmenes con Apache Spark, por medio de Spark R y Pyspark Visualización con herramientas BI comerciales Visualización con Bokeh Python Requisitos: Se requieren conocimientos básicos de programación en cualquier lenguaje (Scala, Java, Python, R)