Download Programa del taller - CISEPA
Document related concepts
Transcript
Investigación Social Aplicada Usando Stata 13 DESCRIPCIÓN Objetivo: Brindar a los alumnos las herramientas necesarias para el manejo, análisis descriptivo y exploratorio de bases de datos en ciencias sociales, sean de microdatos o de datos agregados. En particular, se busca que los alumnos del curso desarrollen la capacidad para desenvolverse en el entorno de Stata 13 para (i) administrar y consolidar las bases de datos que tengan a su disposición, resolviendo de manera independiente los problemas usualmente presentes en bases de datos de ciencias sociales (e.g. tratamiento de missing values, uso de factores de expansión, corrección de errores sistemáticos en los datos, construcción de variables de interés); (ii) describir y analizar exploratoriamente los datos, en búsqueda de patrones presentes en ellos mediante el uso de las herramientas del software (e.g. distribuciones, gráficos, mapas geográficos, tablas, tests); y (iii) realizar algunas pruebas de hipótesis introductorias, según sean necesarias y frecuentes en cada ciencia social1. A lo largo del curso, se hará énfasis en que los alumnos “aprendan a aprender” en Stata 13, la que suele ser la habilidad más importante en el software, mediante el uso adecuado del archivo de ayuda, el manual y los servidores especializados de usuarios del software. Público objetivo: Investigadores o tesistas en ciencias sociales y alumnos de últimos ciclos de facultad con interés en la investigación con algún tema de investigación en mente, y que requieren el manejo de información cuantitativa, poco familiarizados con Stata 13. Estrategia metodológica: - Modalidad presencial para las presentaciones en clases prácticas. Manejo interactivo de los casos desarrollados en el curso. Presentación, y análisis exploratorio y descriptivo de las principales bases de datos nacionales2 y globales3. Se hará énfasis en aquella información de acceso No obstante, elcurso no busca ser un curso teórico sobre investigación en ciencias sociales, si bien se hará el repaso necesario de nociones de estadística importantes para el desarrollo de la investigación. Por el contrario, el énfasis del curso estará en el análisis cuantitativo y el manejo de bases de datos, ambos elementos suficientemente extensos e importantes para el desarrollo de una investigación, tomando como supuesto que el tema que se investiga está bien acotado y es relevante para la disciplina. 2 Por ejemplo, Encuestas de Hogares (ENNIV, ENAHO), Censo Nacional de Población y Vivienda, Encuesta Demográfica de Salud Familiar (ENDES), datos de la Comisión de la Verdad y Reconciliación (CVR), Registro 1 - fácil y público, cuya información pueda ser estudiada, en principio, desde diferentes ciencias sociales; no obstante, se atenderán consultas sobre bases de datos específicas de interés para los alumnos. Evaluación en base a un trabajo (para casa) aplicando las herramientas desarrolladas en el curso. La aprobación de la evaluación es necesaria para obtener el certificado del curso. Conocimientos previos recomendados: Estadística (Probabilidad y Estadística Inferencial). Horario: Lunes, 27 de octubre, de 7:00 p.m. a 10:00 p.m. Martes, 28 de octubre, de 6:00 p.m. a 10:00 p.m. Miércoles, 29 de octubre, de 7:00 p.m. a 10:00 p.m. Jueves, 30 de octubre, de 6:00 p.m. a 10:00 p.m. Viernes, 31 de octubre, de 6:00 p.m. a 10:00 p.m. Lugar: Aulas Informáticas PUCP (Edificio Mc Gregor). INSCRIPCIÓN Inversión: Público en general: S/. 350 // Estudiantes de pregrado: S/. 250 Vacantes: 39 alumnos Informes: cisepa@pucp.edu.pe EXPOSITOR José Luis Flor Toro, Candidato a Magíster en Economía de la PUCP, Bachiller en Economía de la PUCP. Actualmente, es Asesor en el Despacho Ministerial de Nacional de Municipalidades (RENAMU), Sistema Integrado de Administración Financiera (SIAF), Inventarios de Desastres Naturales (DesInventar, SINPAD). 3 Por ejemplo, Penn World Tables, Polity IV, y Latinobarómetro. PRODUCE. Ha sido Jefe de Prácticas a Tiempo Completo en el Departamento de Economía de la PUCP (2012-2014) y es asistente de investigación en varios proyectos con profesores del Departamento de Economía y coautor de varios documentos de investigación, y cuenta con ponencias nacionales e internacionales. Sus temas de interés son el desarrollo y el crecimiento económico, la desigualdad económica, y el efecto de los desastres naturales sobre el desarrollo económico. PROGRAMA Sesión 1. Elementos básicos de Stata y del manejo de bases de datos. Sesión 2. Análisis descriptivo I. Sesión 3. Análisis descriptivo II. Sesión 4. Análisis exploratorio. Sesión 5. Elementos básicos de programación y solución de problemas prácticos. Lunes 3/11. Lunes 10/11 (1a) Presentación (1b) “Aprendiendo a hablar en Stata”. (1c) Manejo de bases de datos en ciencias sociales. (2a) Distribuciones: Tablas. (2b) Distribuciones: Gráficos. (3a) Estadísticos descriptivos. (3b) Mapas en Stata. Asignación del trabajo para la evaluación. (4a) Relaciones entre dos o más variables 1. (4b) Relaciones entre dos o más variables 2. (5a) Programación funcional en Stata. (5b) El problema de los missing values y las soluciones al problema. Entrega de trabajos4 (vía correo electrónico). Devolución de trabajos corregidos (vía correo electrónico) y recojo de certificados. El trabajo (para casa) es el componente único de la evaluación de los alumnos del curso, y deberá ser aprobado con nota aprobatoria (11 o más), para la entrega del certificado correspondiente. Aunque el nivel de dificultad y los temas serán definidos durante el curso mismo, en líneas generales el trabajo consistirá en dos elementos: (i) la replicación de procedimientos desarrollados en el curso (60% de la nota) y (ii) la solución de un problema práctico basado en ciertos elementos desarrollados durante el curso pero que también requerirá que el alumno aprenda a usar algunos comandos por su cuenta. De esta manera, la forma de evaluación busca ser consistente con el objetivo del curso. 4 CONTENIDOS Sesión 1. Elementos básicos de Stata y del manejo de bases de datos. (1a) Presentación. ¿Por qué Stata? ¿Qué pueden decirnos los datos? (1b) “Aprendiendo a hablar en Stata”. Algunas convenciones de Stata. La interface de Stata y sus elementos. El uso de do-files y log-files para ordenar nuestro trabajo. (1c) Manejo de bases de datos en ciencias sociales. Acceso a e ingreso de los datos. Descripción y exploración de la base de datos. Creación y modificación de variables. Tipos de variables: string y numéricas. Missing values. Manejo de etiquetas. Formas long y wide de las bases de datos. Juntando bases de datos. Almacenamiento y exportación de la base de datos. Sesión 2. Análisis descriptivo I. (2a) Distribuciones: Tablas. Valores medios de una distribución: media, mediana, y moda. Dispersión y sus medidas: desviación estándar, varianza, coeficiente de variación. Tabulaciones y tablas. (2b) Distribuciones: Gráficos. Gráficos para distintos tipos de variables: categóricas, categóricas ordenadas, cuantitativas. Manejo y almacenamiento de gráficos. Otros gráficos en Stata. Series de tiempo. Sesión 3. Análisis descriptivo II. (3a) Estadísticos descriptivos. Uso de tablas en Stata. Uso apropiado de factores de expansión: tipos de factores de expansión. Diseños de encuesta. Pruebas de hipótesis: ¿Qué nos dicen y cómo las interpretamos? ¿Cuándo podemos confiar en ellas? ¿Cómo las ejecutamos? (3b) Mapas en Stata. Construcción de mapas en Stata: acceso a shapefiles, transformación y uso de comandos pertinentes. Diseño de mapas: distritales, provinciales, departamentales, por cuenca, internacionales. Manejo y almacenamiento de mapas. Sesión 4. Análisis exploratorio. (4a) Relaciones entre dos o más variables 1. Gráficos de dispersión. Correlaciones, covarianzas. Correlación entre variables ordinales. Regresión bivariada y multivariada: supuestos del modelo clásico de regresión lineal, “usos y abusos”, alcances y limitaciones. (4b) Relaciones entre dos o más variables 2. Análisis de varianza: one-way y two-way. Análisis factorial: principal factor y principal-component factor. Sesión 5. Elementos básicos de programación y solución de problemas prácticos. (5a) Programación funcional en Stata. Loops: -foreach- y –forvalues-. Macros: -local- y – global-. Manejo de los contenidos de r(.) y e(.). Matrices. Comandos –egen-. Prefijo –by-. (5b) El problema de los missing values y las soluciones al problema. La naturaleza del problema. Imputación: supuestos, métodos y comandos relevantes. (5c) El helpfile y otros recursos para el aprendizaje. El archivo de ayuda de Stata: alcances y limitaciones. Statalist. Comandos en –ssc install-. Ejercicios. Referencias bibliográficas Acock, A.C. 2010 “A gentle introduction to Stata”, 3rd Ed. College Station, TE : Stata Press, 2010. Baum, C. 2005 “A little bit of Stata programming goes a long way…”. SUGUK 2005, invited lecture. Disponible en http://fmwww.bc.edu/ec-p/wp612.pdf. 2009 “An introduction to Stata programming”. College Station, TE : Stata Press, 2009 2011 “Using Stata for Applied Research: Reviewing its Capabilities” En: Journal of Economic Surveys, 2011, 25:2, 380-394 StataCorp 2011 “Stata 12 Base Reference Manual”. College Station, TX: Stata Press.