Download guia stata
Document related concepts
no text concepts found
Transcript
Maestría en Economía UNLP Econometría Avanzada 2012 Instructivo de Stata Trabajo Práctico 1 Estadísticas Descriptivas y Reportes Los comandos de Stata más utilizados para calcular estadísticas descriptivas de una o varias variables son summarize, tabstat y table. Por ejemplo: summarize x1 x2 x3 calcula el promedio, el desvío estándar, el mínimo y el máximo de las variables x1, x2 y x3. Otras estadísticas adicionales se obtienen al utilizar la opción detail. summarize x1 x2 x3, detail El comando tabstat es más completo, ya permite definir los estadísticos de interés. Por ejemplo: tabstat x1 x2 x3, s(mean sd cv p10 p50 p90) calcula la media, el desvío estándar, el coeficiente de variación y los percentiles 10, 50 y 90 de las variables x1, x2 y x3. Por último, el comando table permite filtrar las estadísticas por alguna variable categórica. Por ejemplo, si la variable u indica con 1 si la observación corresponde al área urbana y con 0 si corresponde a la rural, y se quiere calcular el promedio de x1, x2 y x3 por área geográfica, una opción es: summarize x1 x2 x3 if u==0 summarize x1 x2 x3 if u==1 La alternativa a esto es utilizar el comando table con la siguiente sintaxis: table u, c(mean x1 mean x2 mean x3) Esta sentencia calcula el promedio de las variables x1, x2 y x3 para cada área (para cada valor posible de la variable u) y las presenta en forma de tabla. Creación de variables La incorporación de nuevas variables al dataset se hace con el comando generate, o su abreviación gen. Por ejemplo, para crear una nueva variable (llamémosla z) que contenga el cuadrado de la variable y, se escribe: gen z = y^2 1 Otro ejemplo es la transformación logarítmica: gen ly = ln(y) donde ly es una nueva variable que contiene los valores del logaritmo natural de la variable y. Regresiones por OLS Para correr una regresión por Mínimos Cuadrados Ordinarios (OLS) se utiliza el comando regress. Por ejemplo, supongamos que se quiere estimar los parámetros del siguiente modelo por OLS: y = β0 + β1 x1 + β2 x2 + β 3 x3 + µ entonces el comando a utilizar en Stata es: regress y x1 x2 x3 donde y es la variable dependiente y x1, x2 y x3 son los regresores. Test de hipótesis sobre coeficientes En general, una prueba de hipótesis sobre cualquier combinación de coeficientes de una regresión puede hacerse con el comando test. El mismo es un comando postregresión; esto significa que para utilizarlo se debe haber ejecutado previamente el comando regress (o similar). Siguiendo con el caso anterior, supongamos la siguiente prueba de hipótesis: H0: β1 = 0 vs H1: β1 ≠ 0 entonces luego de ejecutar el comando regress se escribe lo siguiente: test x1 = 0 donde el resultado será el valor del estadístico de prueba junto con su p-valor. Dado que la prueba anterior es un test de significatividad individual, el resultado coincide con el test t que muestra la salida de regresión de Stata. Sin embargo, cualquier otra combinación de parámetros en la hipótesis nula también puede ponerse a prueba con el comando test, por ejemplo: H0: β1 = β2 = 0 vs H1: β1 ≠ 0 ν β2 ≠ 0 En este caso luego de la regresión debe escribirse: test x1 = x2 = 0 Obviamente, si en la línea de comandos se escribe 2 test x1 = x2 = x3 = 0 el resultado en pantalla coincide con el test conjunto (F) que aparece en la salida de regresión de Stata. 3