Download variables cualitativas
Document related concepts
no text concepts found
Transcript
TODO ECONOMETRIA Variables cualitativas Índice • Definición de las variables dummy (o variables ficticias) • Regresión con variables explicativas dummy Variables dummy • Si queremos estudiar si los hombres ganan más que las mujeres, ¿cómo introducimos en nuestro modelo el sexo del individuo? • Y si queremos comprobar si el nivel de estudios o el estado civil influyen en el salario, ¿cómo introducimos estas variables? • ¿Cómo introducimos la edad de los individuos en un modelo? Variables dummy • Variables NO cuantitativas • Definen algo cualitativo (estado civil, nacionalidad, sexo, área de actividad, ser una empresa multinacional o no, etc.) • Diversos nombres: – Dummy, de Categoría, Dicotómicas, Binarias, Cualitativas, Ficticia • Método – 0 = ausencia de una característica – 1 = presencia de una característica Variables dummy • Sexo: 2 posibilidades = 2 variables – Hombre: 0,1 – Mujer: 0,1 • Nivel de estudios: 4 posibilidades = 4 variables – – – – Sin estudios: 0,1 Primaria: 0,1 Secundaria: 0,1 Universitario: 0,1 Relevancia del uso de variables dummy • Estudiamos pesos y alturas • ¿La relación entre pesos y alturas es igual para hombres que para mujeres? • Si la relación no es igual, podemos cometer errores graves Podríamos creer que X no es significativa • Podríamos estimar la relación inversa Regresión con variables EXPLICATIVAS dummy • Modelos ANOVA (análisis de varianza): – Una sola variable explicativa dummy Yi 1 Di 2 ui Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre E(Yi Di 0) 1 2 E(Y i D i 1) 1 2 (0 ) (1 ) 1 1 2 Regresión con variables EXPLICATIVAS dummy • ¿Cómo explicaríais el valor de los parámetros del modelo? E (Yi Di 0) 1 2 E (Yi Di 1) 1 2 Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre (0) (1) 1 1 2 Regresión con variables EXPLICATIVAS dummy • ¿Cómo verías si el gasto de los hombres difiere del de las mujeres? Yi 1 2 Di ui Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre E(Yi Di 0) 1 2 E(Yi Di 1 ) 1 2 (0) (1) 1 1 2 Regresión con variables EXPLICATIVAS dummy • Datos originales Regresión con variables EXPLICATIVAS dummy • Datos transformados Regresión con variables EXPLICATIVAS dummy • Resultado de la estimación: Yˆi se 3.177 ( 233 ) 503 (330) t (13,63 ) ( 1,53) r 2 0,19 Yi = gasto anual en alimentos D i = 1 si es mujer 0 si es hombre Di Regresión con variables EXPLICATIVAS dummy • ¿Cómo se representaría la recta de regresión? Yˆi se t r2 3.177 ( 233 ) ( 13,63) 0,19 Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre 503 Di ( 330 ) ( 1,53) Regresión con variables EXPLICATIVAS dummy • Modelos ANCOVA (análisis de covarianza): – Una variable explicativa dummy y una variable de control Yi 1 2 Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre Xi = renta después de impuestos Di 3 Xi ui Regresión con variables EXPLICATIVAS dummy • Resultado de la estimación: Yˆi 1.506 229 Di se t p R2 (188 ) (8,01) (0,000 *) ( 107 ) ( 2,14) (0,0611) 0,9284 Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre Xi = renta después de impuestos 0,059 ( 0,0061) ( 9,64 ) ( 0,000 *) Xi Regresión con variables EXPLICATIVAS dummy • Resultado de la estimación: Regresión con variables EXPLICATIVAS dummy • Diferencias en la pendiente y punto de corte Yi 1 2 Di 3 Xi 4 (Di X i ) ui Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre Xi = renta después de impuestos E(Yi Di 0) 1 E(Yi Di 1) (1 Xi 3 2 ) ( 3 ) Xi 4 Regresión con variables EXPLICATIVAS dummy • Diferencias en la pendiente y punto de corte Yi = gasto anual en alimentos Di = 1 si es mujer 0 si es hombre Xi = renta después de impuestos Regresión con variables EXPLICATIVAS dummy • Y si analizamos el nivel de estudios: Yi 1 2 D2i 3 D3i 4 Yi = gasto anual en alimentos D1i = 1 sin estudios D2i = 1 primaria 0 en otro caso 0 en otro caso D3i = 1 secundaria D4i = 1 universitario 0 en otro caso 0 en otro caso Xi = renta después de impuestos E(Yi D1i 0) E(Yi D3i 1) 1 1 5 3 5 Xi ui Aunque haya cuatro dummies, solo tres están incluidas en el modelo. Xi 5 D4i Xi Regresión con variables EXPLICATIVAS dummy • Y si tenemos datos históricos trimestrales y queremos analizar la estacionalidad? Yi 1 D1i 2 D2i 3 D3i 4 D4i 5 Xi donde Yi = demanda de helados y Xi = precio de helados D1i = 1 invierno D2i = 1 primavera 0 en otro caso 0 en otro caso D3i = 1 verano D4i = 1 otoño 0 en otro caso 0 en otro caso Xi = precio de helados Hay cuatro dummies, y todas están incluidas en el modelo. ui Consideraciones • Interpretación de los coeficientes de las variables ficticias cuando la variable dependiente es logaritmo de Y. • Trampa de las variables ficticias Si una variable cualitativa tiene m categorías, solo hay que incluir m-1 variables ficticias. Si no se respecta esta regla, se tendrá una situación de perfecta colinealidad- ya que la suma de estas variables da 1 y reproduce la columna de intersección- y el programa da error (near singular matrix) y no lleva a cabo la estimación. Entonces, para evitar la trampa si incluimos la constante, omitimos una dummy, o incluimos todas las dummies y omitimos la constante. Consideraciones • Regresión lineal por secciones. • Cambio estructural. La H0 del Chow test es la estabilidad del modelo. La prueba de Chow es un estadístico F para comprobar la estabilidad del modelo. Se estima la regresión para todo el periodo (modelo restringido) y se calcula la suma de residuos al cuadrado. Se estima la regresión para el primer y el segundo periodo y se calcula la suma de las sumas de residuos al cuadrado de los dos modelos (modelo no restringido). Si hay en total n=n1+n2 observaciones y k+1 variables explicativas, entonces: F SSRR SSRNR SSRNR n1 n2 2(k 1) k 1 Fk* 1,n1 n2 2 ( k 1)