Download Econometria de Datos en Paneles
Document related concepts
no text concepts found
Transcript
¿Porque paneles? Modelos lineales para datos en paneles Econometria de Datos en Paneles Walter Sosa-Escudero Universidad de San Andres Agosto de 2011 Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles ¿Porque paneles? Ejemplo (Cronwell y Trumbull): Determinantes del crimen y = g(I), y = crimen, I = variables de justicia criminal. Corte transversal: (yi , Ii ) para varias regiones i = 1, . . . , n I resulta ‘muy importante’ Critica: I capta el efecto de otros efectos regionales, que tambien son determinantes del crimen. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles En terminos econometricos Existe una variable omitida y relacionada positivamente con I. El estimador de MCO que regresa y en I es sesgado (hacia arriba) Solucion? ‘Controlar’ por esta varaible omitida. Paneles al rescate: una solucion simple sin tener que incorporar nuevas variables Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Datos en paneles Una base de datos en panel contiene informacion para varios individuos (empresas, paises, etc.) en el tiempo. El aspecto fundamental es esta bidimensionalidad de los datos. Ejemplos: PSID: 6500 familias desde 1968. La EPH tiene una estructura de panel rotativo. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Ventajas Control de ‘heterogeneidades no observables’ Con N individuos y T periodos podriamos estimar N modelos de series de tiempo y T modelos de corte transversal. Las ventajas de disponer de un panel tienen que ver con la posibilidad de agregar esta informacin de alguna manera. Ejemplo: yit = x0it β + uit Supone que el modelo lineal subyacente es el mismo para todos los individuos y periodos. Mayor informacion sobre un mismo parametro. Mayor eficiencia. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Desventajas No siempre es posible agregar informacion temporal y de corte transversal (pueden ser ms observaciones pero de poblaciones heterogeneas). Los paneles son costosos de implementar y administrar. Problemas de selectividad: auto-seleccion, no respuesta, ”attrition”. Dimension temporal corta Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles El Modelo El modelo basico es: yit = x0it β + uit uit = µi + δt + it i = 1, . . . , N, t = 1, . . . , T . xit es un vector de K variables explicativas, incluyendo una constante. El termino de error incluye tres componentes, que representan las tres posibles fuentes de variabilidad no observable. Supondremos δt = 0 y que it satisface todos los supuestos clasicos. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Caso mas simple: µi = 0 En este caso, uit = it satisface todos los supuestos del teorema de Gauss-Markov: E(it ) = 0 2 σ si i = h y t = s E(it ehs ) = 0 si i 6= h o t 6= s El estimador de MCO es MELI. La estructura de panel no agrega informacion Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles En terminos matriciales Y = Xβ + u YN T ×1 , XN T +×K , apilando las observaciones por individuo, primero ordenadas temporalmente. Entonces: β̂M CO = (X 0 X)−1 X 0 Y Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles El estimador de efectos fijos yit = x0it β + µi + it Las realizaciones de µi pueden ser estimadas con un panel (no con un corte transversal!). Puede ser visto un modelo lineal en donde cada individuo tiene su propia ordenada al origen: yit = µi + β1 +β2 x2,it + · · · + βK xK,it + it | {z } El modelo se puede estimar usando N − 1 variables binarias por individuo, para evitar la ‘trampa de variables binarias’. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles En terminos matriciales Y = Xβ + Dµ + u Y es N T × 1, X es N T × K, X incluye el intercepto. D es una matriz de N − 1 variables binarias por individuo. 1N ≡ 1 1 .. . 1 , 1N 0 ··· Z= 0 .. . 1N 0 .. . 0 0 ··· Walter Sosa-Escudero 0 .. . .. . 1N N T ×(N −1)T Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Reescribamos el modelo como: Y = Xβ + Dµ + u = Ẋδ + u con Ẋ ≡ [X D] y δ ≡ [β 0 µ0 ]0 . Entonces, el estimador de efectos fijos es: β̂EF δ̂EF = = (Ẋ 0 Ẋ)−1 Ẋ 0 Y µ̂EF que no es otra cosa que un estimador de MCO agregando N − 1 variables binarias por individuo. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Efectos fijos y transformacion ‘within’ Comencemos con el modelo yit = x0it β + µi + it Tomando promedios por individuo: ȳi = x̄0i β + µi + ¯i Restando yit − ȳi = (xit − xi )0 β + it − ¯i o ∗ yit = xit ∗0 β + ∗it con m∗it ≡ mit − m̄i , m = y, x, . Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Resultado: β̂EF = (X ∗0 X ∗ )−1 X ∗0 Y ∗ (Prueba: Teorema de Frisch,Waugh, Lovell) Existen dos formas identicas de computar β̂EF . Regresar Y en X y las variables binarias por individuo. β̂EF son los coeficientes estimados para X. En dos pasos: 1) Expresar las variables en desvios con respecto a la media por individuo. 2) MCO en base a estos desvios. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Terminologia: Modelo within yit − ȳi = (xit − xi )0 β + it − ¯i Modelo between ȳi = x̄0i β + µi + ¯i Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Propiedades de β̂EF Es insesgado (X y Dµ son exogenas con respecto a ). Es consistente, cuando N o T → ∞. Importante: la insesgadez y consistencia de β̂EF no presupone que X y Dµ son ortogonales (puede haber correlacion entre X y Dµ Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Efectos fijos y control de heterogeneidades no observables Supongamos que el modelo es yit = x0it β + zi0 δ + µi + it zi no es observable, pero esta correlacionada con xit . La transformacion within de este modelo es ∗ yit = xit ∗0 β + ∗it La tranformacion within elimina cualquier variable que no varia en el tiempo (zi y µi ): estimar por efectos fijos permite ‘controlar’ por la presencia de zi . Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Es relevante notar que sin datos de panel, no podriamos haber dado cuenta de zi (que no sea incluyendola en el nodelo. Con datos de corte transversal el modelo es yi = x0i β + zi0 δ + µi + i , de modoe que omitir zi conduce a sesgos. Observar que la tranformacion within es inaplicable (trivialmente cero). Este es el sentido en el cual la disponibilidad de paneles permite controlar por variables omitidas que no varian en el tiempo. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Una exploracion grafica Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Verbalizacion Y = tasa de criminalidad X = ineficiencia del sistema judicial (mas ineficiente, mas criminalidad). Dos regiones Determinante omitido del crimen, a que varia solo por region y correlacionado (positivamete) con la ineficiencia judicial: densidad poblacional. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles El estimador de efectos aleatorios El modelo es el mismo yit = x0it β + µi + it En terminos matriciales Y = Xβ + Dµ + Si Dµ es ortogonal a X, y si E(µi |X) = 0, entonces, el estimador de MCO que regresa Y en X es insesgado. Es decir, si Dµ es ortogonal a X, la omision de las variables binarias no sesga al estimador de MCO. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Efectos fijos vs aleatorios Discusion muy extraña. Es mas una cuestion de tratamiento Y = Xβ + Dµ + Efectos fijos (controla por Dµ) Y = Xβ + Dµ + Efectos aleatorios (trata a Dµ como variable omitida) Y = Xβ + Dµ + Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Y = Xβ + Dµ + Y = Xβ + u, u ≡ Dµ + Problema: u no satisface los supuestos clasicos, aun cuando Dµ y por separado lo hagan. Prueba simple: supuestos clasicos por separado (esperanza nula, no correlacion ni heterocedasticidad), ademas, no correlacion entre Dµ y . Entonces V (u) = V (Dµ + ) = DV (µ)D0 + V () = σµ2 + σ2 IN T que no es un escalar por la matriz identidad (los elementos fuera de la diagonal no son cero). Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Intuicion: uit = µi + it Trivialmente, uit esta correlacionado con ui,t−1 ya que ambos ‘comparten’ µi : la presencia permanente de µi hace que la especificacion de efectos aleatorios induzca autocorrelacion. Si bien MCO es insesgado, no es eficiente, por la presencia de autocorrelacion. Eficiente? Minimos cuadrados generalizados. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles MCG para efectos aleatorios Consideremos un modelo lineal basico: Y = X 0β + u en donde valen todos los supuestos clasicos, salvo que: V (u) = Ω Ω es una matriz simetrica y positiva definida (permite, potencialmente, autocorrelacion y heterocedasticidad). Teorema (Aitken): el MELI de β es: β̂M CG = (X 0 Ω−1 X)−1 X 0 Ω−1 Y Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles En nuestro caso V (u) = σµ2 DD0 + σ2 IN T ≡ Ω(θ) con θ0 = (σµ2 , σ2 )0 La implementacion de MCG requiere primero estimar θ (los componentes de varianzas). Estimador de efectos aleatorios: estimador MCG. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Resumen Y = Xβ + Dµ + X ⊥ Dµ: MCO, EF, EA y between son todos consistentes parar β. EA es eficiente. X ¬⊥ Dµ: solo EF es consistente para β. La practica gravita mayoritariamente a EF. Walter Sosa-Escudero Econometria de Datos en Paneles ¿Porque paneles? Modelos lineales para datos en paneles Test de Hausman H0 : X ⊥ Dµ, HA : X ¬⊥ Dµ Test de Hausman: bajo H0 H = (β̂EA − β̂EF )0 (ΩEF − ΩEA )−1 (β̂EA − β̂EF ) ∼ χ2 (K) Rechazar si H es significativamente distinto de cero. Intuicion: bajo H0 , β̂EA y β̂EF son consistentes, H deberia ser pequeño. Bajo HA , solo β̂EF es consistente, H deberia ser alto. Permitiria, bajo H0 , explotar las ganancias de eficiencia de estimar por EA. Walter Sosa-Escudero Econometria de Datos en Paneles