Download Las variables retardadas como instrumento
Document related concepts
no text concepts found
Transcript
Las variables retardadas como instrumento econométrico para cuantificar en el corto y largo plazo el efecto de una política pública en la economía y para identificar y eliminar la presencia de la autocorrelación en MCO. Genaro Sánchez Barajas es Ph. D. por la Russian Academy of Sciences, profesor en la licenciatura y en la maestría en economía y tutor en los doctorados de Economía y de Ciencias de la Administración de la UNAM. Domicilio: Cubículo 15, Edificio A de la Facultad de Economía, Cd. Universitaria, D.F.Celular: 55 1473 2231; correo: genarosa@unam.mx, celular 55 14732231 Clasificación Jel: C4 - Econometric and Statistical Methods: Special Topics; Palabras clave: políticas públicas, variables autorregresivas, autocorrelación, corto, largo plazo. Resumen: El método de las variables retardadas es muy importante dentro de las políticas públicas económicas y de la econometría empírica porque su aplicación además de corregir la violación que produce la autocorrelación en MCO, proporciona el periodo de tiempo que dura el impacto que suelen tener las políticas públicas por medio de variables específicas en la economía; un ejemplo lo proporciona la inversión en activos fijos, cuyo efecto no termina en el siguiente año en que la planta productiva entra en operación, sino que se prolonga por varios años más. Otro ejemplo es el ingreso de las personas de hace dos años que incide en su ingreso del año pasado y en el de este año; también, la inflación del mes pasado indudablemente incide en la inflación de este mes, etc. Como puede observarse, este método es muy útil para hacer planeación económica porque aporta a las autoridades y/o ejecutivos de las empresas, el periodo que dura el efecto que tiene una política pública o privada sobre las variables que se desean afectar positiva o negativamente. Como se intuye, la aplicación de este método no se hace con datos de corte transversal, es fundamentalmente con datos de series de tiempo de variables económicas ya que su uso se sustenta en la observación que por lo general el impacto de algunas variables exógenas sobre las endógenas no termina en un punto en el tiempo, sino que se prolonga a un periodo mucho más largo. En este contexto es que decimos que los efectos diferidos en el tiempo se incorporan en un modelo econométrico mediante el uso de “variables retardadas o rezagadas” . Por otra parte, en MCO dichos efectos pueden indicar autocorrelación o dependencia entre los términos de error Ui de los años sucesivos de la serie bajo estudio. Al respecto, dichos efectos pueden expresarse de dos maneras diferentes, las cuales son: I.- Por medio de modelos autorregresivos. En este caso si se define a Y como el ingreso incluido en un modelo econométrico como variable endógena, su incidencia progresiva en el tiempo (t) se cuantifica por medio de su uso ahora como variable exógena pero retardada en algún periodo determinado, digamos anualmente, misma que se denota como Yt-1 o Y(-1), donde (-1) se conoce como rezago o retardo de un año; igualmente, en ese sentido digamos Yt-3 o Y(-3) indica que Y ha sido rezagada o retardada tres años, estos valores ahora pueden usarse como variables explicativas de Y en tres años. Así, en general sirven para mostrar el efecto que ejercen en el tiempo (Yt-1 , Yt-2,Yt-3, …..Yt-n ) sobre Y. II. -Por medio de modelos de retardos distribuidos: finitos e infinitos. A diferencia de los modelos autorregresivos, en estos son las variables explicativas X1, X2………Xn las que ejercen impactos o efectos prolongados en el tiempo sobre la variable dependiente o endógena Y. Dicho lo anterior, ahora primero se ilustra el cálculo del efecto que tienen una política pública usando sólo una variable exógena que denominaremos X1 sobre otra endógena que representaremos con Y.( Sánchez et al, 2015). II.1.- Cálculo del efecto de una política pública sobre la economía usando modelos con retardos distribuidos: finitos. . Modelos con retardos distribuidos finitos El cálculo del efecto de la variable independiente o exógena, digamos X1 sobre la dependiente o endógena, Y, se hace mediante el uso de un número determinado de retardos necesarios para cuantificar en el tiempo dicho efecto. El problema de determinar el número de retardos (¿cuántos? ) sabiendo que X1 ejerce un efecto prolongado sobre la variable dependiente Y en el tiempo, se soluciona corriendo el modelo varias veces con X1 retardada y definiendo a M como el número finito de retardos que viene a indicar “el número de periodos en los que se mantiene el efecto” ( Carrascal, et al, 2001:307). Ejemplo usando Eviews, los M retardos se escriben en la caja de diálogo así: X1(-1), X2(2),X3(-3),…..,XM(-M); por eso se le llama también “longitud del retardo”. Luego que se obtienen los resultados de los diferentes modelos que se hayan corrido, se deben de comparar entre sí y enseguida seleccionar aquel modelo cuya R2 ajustado sea mayor y que muestre el menor valor en los criterios de información de AKAIKE y SCHWARZ. Así, corriendo cada modelo con M retardos, con Eviews supóngase que si deseamos conocer el efecto prolongado de X1: INGRESO sobre Y: CONSUMO y si tenemos 12 años de datos para cada una de esas variables, entonces corremos en este caso con un número diferente de retardos el modelo siete veces y sus valores se registran en la siguiente tabla: M: número de T: Número de R2 ajustado Criterio retardos datos AKAIKE SCHWARZ 0 12 0.7391 4.26 4.34 1 11 0.7766 4.03 4.14 2 10 0.8834 3.30 3.40 3 9 0.8937 3.15 3.22 4 8 0.9151 2.91 2.94 5 7 0.8436 3.44 3.42 6 6 0.7469 3.75 3.65 de Criterio de De acuerdo con estos resultados estadísticos, se escoge el modelo que fue corrido con 4 retardos de la variable independiente X1, puesto que es el que presenta el mayor valor para el coeficiente de determinación ajustado como el menor valor de los indicadores de Akaike y Schwarz (Carrascal et al, 2001: 310 ). Interpretación: De acuerdo con estos resultados, el efecto prolongado de X1 sobre Y es de cuatro años. III. Identificación de la presencia o ausencia de autocorrelación con variables retardadas, cuya eliminación sienta las bases para calcular el efecto de la variable independiente en la variable dependiente en el corto y largo plazo. III.1- Modelos autorregresivos usados para detectar autocorrelación con h llamada “ Contraste h de Durbin”, definiendo a Y como consumo, X1: ingreso y inflación, de los últimos 30 meses, cuya base de datos es la siguiente: Observación Y X1 X2 1 3 1 8 2 2 2 15 3 4 2.5 10 4 5 3 9 5 5 4 7 6 7 5 6 7 6 7 8 8 8 8 4 9 9 9 3 10 12 15 1 11 12.2 16 12 12.4 13.5 4 13 12.1 13.6 3.5 14 12.5 14.2 4.6 15 12.9 16.5 2.3 16 13.8 16.2 4.2 17 14.1 18.6 3.9 18 13.1 19.3 5.2 19 13 20 13.2 18.6 3.19 21 13.3 15.6 4.6 22 13.4 19.2 3.9 23 13.5 13.6 4.2 24 14.1 15.6 4.5 1.5 17.2 4.1 X2 como 25 14.2 17.5 3.1 26 14.3 16.2 5.3 27 14.4 14.2 4.2 28 15 16.2 4.3 29 15.2 16.6 3.8 30 15.6 17.5 4 Fuente: Investigación propia Al respecto, Carrascal et al (2001: 294) indica que si usamos los modelos autorregresivos es porque “suponen una violación de una de las hipótesis establecidas en el modelo de regresión lineal clásico. Concretamente, la hipótesis de que los regresores no son aleatorios, ya que la variable endógena retardada depende de la perturbación aleatoria y, por tanto, tiene un carácter estocástico”. Es por eso que cuando hay regresores estocásticos: Y (-1) que la estadística d de Durbin Watson ya no es apropiada para identificar la autocorrelación que pueda existir entre la variable endógena Y (-1) retardada y la perturbación aleatoria (Ui). César Pérez (2007: 129) es más parco, no dice por qué usar h, simplemente informa que “ El estadístico de Durbin Watson no debe utilizarse para modelos que introducen retardos en la variable dependiente ni para modelos sin término constante.” Por consiguiente, continuando con Carrascal et al ( 2001:294), es importante mencionar que con este método las estimaciones están en función del tipo de dependencia en el tiempo que se detecte entre la variable estocástica Y(-1) y las Ui´s, es decir, depende del tiempo que dure su efecto sobre Y. Cuando es parcial ( en tiempo pasado pero no en el presente y menos en el futuro) se dice que los estimadores sólo dependen de las perturbaciones en periodos de tiempo pasados, de manera que mantienen su propiedad de consistencia pero pierden la de insesgabilidad, por lo que pero aun así pueden seguirse usando. Sin embargo, cuando la dependencia es total (siempre) los regresores estocásticos dependen de las perturbaciones en todos los periodos (ídem), tal que en este caso pierden las dos propiedades antes mencionadas y se busca un método de estimación alterno para que el estimador cuando menos contenga la propiedad de consistencia, el cual puede ser el de variables instrumentales, ya que con éste se garantiza la propiedad asintótica de consistencia en las estimaciones con mínimos cuadrados ordinarios (MCO). En consecuencia, se infiere que cuando no hay dependencia (incorrelación ) de Y(-1) de las Ui´s los estimadores conservan las dos propiedades. En este sentido se indica que cuando no hay correlación entre ellas se dice que existe independencia, en tanto que cuando se detecta que existe, se dice que existe una dependencia total. Uso del Contraste h de Durbin Así como se hizo con la d de Durbin Watson, el contraste h de Durbin establece las mismas hipótesis: Ho: ρ=0, no hay correlación de Y(-1) con las Ui´s Ha: ρ≥0 ó ρ≤0 , decimos que hay correlación positiva o negativa entre ellas. Nota: Eviews no contiene solo el símbolo “mayor que” ni “menor que”, por eso tuve que usar el que nos proporciona, es decir, el de “mayor o igual que” y el de “menor o igual que”. La fórmula para calcular manualmente es h= *la raíz cuadrada del cociente de T/1-TS2 βk+1 con N(0,1). Así, . se establece que h se distribuye normalmente con media aritmética cero y varianza 1; donde ρ es el estimador obtenido en la regresión que se corre de las Ui frente así mismas retardadas un periodo y sin término constante; TS2 βk+1 es el valor de la varianza del estimador correspondiente a la variable endógena retardada un periodo Y(-1) y finalmente T: es el número de términos ( Carrascal et al, 2001: 296). Aquí es importante observar que el signo de la estadística h en la Ha es igual al de ρ. Ejemplo: con α=5% trabajada en una prueba de una cola o extremo, cuando h es mayor que Zα= + 1.645 se rechaza Ho de incorrelación y se acepta Ha de que existe autocorrelación positiva entre Y(1) y las Ui´s; también cuando h es menor que Zα = - 1.645 se rechaza Ho frente a la aceptación de Ha de que se ha detectado autocorrelación negariva. Así, para detectar con Eviews si hay autocorrelación los pasos a seguir son los siguientes: 1. Crear la ecuación: Quick/Estimate Ecuation/ Y_C_X1_Y(-1) / ok. Cuyos resultados son los siguientes: Dependent Variable: Y Method: Least Squares Date: 10/28/08 Time: 12:25 Sample(adjusted): 2 30 Included observations: 29 after adjusting endpoints Variable Coefficien Std. Error t-Statistic Prob. t C 1.424546 0.460451 3.093805 0.0047 X1 0.161815 0.088443 1.829606 0.0788 Y(-1) 0.715366 0.119971 5.962817 0.0000 R-squared 0.956057 Mean dependent var 11.38966 Adjusted R-squared 0.952677 S.D. dependent var S.E. of regression 0.830570 Akaike info criterion 2.564289 Sum squared resid 17.93603 Schwarz criterion 2.705734 Log likelihood -34.18219 F-statistic 282.8386 Prob(F-statistic) 0.000000 Durbin-Watson stat 2.148425 3.818035 Observe que estos resultados son para 29 datos porque hay un retardo o rezago, por eso leemos en “Sample (adjusted): 2 30” y en “included observatios: 29 after adjusting endpoints”. 2. Crear la variable de los residuos (Ui) mediante: Procs/make residual series/ y en la ventana que se abre aceptamos “Residual Type”: o “Ordinary” / ok y aparecen las Ui con el nombre de “Resid01”. 3. Realizar la ecuación de las Ui creadas con respecto a ellas mismas rezagadas un periodo: Quick/Estimate Ecuation/ resid01 resid01(-1)/ ok y aparece el siguiente Cuadro: Dependent Variable: RESID01 Method: Least Squares Date: 10/28/08 Time: 12:33 Sample(adjusted): 3 30 Included observations: 28 after adjusting endpoints Variable Coefficien Std. Error t-Statistic Prob. t RESID01(-1) -0.182654 0.169592 R-squared 0.032551 -1.077024 0.2910 Mean dependent var 0.067653 Adjusted R-squared 0.032551 S.D. dependent var 0.725708 S.E. of regression 0.713799 Akaike info criterion 2.198629 Sum squared resid 13.75673 Schwarz criterion 2.246208 Log likelihood -29.78081 Durbin-Watson stat 1.781797 En este caso el dato importante, y por tanto el que vamos a rescatar, es el valor del coeficiente de la variable retardada “Resid01(-1)” que identificamos con la letra “ρ” (rho) y que en Eviews representamos con “r” que es igual a: -0.182654, mismo que en EViews se guarda como objeto escalar de la siguiente forma: vamos al menú de comandos de la ventana principal y ahí escribimos: scalar_r=@coefs(1)/enter y primero aparece como un objeto más en el Workfile mismo que si le damos doble click su valor aparecerá en la parte inferior izquierda de la pantalla como se muestra a continuación: 4. Se calcula la “h de Durbin” escribiendo en la ventana de comandos lo siguiente: Scalar_h=r*@sqrt(@regobs/(1-@regobs*(@stderrs(3))^2)) Nota: Para calcular “h” necesitamos que esté activada la ecuación original, aquella en donde está incluida la variable endógena retardada como exógena, esto se logra dando un click sobre ella. Donde: r = Coeficiente de las Ui rezagadas un periodo. Regobs = Número de observaciones, en este caso 30. Stderrs(3) = Es la desviación estándar del estimador correspondiente a la variable endógena retardada Y(-1). El número 3 del stderrs corresponde a la posición de este coeficiente en la ventana de la ecuación de regresión en Eviews, por lo que puede variar según su posición o lugar que ocupe en dicha ventana: en nuestro caso ello sucedió cuando creamos en el paso 1 la ecuación de regresión en que establecimos Y(-1) en tercer lugar, por ello su stderrs ahora lleva el número 3. ; al respecto, dicha posición o lugar la establece subjetivamente la persona que está calculando h . En este contexto el 2 que le sigue en la ecuación anterior de arriba para h, significa que stderrs fue elevado al cuadrado, i.e., indica que es la varianza de Y(-1). Cabe señalar que para elevar al cuadrado en Eviews hacemos: apretamos la tecla Alt simultáneamente con las teclas 9 y 4, enseguida se sueltan las tres y aparece en pantalla “^2”. Así, en el ángulo inferior izquierdo aparece la leyenda “h successfully created”, para poder ver su valor damos doble click en el objeto escalar del Workfile que denominamos “h”. Interpretación de “h de Durbin”: Su valor de -1.28867631565 se compara con los valores que toma Zα en una distribución normal que tenga media cero y varianza unitaria, cuando α= 5% en una prueba de una cola o extremo, tal que en ese punto Zα = ±1.645, valores que contrastamos con h = - 1.288676, de manera que rechazamos Ho de ausencia de autocorrelación si el valor de h es mayor que los valores de la distribución en Zα = ±1.645 al 95% de confianza. Así, como h está en la zona de aceptación, aceptamos Ho y decimos que no hay autocorrelación entre Y(-1) y los residuos Ui. Atención: Si hubiéramos rechazado Ho, es decir aceptado Ha, estaríamos frente a un problema de autocorrelación, mismo que deberíamos de resolver llevando a cabo la estimación incorporando un esquema AR(1) y partiendo de la estimación por variables instrumentales para ver si es total la dependencia de Y(-1) de las Ui´s. Con esta metodología obtendriamos estimadores consistentes de todos los parámetros incluido el del esquema AR(1). Así, suponiendo que hubiera autocorrelación entre Y(-1) y Ui´s, ilustremos cómo se eliminaría con el siguiente ejemplo: III.2.- Eliminación de la autocorrelación con el método de variables instrumentales. En este caso debe cuidarse que el número de variables instrumentales debe ser menor o igual que el número de regresores en el modelo econométrico ( el programa Eviews incluye por default una variables con valor de 1 cuando no se haya incluido C entre las mismas), por eso utilizamos X1 y X1(-1). 1. Creamos la ecuación con los instrumentos X1 y X1(-1) de la siguiente manera: Quick/Estimate Equation/ y en la especificación del modelo escribimos: Y_X1_Y(-1)_C /, abajo en el método seleccionamos: TSLS-Two stage Least Squares (TSNLS and ARMA), luego en “Instrument List” escribimos: X1_X1(-1)/ok y aparece la siguiente ecuación: Dependent Variable: Y Method: Two-Stage Least Squares Date: 10/28/08 Time: 13:14 Sample(adjusted): 2 30 Included observations: 29 after adjusting endpoints Instrument list: X1 X1(-1) Variable Coefficien Std. Error t-Statistic Prob. t X1 0.209346 0.136012 1.539176 0.1358 Y(-1) 0.647204 0.190603 3.395554 0.0022 C 1.546159 0.532832 2.901779 0.0075 R-squared 0.955512 Mean dependent var 11.38966 Adjusted R-squared 0.952089 S.D. dependent var 3.818035 S.E. of regression 0.835710 Sum squared resid 18.15871 F-statistic 267.5755 Durbin-Watson stat 2.044055 Prob(F-statistic) 0.000000 El método arriba sombreado se traduce al español como “mínimos cuadrados en dos etapas” , por ejecutar el caso especial de lo que estamos llamando “ variables instrumentales”; al hacerlo, obtiene los instrumentos porque obtiene en una primera etapa las regresiones por MCO de cada uno de los regresores de la ecuación lineal: X 1 e X1(-1) y luego, en una segunda etapa, señala Carrascal et al (2001:300) “efectúa la estimación por mínimos cuadrados ordinarios de la variable endógena original (Y) utilizando como variables explicativas los valores estimados de cada una de las regresiones de la primera etapa. Se demuestra que estas dos etapas son equivalentes a la obtención de los estimadores por variables instrumentales cuando se utilizan como instrumentos los valores estimados de las regresiones de la primera etapa”. Al respecto, en el Cuadro anterior se muestra sombreados el método y las variables instrumentales utilizadas para hacer la regresión lineal. Aquí conviene precisar y aclarar que las estadísticas se calcularon con las Ui´s provenientes de las variables instrumentales y de las variables originales del modelo econométrico y, por consiguiente, no con las variables obtenidas en la segunda etapa del algoritmo de cálculo. Sánchez, et al (2015). De esa manera se elimina la autocorrelación, lo cual se corrobora enseguida con los dos procedimientos que se describen a continuación en los siguientes incisos a) y b): a).- Utilizando el correlograma, la estadística Q y la prueba Breusch – Godfrey para corroborar lo anterior. Para la primera: View/Residual Test/ Correlogram Q-satats y aparece: Interpretación: Grafica y numéricamente vemos que los coeficientes de correlación no se salen de las bandas de confianza y que en AC como en PAC los valores de son bajos, que indica que no existe un problema serio de autocorrelación; igualmente vemos que la probabilidad de Q en todos los casos es mayor que 0.05 o 5% lo cual indica que no hay autocorrelación serial entre Y(-1) y las Ui. b).- Con la prueba de Breusch-Godfrey: View/Residual Tests/Serial Correlation LM Test/ok y aparece: Breusch-Godfrey Serial Correlation LM Test: Obs*R-squared 0.611607 Test Equation: Dependent Variable: RESID Probability 0.434183 Method: Two-Stage Least Squares Date: 10/28/08 Time: 13:27 Presample missing value lagged residuals set to zero. Variable Coefficien Std. Error t-Statistic Prob. 0.7608 t X1 0.046525 0.151170 0.307767 Y(-1) -0.062056 0.210086 -0.295386 0.7701 C 0.064875 0.544842 0.119071 RESID(-1) -0.161584 0.220172 -0.733898 0.4698 R-squared 0.021090 0.9062 Mean dependent var -2.68E17 Adjusted R-squared -0.096379 S.D. dependent var S.E. of regression 0.843226 Akaike info criterion 2.624278 Sum squared resid 17.77574 Schwarz criterion 2.812871 Log likelihood -34.05203 F-statistic 0.179536 Prob(F-statistic) 0.909269 Durbin-Watson stat 1.709575 0.805311 Interpretación: Observamos que p- valores: probabilidad para la Chi cuadrada “Obs*Rsquared” es 0.434183 que es mayor que α = 5% e indica que no hay autocorrelación . Iguamente, la conclusión anterior también se alcanza al analizar la p-probabilidad del Coeficiente AR(1): RESID(-1) estimado que no es significativo porque su p: probabilidad de 0.4698 ≥ α=5%, lo que confirma la estructura AR(1) para los residuos, de manera que podemos decir que los errores muestran un esquema autorregresivo de orden 1 dada que la no significación estadística de RESID(-1) es 0.4698. Similarmente, dado que R2 =0.021090 es un valor muy bajo, cercano a cero, ello también indica que hay incorrelación. IV.-Cálculo del efecto en el corto y largo plazo Por otra parte, con base en lo anterior, hablando del efecto en el tiempo de la variable independiente sobre la dependiente, decimos que el modelo arriba estimado con el método de mínimos cuadrados en dos etapas, proporciona los elementos para señalar con los coeficientes de X1 y de Y(-1) lo siguiente: 1.- Que el Ingreso(X1) tiene un efecto a corto plazo sobre el consumo de 0.209346 y 2.- Que en el largo plazo es de 0.59339= 0.209346/1-0.647204=0.59339. Lo anterior se interpreta así: Cuando el ingreso aumenta en una unidad en el periodo, el consumo crece en 0.209346 en el corto plazo. Esa unidad adicional en el ingreso produce efectos sobre el consumo de los siguientes periodos, tal que en el largo plazo su incidencia será de 0.59339 unidades. La cuantificación del efecto a largo plazo tuvo como referencia la consideración de que los modelos autorregresivos se pueden ver como modelos con “ infinitos retardos de la variable explicativa.”, que, como se observa en el modelo, su cálculo de 0.59339 provino de “ la suma de los infinitos retardos que pueden calcularse como la suma de los infinitos términos de una progresión geométrica de razón 0.647204 y primer elemento 0.209346” ( Carrascal et al, 2001: 305 y 318). Conclusiones 1.- Por medio del modelo de retardos distribuidos: finitos vimos que el efecto prolongado de X1 sobre Y es de cuatro años. 2.- Por medio del modelo de retardos distribuidos infinitos vimos que el Ingreso(X1) tiene un efecto a corto plazo sobre el consumo de 0.209346 y que en el largo plazo es de 0.59339= 0.209346/1-0.647204=0.59339. 3.- Con el método de mínimos cuadrados en dos etapas y usando variables instrumentales se corrigió la autocorrelación. BIBLIOGRAFIA 1.- Carrascal, Urcilino, González . Yolanda y Rodríguez, Beatriz, (2001), Análisis Econométrico con Eviews, Alfaomega,Ra-Ma, Madrid, España. 2.-Pérez, López, César, ( 2007), Econometría Básica, Técnicas y Herramientas, Pearson, Prentice Hall, Madrid, España. 3.- Sánchez, Barajas, Genaro, Bustamante, Lemus, Carlos, (2015), Econometría Básica, con NTIC y Eviews, Facultad de Economía, UNAM, México, Distrito Federal.