Download Pronóstico del Consumo Privado: Usando datos de alta
Document related concepts
no text concepts found
Transcript
ARCHIVOS DE ECONOMÍA Pronóstico del Consumo Privado: Usando datos de alta frecuencia para el pronóstico de variables de baja frecuencia Gustavo Adolfo HERNANDEZ DIAZ Margarita MARÍN JARAMILLO Documento 446 Dirección de Estudios Económicos 13 de Julio de 2016 La serie ARCHIVOS DE ECONOMÍA es un medio de divulgación de la Dirección de Estudios Económicos, no es un órgano oficial del Departamento Nacional de Planeación. Sus documentos son de carácter provisional, de responsabilidad exclusiva de sus autores y sus contenidos no comprometen a la institución. Consultar otros Archivos de economía en: https://www.dnp.gov.co/estudios-y-publicaciones/estudios-economicos/Paginas/archivos-de-economia.aspx http://www.dotec-colombia.org/index.php/series/118-departamento-nacional-de-planeacion/archivos-de-economia Pronóstico del Consumo Privado: Usando datos de alta frecuencia para el pronóstico de variables de baja frecuencia Gustavo Adolfo HERNANDEZ DIAZ ghernandez@dnp.gov.co Margarita MARÍN JARAMILLO* mmarin@dnp.gov.co Resumen Uno de los componentes más importantes del PIB es el consumo de los hogares, por lo cual el pronóstico de esta variable es clave para poder evaluar y predecir el comportamiento de la actividad económica. En este trabajo se introducen dos elementos innovadores para su predicción, primero se incorpora dentro de la función de consumo el índice de confianza al consumidor, con el fin de involucrar un indicador líder del comportamiento de los consumidores y el segundo es el uso de metodologías econométricas en las que se incorporan series de alta frecuencia para el pronóstico de series de baja frecuencia, con el fin de no perder información que pueda ser valiosa. Se encuentra que el pronóstico dentro de la muestra ha sido bastante cercano a los datos reales, aunque los intervalos de confianza del pronóstico pueden ser amplios. Palabras clave: Consumo Privado, Pronósticos, Modelos Bridge, MIxed DAta Sample (MIDAS) Keywords: Private Consumption, Forecasting, Bridge Models, MIxed DAta Sample (MIDAS) Clasificación JEL: C38, C67, E01 y B51 . * Los autores son, respectivamente: Subdirector de Estudios Sectoriales y Regulación y asesor de la Dirección de Estudios Económicos del DNP. Los autores agradecen los comentarios de Jesús OTERO, Gabriel PIRAQUIVE, Néstor GONZÁLEZ y Jurany RAMIREZ del DNP. Los comentarios y errores son responsabilidad del autor y no comprometen a la institución en que trabaja. 1 Introducción Desde el punto de vista de la demanda, el consumo total representa cerca del 83% del PIB y el de los hogares constituye alrededor del 65%. Para tener información oportuna acerca de esta variable es importante poder evaluar y predecir el comportamiento de la actividad económica. Adicionalmente, los datos acerca del consumo privado se encuentran de manera trimestral y con un rezago de poco más de un trimestre para su publicación, luego para la predicción de esta variable se necesitan de variables que tengan al menos su misma periodicidad (trimestral) y una rápida consecución. Un indicador líder para la variable de consumo, muy utilizada en la literatura, son los índices de confianza al consumidor, aunque recientemente se ha utilizado un indicador de consumo construido a partir de las “tendencias de Google” para diferentes categorías de consumo (Schmidt y Vosen, 2011)1. Los índices de confianza son una importante fuente de información acerca del comportamiento de las variables agregadas2, ya que se puede extraer información que sirve tanto para el análisis de coyuntura de la economía, así como para la predicción de corto plazo de distintas variables macro. Ahora bien, estos son construidos por medio de encuestas de opinión, las cuales tienen información de tipo cualitativo que generalmente se basan en tres categorías de respuesta: aumento de la variable, disminución de la variable o estabilidad de la variable; sin embargo, esto no quiere decir que las encuestas tengan solo este tipo de respuestas; puede haber más grupos de ellas dentro de la pregunta que se realiza. Hay que tener en cuenta que las dos series tienen periodicidad distinta, esto es, el consumo privado es de periodicidad trimestral (baja frecuencia) mientras que el índice de confianza al consumidor es de periodicidad mensual (alta frecuencia), por lo que usualmente se realiza una transformación para que el indicador de alta frecuencia quede con la periodicidad de la variable de baja frecuencia. Dado que al realizar este tipo de transformaciones se puede perder información importante en el momento de realizar el pronóstico de las variables, entonces se recurre a realizar el pronóstico mediante dos diferentes estrategias: la primera, utilizando un modelo bridge que pronostica los valores faltantes de la serie de alta frecuencia y luego los agrega mediante una transformación en observaciones de baja frecuencia, y, segundo, los modelos MIDAS (MIxed DAta Sample), que coloca los predictores de alta frecuencia en la regresión de las observaciones de baja frecuencia. Este trabajo tiene dos propósitos. El primero realizar un pronóstico del consumo privado que involucra el índice de confianza al consumidor, ya que hasta ahora no existe evidencia empírica de alguna relación entre estas dos variables para 1 En esta misma línea el Ministerio de Hacienda y Crédito Público, utilizando la metodología desarrollados por Mejia, et. al. (2013), construye los Indicadores Sectoriales Adelantados de Actividad (ISAAC) a partir de las tendencias de Google, que permiten anticipar las tendencias del PIB de las nueve grandes ramas de actividad nacional en el corto plazo. 2 En Colombia son utilizadas por el Banco de la República para la construcción de las expectativas de la inflación para sus modelos de pronóstico. 2 Colombia3, y, segundo, utilizar datos de alta frecuencia para realizar el pronóstico de una variable de baja frecuencia, lo cual tampoco se ha realizado en el país. El documento se organiza como sigue: En la segunda parte se explican las variables que se utilizarán como insumo del pronóstico, haciendo énfasis en el índice de confianza al consumidor, para luego explicar la metodología econométrica utilizada en la estimación. En la cuarta parte de se presentan los principales resultados y finalmente se señalan algunas conclusiones. Datos para la estimación Índices de confianza Como lo mencionan Julio y Grajales (2011) los índices de confianza tienen varias ventajas y desventajas. Dentro de las ventajas se puede destacar la “oportunidad” de la variable, esto es, una variable de periodicidad mensual y de un procesamiento rápido, que provee información acerca del comportamiento del consumo. Adicionalmente, se argumenta que estos índices presentan una mayor robustez, en el sentido que las respuestas de los encuestados no son afectadas por fenómenos idiosincráticos de algunas firmas o sectores. Por ejemplo, recientemente el fenómeno de la devaluación que se ha presentado desde comienzos del 2015, que afecta más a los sectores con ingresos o gastos en sectores altamente expuestos al sector externo, que los sectores que basan sus ingresos y gastos domésticamente. En cuanto a las desventajas que mencionan los autores cabe destacar que al ser medidas de tipo cualitativo los encuestados pueden responder más con sus deseos que con la situación que están pasando. Adicionalmente, el diseño de respuestas de la encuesta puede sesgar las respuestas, por ejemplo, los encuestados pueden confundir la respuesta “no cambió” con “no sé”. Finalmente, una de sus grandes ventajas, es el de utilizar muestras muy pequeñas que facilitan su procesamiento, lo cual también es a la vez una desventaja, debido a que las inferencias que puedan ser derivada de estas llegan a ser imprecisas. La construcción de los índices de confianza de los consumidores en Colombia proviene de la Encuesta de Opinión del Consumidor (EOC) realizada por Fedesarrollo, que se basa en la realizada por la Universidad de Michigan y el Conference Board. Inicialmente esta encuesta era ejecutada vía telefónica a un total de 600 hogares y cubría las cuatro principales ciudades del país: Bogotá (50%), Medellín (20%), Cali (20%) y Barranquilla (10%). Adicionalmente se distribuía en tres estratos socioeconómicos: alto (6%), medio (20%) y bajo (74%) y en rangos de edades entre los 25 a 44 años (considerado productivo tanto en consumo como en ahorro), lo que equivalía a un 53 % del total de la muestra. 3 La evidencia empírica para otros países no es conclusiva, esto es, trabajos como el de Carroll, et. al. (1994), Bram y Ludvigson (1998), presentan una correlación positiva en Estados Unidos, al tiempo que Acemoglu y Scott (1994), lo hacen para el Reino Unido 3 Sin embargo, a partir de enero de 2015, la EOC incluyo a la ciudad de Bucaramanga y aumento en número de hogares encuestados a 700, por lo cual las proporciones han cambiado. Ahora cubre cinco ciudades Bogotá (43%), Medellín (17%), Cali (17%), Barranquilla (14%) y Bucaramanga (9%), distribuida nuevamente en tres estratos socioeconómicos: alto (18%), medio (31%) y bajo (51%); y el rango de edades entre los 25 a 44 años equivale a un 56,6 % del total de la muestra. La EOC consta de 15 preguntas (Cuadro 1) que miden diferentes percepciones y expectativas de los hogares encuestados: cómo los consumidores perciben la economía en general, cuáles son sus expectativas sobre las condiciones económicas en los próximos 12 meses, cómo ven la situación financiera de su hogar, las condiciones de compra de bienes durables (casa, carro, entre otros), la capacidad de ahorro de la familia y las perspectivas de cambio de las principales variables macroeconómicas (desempleo, precios, tasas de interés, entre otros) Cuadro 1. Preguntas de las Encuestas de Opinión del Consumidor Acrónimo Descripción Pregunta P01 Percepción del hogar ¿Cree usted que a su hogar le está yendo económicamente mejor o peor que hace un año? P02 Expectativas del hogar ¿Piensa usted que dentro de un año a su hogar le estará yendo económicamente mejor, peor o lo mismo que ahora? P03 Expectativas del país ¿Piensa usted que durante los próximos doce meses vamos a tener buenos o malos tiempos económicamente? P04 Percepción del país ¿Diría usted que las condiciones económicas del país son mejores o peores que hace un año? P05 Perspectiva país dentro de un año ¿Cree usted que las condiciones económicas del país estarán mejores o peores dentro de un año que hoy en día? P06 Desempleo ¿Cree usted que durante los próximos doce meses va a haber más desempleo que hoy en día? P07 Tasas de interés ¿Cree usted que durante los próximos doce meses los intereses de los préstamos subirán o bajarán? P08 Precios ¿Cree usted que durante los próximos doce meses los precios de las cosas subirán o bajarán? P09 Inflación Porcentualmente, ¿cuánto cree usted que van a (subir/bajar) los precios de las cosas en general durante los próximos 12 meses? P10 Compra de vivienda ¿Cree usted que este es un buen momento para comprar vivienda? P11 Comprar bienes durables ¿Cree usted que este es un buen momento para comprar cosas grandes como muebles o electrodomésticos? P12 Compra de carro ¿Cree usted que este es un buen momento para comprar carro? P13 Ahorro ¿Diría usted que en la actualidad le está alcanzando para ahorrar? P14 Préstamo con entidades financieras ¿Alguien en este hogar ha solicitado un préstamo en alguna entidad financiera? Préstamo con amigos o ¿Alguien en este hogar ha solicitado un préstamo a algún conocidos familiar, amigo o conocido? Fuente: Adaptado de Julio y Grajales (2011) P15 4 Antes de proseguir, hay que tener en cuenta que las respuestas a las preguntas realizadas en la EOC son de tipo cualitativo y para poder realizar cualquier trabajo cuantitativo es necesario hacer algún tipo de transformación. Los tres métodos más utilizados para esto son4: la estadística de balance, propuesto por Anderson (1952) y Theil (1952), el método probabilístico, desarrollado por Carlson y Parkin (1975), y el método de regresión, propuesto por Pesaran (1984, 1987). En este caso, se utiliza el balance neto de Anderson (1952) y Theil (1952que se construye como: 𝑈−𝐷 𝐵𝐴𝐿 = ( ) ∗ 100 𝑈 + 𝑆 + 𝐷 + 𝑁𝐴 (1) Donde U, S, D, NA representan los porcentajes correspondientes a las respuestas “se incrementa”, “permanece igual”, “disminuye” y “no aplica”, respectivamente. La variables BAL, se refiere al valor del saldo para cada una de las preguntas con las cuales se construye cada uno de los índices. Con base en la EOC se derivan tres indicadores: el índice de expectativas económicas (IEC), el índice de condiciones económicas para consumir (ICE) y el índice de confianza del consumidor (ICC). El primero, IEC, es calculado como el promedio de los balances de tres preguntas sobre expectativas tanto para el hogar como para el país (P02, P03 y P05). El segundo índice, ICE, es el promedio de los balances de dos preguntas sobre la situación actual del país (P01 y P11). Finalmente, el ICC es el promedio de los balances de las preguntas que averiguan la opinión de los hogares, tanto de las condiciones actuales como de la perspectiva a futuro del país, las cuales son: P01, P02, P03, P05 y P11. El índice de confianza del consumidor, mide las percepciones y expectativas del consumidor frente a su propia situación económica y la del país, considerando los doce meses anteriores y los siguientes. Esté índice se viene publicando desde noviembre de 2001 y presenta un rezago de publicación de un mes, esto es, a mediados del mes en curso se conoce el resultado del índice para el mes inmediatamente anterior. Como se puede ver en los índices siguen la misma tendencia, manteniéndose constante desde 2013 pero deteriorándose desde comienzos del 2015 (Gráfico 1) 4 Para una descripción más detallada de los métodos véase Holmes, Mitchell, y Silverstone (2009). 5 Gráfico 1. Índices de confianza al consumidor 50,00 40,00 Crecimiento del balance % 30,00 20,00 10,00 0,00 -10,00 -20,00 -30,00 Indice de confianza del consumidor (ICC) Indice de condiciones económicas (ICE) sep.-15 mar.-16 sep.-14 mar.-15 sep.-13 mar.-14 sep.-12 mar.-13 sep.-11 mar.-12 sep.-10 mar.-11 sep.-09 mar.-10 sep.-08 mar.-09 sep.-07 mar.-08 sep.-06 mar.-07 sep.-05 mar.-06 sep.-04 mar.-05 sep.-03 mar.-04 sep.-02 mar.-03 mar.-02 -40,00 Indice de expectiativas de los consumidores (IEC) Fuente: Fedesarrollo Igualmente, existe una correlación entre el crecimiento del consumo privado y el índice de confianza al consumidor ( Gráfico 2). Sin embargo, dado que se tomaron los datos par fin de período del ICC, no es muy claro el rezago entre ambas variables. Por esta razón en el Cuadro 2 se presentan las correlaciones entre el crecimiento del consumo privado y el ICC, para un año hacia atrás y adelante. En este caso se observan fuertes correlaciones principalmente en el subintervalo entre un trimestre antes y un trimestre posterior, siendo estadísticamente significativas las correlaciones en la medición contemporánea cuando se considera el periodo simple y uno y dos trimestres adelante, cuando se considera la agregación de fin de periodo. Gráfico 2. Crecimiento del consumo privado y el índice de confianza al consumidor 9,00 40,00 8,00 30,00 20,00 Porcentaje 6,00 5,00 10,00 4,00 0,00 3,00 -10,00 Crecimiento del balance % 7,00 2,00 -20,00 1,00 Consumo privado mar.-16 ago.-15 ene.-15 jun.-14 nov.-13 abr.-13 sep.-12 jul.-11 feb.-12 dic.-10 may.-10 oct.-09 mar.-09 ago.-08 jun.-07 ene.-08 abr.-06 nov.-06 feb.-05 sep.-05 jul.-04 dic.-03 may.-03 oct.-02 -30,00 mar.-02 0,00 Indice de confianza al consumidor Fuente: DANE y Fedesarrollo; Cálculos de los autores 6 Cuadro 2. Correlaciones con el crecimiento del consumo privado Índice de confianza -4 Fin de período 0,267 Promedio simple 0,371 -3 0,457 0,547 -2 0,602 0,660 -1 0,722 0,792 0 0,800 0,817* 1 0,783* 0,750 2 0,634* 0,617 3 0,536 0,482 0,325 4 0,288 * Significancia al 95% de confianza Fuente: Cálculos de los autores Otras variables utilizadas En el caso del consumo, se utilizó como variable la variación anual del consumo total de los hogares, obtenido a partir de las cuentas nacionales (base 2005) lo cual involucra tanto el consumo de bienes durables como de bienes no durables. Dado que no existe una variable de ingreso disponible de periodicidad mensual o trimestral, se tomó como una variable proxy la variación anual del índice de comercio a minoristas sin combustibles, que muestra el comportamiento de la actividad comercial del país y puede sugerir la forma en que el consumo de la economía se lleva acabo. El cálculo de este índice se realiza con base en la muestra mensual de comercio al por menor del DANE, que tiene una muestra de 823 empresas5, distribuida geográficamente en la ciudades de Barranquilla, Bogotá, Bucaramanga, Cali y Medellín. Esta muestra es recolectada de forma mensual desde 1989, pero presenta cambios metodológicos en 1999 y 2013. Para la estimación del modelo se tomó la serie desde julio de 2002 mediante el empalme de las series de enero de 2003 a abril de 2016 con la serie existente desde enero de 1999 hasta diciembre de 2013. De otra parte, para una proxy del costo de oportunidad de los consumidores, se escogió la serie de tasa de interés de tarjetas de crédito para personas naturales, por parte de los bancos comerciales, reportada por el Banco de la República que se encuentra disponible desde julio de 2002. La periodicidad de esta serie es de carácter semanal, por lo tanto para obtener la misma de forma mensual o trimestral, se procedió a realizar un promedio de acuerdo a la periodicidad requerida. En una primera instancia, para todas las variables tanto en su agregación trimestral como mensual se realizan las pruebas de raíz unitaria, particularmente, la prueba de Dickey y Fuller (1979) aumentada (Cuadro 3), encontrando que 5 Las cuales son empresas comerciales que en 1997 presentaron ventas superiores a 1.210 millones de pesos, que se ha venido actualizando con el IPC, y/o tenían contratadas 20 o más personas. 7 únicamente en la agregación trimestral de la serie de tarjetas de crédito se puede descartar el problema de raíz unitaria. Ahora bien, al observar los gráficos de las series (Gráfico 3), se observa un comportamiento más o menos estacionario de las series, pero con una fuerte caída en los últimos periodos, lo que puede estar alterando los resultados de las pruebas. Dado lo anterior, se decide realizar los modelos, suponiendo estacionalidad de las series de aquí en adelante. Cuadro 3. Prueba de raíz unitaria Dickey-Fuller aumentado Prueba con drift y tendencia Series trimestrales Consumo ICC Tarjetas de crédito Comercio sin combustible Prueba con drift -2,32 -0,95 -3,32* -2,38 -2,36 -1,26 -2,40 Series mensuales ICC -2,40 Tarjetas de crédito -1,76 Comercio sin combustible -2,70 * Prueba de significancia al 95% -2,50 -1,76 -2,70 Gráfico 3. Series utilizadas en la estimación Consumo de los hogares Indice de comercio sin combustibles (variacion trimestral anualizada) (variacion trimestral anualizada) 9,00 20,00 8,00 15,00 7,00 10,00 Porcentaje Porcentaje 6,00 5,00 4,00 3,00 5,00 0,00 2,00 -5,00 1,00 0,00 sep.-14 sep.-15 mar.-16 mar.-16 sep.-13 sep.-12 mar.-13 sep.-11 mar.-12 sep.-10 mar.-11 sep.-09 mar.-10 sep.-08 mar.-14 mar.-14 sep.-13 mar.-13 sep.-12 mar.-12 sep.-11 mar.-11 sep.-10 mar.-10 sep.-09 mar.-09 sep.-08 mar.-08 sep.-07 mar.-07 sep.-06 mar.-06 sep.-05 mar.-05 sep.-04 mar.-04 sep.-03 mar.-16 sep.-15 sep.-14 mar.-15 mar.-14 sep.-13 mar.-13 sep.-12 mar.-12 sep.-11 mar.-11 sep.-10 mar.-10 sep.-09 mar.-09 sep.-08 mar.-08 sep.-07 sep.-06 mar.-07 0,00 sep.-05 5,00 -30,00 mar.-06 10,00 -20,00 sep.-02 15,00 -10,00 sep.-04 mar.-09 20,00 mar.-03 0,00 mar.-02 10,00 mar.-05 mar.-15 25,00 sep.-03 sep.-15 20,00 mar.-04 mar.-15 30,00 sep.-02 sep.-14 30,00 Porcentaje 35,00 mar.-03 sep.-07 (fin de trimestre) (balance trimestral) 40,00 mar.-02 mar.-08 sep.-06 Tasa de interés de tarjetas de crédito de personas naturales indice de confianza al consumidor Porcentaje mar.-07 sep.-05 mar.-06 sep.-04 mar.-05 sep.-03 mar.-04 sep.-02 mar.-03 mar.-02 sep.-15 mar.-16 sep.-14 mar.-15 sep.-13 mar.-14 sep.-12 mar.-13 sep.-11 mar.-12 sep.-10 mar.-11 sep.-09 mar.-10 sep.-08 mar.-09 sep.-07 mar.-08 sep.-06 mar.-07 sep.-05 mar.-06 sep.-04 mar.-05 sep.-03 mar.-04 sep.-02 mar.-03 mar.-02 -10,00 De izquierda a derecha y de arriba abajo los gráficos corresponden con: a) Consumo de los hogares: b) Variación del índice de comercio sin combustible; c) índice de confianza del consumidor; d) Tasa de interés de las tarjetas de crédito de personas naturales Fuente: DANE, Fedesarrollo y Banco de la República; Cálculos de los autores 8 Estrategia de pronóstico La disponibilidad de datos para la realización de pronósticos de series macroeconómicas presenta desafíos para la persona que las realiza. En algunos casos las series a pronosticar son de baja frecuencia, mientras que las series que ayudan con el pronóstico tienen una alta frecuencia. La solución más común es convertir los datos en una sola frecuencia mediante algún tipo de transformación, perdiendo de esta manera información importante dentro del pronóstico. Ahora bien, es posible combinar datos de distintas frecuencias mediante la utilización de diferentes procedimientos. Dentro de los más utilizados se encuentran: los modelos de factores, que reúnen la información contenida en una gran base de datos en un pequeño número de factores comunes (Stock y Watson, 2002a; Stock y Watson, 2002b); los modelos bridge, que resuelven el problema de la combinación de frecuencias por pronosticar primero los valores faltantes de la serie de alta frecuencia y luego agregarlos las observaciones a la baja frecuencia de la serie a pronosticar (Klein y Sojo, 1989); y los modelos MIxed DAta Sampling (MIDAS), que coloca los predictores de alta frecuencia en la regresión de las observaciones de baja frecuencia (Ghysels, et al. 2004; Ghysels, et al. 2007). En este ejercicio de pronóstico, la estrategia está basada en la utilización de tres tipos de modelos: un modelo “agregación temporal”, en el que no se toma la información de baja frecuencia, sino se hacen transformaciones a las variables de alta frecuencia para volverlas de baja frecuencia, un modelo bridge y un modelo MIDAS, estos dos últimos si toman en cuenta la información de baja frecuencia de las variables. Antes de proseguir es importante detenerse en la notación utilizada de aquí en adelante. Como se ha mencionado anteriormente se quiere realizar un pronóstico del consumo, que es una serie de baja frecuencia, la cual va a ser denotada Y, con una frecuencia en el tiempo t. En este caso la unidad de tiempo t es trimestral (1, 2, 3 y 4). Por ejemplo, para el mes de marzo tenemos que para la serie de baja frecuencia se denota como Y1. En el caso de los rezagos de la serie de baja frecuencia se utiliza el operador de rezagos L. Adicionalmente, es importante comprender la notación de la series de alta frecuencia denota como X, que tiene una frecuencia m dentro de la unidad de tiempo t. La frecuencia de Xmt se supone mensual (1, 2 y 3), luego entre t y t-1 la variable de alta frecuencia puede ser observada 3 veces. Por ejemplo, para el mes de marzo tenemos que la serie de alta frecuencia se denota como X31 y en el mes de abril como X12. Finalmente, los rezagos de la serie de alta frecuencia se denotan como LHF. En el Gráfico 4 se muestra el pronóstico de un período adelante de la variable Yt, el cual puede ser generalizado sin problema. Supongamos que en el período t estamos interesados en pronosticar Yt+1. En un ejercicio tradicional se utilizarían los datos hasta el momento t, perdiendo la información que puede encontrarse en X1t+1 y X1t+2. Con los modelos bridge y MIDAS esta información es incorporada en el pronóstico de Yt+1. 9 Gráfico 4. Línea de tiempo de pronóstico Yt-1 Yt-2 Xt-11 t-2 Xt-12 Xt-1 t-1 Yt Xt1 Xt2 Yt+1 Xt+11 Xt3 t Xt t+1 Xt+1 Fuente: Adaptado de Armesto, Engemann y Owyang (2010) Modelos de “agregación temporal” La forma más común para tratar con series de distintas frecuencias es agregarlas temporalmente. Ahora bien, agregación puede ser interpretado de maneras distintas de acuerdo a la definición de la variable. Por ejemplo. Al pasar series mensuales a trimestrales uno podría tomar el primer dato, el segundo o el último dato para ser el representativo del trimestre. Otra forma de agregar los datos es realizar un promedio simple de las observaciones de la serie de alta frecuencia entre las unidades de tiempo de las series de baja frecuencia (2), lo cual implica que la información relevante del pronóstico está contenida dentro de cada uno de los meses del trimestre. 𝑚 1 𝑋̅𝑡 = ∑ 𝐿𝑘𝐻𝐹 𝑋𝑡 𝑚 (2) 𝑘=1 En este caso el peso que se le da la información de cada trimestre es igual, para que estos pesos fueran diferentes se podría llevar acabo algún tipo de ponderación de la información6. Ahora bien, si tomamos como base el promedio simple para la agregación, tenemos que la regresión a estimar se puede escribir como: 𝑝 𝑛 (3) 𝑌𝑡 = 𝛼 + ∑ 𝛽𝑖 𝐿𝑖 𝑌𝑡 + ∑ 𝛾𝑗 𝐿𝑗 𝑋̅𝑡 + 𝜀𝑡 𝑖=1 𝑗=1 Donde γj son los coeficientes de los promedios. A partir de (3) entonces podemos obtener los pronósticos del consumo, pronosticando las variables independientes agregadas. En nuestro caso específico se tomara el promedio para las variables de flujo y el último dato del trimestre para las variables de stock. Sin 6 La cual podría ser estimada dentro del modelo, pero esto implica: i) un incremento en el número de parámetros a estimar y ii) los coeficientes asociados a las ponderaciones no van a estar restringidos a que la suma sea uno, lo cual dificulta su interpretación. 10 embargo, debido a la existencia de autocorrelación en los errores, es necesario especificar un ARIMA (Box y Jenkins, 1976) con variables explicativas (Pankratz, 1991). Modelos bridge Un modelo bridge puede ser visto como una ecuación dinámica donde los componentes del PIB son explicados por indicadores de corto plazo7. La elección de las variables en un modelo bridge está basado en la experiencia del investigador así como en diferentes procedimientos estadísticos, que en relaciones estructurales de las variables. En general se usan ecuaciones auxiliares para pronosticar la serie de alta frecuencia hasta el final del período de consideración de pronóstico de la variable de baja frecuencia. Por ejemplo, si se tiene información hasta enero y se quiere pronosticar el primer trimestre, se realiza un pronóstico independiente del indicador hasta marzo, lo cual completa el período para que la serie de alta frecuencia sea agregada temporalmente a una serie de baja frecuencia. En nuestro caso, lo que se hace es realizar el pronóstico de la serie del índice de confianza a partir de un modelo ARIMA de la forma 𝑝 𝑞 (4) 𝛥𝑋𝑡𝑚 = 𝛿 + ∑ 𝜙𝑘 𝐿𝑘𝐻𝐹 𝑋𝑡𝑚 + ∑ 𝜃𝑘 𝐿𝑘𝐻𝐹 𝜗𝑡𝑚 𝑘=1 𝑘=1 A continuación, el pronóstico de los resultados se agrega temporalmente para completar el trimestre de referencia, mediante un promedio simple 1 𝑘 ̂ 𝑋̅̂𝑡 = 𝑚 ∑𝑚 𝑘=1 𝐿𝐻𝐹 𝑋𝑡 (5) Y con estos resultados, se pronostica de la serie de consumo se estima mediante un modelo ARIMA con variables explicativas. Modelos MIDAS Como una alternativa a la agregación temporal y los modelos bridge se ha presentado los modelos MIDAS (Ghysels, et al., 2004; Ghysels, et al., 2007) en los que se representa de forma parsimoniosa y flexible modelos de series de tiempo que tienen en el lado derecho e izquierdo variables de series de tiempo con muestras de diferentes frecuencias. Para esto, proponen generar un número de hiper-parámetros relativos a la muestra de alta frecuencia para estimar o pronosticar los datos de baja frecuencia, de manera que 𝑘 𝑌𝑡 = 𝛼 + ∑𝑝𝑖=1 𝛽𝑖 𝐿𝑖 𝑌𝑡 + 𝛾 ∑𝑚 𝑘=1 𝛷(𝑘; 𝜃)𝐿𝐻𝐹 𝑋𝑡 + 𝜀𝑡 7 (6) Para mayor información véase Wohlrabe (2009). 11 donde la función 𝛷(𝑘; 𝜃) es un polinomio que determina las ponderaciones para la agregación temporal. Esta función puede tener numerosas formas funcionales para esto Ghysels, et al. (2004) sugieren utiliza una función beta 𝑘 𝑓 (𝑚 , 𝜃1 , 𝜃2 ) 𝛷(𝑘; 𝜃1 , 𝜃2 ) = 𝑗 ∑𝑚 𝑗=1 𝑓 (𝑚 , 𝜃1 , 𝜃2 ) (7) En el caso de querer obtener el promedio simple los coeficientes son 𝜃1 = 𝜃2 = 1. Como también es posible utilizar un polinomio de Almon 𝛷(𝑘; 𝜃1 , 𝜃2 ) = 𝑒 (𝜃1 𝑘+𝜃2 𝑘 2) (8) (𝜃1 𝑗+𝜃2 𝑗 2 ) ∑𝑚 𝑗=1 𝑒 En el que la obtención del promedio simple los coeficientes son restringidos a 𝜃1 = 𝜃2 = 0. Resultados de los pronósticos El ejercicio de pronóstico tanto para la agregación temporal como para el modelo bridge y MIDAS está basado en la siguiente ecuación Δ𝑦𝑡 = 𝛼 + ∑𝑝𝑖=1 𝛽𝑖 𝐿𝑖 Δ𝑦𝑡 + ∑𝑛𝑗=1 𝛾𝑗 𝐿𝑗 Δ𝑥̅𝑡 + 𝜀𝑡 Donde la variable en minúscula es el logaritmo de la misma y la diferencia anualizada de la variable, esto es, las variables utilizadas en los modelos se presentan como crecimientos anualizados de las mismas. El orden los rezagos para las variables responde a los criterios de información de Akaike y Schwarz, donde el máximo tamaño de un rezago fue de cuatro, esto es un año. Dentro de las variables explicativas utilizadas se tomó el índice de confianza del consumidor (ICC), ya que este es construido a partir del índice de expectativas económicas (IEC) y el índice de condiciones económicas para consumir (ICE). De otra parte, como una proxy del ingreso se consideró la variación anual del índice de comercio sin combustibles, y como proxy del costo de oportunidad del consumidor, la tasa de interés de las tarjetas de crédito de personas naturales. Partiendo de estas variables explicativas se realizan las tres diferentes estrategias de pronóstico para el crecimiento del consumo, con base en las ecuaciones (3) a (6). Como se puede observar en todos los casos se consideran modelos dinámicos, es decir, que se utiliza la variable de consumo rezagada un periodo como variable explicativa. Por lo anterior, a todos los modelos se les realiza pruebas de autocorrelación y con excepción del modelo MIDAS (que muestra problemas de autocorrelación para el cuarto rezago), no existen evidencias de este problema a uno, dos, tres y cuatro rezagos. 12 En el caso de los modelos de agregación temporal (modelo base) y el modelo bridge, hay que considerar que se debe pasar los datos de alta frecuencia (mensual) a baja frecuencia (trimestral), por lo que para el ICC se tomaron los datos a fin de trimestre, mientras que para las tarjetas de crédito y la variación del comercio se optó por realizar la agregación promedio. Bajo el modelo base, sin involucrar los datos de alta frecuencia en el pronóstico, se obtuvo que el crecimiento del consumo privado, para el segundo trimestre de 2016, se encuentra entre un 3,8% y 5,7%, con un intervalo de 60% de confianza, siendo la estimación puntual de 4,3%. En el caso del modelo bridge, se pronostica un crecimiento de 3,8%, para el mismo periodo, que se encuentra en un intervalo de confianza al 60% entre 3,4% y 4,2%. Finalmente, con el modelo MIDAS, se pronostica un crecimiento de 3,6% para el segundo trimestre de 2016, el cual se encuentra entre 3,2% y 3,9%, con una confianza del 60%. En el Gráfico 5, se presentan los resultados para el cierre del año 2016 con esto tres modelos para los intervalos del 90%, 80% y 60%. Gráfico 5. Pronostico del consumo (trimestre anualizado) Modelo base (a) Modelo bridge (b) Modelo MIDAS (c) Fuente: Cálculos de los autores 13 Los pronósticos puntuales para el año 2016, muestran un crecimiento para el consumo privado de: 3,9% para el modelo base; 3,5% para el modelo bridge y 3,4% para el modelo MIDAS. Al realizar la combinación de pronósticos, mediante un promedio simple, se esperaría un crecimiento de 3,6% para el año, que implicaría un incremento del consumo de 0,5 puntos porcentuales (pp.), con respecto a lo observado en el 2015. Cuadro 4. Pronóstico del consumo para 2016 Observado Base Bridge Midas Combinación II-16 4,3% 3,8% 3,6% 3,9% III-16 3,8% 3,2% 3,0% 3,3% IV-16 3,8% 3,5% 3,6% 3,6% 2016 3,9% 3,5% 3,4% 3,6% I-15 4,7% II-15 3,7% III-15 4,2% IV-15 2,8% 2015 3,1% I-16 3,4% Fuente: Cálculos de los autores Gráfico 4 Pronóstico del consumo para 2016 8% 7% 6% 5% 3,6% 4% 3% 2% 1% III IV I-16 III I-15 III I-14 III I-13 III I-12 III I-11 III I-10 0% Fuente: Cálculos de los autores 14 Conclusiones En este trabajo se realiza una aproximación a los pronósticos del consumo privado a partir de la utilización de índices de confianza y la variación anual del índice de comercio sin combustibles (como proxy del ingreso) y la tasa de interés de las tarjetas de crédito de personas naturales (como proxy del costo de oportunidad del consumidor), con el fin de tener información oportuna acerca de esta variable es importante para poder evaluar y predecir el comportamiento de la actividad económica. Lo anterior es de gran importancia puesto que en primer lugar se realizar un pronóstico del consumo privado que involucra el índice de confianza al consumidor, ya que hasta ahora no existe evidencia empírica de alguna relación entre estas dos variables y en segundo lugar, se utilizan datos de alta frecuencia para realizar el pronóstico de una variable de baja frecuencia, lo cual tampoco se ha realizado en el Colombia. Para esto, se utilizaron tres aproximaciones metodológicas: la agregación trimestral de las variables y su pronóstico; los modelos bridgeen el que se pronostican primero los valores faltantes de la serie de alta frecuencia y luego se agregan las observaciones a la baja frecuencia de la serie a pronosticar; y los modelos Mixed Data Sampling (MIDAS), que coloca los predictores de alta frecuencia en la regresión de las observaciones de baja frecuencia. Con lo anterior, se encuentra que bajo el modelo base se pronostica un crecimiento de 4,3% para el segundo trimestre de 2016. En el caso del modelo bridge, se pronostica un crecimiento de 3,8%y bajo el modelo MIDAS, se espera un crecimiento de 3,6%. Asimismo, los pronósticos puntuales para el año 2016, muestran un crecimiento para el consumo privado de: 3,9% para el modelo base; 3,5% para el modelo bridge y 3,4% para el modelo MIDAS. Al realizar la combinación de pronósticos, mediante un promedio simple, se esperaría un crecimiento de 3,6% para el año, que implicaría un incremento del consumo de 0,5 puntos porcentuales (pp.), con respecto a lo observado en el 2015. 15 Anexo A: Resultados de los modelos Cuadro 5. Modelo Base/Bridge Modelo Base/Bridge AR1 0,73* (0,1) D1 -6,42 (10,14) D2 -6,10 (10,12) D3 6,19 (10,10) D4 6,57 (10,10) ICC 0,001 (0,011) ICC Rezagado 0,01 (0,012) Comercio 0,28* (0,03) Comercio Rezagado 0,001 (0,03) Tasa Tarjeta 0,24* (0,08) Tasa Tarjeta Rezagado -0,11* (0,08) n 54 16 Cuadro 6. Modelo Midas Modelo Midas Intercepto 2,70* (1,51) Consumo Rezagado 0,84* (0,12) ICC periodo 1 0,02 (0,01) ICC periodo 2 -0,01 (0,02) ICC periodo 3 -0,01 (0,02) ICC Rezagado periodo 1 0,03* (0,02) ICC Rezagado periodo 2 -0,03 (0,02) ICC Rezagado periodo 3 0,01 (0,03) Comercio periodo 1 0,07* (0,03) Comercio periodo 2 0,03 (0,03) Comercio periodo 3 0,14* (0,03) Comercio Rezagado periodo 1 -0,04 (0,04) Comercio Rezagado periodo 2 -0,1* (0,04) Comercio Rezagado periodo 3 -0,07* (0,02) Tasa Tarjeta periodo 1 -0,20 (0,18) Tasa Tarjeta periodo 2 0,44* (0,21) Tasa Tarjeta periodo 3 -0,14 (0,37) Tasa Tarjeta Rezagado periodo 1 -0,33 (0,31) Tasa Tarjeta Rezagado periodo 2 0,36 (0,32) Tasa Tarjeta Rezagado periodo 3 -0,20 (0,28) n 54 17 Referencias Anderson, O. (1952). “The business test of the IFO-Institute for economic research, Munich, and its theoretical model”. Review of the International Statistical Institute, Vol. 20, pp. 1–17. Armesto, M. Engemann, K. and Owyang, M. (2010). “Forecasting with mixed frequencies”. Federal Reserve Bank of St. Louis Review, Vol. 92 (6), pp. 521-536. Box, G. E. P and Jenkins, GM (1976). Time series analysis: Forecasting and control. Carlson, J. A. and Parkin, M. (1975). “Inflation expectations”. Economica, Vol. 42 (166), pp. 123–138. Dickey, D. A. and Fuller, W. A., 1979. Distribution of the Estimators for Autoregressive Time Series with a Unit Root. Journal of the American Statistical Association, Vol. 79, pp. 427-431. Dreger, C. and Arkadievich, K. (2011). “Forecasting Private Consumption by Consumer Surveys”. Journal of Forecasting, Vol. 32 (1), pp. 10–18. Ghysels, E., Kvedaras, V. and Zemlys, V. (2015). Mixed frequency data sampling regression models: the R Package midasr. Unpublished manuscript https://github.com/mpiktas/midasr-user-guide/raw/master/midasr-user-guide.pdf. Ghysels, E., Santa-Clara, P. and Valkanov, R. (2004). The MIDAS Touch: Mixed Data Sampling Regression Models. Center for Interuniversity Research and Analysis of Organizations Working Paper, No 2004s-20. Ghysels, E., Sinko, A. and Sockin, M. (2010). Matlab Toolbox for Mixed Sampling Frequency Data Analysis using MIDAS Regression Models. Unpublished manuscript www.unc.edu/~eghysels/papers/MIDAS_Usersguide_Version1.pdf. Ghysels, E., Sinko, A. and Valkanov, R. (2007). “MIDAS regressions: further results and new directions”. Econometric Reviews, Vol. 26 (1), pp. 53–90. Holmes, M., Mitchell, J. and Silverstone, B. (2009). “Architects as nowcasters of housing construction”. National Institute Economic Review, Vol. 210 (1), pp. 111122. Julio, J. M. y Grajales, A. (2011). ¿Qué nos dicen los índices de confianza? Banco de la República, Borradores de Economía, No 659. Klein, L. R. and Sojo, E. (1989). Combinations of High and Low Frequency Data in Macroeconometric Models, pp. 3-16. In Klein, L. R. and Márquez, J. (1989). Economics in Theory and Practice: An Eclectic Approach. Dordrecht: Kluwer Lahiri, K., Monokrousos, G. and Zhao, Y. (2015). “Forecasting consumption: the role of consumer confidence in real time with many predictors”. Journal of Applied Econometrics, DOI: 10.1002/jae.2494. Ludvigson, S. (2004). “Consumer confidence and consumer spending”. Journal of Economic Perspectives, Vol. 18 (2), pp. 29–50. 18 Mejia, L. F., Monsalve, D., Parra, Y., Pulido, S. y Reyes, A. M. (2013). Indicadores ISAAC: Siguiendo la actividad sectorial a partir de Google Trends. Ministerio de Hacienda y Crédito Público, Notas Fiscales, No 22. Pankratz, A. (1991). Forecasting with Dynamic Regression Models. WileyInterscience. Pesaran, M.H. (1984). “Expectations formation and macroeconomic modelling”. En Malgrange, P. and Muet, P. (eds): Contemporary Macro-economic Modelling, Oxford, Blackwell. Pesaran, M.H. (1987). The Limits to Rational Expectations. Oxford, Blackwell. Pfaff, B. 2008). “Analysis of integrated and cointegrated time series with R”. Springer. Sánchez, K. y Zarate, H. (2010). Formación de las expectativas de inflación y actividad económica tenidas de la encuesta de clima de los negocios realizada por el Banco de la República de Colombia. VII Coloquio Regional de Estadística y XII Seminario de Estadística Aplicada IASI, Universidad Nacional de Colombia Sede Medellín, Mimeo. Schmidt, T. and Vosen S. (2011). “Forecasting private consumption: survey-based indicators vs. Google trends”. Journal of Forecasting, Vol. 30 (6), pp. 565-578. Stock, J. H. and Watson, M. W., 2002a. Forecasting Using Principal Components From a Large Number of Predictors. Journal of the American Statistical Association, 97(460), pp. 1167-1179. Stock, J. H. and Watson, M. W., 2002b. Macroeconomic Forecasting Using Diffusion Index. Journal of Business Economics and Statistics, 20(2), pp. 147-162. Theil, H. (1952). “On the time shape of economic microvariables and the Munich business test”, Review of the International Statistical Institute, Vol. 20, pp. 105–120. Wohlrabe, K. (2009). Forecasting with mixed-frequency time series models. PhD tesis, University of Munich. 19