Download La Gaceta de Economía - Gaceta de Economia
Document related concepts
Transcript
Índice 1 What is the effect of macroeconomic announcements on the foreign exchange market? An intraday analysis on the peso/dollar exchange rate Roberto Gómez Cram.......................................................................................... 1 2 Efecto de una política monetaria de compra de activos en una economía emergente Luis Simon Tamborrel......................................................................................... 27 3 Una justificación para tener una meta de inflación positiva Miguel Zerecero .................................................................................................. 59 4 Voto estratégico bajo el sistema mixto mexicano Román Acosta ..................................................................................................... 69 5 Should you ask her out? Jose Manuel Rodríguez Sotelo ............................................................................ 87 E DITORIAL El nuevo equipo editorial de la Gaceta de Economía se complace en presentarles la edición número 32. En esta ocasión, los cinco artículos publicados son investigaciones originales realizada por alumnos y exalumnos del Instituto Tecnológico Autónomo de México. La selección de artículos abarca diversos temas, mostrando la riqueza de los métodos y herramientas de la ciencia económica y confirmando que ésta puede dar respuesta a numerosos tipos de preguntas y analizar una gran variedad de cuestiones. El artículo What is The Effect of Macroeconomic Announcements on The Foreign Exchange Market? An Intraday Analysis on The Peso/Dollar Exchange Rate, de Roberto Gómez Cram, analiza utilizando datos de cada cinco minutos, el efecto que tienen las noticias relacionadas a los agregados macroeconómicos fundamentales sobre el tipo de cambio entre el peso mexicano y el dólar. En el artículo subsecuente, Luis Simon Tamborrel investiga los efectos de una política monetaria de compra de activos en el contexto de una crisis de reducción de liquidez de uno de los activos disponibles en la economía. En particular, investiga la conveniencia de este tipo de acciones para economías emergentes las cuales enfrentan restricciones de liquidez más importantes que las economías desarrolladas. En Una justificación para tener una meta de inflación positiva, Miguel Zerecero utiliza una simplificación de un modelo de Mankiw y Reis para argumentar a favor de una meta de inflación positiva para contrarrestar mercados con un bajo nivel de competencia. El modelo presentado no deja de tomar en cuenta los efectos negativos de la inflación y considera el problema que una mayor dispersión de precios tiene sobre la producción. Dejando de lado la macroeconomía, Román Acosta investiga, en Voto estratégico bajo el sistema mixto mexicano, la posibilidad de que los votantes mexicanos actúen de manera estratégica al momento de elegir a sus representantes dada la doble implicación de sus votos legislativos, es decir, dada la presencia de curules plurinominales. Acosta encuentra que efectivamente la representación proporcional reduce los incentivos para el voto estratégico y presenta datos de elecciones locales que sustentan su hipótesis. Finalmente, el artículo Should you ask her out?, de José Manuel Rodríguez Sotelo, muestra un divertida aplicación de estadística bayesiana a un problema de decisión con comportamiento estratégico: invitar a salir a una persona. Con un estilo sencillo y una prosa ligera, este articulo resulta didáctico e invita a usar el pensamiento analítico en temas menos ortodoxos. La cuestión de si la historia que sirve como pretexto para este artículo es realista o no se deja a criterio del lector. El propósito de esta publicación es fomentar la investigación científica de excelencia sobre temas relacionados con la economía, complementar la formación académica de los estudiantes y ser un foro para la discusión de temas relevantes para la sociedad; por ello, nos enorgullece presentar esta selección de artículos de gran calidad. Agradecemos a todos aquéllos que contribuyeron a escribir, seleccionar, editar y comentar el contenido de este número de la Gaceta. En particular a César Martinelli y Diego Domínguez, así como a todos los miembros del Consejo Editorial de esta edición. Esperamos que sea de su agrado e invitamos a la comunidad de economistas a continuar colaborando con la labor de investigación científica que aquí se presenta. II 1 W HAT IS T HE E FFECT OF M ACROECONOMIC A NNOUNCEMENTS ON T HE F OREIGN E XCHANGE M ARKET ? A N I NTRADAY A NALYSIS ON T HE P ESO /D OLLAR E XCHANGE R ATE⇤ R OBERTO G ÓMEZ C RAM† This paper analyzes the effect of unexpected information (surprises) about macroeconomic fundamentals on the exchange market. For this purpose, we employ peso/dollar exchange rate data with a five minute frequency as well as a broad variety of US and Mexican macroeconomic expectations and realizations for the period extending from January 2005 to November 2012. The results of this study suggest that peso/dollar exchange rate movements are not linked in the short term to Mexican macroeconomic fundamentals; however, there is evidence of a close relationship with US fundamentals. In particular, surprises on the majority of the US announcements have an immediate and significant effect on the volatility of the exchange rate returns which dissipates gradually. On average, the increase in volatility lasts 15 minutes. Additionally, we identify the macroeconomic announcements that have the greatest impact on exchange rate volatility; surprises on Change in Nonfarm Payrolls and in the Unemployment Rate have the most pronounced effect. En el presente trabajo se examina el efecto que tiene la llegada de información no esperada (sorpresas) de fundamentales macroeconómicos en el mercado cambiario. Para esto se utilizan datos del tipo de cambio peso/dólar con una frecuencia de cinco minutos así como una variedad de expectativas y anuncios macroeconómicos de México y de Estados Unidos para el periodo de enero de 2005 a noviembre de 2012. Los resultados sugieren que los movimientos en el tipo de cambio no están vinculados a los fundamentales macroeconómicos mexicanos en el corto plazo mientras que sí existe una estrecha relación con los fundamentales estadounidenses. En concreto, las sorpresas en la mayoría de los anuncios de Estados Unidos tienen un efecto inmediato y significativo en la volatilidad de los rendimientos del tipo de cambio. Dicho efecto tarda, en promedio, 15 minutos en disiparse. Adicionalmente, se identifican aquellos anuncios macroeconómicos que tienen el mayor impacto en la volatilidad del tipo de cambio, en específico, las sorpresas en el cambio en la nómina no agrícola y en la tasa de desempleo tienen el mayor efecto. K EYWORDS : exchange rates, expectations data, high-frequency data, macroeconomic news announcements. 1. I NTRODUCTION How do markets price in fundamental macroeconomic news into financial assets? Understanding the relationship between macroeconomic variables and asset prices as well as the process through which the latter are determined are of key interest for relevant financial and economic decisions, such as risk management, financial asset pricing, and defining investment portfolios. ⇤ This article is a short version of my ITAM undergraduate thesis: ¿Cuál es el efecto de las noticias macroeconómicas en el mercado cambiario? Un análisis indradía para el tipo de cambio peso/dólar. My thesis received the first place at the XXIX Premio Internacional de Investigación Financiera, IMEFErnst Young 2013. † Research Analyst at the Economics Research Directorate at Banco de México. I would like to thank Santiago García Verdú, Ignacio Lobato, Diego Domínguez and Carlos Capistrán for their invaluable advice and comments throughout all of the research process. I have also benefitted from discussions with Miguel Zerecero, Juan Arroyo, Mauricio Torres and Alexandro Jara. The views presented in this work are exclusively of the author and do not necessarily reflect those of Banco de México. All errors remain my own. Email: rgomezcram@gmail.com. 2 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET This paper studies this relationship in the case of the foreign exchange market in an effort to determine to what extent peso/dollar exchange rate movements are linked to Mexican and US macroeconomic fundamentals.1 This is important to the extent that it makes it possible to identify the potential macroeconomic determinants that generate systemic risk in the exchange market. On the other hand, the importance of analyzing the exchange rate resides in the role it plays in any economy as a facilitator of commerce, investment and cross-border financial transactions. We focus on the conditional volatility of peso/dollar exchange rate returns and we address a central question in exchange rate economics: What is the effect of unexpected information (surprises) about macroeconomic fundamentals on the foreign exchange market? To answer this question, we employed peso/dollar exchange rate data with a five minute frequency as well as a broad variety of US and Mexican macroeconomic fundamental expectations and announcements for the period extending from January 2005 to November 2012. The reason for restricting our study to surprises rather than considering directly the announcements is that the market has already discounted the expected value of the macroeconomic realizations. That is, only relevant unanticipated news of fundamentals should induce exchange rate movements. This is line with Malkiel’s (1992) definition of market efficiency in which a market is efficient if it fully and correctly reflects all relevant information in determining security prices; in this case the exchange rate ought to adjust rapidly as new relevant information arrives. In this paper we approximate this unexpected information -how much of the announcement was not anticipated by the marketthrough the standardized difference between the expectations and realizations. The advantage of using a database with such a high frequency is the extent to which it makes it possible to isolate more precisely the effect on exchange rate movements in response to macroeconomic news surprises as opposed to any other significant developments that may have occurred on the same day as the surprises. This is especially useful in the case of the US and Mexican macroeconomic announcements as the day and time of release are known in advance. We estimate the effect of surprises on the volatility of the returns via ordinary least squares and we use heteroskedasticity and serial correlation consistent standard errors using the kernel proposed by Newey-West (1987). It is also necessary to control for the seasonal behavior displayed by the volatility returns at such high frequencies.We use the theoretical framework of Andersen and Bollerslev (1997) in order to deseasonalize the volatility series.2 The results of this study suggest that the peso/dollar exchange rate move1 In this case macroeconomic fundamentals should be understood as aggregate indicators that summarize the current state of the economy. These announcements usually refer to the following economic variables: real activity, consumption, investment, government, foreign trade, prices, forward-looking and monetary announcements 2 A failure to take into account this seasonal behavior before analyzing the impact of unexpected macroeconomic news on yield volatility can lead to a statistically erroneous analysis. We address this matter in section 3. R OBERTO G ÓMEZ C RAM 3 ments are not linked in the short term to Mexican macroeconomic fundamentals, but there is strong evidence of a close relationship with US fundamentals. To this end, we not only consider the contemporaneous effect on volatility but we also analyze how persistent it is. In particular, US macroeconomic news surprises immediately increase peso/dollar exchange rate return volatility and the effect dissipates gradually. On average, the increase in volatility lasts 15 minutes. More specifically, the effect of surprises in Change in Nonfarm Payrolls and the Unemployment Rate endure for more than 45 minutes after they are released. We also identified the macroeconomic announcements that exert the greatest impact on peso/dollar exchange rate volatility. We find that the effect depends in large part on the date of the release of the news relative to those of other indicators that measure similar segments of the US economy. The intuition of this result is as follows: Agents observe the value of the initial announcements and on the basis of that information they adjust their expectations regarding the content of subsequent indicators that assess the performance of similar segments. In this way, the deviations in expectations surrounding these observed values from the most recent announcements tend to be less pronounced with the degree of volatility they stoke successively tapering off. Surprises in the following macroeconomic indicators have the greatest effect: Change in Nonfarm Payrolls, the Unemployment Rate, the Consumer Price Index, Construction Spending, ISM Manufacturing and Advance Retail Sales, in that same statistical order. Several studies have examined the response of different asset prices to public announcements of economic news. Ederington and Lee (1993) and Balduzzi et al. (2001), for example, analyze intraday patterns in Treasury bond prices and trading around announcement times. The work most similar to ours is Andersen et al. (2003), since in both cases we study the effect of macroeconomic news in the foreign exchange market. Andersen et al. (2003) focus on the performance of the exchange rate returns, whereas we focus on studying the impact on the volatility of returns.3 Our analysis extends theirs in the sense that we consider a much broader set of macroeconomic announcements (51 instead of 41) and a longer sample period (eight years instead of six years). However, Andersen et al. (2003) make a more detailed study of the exchange market since they analyze the effect in five different exchange rates. Our findings provide a new perspective on the relative importance that financial agents assign to the performance of the Mexican economy in the short 3 Despite the advantages there are in studying directly exchange rate conditional means as opposed to conditional variances, the a priori exchange rate movement to news announcements it is not entirely clear. A depreciation or appreciation of the exchange rate may depend on the current agent beliefs of the reaction of the Central Bank. For instance, one would expect that a positive surprise in Change in Nonfarm Payrolls (an announce value greater than the expected one) would depreciate the peso/dollar rate since it is a good sign of the US economic conditions. However, when we look at the peso/dollar movements immediately after a positive surprise, we actually see an appreciation. The most reasonable explanation for this is that in the aftermath of the recent financial crisis the Fed’s decision of tapering QE greatly depends on the positive performance of this particular indicator. 4 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET term. To our knowledge, there is no intraday study that analyzes news effects on the price of any asset related to the Mexican economy, and in particular on the peso/dollar exchange rate. Cermeño and Solis (2011), present an empirical evaluation of the link between the releases of macroeconomic announcements and the stock market. In their analysis they use daily returns of a portofolio composed of shares from the Mexican Stock Market. However, Ederington and Lee (1993) suggest that data even with a one hour frequency are of too low frequency to accurately measure the effect of news on volatility asset returns. Regarding the effect of US announcements our results are quite consistent with prior related work: Volatility increases immediately after the arrival of unexpected information and dissipates gradually. Balduzzi et al. (2001) and Andersen et al. (2003) find that US news announcements are the most important ones measured by the induced effect in asset prices. Our findings in this particular aspect may be viewed as providing confirmation to their work. Along these lines, James and Kasikov (2008) conclude that US indicators have a greater impact on market movements compared to the effect caused by data from countries such as Japan, Switzerland or the European Union. The rest of the paper is organized as follows. In section 2 we provide an analysis of the database and a characterization of both intraday peso/dollar exchange rate returns as well as their volatility in the period under study. We also describe the basis of the macroeconomic variable expectations and realizations contemplated in the study. In section 3, we explain the methodology we employ to calculate the seasonal component of peso/dollar exchange rate return volatility. This variable serves as control on the econometric model we describe in section 4, which details the exercises we present to evaluate the impact of unexpected information about macroeconomic fundamentals on the volatility of the exchange rate returns. The conclusions appear in section 5. 2. D ATA D ESCRIPTION This study uses intraday peso/dollar exchange rate returns as well as data regarding US and Mexican macroeconomic expectations and realizations. In subsection 2.1 we describe how we constructed the high frequency peso/dollar exchange rate database and we provide a basic statistical description of their returns and volatility. In subsection 2.2 we describe the database we used regarding the macroeconomic variables. 2.1 E XCHANGE R ATE Our primary data set consists of 5-minute returns of the peso/dollar spot exchange rate and we obtained it from Olsen & Associates (O&A).4 The entire sample extends from January 1, 2005 to November 30, 2012, for a total of 832, 608 (= 2, 891 days ⇥ 288 minute intervals per day) high frequency foreign 4 Dacorogna et al. (1990), Andersen and Bollerslev (1998) and Andersen et al. (2003) are some of the studies that have employed data from this firm. For an exhaustive list, see http://www.olsendata.com/about_us/research/ R OBERTO G ÓMEZ C RAM 5 exchange return observations. As in Dacorogna et al. (1990) and Andersen et al. (2003), we use all the interbank quotes that appeared in the Reuters screens during the sample period to construct our 5-minute returns. Each quote consists of a bid and an ask price together with the time it was registered to the nearest second. For each day, t, and for each five minute interval, n, we obtained the median of the average of the bid and ask prices, Pt,n . This data was filtered by O&A for outliers and other anomalies.5 Out of the entire 832, 608 sample observations, in 386, 398 cases no interbank quote was registered while in the remaining 446, 210 observations a total of 24, 783, 660 quotes were recorded. When we analyze the number of quotes registered for the entire sample, we realize that the market activity is similar throughout the week and each day’s trading patterns are consistent with the exception of weekends and Friday evenings (Saturday in Asian markets), when activity diminishes considerably. As a result of this, we restrict the sample in order to obtain the 5-minute returns. In line with Andersen and Bollerslev (1997), we explicitly exclude the quotes registered on weekends; all observations between Friday, 21:05 hours Greenwich Mean Time (GMT) and Sunday 21:00 GMT were not taken into account. As we previously mentioned, this particular definition of the weekend is primarily in response to the activity patterns observed in the exchange market and keeps the daily periodicity intact (see Bollerslev and Domowitz (1993)). In addition, we did not take into account several non-working days, including Christmas, New Years, Constitution Day, Benito Juárez’s Birthday, Easter Thursday and Friday, May Day, Mexican Independence Day, Day of the Dead, Day of the Mexican Revolution and Virgin of Guadalupe Day. With respect to the US calendar, we removed the 4th of July, Labor Day, Thanksgiving Day, and Memorial Day.6 Although our cuts do not account for all of the holiday market slowdowns, we think that we capture the most important daily calendar effects. We obtain our 5-minute returns in the subinterval n of day t, Rt,n , using the logarithmic difference between the price registered in two contiguous Pt,n subintervals, that is, Rt,n = log( Pt,n )100. To that end, we did not include 1 the subintervals for the days in which no quote was registered or they were registered in an isolated manner. As is standard in the literature, we measure the exchange rate volatility, Vt,n , by means of the absolute return values. In the end we are left with to 1, 999 days of data, containing 390, 371 highfrequency peso/dollar exchange rate return observations, which equal to 97% of all quote prices observed during the reference period. A basic statistical description shows that the 5-minute returns are not significantly different from zero. Furthermore, we observed that they are not normally distributed. They are approximately symmetric, however, they exhibit excess kurtosis. At the 5 Given that prices are indicative and not necessarily trading prices, there is a need to filter them as the quotes are not binding, thus raising the possibility that frivolous or erroneous prices might appear. This problem is especially severe when we are dealing with high frequency data as the risk of an input error increases. 6 On all these days, we cut from 21:05 GMT the night before to 21:00GMT that evening. 6 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET same time, the maximum and minimum returns registered in the sample were 2.96% and -3.24%, respectively, which does not suggest the presence of pronounced returns discontinuities. The ‘robusticized’ Box-Pierce statistic, Q⇤K , suggests the existence of a serial correlation both in returns and absolute returns.7 This serial correlation is consistent with the one found in other studies that analyze the returns on various types of exchange rates at similar frequencies (see for example Bollerslev and Domowitz (1993) and Andersen et al. (2003)). This is principally due to the fact that market activity is very similar in contiguous time intervals given that price changes are registered in a relatively brief period of time. For instance, we computed Q⇤K for the 10-minute returns and we are not able to rejected the null hypothesis of white noise. In order to evaluate the intraday frequency of exchange rate absolute returns, Figure 1a displays their sample average for each 5-minute subinterval in the day. Significant differences in volatility can be seen, ranging from 0.010% at 3:30 GMT (interval 47) to 0.054% at 12:30 GMT (interval 151). This pattern is similar to the ones calculated by other authors in relation to other currencies8 and is closely linked to the cycle of market activity. Volatility begins at a relatively high level followed by a slow decay. Volatility increases around 6:00 GMT (interval 73) as activity intensifies with the opening of the European markets and the mid-day session, following the lunch hour, in Tokyo and Hong Kong. Thereafter, volatility remains constant until the European lunch hour at 11:30 GMT (interval 139) before increasing considerably with the overlap of activity in Europe and arrival of Mexico and the United States to market at around 12:00 GMT (interval 145). After the close of markets in Europe, volatility decreases monotonically.9 In contrast, the sample average of the returns for each 5-minute subinterval in the day, are centered around zero and there is no evidence of a systematic peso/dollar exchange rate appreciation or depreciation. In order to assess the economic relevance of the temporal dependencies in the absolute returns series, Figure 1b shows their sample autocorrelations up to a day (288 lags). The sample autocorrelation of absolute returns are surprisingly regular, they display a slow decay and pronounced diurnal variations, which forms a U.10 On the other hand, the raw returns, only display statistically significant serial correlation in the first lag. This intraday return and 7 In practice, the statistic Q⇤ (see Lobato et al. (2001)) is preferred over the Box-Pierce or LjungK Box test, Q, given that it is robust to conditional heteroskedasticity. Concretely, it is defined as P PT ⇢ ˆ2 Q⇤K = T K ˜2j , in which ⇢˜2j = j with ⌧ˆj = ˆ12 ( T1 Ȳ )2 (Yt j Ȳ )2 ), and j=1 ⇢ t=1+j (Yt ⌧ ˆj 0 under the null hypothesis (H0 : ⇢1 =⇢2 =...=⇢K =0) Q⇤K !d 2K . We computed the statistic for different values of K and all suggest the existence of a serial correlation in returns as well as in their absolute value. 8 See, for example, Anderson and Bollerslev (1997). 9 It is important to mention, that we observe the same pattern over the course of the week, with the greatest volatility when markets in Europe, the United States and Mexico are open. In the same way, volatility diminishes at the end of the day and revives when markets reopen on the next day. 10 The behavior of the sample autocorrelation throughout the week (up to 1,405 lags) is similar to what we observed in Figure 1b, with the cycle remaining notably regular. R OBERTO G ÓMEZ C RAM 7 F IGURE 1: AVERAGE AND C ORRELOGRAM OF I NTRADAY V OLATILITY OF R ETURNS Avg. Volatility (%) 0.06 a) 0.04 0.02 0 0 0.5 100 150 Five Minute Interval 200 250 50 100 200 250 b) 0.4 Correlation 50 0.3 0.2 0.1 0 0 150 Five Minute Lag Note: This figure shows average 5-minute peso/dollar exchange rate return volatility (Fig. 1a, 288 observations) and the sample correlation over the course of the day (Fig. 1b, up to 288 lags). The period under study extends from January 2005 to November 2012. T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET 8 volatility patterns for the peso/dollar exchange rate are consistent with those reported in the more detailed analysis of Dacorogna et al. (1993), Anderesen and Bollerslev (1997) and Andersen et al. (2003) for various types of exchange rates. While this intraday volatility patterns may be irrelevant for standard studies of the return dynamics based on observed prices in daily or monthly frequencies, empirical studies on return volatility at such high-frequencies are probably subject to severe distortions given the strong periodicity observed in Figure 1. The pronounced fluctuations in the absolute return correlogram provide a first signal of how inconvenient it is to directly model intraday return volatility based on ARCH models, just as Andersen and Bollerslev (1997) noted, a conclusion that this study reaches in relation to the peso/dollar exchange rate. Standard ARCH models imply a geometric decrease in the autocorrelation structure of the returns and simply cannot accommodate the regular cycle in the pattern shown in Figures 1. We address this issue in the next section. Before we move on to the next subsection in which we describe the US and Mexican economic news announcements, it is important to mention that a possible disadvantage of our data set is that we use quotation prices rather than transaction prices. As a result, it is not possible to obtain trading volume data or information about the quantity of buying and selling conducted at any point in time. This makes it impossible to study the joint dynamics between volume and prices, or order flow and prices. However, Danielsson and Payne (2002) find that the basic characteristics of returns calculated based on those quote prices are tightly related with those that can be obtained from transaction prices, which are generally not available in the foreign exchange market. In addition, we are implicitly assuming that our quotes are representative of all transactions on a global scale. 2.2 M ACROECONOMIC F UNDAMENTAL E XPECTATIONS AND R EALIZATIONS In this subsection we describe the expectations and announcements used to construct the surprises about the macroeconomic fundamentals under consideration. In addition, we analyze the prospect that the expectations of those surveyed did not contain valuable information about the forecasted variable or that they are biased, a possibility that we discarded. We obtain the expected and realized macroeconomic fundamentals related to the US and Mexican economies from Bloomberg. Agent expectations were drawn from the surveys conducted with various agencies and the median forecasts, the standard deviation and the number of those surveyed for each survey are reported.11 Usually the surveys are conducted two weeks prior to the pub11 It was not possible to obtain from the survey the standard deviation for 5 US macroeconomic variables and 2 for Mexico, so an approximation was made based on the difference between the high and low values reported and were divided by six. For the United States the cases were: FOMC Rate Decision, GDP QoQ (Annualized), Consumer Confidence from the University of Michigan, Personal Consumption, Nonfarm Productivity. For Mexico they were Bi-Weekly CPI and the Bi- R OBERTO G ÓMEZ C RAM 9 lication of the announcement and those polled can modify their estimates up to 5 minutes before the news is released. We employed 36 economic variables that measure different fundamentals of the US economy, as well as 15 for the economy of Mexico. Overall, we used 3,452 expectations and corresponding macroeconomic news items in the case of the United States and 1,192 for Mexico. On average, for each announcement, 57.5 economic institutions were interviewed for the United States and 12.7 for Mexico. Tables 1 and 2 provide a brief descriptions of the announcements, which are divided into eight categories according to the economic sector to which they refer: real activity, consumption, investment, government, foreign trade, prices, forward-looking and monetary announcements. Within each of these categories, we listed each macroeconomic indicator in the order of each one’s relative importance.12 Tables 1 and 2 list for each macroeconomic variable that we employed (Announcement), the agency in charge of its publication (Source), the range of publication dates (Date), the frequency with which is released (Freq.), the time of the day in which it is published Mexico City time (Hour), the total number of observations (Obs.) as well as the average number of analysts surveyed for each economic variable in question (Nr.). In the United States, 17 announcements are made at 7:30 am; two at 8:15 am; 13, at 9:00 am and four more announcements at 8:45 am, 1:00 pm, 1:15 pm and 2:00 pm, respectively. In the sample used, a change to the hour of publication was made for two indicators and most of them appear on a monthly basis. In contrast, 12 announcements in Mexico are published at 8:00 am, and another three at 9:00 am, 12:00 pm and 2:30 pm, respectively. Eleven of the indicators are monthly, three quarterly and one is release every 15 days. The hour of publication changed twice in the case of 12 announcements and once in the case of another indicator. The announcements in the sample tend to be published at the end of the week and uniformly in the months over the course of the year, with the only exception being the month of December in which there are fewer publications on average. Lastly, the distribution of the announcements is similar in each of the countries considered. Before we turn to describe the estimation of the seasonal component that we use as a control variable in section 4, it is worthwhile analyzing the possibility that the Bloomberg forecasts may not capture all information regarding the announced value. This is important since information still arrives between the time the forecast is done and the time the macroeconomic variable is published; hence there exists the possibility that the expectations are outdated. In order to assess if the Bloomberg forecasts are systematically biased, we estimated the following regression: weekly Core CPI. 12 Bloomberg assigned to each macroeconomic announcement a number between 0 and 1 according to the relative quantity of alert subscriptions that exist in each country. The bigger the number, the greater the number of subscribers. We used this variable as criteria for assigning the relative importance for each announcement. 10 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET ek,t = k + uk,t (2.1) Where ek,t is the error of the median forecast for announcement k and it is measured by the difference between the announcement value, Akt,n , and the k market expected value, Et,n , for each indicator k published in the five minute interval n on day t. Under the null hypothesis, H0 : k = 0, the Bloomberg forecasts are systematically unbiased. On the other hand, if k is positive (negative) and statistically different from zero the forecast errors have a positive (negative) bias, so that the forecasts systematically underestimate (overestimate) the macroeconomic variable of interest. Table 3 shows the estimates of equation (1) using robust standard errors.13 For 31 out 36 variables for the United States, it is not possible to reject the hypothesis that k is equal to zero and for Mexico in all cases we reject the null hypothesis. This suggests that the surveys contain real information regarding the forecast variable in question and in most cases, the survey is not biased. Despite the results we report in this section and given that in section 4 we use arrivals of unexpected information about macroeconomic fundamental rather than the survey per se, errors may exist in measuring the surprise. These errors, without a doubt, may bias our estimations. In addition, we are assuming that the survey is representative of market expectations and while we are not including all US and Mexican economic indicators, we think we are considering the most important ones. 3. S EASONAL C OMPONENT This section explains the methodology we use to estimate the seasonal component of peso/dollar exchange rate return volatility. This variable will serve as control in the econometric model described in the following section that quantifies the volatility impact of the arrival unexpected information about US and Mexican macroeconomic fundamentals. In this paper, we use the theoretical framework of Andersen and Bollerslev (1997)14 in order to deseasonalize the volatility series. In general, they assume that the volatility process is driven by the simultaneous interaction of the components associated with calendar effects, intraday cyclical patterns and an unobserved, persistent, latent factor. Given their theoretical framework, it is possible to use standard regression techniques to simultaneously account for each volatility component separately with the objective of isolating the dynamic behavior of volatility around each macroeconomic announcement surprises. 13 Since the surveys are conducted at most two weeks prior to the publication and given that the forecaster will know the most recent value of the variable that she will try to predict in future surveys, it is considered that the forecast errors do not have an autocorrelation structure, such as a moving average, and therefore there is no need to controlled by it in equation (1). 14 Various studies have adopted the same method for modeling the periodic structure of intraday exchange rate volatility. See, for example, Dominguez (2006). R OBERTO G ÓMEZ C RAM 11 Andersen and Bollerslev (1997) decompose the five-minute returns into the following expression: t Zt,n (3.1) 1 N2 where E(Rt,n ) denotes the unconditional mean, so that Rt,n E(Rt,n ), measures the excess returns, st,n represents the periodic component for the nth intraday interval on the trading day t, t is a daily volatility factor and Zt,n is an i.i.d. mean zero unit variance innovation term and N refers to the number of return intervals per day. Given the lack of consensus on the sort of theoretical framework that could serve as a guide to stipulate a particular parametric form for the periodic structure of intraday exchange rate volatility, a flexible parametric procedure seems natural. Following Andersen and Bollerslev (1997), and defining xt,n from equation (2) as: Rt,n xt,n ⌘ 2 log[|Rt,n E(Rt,n ) = st,n E(Rt,n )|] log( 2 t) 2 + log(N ) = log(s2t,n ) + log(Zt,n ) (3.2) the modeling approach is then based on a non-linear regression in the intraday time interval, n, and the daily volatility factor, t2 xt,n = f (✓; t , n) (3.3) + ut,n 2 2 in which the error term, ut,n ⌘ log(Zt,n ) E(log(Zt,n )) is i.i.d. mean zero. In practice, given the strong seasonal pattern in the five-minute rate volatility (see Fig. 1), it appears appropriate to approximate the non-linear regression function f (✓; t , n), by means of the following Fourier series introduced by Gallant (1981): f (✓; t , n) = J X j t [µ0 + µ1 i=1 µ2 n + N1 D n2 X + N2 i=1 i n=di + P X p=1 ( p cos( pn2⇡ )+ N p sin( pn2⇡ ))] N (3.4) where N is the number of returns intervals per day, N1 ⌘ N2+1 and N2 ⌘ (N +1)(N +2) are normalizes constants, P determines the order of expansion of 6 the Fourier series and J 1 allows for an interaction effect between t and the shape of the periodic pattern. The Fourier’s flexible form is parameterized by quadratic components, (with coefficients µ0 , µ1 and µ3 ), a number of sinusoids, (with coefficients p and p ) and time-specific dummies (the i coefficients) that take into account certain intraday intervals that do not adjust with the general periodic behavior of exchange rate volatility. The estimation involves a two-step procedure. First, it is necessary to generate xt,n , call it, x̂t,n , by replacing E(Rt,n ), in equation (3) with the sample mean of the returns and t for the estimate from a daily volatility model. By making 12 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET this substitution and treating x̂t,n as the dependent variable in the regression defined by equations (4) and (5), the parameters of interest can be estimated by ˆ ˆ , n) as the result of the previous ordinary least squares. Defining fˆt,n ⌘ f (✓; estimate and normalizing, the estimator of the intraday periodic component for the interval n on day t is given by, ŝt,n = P T T · exp( PN t=1 fˆt,n 2 ) n=1 exp( fˆt,n 2 ) (3.5) in which T is the number of days of the sample. In this paper, the daily volatility factor, t , is estimated from a MA(1)GARCH(1,1) model, using daily peso/dollar exchange rate returns over the course of 2, 252 days between January 2004 and December 2012. Intuitively, t , tries to capture the level of average volatility over the course of day t and it makes sense to construct it based on ARCH models as it has been shown that they provide good approximations of daily volatility in asset return.15 We include the MA(1) term to take into account the significant, first-order autocorrelation in daily returns.16 We determined the number of interaction terms J (J = 0) and the order of the Fourier expansion P (P = 8) using the Schwarz and Akaike information criteria.17 Since J = 0, the periodic seasonal component, ŝt,n , is simplified to ˆ exp( f2n ) ŝn = P in which fˆn and hence ŝn no longer depends on day t. In adˆ N n=1 exp( f2n ) dition, we used indicative variables for the opening and closing of markets in Tokyo, London and New York. Figure 2 depicts the observed volatility and the dotted line denotes the estimated intraday periodic component, ŝn , which does a god job in approximating the periodicity of intraday volatility in peso/dollar exchange rate returns. 4. P ESO / DOLLAR AND F UNDAMENTALS This section analyzes whether movements in the peso/dollar exchange rate are linked to fundamentals. To that end we measure the immediate effect on return volatility of unexpected information about macroeconomic fundamentals. The results of this section suggest that peso/dollar exchange rate movements are not linked in the short term to Mexican macroeconomic fundamentals; however, there is strong evidence of a close relationship with US fundamentals. To gauge that relationship we conducted an additional exercises were we examine 15 For a summary of GARCH models see Bollerslev, Chou and Kroner (1992). is important to mention that this first order autocorrelation in the returns is not significant if we use robust standard errors. 17 Andersen et al. (2003) finds that J = 0 and P = 4 properly adjusts exchange rate data for Deutsche Mark /dollar, pound sterling /dollar, Japanese yen/dollars and Swiss francs /dollars. Andersen and Bollerslev (1997, 1998) choose J = 0 and P = 6 for Deutsche marks/dollars. Alternatively, Dominguez (2006) uses J = 0 and P = 8. 16 It R OBERTO G ÓMEZ C RAM 13 F IGURE 2: AVERAGE I NTRADAY V OLATILITY AND F OURIER A PPROXIMATION 0.06 Volatility Seasonal Component Avg. Volatility (%) 0.05 0.04 0.03 0.02 0.01 0 0 50 100 150 Five Minute Interval 200 250 Note: This figure shows average 5-minute volatility in the peso/dollar exchange rate over the course of the day (288 observations) and the dotted line shows the average estimate seasonal performance. The period under study extends from January 2005 to November 2012. 14 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET how persistent the effect is.18 As a check on the robustness of the results we present in this section, we conducted the same exercises for two different time periods. Those additional exercises were needed primarily because the sample period under consideration includes two major events that could affect the obtained results: the financial crisis of December 2007 to June 200919 and the period when Mexico joined the Continuous Linked Settlement System (CLS).20 The first of these periods extends from January 2005 to November 2007 while the second extends from December 2007 to November 2012. There was no qualitative change in results between the two timeframes although the effect of some indicators was more pronounced in the second period. However, as volatility in exchange rate returns increased considerably in the second of these time periods,21 we estimate the seasonal component separately for each period, which is to say, ŝn = ŝ1n 1 + ŝ2n 2 , in which ŝjn is the estimated periodic component for the period j and j is a dummy variable that takes the value of one in period j and the value of zero in another case with j✏{1, 2}. 4.1 C ONTEMPORANEOUS V OLATILITY R ESPONSE The first exercise consists of quantifying the peso/dollar exchange rate volatility response immediately after the arrival of unexpected information from various announcements, which is measured by the difference between the ank nouncement value, Akt,n , and the market expected value, Et,n , for each indicator k published in the five minute interval n on day t. This difference is stank dardized by means of the standard deviation of each particular survey, t,n . Which is to say, 'kt,n = Akt,n k Et,n k t,n . (4.1) Use of standardized news facilitates the comparison of the responses of the volatility to different economic variables. In this case, this is especially important because units of measurement vary across macroeconomic indicators. Balduzzi et al. (2001), Andersen et al. (2003) and Evans and Lyons (2005) also use standardized news, however, those works standardize the error of median k forecast, Akt,n Et,n , for each indicator k by means of its historical standard deviation. The principal motivation that led these authors to use standardized 18 We conducted the same exercise for the Mexican indicators, however, we did not find a significant effect. 19 This period was chosen based on the dates published by the National Bureau of Economic Research. 20 CLS plays a fundamental role in the foreign exchange (FX) market. Their stated mission is to enhance financial stability by providing risk mitigation services to the global FX market. The Mexican peso, joined in May 2008. 21 The increase in volatility in peso/dollar exchange rate returns in the second period was confirmed by the test of Levine’s equality of variances, which is robust under non-normality. There is evidence to reject the null hypothesis of equality of variance between these two periods with a 95% level of significance. R OBERTO G ÓMEZ C RAM 15 news is to compare the effect between announcements and not under information criteria. By considering the dispersion of agent beliefs regarding each announcement in a specific time period, it is possible to achieve a more precise measure of the information that is really arriving the market.22 Operationally, we estimate the effect by regressing the exchange rate return volatility Vt,n on the arrival of unexpected information, 'kt,n , by means of the following econometric model: Vt,n = ↵0 + ↵1 ŝn + 2 X i=1 i i + X k k k |'t,n | + "t,n (4.2) where ŝn is the volatility seasonal component estimated for the nth interval of the day and "t,n is the error term. We estimate equation 8 via ordinary least squares using heteroskedasticity and serial correlation consistent (HAC) standard errors. To that end, we use the kernel proposed by Newey-West (1987) to estimate the asymptotic variance of estimators. In addition, we use dummy variables of the recent financial crisis, 1 , as well as the period when Mexico joined the CLS indicated by 2 .23 We report the results in Table 4. As seen in Table 4, many US indicators (23 of 36) have a significant and positive effect on volatility. It is important to note the instantaneous volatility effect generated by the arrival of unexpected information from ten macroeconomic news items. A surprise of one standard deviation in the case of Change in Nonfarm Payrolls increases volatility in 0.0700%, an effect followed in level of intensity by surprises of the same magnitude in the Unemployment Rate (0.0637%), Consumer Price Index (0.0310%), Construction Spending (0.0208%), the ISM Manufacturing (0.0202%), Advance Retail Sales (0.0198%), Consumer Confidence (0.0146%), Leading indicators (0.0145%), Existing Home Sales (0.0135%) and Durable Goods Orders (0.0129%).24 With regard to the surprise effect, for example, from Change in Nonfarm Payrolls, an increase of 0.07% is a sizeable move, from both a statistical and economic perspective. On the statistical side, only less than 8.1% of the sample registered a value greater or equal to 0.07%. From an economic perspective, 0.07% is relatively high compared to the sample’s average peso/dollar spread of 0.008. It is important to note that the similarity between distinct macroeconomic indicators that are published over the course of a month leads to a certain redundancy of the information transmitted to the market. Agents observe the value of the first publications and based on that information they adjust their 22 As a robustness check, the same definition of news was used as that of Balduzzi et al. (2001), Andersen et al. (2003) and Evans and Lyons (2005). The general results were maintained; however, all the estimated coefficients are greater under their definition of news and in one case (Nonfarm Productivity) the estimated effect proved significant that had not been previously. 23 1 takes the value of one if day t is contained in one of the days between December 2007 and June of 2009 and the zero value on another occasion. Similarly, 2 takes the value of one as of May of 2008 and the zero value on another occasion. 24 All these coefficients are significant at 1 %, see Table 4. 16 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET expectations of subsequent indicators that evaluate the development of similar segments. As a result of this learning, agents in the market are capable of improving their predictions regarding future announcements so that deviations in expectations relative to those announcements tend to narrow, thereby diminishing the impact on volatility. This could be a possible explanation of why it was shown that surprises in labor market indicators (Change in Nonfarm Payrolls and the Unemployment Rate) have a greater effect on return volatility relative to the estimated impact of other indicators. Change in Nonfarm Payrolls and the Unemployment Rate are some of the first hard data (e.g. information not gleaned from surveys), that are published at the start of the month immediately following the one to which the data refers. Agents can use this information to infer whether it had been a good or bad month for the economy and update their expectations regarding the rest of the macroeconomic news. On the other hand, the greater effect that was uncovered in the case of a surprise in Change in Nonfarm Payrolls relative to the Unemployment Rate may be a result of the fact that the first announcement is a variable that more precisely gauges labor market behavior, given that it is not contaminated by the economically active population, which is the denominator of the Unemployment Rate.25 Along these lines, Advance Retail Sales data is used as a leading indicator of what consumers are spending (Personal Consumption), so that one would expect the market to react more aggressively to the first indicator. This can be confirmed by comparing the estimated coefficient of both indicators; that of retail sales is significantly greater than that of personal consumption to standard levels of significance. A second example is that of Durable Goods Orders and Factory Orders; despite their being distinct, they are closely related26 and, given that Durable Goods Orders are published earlier in the month, the information obtained from that index can reveal certain information about Factory Orders. When we compare the effect of these two indicators, it is possible to observe how the former variable has a significant impact on volatility. In a similar vein, it is possible to compare the effect on volatility of the ISM Manufacturing and Industrial Production, which appears two weeks after the former of these two indicators. In sharp contrast to the large number of US macroeconomic indicators whose surprises affect the peso/dollar rate, no Mexican macroeconomic indicator has a significant effect at the 5% level and only one variable, Consumer Prices, is significant at 10%. Andersen et al. (2003), analyze a similar problem and find that most of the US macroeconomic news under consideration significantly affect Deutsche mark/dollar exchange rate returns, however, only two German macroeconomic 25 Note that the Unemployment Rate can vary due to changes in the number of people unemployed as well as to the size of the economically active population, as well as movement in both variables. 26 Factory Orders are an economic indicator for which dollar totals are reported for new orders for both durable and nondurable goods. The Factory Orders indicator is usually released two weeks after the publication of data on Durable Goods Orders. R OBERTO G ÓMEZ C RAM 17 variables (M3 and Industrial Production) have a significant effect. They conjectured that the disparity may be due the fact that the release time of US macroeconomic announcements are known exactly (day and time) but only inexactly for Germany (day but not time). Uncertainty regarding the hour of publication can contribute to a reduction in market liquidity and in trading around the time of the announcement, which would also undercut the effect the information exerts in this window of time, which ultimately leads to a more gradual adjustment of volatility following publication. However, this is not the case for the Mexican indicators as the exact day and time of publication is made known beforehand and the announcement for the same indicator has been made recurrently at the same time, as can be seen in Tables 1 and 2. Alternatively, it could be that the measure of information used is not fine enough to detect the effect of Mexican macroeconomic variable surprises on peso/dollar exchange rate volatility. This may be due, in part, to the considerably lesser number of survey respondents Bloomberg polls on the Mexican economy as opposed to those it surveys in relation to United States indicators, as Tables 1 and 2 indicate. That disparity could affect the representativity of the surveys. However, this is a controversial point as the analysis presented in section 2.2 suggests that the surveys on Mexican announcements contain information and in all cases they are not biased. Another possible explanation for why a significant effect was not found is that, according to the predictions of the theory of rational expectations, relevant unexpected shocks in economic fundamentals ought to affect the pesodollar exchange rate. This suggests that when financial agents manage their portfolios they assign more weight to the performance of the United States economy relative to the Mexican economy. In this sense it is worth recalling that most of the Mexican pesos trade takes place outside of Mexico.27 Lastly, note that the estimated coefficients for the crisis of December 2007 to June of 2009 and Mexico’s incorporation to the Continuous Linked Settlement significantly increased exchange rate volatility, however, in most cases the increase is less than the estimated by the arrival of US unexpected macroeconomic fundamental information. Before moving on to the next exercise, in which we measure the persistence of the effect on volatility of surprises, it is necessary to clarify the potential existence of at least two econometric problems that are cause for concern: multicollinearity and endogeneity. However, we believe that neither of these problems appear in this study. Although we use variables that share the same day and hour of publication, such as occurs with a pair of US announcements, there is no serious problem of multicollinearity as the announcements measure different segments of both the US and Mexican economies and the correlation between surprises from these 27 For instance, the 2010 Triennial Central Bank Survey of Foreign Exchange and Derivatives Market Activity reported by the Bank of International Settlements posits that 67% of the Mexican peso trade was made outside of Mexico. 18 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET variables is close to zero.28 Neither does there appear to be a problem of endogeneity given that the announcements published in period t measure various aspects of the economy that occurred in t 1, while return volatility occurs in t. On the other hand, it is possible that volatility in t 1 may affect some aspect of the economy in t. For example, exchange rate return volatility in t 1 could affect the trade balance in t as the exchange rate appreciates or depreciates with their possible effect on imports and/or exports. These changes would be reflected in the publication of the corresponding announcements. Nevertheless, agents will take into consideration this factor at the moment they report between the period t 1 and t their expectations regarding the variable in question and considering that this study contemplates surprises and not announcements, this potential source of endogeneity is discarded. 4.2 P ERSISTENCE OF V OLATILITY In the previous subsection, we found evidence in favor of a contemporaneous effect on peso/dollar exchange rate volatility from unexpected information from a majority of the US indicators included in this study. From there, a natural next step is to analyze the persistence of that effect in volatility. To measure the persistence of volatility in response to the arrival of unexpected information we employ the same definition of variables in subsection 4.1 and we estimate the following regression: Vt,n = ↵0 + ↵1 ŝn + 2 X i=1 i i + XX k i k k,i |'t,n | + "t,n (4.3) where k,i now represents the effect of a one standard deviation surprise from the indicator k on volatility in i (i=1,...I) periods going forward. Once again, just as in equation (8) we use HAC standard errors. After experimenting with different values of I, we arrived at the conclusion that I=12 is sufficient to measure the persistence in volatility. We experimented with negative values of I to consider the possibility that the surveys published by Bloomberg failed to capture all the available information prior to the announcement, however, this proved to be unnecessary. This conclusion is in line with the findings of Balduzzi et al. (2001) that MMS surveys capture all available information immediately prior to the announcement. In theory, volatility can increase before the realization of the announcement. This can happen if the arrival of the information helps to clear up certain uncertainties and/or disagreements among market participants. This would stoke volatility before the announcement just as Pasquariello (2007) suggests. Our results are more in line with the analysis of Ross (1989), which suggests that in an arbitrage free economy, price volatility is related to the arrival of information in efficient markets, so it is expected that the effect on volatility will be 28 The indicators that are published at the same time on the same day are Changes in Nonfarm Payrolls and the Unemployment Rate; Personal Income and Personal Consumption; Industrial Production and Capacity Utilization, which have a correlation of -0.04, 0.05 and 0.25, respectively. R OBERTO G ÓMEZ C RAM 19 greater following the news announcement. Figure 3, shows the results of the regression and the confidence interval at 95% for each indicator considered. The figure shows that the rise in volatility occurs not only during the exact moment of the realization of the news but also extends through various minutes thereafter. This means that volatility adjusts gradually rather than abruptly, although the most pronounced effect is contemporaneous. On average, the effect is statistically significant, indicators do not have an impact on volatility before the release of the announcement and conditional on being significant, the effect lasts on average 15 minutes following the publication. It is worth noting the persistence of the effect on volatility of a standard deviation surprise from Change in Nonfarm Payrolls; exchange rate return volatility provoked by this variable endures as long as 50 minutes following its release. Lastly, Table 5 shows both the persistence of increased volatility in response to the surprise as well as the accumulated effect for each considered variable. It is worth emphasizing that the accumulated effect of the Change in Nonfarm Payrolls and in the Unemployment Rate, whose effect is more than 0.1% 5. C ONCLUSION This paper analyzes the effect of unexpected information about macroeconomic fundamentals on the volatility of the 5-minute returns of the peso/dollar exchange rate. To that end we employed peso/dollar exchange rate quotations generated in the interbank market. The database used for the expectations of agents regarding published macroeconomic news made it possible to capture the surprise component of an announcement in order to quantify its effect on the exchange market. Due to the high-frequency of the data, it is necessary to control for the seasonal component of peso/dollar exchange rate return volatility. We did not find evidence to support the idea that peso/dollar exchange rate movements are linked in the short term to Mexican macroeconomic fundamentals though we find evidence in favor of a close linkage with the US macroeconomic variables. Most of the US macroeconomic news considered in the study have an immediate effect on the peso/dollar exchange rate volatility and this impact lasts for 15 minutes on average. This finding is in line with the hypothesis of market efficiency in which actual asset prices incorporate past as well as breaking news so that the exchange rate ought to rapidly adjust to a new value with the arrival of relevant new information. In addition, we indentify the most important announcements in terms of their potential effect on the exchange rate. In descending order of importance, the most significant impact comes from surprises in Changes in Nonfarm Payrolls, in the Unemployment Rate, Consumer Price Index, Construction Spending, the ISM Manufacturing and in Advance Retail Sales. 20 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET R EFERENCES [1] Andersen, T., & Bollerslev, T., (1997) “Intraday Periodicity and Volatility Persistence in Financial Markets,” Journal of Empirical Finance 4, 115-158. [2] Andersen, T., & Bollerslev, T., (1998) “Deustche mark-dollar Volatility: Intraday Activity Patterns, Macroeconomic Announcements, and Longer-Run Dependencies,” Journal of Finance 1, 219-265. [3] Andersen, T., Bollerslev, T., Diebold, F.X. & Vega, C. (2003), “Micro Effects of Macro Announcements: Real-Time Price Discovery in Foreign Exchange,” American Economic Review, 93, 38-62. [4] Balduzzi, P., Elton, E.J. & Green, T.C. (2001), “Economic News and Bond Prices: Evidence From the US Treasury Market,” Journal of Financial and Quantitative Analysis, 36, 523-543. [5] Bollerslev, T., Chou, R.Y. & Kroner, K.F. (1992), “ARCH Modeling in Finance: A Selective Review of the Theory and Empirical Evidence,” Journal of Econometrics, 52, 5-59. [6] Bollerslev, T. & Domowitz, I. (1993), “Trading Patterns and Prices in the Interbank Foreign Exchange Market,” Journal of Finance, 48, 1421-1443. [7] Cermeño, R., & Solís, P. (2011) “Impacto de Sorpresas Macroeconómicas de México y Estados Unidos sobre el Mercado Accionario Mexicano, ” EconomÌa Mexicana Nueva . . . poca, XXI, 35-67. [8] Dacorogna, M.M., M¸ller, U.A., Naglerm R.J., Olsen, R.B. & Pictet, O.V. (1993), “A Geographical Model for the Daily and Weekly Seasonal Volatility in the Foreign Exchange Market,” Journal of International Money and Finance, 12, 413-438. [9] Danielsson, J. & Payne, R. (2002), “Real Trading Patterns and Prices in Spot Foreign Exchange Markets,” Journal of International Money and Finance, 21, 203-222. [10] Dominguez, K. (2006) “When do Central Bank Interventions Influence Intra-Daily and Longer-Term Exchange Rate Movements?” Journal of International Money and Finance 25, 1051-1071. [11] Ederington L. & Lee, J. (1993), “How Markets Process Information: News Releases and Volatility,” Journal of Finance, 48, 1161-1191. [12] Evans, M., & Lyons, T. (2005), “Do Currency Markets Absorb News Quickly?” Journal of International Money and Finance 24, 197-217. [13] Gallant, A. (1981), “On the Bias in Flexible Functional Forms and an Essentially Unbiased Form: The Fourier Flexible Form”, Journal of Econometrics, 15, 211-245. [14] Hayashi, R. (2000), “Econometrics", Princeton University Press, Princeton, NJ. [15] James, J. & Kasikov, K. (2008), “Impact of Economic Data Surprises on Exchange Rates in the Inter-Dealer Market,” Quantitative Finance, 8, 5-15. [16] Lobato, I., Nankervis J.C., Savin N. E. (2001), "Testing for autocorrelation using a modified Box-Pierce Q test,” International Economic Review 42, 187-205. [17] Malkiel, B., (1992), “Efficient Market Hypothesis” in Newman, P., M. Milgate and Eatwell (eds.), New Palgrave Dictionary of Money and Finance, Macmillan, London. [18] Newey, W., & West, K. (1987), "Hypothesis Testing with Efficient Method of Moments Estimation,” International Economic Review, 28, 777-787. [19] Pasquariello, P. (2007) “Imperfect Competition, Information Heterogeneity, and Financial Contagion.” Review of Financial Studies, 20, 391-426. [20] Ross, S. (1989), “Information and Volatility: The No-Arbitrage Martingale Approach to Timing and Resolution Irrelevancy,” The Journal of Finance, 44, 1-17. ISM BC BLS FRB BEA ISM ISM ISM FRB FRB BLS BC NAR BEA NAR BEA BC BC BC BC BC CBO ISM Manufacturing Advance Retail Sales Unemployment Rate Industrial Production Personal Income Empire Manufacturing Chicago Purchasing Manager ISM Non-Manf. Composite Capacity Utilization Consumer Credit Nonfarm Productivity New Home Sales Existing Home Sales Personal Spending Pending Home Sales MoM Personal Consumption Durable Goods Orders Factory Orders Wholesale Inventories Construction Spending MoM Business Inventories Monthly Budget Statement BLS BLS BLS ISM Consumer Price Index (MoM) Producer Price Index (MoM) Employment Cost Index ISM Prices Paid Prices BEA/BC BEA/BC Trade Balance Current Account Balance Foreign Trade Government Investment Consumption ETA BLS BEA Source1 Initial Jobless Claims Change in Nonfarm Payrolls GDP QoQ (Annualized) Real Activity Announcement 14/01/2005 - 14/11/2012 28/01/2005 - 31/10/2012 01/03/2005 - 01/11/2012 19/01/2005 - 15/11/2012 12/01/2005 - 08/11/2012 16/03/2005 - 18/09/2012 12/01/2005 - 13/11/2012 27/01/2005 - 27/11/2012 04/01/2005 - 04/10/2012 10/01/2005 - 09/11/2012 01/03/2005 - 01/11/2012 14/01/2005 - 14/11/2012 31/01/2005 - 28/11/2012 23/03/2005 - 19/10/2012 31/01/2005 - 30/11/2012 01/06/2005 - 19/11/2012 30/03/2005 -29/11/2012 31/01/2005 - 30/11/2012 05/02/2008 - 05/11/2012 14/01/2005 - 16/11/2012 07/01/2005 - 07/11/2012 03/02/2005 - 01/11/2012 01/03/2005 - 01/11/2012 13/01/2005 - 14/11/2012 07/01/2005 - 05/10/2012 14/01/2005 - 16/11/2012 31/01/2005 - 30/11/2012 18/01/2005 - 15/11/2012 06/01/2005 - 29/11/2012 07/01/2005 - 05/10/2012 28/01/2005 - 29/11/2012 Date2 United States TABLE 1: N EWS A NNOUNCEMENTS Monthly Monthly Monthly Monthly Monthly Quarterly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Monthly Weekly Monthly Monthly Freq.3 7:30am 7:30am 9:00am 7:30am 7:30am 7:30am 1:00pm 7:30am 9:00am 9:00am 9:00am 9:00am 92 32 83 91 92 27 90 93 90 95 85 90 94 90 90 90 92 97 58 88 92 62 9:00am / 8:45am7 9:00am 8:15am 2:00pm 7:30am 9:00am 9:00am 7:30am 9:00am 7:30am 92 91 88 88 90 88 404 88 94 Obs.5 9:00am 7:30am 7:30am 8:15am 7:30am 7:30am 7:30am 7:30am 7:30am Hour4 72.7 55.2 17.1 76.7 71.5 43.0 30.7 72.7 62.6 33.4 48.3 50.6 69.3 68.3 71.1 29.8 13.8 54.9 70.5 65.3 33.8 63.4 73.9 76.4 77.4 75.4 67.1 48.3 41.3 80.5 76.4 Nr.6 R OBERTO G ÓMEZ C RAM 21 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET 22 INEGI INEGI INEGI INEGI INEGI INEGI INEGI FRB CB UMICH BC CB Source1 04/02/2005-29/05/2009 14/01/2005-07/11/2012 11/01/2005 -12/11/2012 26/01/2005-21/11/2012 20/10/2005-23/11/2012 10/01/2005-16/11/2012 24/05/2005-23/11/2012 03/09/2009-01/11/2012 02/02/2005-24/10/2012 22/02/2005-27/11/2012 21/11/2005 -02/11/2012 19/01/2005-20/11/2012 20/01/2005-21/11/2012 Date2 Bi-Weekly Quarterly Quarterly Monthly Monthly Monthly Monthly Monthly Quarterly Monthly 2:30pm/9:00am/8:00am15 2:30pm/9:00am16 2:30pm 2:30pm/9:00am/8:00am14 2:30pm/9:00am/8:00am9 2:30pm/9:00am/8:00am10 2:30pm/9:00am/8:00am11 2:30pm/9:00am/8:00am12 2:30pm/9:00am/8:00am13 12:00pm 6-Week 1:15pm Mexico Monthly Bi-Weekly Monthly Monthly 2:30pm/9:00am/8:00am17 2:30pm/9:00am/8:00am18 2:30pm/9:00am/8:00am19 2:30pm/9:00am/8:00am20 96 94 104 92 79 138 31 32 95 95 89 87 96 29 35 59 94 184 95 93 Obs.5 7.9 13.5 15.3 16.0 13.5 10.8 12.3 4.7 12.5 15.7 14.2 14.1 14.5 6.4 4.9 86.2 67.9 60.9 17.5 54.6 Nr.6 TABLE 2: N EWS A NNOUNCEMENTS (C ONT.) SHCP 07/01/2005 -26/11/2012 24/05/2005-23/11/2012 Monthly Monthly Monthly Monthly 2:30pm/9:00am/8:00am21 Hour4 INEGI INEGI 07/01/2005-08/11/2012 14/01/2005-22/11/2012 09/03/2005-08/11/2012 22/03/2007-22/11/2012 Monthly Freq.3 Estados Unidos INEGI INEGI INEGI INEGI 06/01/2005-05/11/2012 Announcement Forward-Looking Consumer Confidence U. of Michigan Confidence Housing Starts Leading Indicators Monetary FOMC Rate Decision INEGI 9:00am 8:45am/8:55am/9:00am8 7:30am 9:00am Real Activity Industrial Production (YoY) Retail Sales (INEGI) Unemployment Rate Global Economic Indicator IGAE GDP Current $ YoY IMEF Non Manufacturing Index Investment Gross Fixed Investment Government Public Balance (MXP) Foreign Trade Trade Balance Current Account Balance Prices Consumer Prices (YoY) Bi-Weekly CPI Consumer Prices Core (MoM) Bi-Weekly Core CPI Forward-Looking Consumer Confidence Notes: 1. Bureau of Economic Analysis (BEA), Bureau of the Census (BC), Bureau of Labor Statistics (BLS), Federal Reserve Board (FRB), Conference Board (CB), Institute for Supply Management (ISM), National Association of Realtors (NAR), Congressional Budget Office (CBO), University of Michigan (UMICH), Instituto Nacional de EstadÌstica y GeografÌa (INEGI), SecretarÌa de Hacienda y Crédito Público. 2. Date denotes the range of publication dates 3. Freq. refers to the frequency with which is released 4. Hour stands for the time of the day in which it is published (Mexico City time). 5. Obs. denotes the total number of observations 6. Nr. is the average number of analysts surveyed. 7. In 31/01/2007 the announcement time moved to 8:45am 8. In 13/10/2006 the announcement time moved to 8:55am and in 15/1/2010 was released regulary at 9:00am . 9. In 12/01/2010 was released at 9:00am and in 12/11/2012 at 8:00am. 10. In 25/01/2010 was released at 9:00am and in 26/01/2011 at 8:00am. 11. In 22/01/2010 was released at 9:00am and in 21/01/2011 at 8:00am. 12. In 14/01/2010 was released at 9:00am and in 10/01/2011 at 8:00am. 13. In 24/02/2010 was released regulary at 9:00am and in 25/02/2011 at 8:00am. 14. In 12/01/2010 was released regulary at 9:00am and in 11/01/2011 at 8:00am. 15. In 22/01/2010 was released regulary at 9:00am and in 25/01/2011 at 8:00am. 16. In 24/08/2007 was released regulary at 9:00am. 17. In 09/07/2007 was released regulary at 9:00am and in 9/8/2011 at 8:00am. 18. In 24/07/2007 was released regulary at 9:00am and in 22/07/2012 at 8:00am.19 In 09/07/2007 was released regulary at 9:00am and in 09/08/2011 at 8:00am. 20. In 24/07/2007 was released regulary at 9:00am and in 22/07/2011 at 8:00am. 21. In was released regulary at 9:00am and in 04/08/2010 at 8:00am. 0.979** Monthly Budget Statement -0.0281 Consumer Price Index (MoM) (0.0270) (1.082) (0.482) (0.426) (0.0744) (0.357) (1.015) (0.0551) (0.0949) (0.0457) (0.0528) (0.0216) (0.0340) (0.0149) (0.957) (6.878) (0.00633) (0.0432) (0.517) (0.225) (0.0150) (0.205) (0.256) (5.532) (0.0570) (0.0175) (8.155) (0.0225) Std. Error Monetary Consumer Confidence Forward-Looking Consumer Prices (YoY) Bi-Weekly CPI Consumer Prices Core (MoM) Bi-Weekly Core CPI Prices Trade Balance Current Account Balance Foreign Trade Public Balance (MXP) Government Gross Fixed Investment -0.0281 0.0232 0.0500 0.00111 0.0600 -0.0273 3.516 -0.0121 -4 -0.00644 -0.0638 -0.150 -0.00110 -0.152 -0.219 Industrial Production (YoY) Retail Sales (INEGI) Unemployment Rate Global Economic Indicator IGAE GDP Current $ YoY IMEF Non Manufacturing Index Investment Coef. ( ˆ ) Mexico Announcement Real Activity FOMC Rate Decision -0.00989 -0.0174 -0.0693* -0.0151 0.268*** Consumer Confidence U. of Michigan Confidence Housing Starts Leading Indicators Forward-Looking -0.0207 0.881 -0.171 Coef. ( ˆ ) Producer Price Index (MoM) Employment Cost Index ISM Prices Paid Announcement Prices (Cont.) (0.0270) (0.0216) (0.0340) (0.0149) (0.0744) (0.0175) (8.155) (0.0570) (5.532) (0.00633) (0.0432) (0.517) (0.0150) (0.205) (0.256) Std. Error (0.0223) (0.0379) (0.0392) (0.716) (0.0867) (0.274) (1.384) (0.655) Std. Error Robust standard errors in parenthesis, *** p<0.01, ** p<0.05, * p<0.1 In order to assess if the Bloomberg forecasts are systematically biased, the following regression is estimated: ek,t = k + uk,t , where ek,t is the error of the median forecast for announcement k and it is measured by the k difference between the announcement value, Akt,n , and the market expected value, Et,n , for each indicator k published in the five minute interval n on day t. The period under study extends from January 2005 to November 2012. Prices 0.646 0.416 Trade Balance Current Account Balance Foreign Trade Government 0.0600 0.0913 0.109 0.0445 0.0553 Durable Goods Orders Factory Orders Wholesale Inventories Construction Spending MoM Business Inventories Investment New Home Sales Existing Home Sales Personal Spending Pending Home Sales MoM Personal Consumption -0.0977** 0.0630 0.0232 0.0500 0.00111 1.260 -14.05** -0.00644 -0.0638 -0.150 0.0561 -0.00110 -0.152 -0.219 -4 -0.0121 -0.0273 3.516 -0.0148 Initial Jobless Claims Change in Nonfarm Payrolls GDP QoQ (Annualized) ISM Manufacturing Advance Retail Sales Unemployment Rate Industrial Production Personal Income Empire Manufacturing Chicago Purchasing Manager ISM Non-Manf. Composite Capacity Utilization Consumer Credit Nonfarm Productivity Consumption Coef. ( ˆ ) United States Announcement Real Activity TABLE 3: B IAS T EST IN M ACROECONOMIC E XPECTATIONS R OBERTO G ÓMEZ C RAM 23 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET 24 Std. Error (0.00171) (0.01015) (0.00313) (0.00573) (0.00580) (0.01614) (0.00435) (0.00379) (0.00208) (0.00207) (0.00250) (0.00419) (0.00119) (0.00313) (0.00224) (0.00419) (0.00239) (0.00630) (0.00112) (0.00340) (0.00294) (0.00202) (0.00801) (0.00274) (0.00382) (0.00280) (0.00778) (0.01208) (0.00257) (0.01059) (0.00320) -0.00226 0.00281 0.00161 0.012560 0.00225 -0.00126 -0.00145 -0.00112 (0.00003) (0.00338) (0.00155) (0.00506) (0.00187) (0.01195) (0.00208) (0.00093) (0.00152) (0.00140) Std. Error -0.00004 -0.00426 (0.00635) (0.00058) (0.00485) (0.00071) Coef. 0.01195* 0.00048 0.00295 -0.00017 (0.00063) Coef. Std. Error (0.00237) (0.00173) (0.00189) (0.00607) -0.00099 (0.00046) (0.00018) (.06148) 0.01460*** 0.00456*** 0.00698*** 0.01455** Announcement Forward-Looking Consumer Confidence U. of Michigan Confidence Housing Starts Leading Indicators Monetary FOMC Rate Decision Mexico Announcement Real Activity Industrial Production (YoY) Retail Sales (INEGI) Unemployment Rate Global Economic Indicator IGAE GDP Current $ YoY IMEF Non Manufacturing Index Investment Gross Fixed Investment Government Public Balance (MXP) Foreign Trade Trade Balance Current Account Balance Prices Consumer Prices (YoY) Bi-Weekly CPI Consumer Prices Core (MoM) Bi-Weekly Core CPI Forward-Looking Consumer Confidence 0.01345*** 0.01840*** 4.65254*** (0.00041) (0.04536) Crisis 2007.12-2009.06 CLS Seasonal Component, ŝt,n -0.01193*** 390,231 0.03914 Constant Observations TABLE 4: C ONTEMPORANEOUS V OLATILITY R ESPONSE TO US AND M EXICAN A NNOUNCEMENT S URPRISES United States Announcement Coef. Real Activity Initial Jobless Claims 0.00854*** Change in Nonfarm Payrolls 0.07001*** GDP QoQ (Annualized) 0.01108*** ISM Manufacturing 0.02026*** Advance Retail Sales 0.01987*** Unemployment Rate 0.06378*** Industrial Production 0.00585 Personal Income 0.00474 Empire Manufacturing 0.00799*** Chicago Purchasing Manager 0.00592*** ISM Non-Manf. Composite 0.00421* Capacity Utilization 0.00364 Consumer Credit 0.00122 Nonfarm Productivity 0.00355 Consumption New Home Sales 0.00815*** Existing Home Sales 0.01356*** Personal Spending 0.00023 Pending Home Sales MoM 0.01064* Personal Consumption 0.00246** Investment Durable Goods Orders 0.01294*** Factory Orders 0.00318 Wholesale Inventories 0.00302 Construction Spending MoM 0.02086*** Business Inventories -0.00007 Government Monthly Budget Statement 0.00072 Foreign Trade Trade Balance 0.00585** Current Account Balance 0.0067 Prices Consumer Price Index (MoM) 0.03108*** Producer Price Index (MoM) 0.00986*** Employment Cost Index 0.01435 ISM Prices Paid 0.00930*** k HAC standard errors in parenthesis, *** p<0.01, ** p<0.05, * p<0.1 In order to quantify the contemporaneous response of exchange rate volatility the following model was estimated: P2 P k Vt,n = ↵0 + ↵1 ŝn + i=1 i i+ k |'t,n | + "t,n . Where Vt,n is the 5-minute exchange rate volatility, ŝn k is the volatility seasonal componentand 't,n is the standardized surprise corresponding to announcement k (k=1, ..., 51) and i with i = 1, 2 are dummy variables for 2007.12-2009.06 crisis as well as the period when Mexico joined the CLS. 0.00815*** 0.01839*** 0.01064* 0.00246** 5 10 5 5 i 0.01386*** 0.18641*** 0.02355*** 0.03900*** 0.02779*** 0.16564*** 0.01508*** 0.00592*** 0.00421* - Acum.2 10 50 15 15 10 45 10 5 5 - k Min.1 (0.00224) (0.00550) (0.00630) (0.00112) (0.00257) (0.02311) (0.00633) (0.01006) (0.00794) (0.02806) (0.00400) (0.00207) (0.00250) - Std. Error Investment Durable Goods Orders Factory Orders Wholesale Inventories Construction Spending MoM Business Inventories Government Monthly Budget Statement Foreign Trade Trade Balance Current Account Balance Prices Consumer Price Index (MoM) Producer Price Index (MoM) Employment Cost Index ISM Prices Paid Forward-Looking Consumer Confidence U. of Michigan Confidence Housing Starts Leading Indicators Monetary FOMC Rate Decision Announcement 0.01294*** 0.05420*** 0.00585** 0.03108** 0.01459*** 0.02730*** 0.02429*** 0.01361*** 0.01204*** 0.01455*** - 5 5 10 20 10 25 10 5 - Acum.2 5 25 - Min.1 - (0.00488) (0.00354) (0.00370) (0.00607) (0.01208) (0.00402) (0.00796) (0.00280) - - (0.00340) (0.01660) - Std. Error is the volatility seasonal componentand 'kt,n is the standardized surprise corresponding to announcement k (k=1, ..., 36) and i with i = 1, 2 are dummy variables for 2007.12-2009.06 crisis as well as the period when Mexico joined the CLS. HAC standard errors in parenthesis, *** p<0.01, ** p<0.05, * p<0.1 Notes: 1. Min shows the persistence in minutes of increased volatility in response to the surprise. 2. Depicts the accumulated effect for each macroeconomic surpirse. In order to quantify the persistence of exchange rate volatility to news the following model was estimated: P PP k Vt,n = ↵0 + ↵1 ŝn + 2i=1 i i + k,i |'t,n | + "t,n ,where Vt,n is the five-minute exchange rate volatility, ŝn Real Activity Initial Jobless Claims Change in Nonfarm Payrolls GDP QoQ (Annualized) ISM Manufacturing Advance Retail Sales Unemployment Rate Industrial Production Personal Income Empire Manufacturing Chicago Purchasing Manager ISM Non-Manf. Composite Capacity Utilization Consumer Credit Nonfarm Productivity Consumo Venta de Casas Nuevas Venta de Casas Existentes Gasto Personal Ventas de Casas Pendientes Consumo Personal Announcement TABLE 5: V OLATILITY P ERSISTANCE TO US A NNOUNCEMENT S URPRISES R OBERTO G ÓMEZ C RAM 25 T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET 26 5 Min. 5 10 10 Industrial Production 5 Min. 5 ISM Manufacturing 10 Initial Jobless Claims Real Activity 0.005 0 −0.005 0 0.05 0 −0.05 0 0.05 0 5 Min. 5 10 10 Wholesale Inventories 5 Min. 5 Personal Consumption −0.05 0 0.005 0 −0.005 0 0.02 0 5 Min. 5 10 10 10 10 10 10 10 0.02 0 −0.02 0 0.01 0 −0.01 0 0.05 0 −0.05 0 10 GDP QoQ (Annualized) 5 5 Min. 10 Unemployment Rate 5 5 Min. 10 Empire Manufacturing 5 Min. 5 10 Factory Orders 5 5 Min. 10 Business Inventories 5 Min. 5 5 Min. 5 10 Current Account Balance −0.005 0 0 0.005 −0.1 0 0 0.1 −0.02 0 0 0.02 0 −0.005 0 0.005 0 −0.005 0 0.05 0 −0.05 0 0 −0.1 0 0.02 0 −0.02 0 0 0.02 −0.02 0 5 Min. 10 10 Consumer Credit 5 5 Min. 10 Existing Home Sales 5 Min. 5 5 5 Min. 10 10 ISM Prices Paid 5 Min. 5 10 Housing Starts 5 Min. 5 0.01 0 5 5 Min. 10 10 Nonfarm Productivity 5 5 Min. 10 Personal Spending 5 Min. 5 10 0.1 0 −0.1 0 10 Capacity Utilization 5 Min. 5 10 New Home Sales 5 Min. 5 5 Min. 5 10 10 Employment Cost Index 5 5 Min. Pending Home Sales MoM 0 0 0.2 −0.2 0 5 Min. 5 10 10 FOMC Rate Decision 5 Min. 5 U. of Michigan Confidence −0.005 0 0 0.005 −0.05 0 0 0.05 −0.02 0 0.02 0.04 −0.02 0 0 0.02 Consumption ISM Non−Manf. Composite −0.01 0 0.02 0 −0.02 0 0.02 0 −0.02 0 0 5 5 Min. 10 Consumer Confidence 5 Min. 5 10 Leading Indicators 5 Min. 5 Monetary Producer Price Index (MoM) 0.02 −0.02 0 −0.05 0 0 0.05 −0.02 0 0 0.02 Forward−Looking Consumer Price Index (MoM) 0.1 Prices 5 Chicago Purchasing Manager 0.005 F IGURE 3: V OLATILITY P ERSISTANCE TO US A NNOUNCEMENT S URPRISES 5 Durable Goods Orders 5 Min. 5 Personal Income 5 Min. 5 Advance Retail Sales 5 Min. 5 Change in Nonfarm Payrolls 0.1 0 −0.1 0 0.05 0 −0.05 0 0.02 0 −0.02 0 0.02 Investment 0 −0.02 0 5 Min. 5 Min. 5 Trade Balance 5 Min. 5 Construction Spending MoM 0.05 0 −0.05 0 −0.02 0 0 0.02 Foreign Trade Monthly Budget Statement −0.02 0 0.02 Government 0 5 Min. 5 P2 P P k Note: To quantify the persistence of exchange rate volatility to news the following model was estimated: Vt,n = ↵0 +↵1 ŝn + i=1 i i+ k i k,i |'t,n |+ k is the standardized surprise corresponding to "t,n , where Vt,n is the five-minute exchange rate volatility, ŝn is the volatility seasonal component and 't,n announcement k. (k =1, ..., 36) and i with i = 1, 2 are dummy variables for 2007.12-2009.06 crisis as well as the period when Mexico joined the CLS. HAC standard erros where used and the confidence interval is at the 95% level. −0.02 0 % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % % 27 E FECTO DE UNA P OLÍTICA M ONETARIA DE C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE * L UIS S IMON TAMBORREL** En este trabajo se analiza el efecto de una política de compra de activos por parte del banco central como respuesta a una crisis en una economía monetaria. Existen dos tipos de activos, uno líquido y otro con restricciones de liquidez y la crisis que se estudia es tal que exacerba esta falta de liquidez. Se analizan los efectos que podría tener una política de este estilo sobre una economía emergente bajo distintas reglas de intervención y se compara con la reacción que habría en una economía avanzada en la que es más fácil canalizar los recursos a los agentes con capacidad de invertir. Siguiendo el modelo base de Kiyotaki y Moore (2012) se concluye que este tipo de políticas son potencialmente benéficas y menos costosas para las economías emergentes aunque existen ciertos riesgos que se deben tomar en cuenta para su implementación. Así, se sugiere que en México deben estudiarse ciertos aspectos de los mercados financieros con el objetivo de detectar a tiempo choques de liquidez y reaccionar oportunamente aminorando los efectos adversos de dicho choque. PALABRAS CLAVE : política monetaria, economías emergentes, DSGE, política monetaria no convencional, liquidez 1. I NTRODUCCIÓN En este trabajo se pretende analizar el efecto que podría tener una política monetaria no convencional en una economía emergente durante una crisis. El tipo de política que se va a analizar es una de compra de activos con el fin de proveer de liquidez a la economía una vez que ha habido una crisis de liquidez y el dinero no se puede canalizar hacia los empresarios con posibilidad de invertir en acumulación de capital. El hecho de que la política monetaria sea no convencional radica en el hecho de que los activos adquiridos por el banco central no son solamente pasivos de corto plazo del gobierno federal como es usual sino que se extiende a activos de mayor plazo, mayor riesgo, menor liquidez, etc. Además, implica un aumento de la hoja de balance del banco central. En el presente trabajo, este tipo de políticas serán modeladas como compras de capital en lugar de solamente movimientos en la base monetaria. Este análisis está motivado por la crisis del 2008 y por la reacción que tuvieron las principales economías avanzadas una vez que sus tasas de interés llegaron a niveles extraordinariamente bajos y tuvieron que buscar otras medidas para aliviar la fuerte desaceleración económica. Un claro ejemplo de esto son las medidas anunciadas en Estados Unidos por la Reserva Federal con sus tres programas de Quantitative Easing (QE) de los cuales el primero inició en diciembre de * Este trabajo resultó ganador del concurso de carteles de estudiantes de Economía del CEMLA, 2013. ** Economista de la Dirección General de Investigación Económica del Banco de México y estudiante de la Maestría en Teoría Económica del ITAM. Agradezco a Alejandro Hernández, Daniel Sámano, Manuel Sánchez y de forma muy especial a Carlos Urrutia por sus comentarios que mejoraron y enriquecieron de forma importante el presente trabajo. Agradezco también los comentarios de los jueces del concurso de carteles del CEMLA. Las opiniones expresadas en este artículo son responsabilidad del autor y no necesariamente reflejan la postura del Banco de México. Cualquier error u omisión es responsabilidad del autor. Email: luis.simon.t@gmail.com 28 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE 2008 y el último en septiembre de 20121 . Además de Estados Unidos, otros bancos centrales de economías avanzadas han tomado este tipo de medidas como los bancos de Inglaterra (Asset Purchase Facility, APF)2 , Japón (Asset Purchase Program, APP, y actualmente Quantitative and Qualitative Easing, QQE)3 y la Eurozona (Outright Monetary Transactions, OMT)4 . Cada programa tiene ciertas características particulares así como objetivos que pueden variar. Sin embargo, términos generales podemos decir que el fin de estos programas de estímulo monetario era el de proveer de liquidez a la economía una vez que ésta había sufrido una crisis de confianza a costa de un importante aumento del tamaño de la hoja de balance del banco central. Además, al aumentar dramáticamente la demanda por ciertos activos de renta fija, empujan hacia abajo las tasas de interés, especialmente las de largo plazo. Durante la presente crisis, estos programas de estímulo monetario han jugado un papel central para tratar de regresar la confianza a los mercados financieros y para aminorar, en el corto plazo, los efectos de la fuerte desaceleración económica. En Estados Unidos, durante el QE1, se anunciaron compras hasta por 1.25 billones de dólares en activos respaldados por hipotecas (MortgageBacked Securities, MBS) así como compras hasta por 100 mil millones de dólares de las agencias de financiamiento inmobiliario (Fannie Mae y Freddie Mac) y hasta 300 mil millones de dólares de bonos del Tesoro de largo plazo con el fin de disminuir la parte larga de la curva de rendimientos una vez que la parte corta estaba prácticamente en cero. Las Gráficas (1) y (2) muestran el tamaño de esta medida en relación a la hoja de balance del banco y a la tasa de acumulación de activos que se había venido observando. Queda claro que fue una medida extraordinaria pero esto obedece a que se trató de una crisis de dimensiones extraordinarias, como podemos ver en la Gráfica (2), que muestra el cambio en la tasa de crecimiento del PIB de Estados Unidos. 1 El QE1 se anunció mediante un comunicado de prensa el 25 de noviembre de 2008 y posteriormente se presentó formalmente por el Comité de Mercado Abierto (FOMC) junto con la decisión de política monetaria del 16 de diciembre de 2008; entró en vigor en enero de 2009. El QE3 se anunció en el comunicado de decisión de política monetaria del 13 de septiembre de 2012. 2 El APF fue anunciado en enero de 2009 con el fin de proveer de liquidez a la economía y como una herramienta de política monetaria más en manos del banco central. Empezó a operar en marzo de 2009 anunciando compras por 75 mil millones de libras junto con el comunicado de la decisión de tasa de interés y posteriormente aumentó en varias ocasiones hasta llegar a 375 mil millones de libras. 3 El APP se anunció el 05 de octubre de 2010 y el QQE el 04 de abril de 2013. El primer programa se anunció por 35 billones de yenes pero fue aumentando hasta que en enero de 2013 se anunció que no tendría un fin predeterminado sino que se extendería mientras fuera necesario. El QQE llegó a reemplazar este programa y fue mucho más agresivo desde el comienzo pues anunció compras por alrededor de 50 billones de yenes anuales además de que cambió el instrumento objetivo del Banco de Japón a los agregados monetarios en lugar de la tasa de interés. 4 El OMT fue anunciado por el Banco Central Europeo el 02 de agosto de 2012 en la conferencia de prensa posterior a la decisión de política monetaria de ese día. Posteriormente, se publicaron los detalles el 06 de septiembre de 2012. Este programa es un poco distinto a los otros que se han mencionado ya que, aunque el mecanismo de compra de activos es muy similar, se anunció que las compras iban a ser esterilizadas por lo que la liquidez que se inyectara se iba a retirar del mercado. Su objetivo principal es reducir las primas de riesgo de los países de los cuales compre bonos y con esto reducir los diferenciales de tasas de interés de deuda soberana ante el resto de la eurozona. L UIS S IMON TAMBORREL 29 F IGURA 1: H OJA DE B ALANCE DE LA R ESERVA F EDERAL ( A ) N IVELES (M ILLONES DE D ÓLARES ) ( B ) TASA DE C RECIMIENTO A NUAL Fuente: Reserva Federal. F IGURA 2: TASA DE C RECIMIENTO DEL PIB Fuente: Haver Analytics. DE EUA C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE 30 1.1 I MPORTANCIA DE UNA P OLÍTICA DE C OMPRA DE A CTIVOS EN E CONOMÍAS E MERGENTES A través de este trabajo se pretende analizar cuál sería el efecto de una política monetaria similar en una economía emergente. Antes de esto, es necesario aclarar por qué podría ser necesaria esta política o bajo qué circunstancias podría una economía emergente querer recurrir a esto. La razón más obvia sería decir que una economía se encuentra en un caso similar al de las economías avanzadas en el que sus tasas de interés ya son muy bajas pero su economía requiere de mayor estímulo. Aunque sea un caso que a primera vista parezca poco común, tenemos ejemplos como el de Chile cuando en julio de 2009 llevó su tasa a 0.50 por ciento y el banco reconoció que, aunque la tasa de interés se encontraba en niveles mínimos, era necesario un mayor estímulo monetario por lo que tomó medidas adicionales5 . Otro ejemplo de esta situación es la que está ocurriendo actualmente en la República Checa. Este país ha llevado su tasa de interés a cero (oficialmente es 0.05 %) además de que ha venido mencionando que podría empezar a intervenir en el mercado cambiario con el fin de depreciar su moneda6 . Actualmente la economía checa está estancada además de que tiene una inflación baja y controlada por lo que podría ser deseable un mayor estímulo monetario dadas las malas perspectivas de crecimiento hacia delante. Otro caso que podría ameritar una política de compra de activos sería si la economía tuviera problemas de liquidez pero también tuviera problemas de alta inflación. En este caso, proveer liquidez mediante el canal tradicional de política monetaria podría no ser conveniente pues aumentaría las presiones inflacionarias, mientras que una política no convencional podría ayudar a aliviar los problemas de liquidez en algunos mercados específicos sin generar presiones inflacionarias adicionales. Este es el caso de India en 2012 en el que su M37 crecía de manera menor a lo proyectado y tanto la inversión como el crédito mostraban debilidad. Todo esto se dio en un entorno de inflación superior al siete por ciento8 . Fue este panorama el que llevó al banco de India a mantener sin cambio su tasa de política durante los últimos tres trimestres del año aunque sí hizo ajustes en sus requerimientos de reservas9 . En general, podemos pensar que una política no convencional de compra de activos podría ser deseable cuando una economía tiene choques de liquidez, por ejemplo, en 5 Entre ellas una facilidad de liquidez de corto plazo para los bancos. El comunicado es el que corresponde a la decisión del 9 de julio de 2009. 6 El banco central anunció el 1 de noviembre de 2012 el recorte en la tasa que la llevó a 0.05 % y fue en esta misma reunión que el gobernador anunció en la conferencia de prensa que podrían venir intervenciones del mercado cambiario. 7 El Banco de México define M3 a partir de M2 y M1 como: La definición actual del agregado monetario estrecho (M1) considera a los billetes y monedas en poder del público, así como a las cuentas de cheques en monedas nacional y extranjera... El agregado monetario M2 incluye a M1 y a los instrumentos bancarios a plazo de hasta un año. Por su parte, el agregado monetario M3 incluye, en adición a M2, a los instrumentos no bancarios de plazo menor a un año (principalmente valores gubernamentales). 8 Véase, por ejemplo, el comunicado del 30 de octubre de 2012 del banco de India. 9 El único recorte de tasa del banco de India fue de medio punto porcentual en abril de 2012 para llevarla a 8.0 %. Por otro lado, los requerimientos de reservas iniciaron el año en 6.0 % y terminaron en 4.25 %. L UIS S IMON TAMBORREL 31 escenarios de aversión al riesgo o crisis de confianza y que además la economía tiene alta inflación o un tipo de cambio depreciado por lo que podrían no querer recortar la tasa de referencia. Otra opción podría ser que existiera un sistema financiero poco desarrollado, por lo que ante choques adversos sería más difícil reubicar los activos hacia otros sectores de la economía y en ese caso el banco central podría ayudar a aliviar esa falta de liquidez. Estos ejemplos y situaciones muestran la importancia de estudiar y entender políticas no convencionales tomando en cuenta las particularidades de las economías emergentes y no sólo dentro del marco de las avanzadas como se ha hecho generalmente. En México ya han habido políticas similares de compra de activos como por ejemplo durante la crisis del 2008 con la compra de valores del Instituto de Protección al Ahorro Bancario (IPAB). De manera conjunta, el Banco de México y la Secretaría de Hacienda y Crédito Público (SHCP) anunciaron una serie de medidas destinadas a preservar la estabilidad financiera del país durante la turbulencia internacional10 . El propósito de esta medida fue el de proveer de liquidez a las sociedades de inversión ante el choque externo que sufrió nuestro país. Existe una diferencia importante entre esta medida y las que se van a analizar en el presente trabajo y es el aumento en la hoja de balance del banco central a la hora de implementar la compra de activos; en el caso de México, esta medida trajo un cambio en la composición de la hoja de balance más no en el tamaño11 . Dejando esto de lado, la finalidad es la misma: el banco absorbe un activo con poca liquidez y regresa a la economía un activo más líquido con el fin de aminorar el efecto del choque de liquidez ocasionado, en este caso, por un escenario de aversión al riesgo y de dificultad para obtener financiamiento por parte de las instituciones financieras locales. La Gráfica (3) muestra el tamaño del programa como porcentaje de los activos totales en poder del Banco de México. El resultado de este choque lo podemos ver reflejado en el saldo neto de la cuenta financiera y en el rubro de la misma que corresponde a la inversión en portafolios. La Gráfica (4) muestra que ambas variables tuvieron un importante déficit en el primer trimestre de 2009 reflejando la salida de capital extranjero en este escenario de aversión al riesgo y fue esta salida de capitales la que ocasionó la menor liquidez y en consecuencia la mayor dificultad para obtener financiamiento. Se ha mencionado porque pudieran ser deseables este tipo de medidas, pero también conllevan riesgos. Entre éstos podemos destacar la pérdida de credibilidad del banco central, pues este tipo de acciones podrían ser interpretadas como un abandono al compromiso de estabilidad de precios, lo que podría desanclar las expectativas de inflación. Así, debemos mencionar que la credi10 La SHCP publicó un comunicado el 27 de octubre de 2008 en el que anunciaron las medidas que se iban a implementar para contrarrestar los efectos de la crisis. Entre ellas destaca la reestructuración de las subastas de deuda gubernamental favoreciendo la emisión de títulos de corto plazo, subastas de swaps de tasas de interés y un programa de endeudamiento con organismos financieros internacionales como el Banco Mundial y el Banco Interamericano de Desarrollo, además de la mencionada compra de valores del IPAB. 11 El Informe Anual de 2008 del Banco de México menciona que este programa vino acompalado de una disminución del crédito a intermediarios financieros lo que ocasionó que no hubiera cambios en el tamaño de la hoja de balance del banco central como consecuencia de este programa. 32 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE F IGURA 3: M EDIDAS ADOPTADAS POR EL B ANCO DE M ÉXICO EN LA C RISIS DE 2008 Valores del IPAB como Porcentaje de los Activos Totales del Banco de México Fuente: Cálculos propios con datos del Banco de México. F IGURA 4: C UENTA F INANCIERA E I NVERSIÓN EN P ORTAFOLIOS Cuenta Financiera e Inversión en Portafolios como Porcentaje del PIB Valores del IPAB como Porcentaje de los Activos Totales del Banco de México Fuente: Cálculos propios con datos del Banco de México. L UIS S IMON TAMBORREL 33 bilidad del banco central es indispensable para que estas políticas puedan ser exitosas. Además, se han cuestionado las implicaciones de un aumento de gran magnitud en la hoja de balance del banco central sobre la estabilidad de precios y cambiaria por lo que otra vez la credibilidad y la comunicación efectiva de las intenciones son importantes. Otro riesgo que vale la pena mencionar es que estas políticas podrían usarse para financiar el endeudamiento e incentivar una política fiscal irresponsable por lo que la autonomía del banco central también resulta una condición fundamental para este tipo de programas. 1.2 U NA E CONOMÍA E MERGENTE T IENDE A S ER M ENOS L ÍQUIDA QUE UNA E CONOMÍA AVANZADA La idea de que una economía emergente es menos líquida que una economía avanzada será un supuesto clave en el presente trabajo. Como veremos, es difícil medir la liquidez de una economía y cuantificar qué proporción de sus activos son líquidos con respecto al total. La liquidez se refiere a qué tan fácil es convertir un activo en efectivo y en nuestro modelo la liquidez estará caracterizada por cuánto capital podemos vender en el mercado en un momento dado. Un primer acercamiento a la liquidez de un activo en particular puede ser el volumen operado, pero, como menciona Panigirtzoglou (2013), ésta es sólo una pieza de un rompecabezas más complejo. Existen otros aspectos del mercado que nos dan información sobre la liquidez como la diferencia entre los bids y los asks o el efecto sobre los precios que puede tener un solo intercambio. Otra manera de ver la liquidez es viendo cuánto tiene que bajar el precio que esté dispuesto a aceptar alguien que quiera ejecutar una orden grande y qué tan fácil lo puede hacer. Todas estas medidas nos muestran la dificultad de dar una sola medida de liquidez para un activo en particular, la tarea se vuelve mucho más compleja al tratar de cuantificarla para la economía en su conjunto. No trataremos de cuantificar la liquidez de las economías sino simplemente mostrar el hecho estilizado que, en general, las economías emergentes son menos líquidas que las avanzadas, destacando entre éstas el caso de México. Esto lo veremos a través de algunos indicadores que pudiéramos pensar que son representativos de toda la economía. La Gráfica (5) muestra indicadores del tamaño de los mercados financieros de México en comparación con otros países o grupos de países. Por un lado, tener bolsas de valores de menor tamaño relativo a la economía nos indica que existen menos empresas cuyos títulos se pueden intercambiar de manera fácil y rápida; para las empresas que no cotizan en bolsa es más difícil hacer transferencias de la propiedad de los activos o canalizarles recursos para aumentar su producción. Vemos también que, además de ser más pequeña, en las bolsa de valores de México se intercambian menos acciones de las empresas que ya están listadas. Así, podemos concluir que algunas economías emergentes, y México en particular, tienden a ser menos líquidas que las economías avanzadas con lo que podríamos suponer que una mayor penetración financiera facilitaría el tránsito de recursos en la economía hacia una asignación más eficiente. Esta diferencia en liquidez que queda clara para el caso de México será un supuesto clave durante el resto del trabajo. 34 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE F IGURA 5: TAMAÑO DE LAS B OLSAS DE VALORES DE D ISTINTOS PAÍSES ( A ) C APITALIZACIÓN DE M ERCADO COMO P ORCENTAJE DEL PIB (C IERRE DE A ÑO ) ( B ) VALOR DE LAS A CCIONES I NTERCAMBIADAS EN D ÓLARES C ORRIENTES COMO P CT. DEL PIB ( C ) VALOR T OTAL DE LAS A CCIONES I NTERCAMBIADAS E NTRE C APITALIZACIÓN P ROM . DEL P ERIODO Nota: La clasificación de los países según su ingreso corresponde a la que da el Banco Mundial. Datos para 2012. Fuente: Banco Mundial. L UIS S IMON TAMBORREL 2. 35 R EVISIÓN DE LA L ITERATURA Hasta el momento, la literatura sobre medidas de política monetaria no convencionales mediante compra de activos en economías emergentes es escasa. Podemos encontrar trabajos como el de Ghosh et al. (2009) que analiza las opciones de política monetaria de naciones emergentes a través de la posición del Fondo Monetario Internacional, e Ishi (2009) que hace una recopilación de los países emergentes que han tomado acciones no convencionales, pero sin un análisis basado en un modelo teórico explícito detrás sino que más bien se limita a documentar estos hechos. Donde sí existe más investigación respecto a medidas no convencionales en economías emergentes, en especial debido a la crisis del 2008, es en las medidas macroprudenciales. El objetivo principal de estas medidas es fomentar la estabilidad financiera a través de mecanismos como los requerimientos de reservas de los bancos, requerimientos de reservas en moneda extranjera, variaciones en el colateral entre muchos otros instrumentos (véase Galati y Moessner (2012) para un análisis detallado tanto de los instrumentos macroprudenciales como de sus objetivos y del estado general de estas políticas en la literatura y en la práctica). Para el presente análisis se recurrirá a un modelo de ciclos reales de negocios que introduce diferencias de liquidez entre los activos. La literatura de ciclos reales de negocios utiliza modelos dinámicos estocásticos de equilibrio general (DSGE por sus siglas en inglés) con el fin de explicar las fluctuaciones que sufre una economía en el corto plazo. El modelo que se va a adoptar es el de Kiyotaki y Moore (2012), que a su vez es una modificación de Kiyotaki y Moore (2001). La obra de estos dos autores, junto con la de Bernanke y Gertler, son modelos ya clásicos de fricciones financieras. Bernanke y Gertler (1986) introducen fricciones financieras a través del mercado de crédito donde hacen que el costo de financiamiento dependa del valor de cada empresa. En este mismo sentido encontramos una obra canónica para tratar fricciones financieras que es la del acelerador financiero de Bernanke et. al. (1999) en la que los autores nos muestran como las fricciones del mercado crediticio pueden amplificar choques macroeconómicos. El antecedente directo del modelo que vamos a usar corresponde a Kiyotaki y Moore (1997) donde la fricción en el mercado de crédito aparece mediante el colateral que necesitan las empresas para endeudarse; una vez que desarrollemos el modelo veremos que las fricciones que usaremos son muy similares y pueden tener la misma interpretación: las empresas sólo podrán financiar una parte de su capital con recursos que no tienen en ese momento. El lugar en la literatura que ocupa este trabajo es precisamente a la mitad entre el ya mencionado modelo de Kiyotaki y Moore (2012) y el que muestran Del Negro et al. (2011). Ambos modelos son similares pero el primero es un ejercicio teórico mientras que el segundo tiene un enfoque claramente práctico que pretende analizar el efecto del QE sobre la economía de Estados Unidos. Aquí seguiremos un planteamiento similar al del primero pero desde un enfoque que nos ayude a dar predicciones más claras sobre las efectos en una economía emergente y las diferencias en los resultados con una economía avanzada, además de que nos ayude a generar hipótesis contrafactuales para teorizar sobre la efectividad de 36 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE este tipo de política monetaria en una economía emergente como es el caso de México. El modelo de Del Negro et. al. (2011) incluye más elementos en la economía que pueden ayudar a hacerlo más realista pero que no son necesarios para este primer acercamiento aunque por su orientación claramente práctica y predictiva podría ser interesante hacer un ejercicio similar para México. El objetivo principal de este trabajo es dar un primer acercamiento al efecto de políticas monetarias no convencionales en el caso de una crisis similar a la que observamos en el 2008 en Estados Unidos. Aunque esta crisis ha sido de escala mundial, mencionamos el caso de Estados Unidos por la reacción del banco central ante este escenario y no por alguna otra característica particular de la crisis. La idea principal es mostrar que existen situaciones que podrían ameritar un programa de este tipo y que vale la pena considerarlos, estudiar más a detalle sus características y sus posibles costos y beneficios. Queremos destacar que ésta es una opción más que agregar a la lista de herramientas que posee un banco central en una economía emergente para hacer política monetaria. 3. M ODELO B ASE En el modelo, las fricciones en el mercado financiero vendrán por diferencias en la liquidez de los activos. Como veremos con detalle más adelante, la diferencia entre las dos economías, avanzada y emergente, se modelará a través de diferencias en liquidez entre estas economías y será esta diferencia la que genere las diferentes dinámicas en cada una. El dinero será deseable porque será más líquido que el capital y será esta característica la que haga que tenga un precio estrictamente positivo. Otra fricción que usaremos en el modelo será que no todos los empresarios tienen la posibilidad de invertir en cada periodo por lo que será necesario canalizar los recursos hacia los inversionistas con el fin de acumular capital e incrementar rendimientos futuros. Así, el dinero servirá para impulsar la actividad ya que permite mover los recursos hacia el sector productivo de la economía. En este escenario, las crisis corresponden a choques de liquidez. Cuando la economía sufre un choque, se vuelve más difícil canalizar el dinero hacia los inversionistas para que acumulen capital y es aquí donde entra el banco central, que sigue una regla de política monetaria distinta a las reglas de Taylor que estamos acostumbrados; su regla de intervención depende del choque observado en la liquidez y la reacción no corresponde a las tasas de interés o a la oferta monetaria, sino que vendrá a través de la compra de capital para intentar aliviar esta falta de liquidez. Tenemos una economía con infinitos periodos y dos tipos de agente: empresarios y trabajadores. La economía incluye trabajo, producción, dinero y capital. Los empresarios producen usando su capital y el trabajo de los trabajadores; el capital se deprecia y para reemplazarlo hace falta invertir. Para invertir, el empresario deberá gastar dinero o capital y suponemos que el capital es menos líquido que el dinero, en particular, suponemos que un empresario puede vender a lo más una fracción de su capital en cada periodo. En el modelo, la decisión de invertir solamente se le concede a los empresarios con cierta probabilidad por lo que se vuelve L UIS S IMON TAMBORREL 37 necesario transferir recursos de los empresarios no-inversionistas (a partir de ahora les llamaremos ahorradores) a los inversionistas. Los inversionistas pueden comprometer a lo más una fracción ✓ de sus ganancias futuras para poder invertir más de lo que tienen en capital nuevo. Podemos pensar en ✓ como la fracción máxima que el inversionista puede comprometer creíblemente sobre las ganancias futuras del capital que va a adquirir. Este supuesto permite a los empresarios ser dueños de capital que está en otra empresa. Para simplificar el análisis, vamos a suponer que el capital se puede vender a la misma tasa sea de su propia empresa o de otra lo que convierte a estos dos tipos de capital en perfectos sustitutos. Así, los empresarios serán indiferentes entre invertir en su empresa o en otra ya que reciben los mismos rendimientos y el capital está sujeto a la misma restricción de liquidez. De esta manera podemos utilizar el término capital sin tener que hacer distinción sobre si el empresario lo tiene en su empresa o no. El valor del dinero aparece porque ayuda a financiar la parte de la inversión que no puede ser financiada mediante emisión de capital para vender a otros inversionistas o por capital viejo que está sujeto a la restricción de liquidez. Aquí, el dinero pasa a ser el medio que canaliza los recursos hacia dónde se pueden invertir. El problema de los empresarios (que no trabajan, sólo son dueños de la empresa) es máx E 1 X t log(ct ) (3.1) t=0 Los empresarios sólo son dueños del capital y producen mediante la tecnología yt = At kt lt1 (3.2) El parámetro de la productividad total de los factores es igual para todos los inversionistas pero supondremos que sigue un proceso estocástico estacionario autorregresivo de primer orden. El capital se deprecia a tasa y por conveniencia definiremos ⌘1 (3.3) w t l t = rt k t (3.4) Bajo el supuesto de competencia perfecta, podemos definir los beneficios de las empresas como yt Los empresarios tienen una probabilidad n de poder invertir. Cuando pueden invertir tienen acceso a una tecnología de rendimientos constantes que produce it unidades de capital a partir del mismo número de unidades del bien de consumo. La inversión de este periodo se puede utilizar hasta el siguiente periodo con lo cual obtenemos la siguiente regla de movimiento del capital kt+1 = kt + it (3.5) 38 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE Para poder financiar la inversión, el inversionista puede comprometer parte de los beneficios que obtendrá del nuevo capital. Una unidad de capital en t nos dará los rendimientos rt+1 en el periodo t+1, rt+2 en t+2 y así sucesivamente. Pero suponemos que el empresario inversionista puede comprometer a lo más una fracción ✓ de su nuevo capital. Mientras más pequeña sea esta fracción, más fuerte es la restricción que enfrenta el inversionista y tendrá que vender más capital para financiarla. El capital no es tan líquido como el dinero y suponemos que sólo puede vender t < 1 del capital que posee en otros empresarios. t sigue un proceso igual al de la productividad, estacionarios y centrados en A y respectivamente. Con esto permitimos que haya dos tipos de choques en la economía, uno de productividad y uno de liquidez. Nos vamos a centrar solamente en choques de liquidez por lo que podríamos deshacernos de la variable de la productividad total de los factores y sustituirla por su valor de estado estacionario. Esta simplificación no reduce la complejidad del modelo pero nos limita en cuanto al tipo de choques que puede sufrir nuestra economía. Es por esta razón que se mantiene el término At aunque en nuestras simulaciones no reciba ningún tipo de choque. El modelo puede analizarse de la misma manera que lo vamos a hacer pero con choques en la productividad sin hacerle ningún tipo de modificación. Estos supuestos ocasionan que un empresario tenga tres tipos de activos: dinero, capital en otra empresa, y la fracción no comprometida (1 ✓) de su propio capital. Denotamos por nt al capital y por mt al dinero de un empresario que enfrenta dos restricciones de liquidez: mt+1 0 nt+1 (1 (3.6) ✓t )it + (1 t ) nt (3.7) La primera restricción simplemente nos dice que los saldos monetarios no pueden ser negativos. La segunda nos limita la velocidad a la que un empresario puede desacumular capital. El término del lado izquierdo es el capital del próximo periodo y éste no puede ser menor que la fracción máxima que no comprometida de su capital nuevo más la fracción restante suponiendo que vende la mayor cantidad posible de su capital acumulado no depreciado. No olvidemos que el primer término del lado derecho puede ser cero en caso de que el empresario no tenga la posibilidad de invertir. A priori no podemos asegurar que el dinero tenga un precio positivo puesto que su función en la economía es sustituir la falta de liquidez del capital pero podríamos estar en una situación en que el capital tenga la liquidez necesaria por lo que el dinero perdería su valor. Como veremos más adelante, éste no será el caso pero aun así definiremos el precio del dinero en términos de bienes y no viceversa como es la costumbre, denotaremos al precio del dinero por pt . Para denotar al precio del capital, igualmente en términos de bienes de consumo, usaremos qt . Ahora podemos expresar la restricción presupuestal del empresario en cada periodo como ct + qt (nt+1 it nt ) + it + pt (mt+1 mt ) = rt nt (3.8) L UIS S IMON TAMBORREL 39 Su ingreso, del lado derecho, corresponde a los beneficios obtenidos del capital. Del lado izquierdo, el gasto se distribuye entre consumo, inversión, compra de capital a otros empresarios y cambio en los saldos monetarios. Ahora pasamos a caracterizar a los trabajadores, quienes maximizan máx E 1 X t ! 01+⌫ l ) 1+⌫ t u(c0t t=0 ; ! > 0, ⌫ > 0 (3.9) Donde usamos x0 para denotar a las variables de los trabajadores y así distinguirlas de las de los empresarios. La restricción presupuestal que enfrentan los trabajadores es c0t + qt (n0t+1 n0t ) + pt (m0t+1 m0t ) = wt lt0 + rt n0t (3.10) Donde vemos que la restricción es muy similar a la de los empresarios solamente que los trabajadores no tienen posibilidad de invertir y además reciben un salario por su trabajo. Aunque los trabajadores no puedan invertir, pueden comprar capital (y dinero) en el mercado. Suponemos también que los trabajadores no se pueden endeudar y añadiendo la restricción de no-negatividad de los saldos monetarios tenemos que m0t+1 0 (3.11) n0t+1 0 (3.12) De las condiciones de primer orden del trabajador podemos obtener la función de oferta de trabajo sin necesidad de suponer una forma explícita de la función de utilidad. Tenemos que las condiciones de primer orden con respecto al consumo y al trabajo respectivamente son t 0 u (c0t t 0 u (c0t ! 01+⌫ l )= 1+⌫ t ! 01+⌫ 0⌫ l )!lt = 1+⌫ t (3.13) t t wt (3.14) Y despejando el trabajo obtenemos ⇣ w ⌘1/⌫ t (3.15) ! El problema de cada empresa es un problema de maximización de beneficios estándar de la forma lt = máx At kt lt1 w t lt (3.16) De donde podemos obtener la demanda de trabajo de cada empresa en función del capital que tenga y del salario lt = ✓ (1 )At wt ◆1/ kt (3.17) C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE 40 Y dado que todas las empresas son iguales y la demanda es lineal en el capital, podemos agregar fácilmente las demandas para obtener la de toda la economía, igualándola con la oferta tenemos que ⇣ w ⌘1/⌫ t ! = ✓ (1 )At wt ◆1/ Kt (3.18) Donde usamos variables en mayúsculas para denotar a las variables agregadas. Así, podemos despejar el salario de equilibrio y sustituirlo en (3.4) con lo que obtenemos las ganancias de la empresa en equilibrio rt kt = at Kt↵ 1 (3.19) kt donde at ⌘ ↵ ⌘ ✓ 1 ! (1 + ⌫) +⌫ ◆ 1 +⌫ +⌫ At1+⌫ (3.20) (3.21) Supondremos que, en la vecindad del estado estacionario, los trabajadores no tendrán capital y consumirán únicamente su ingreso laboral12 . Con esto, su restricción presupuestal se convierte en c0t = wt lt0 (3.22) Ahora regresamos al problema de los empresarios. Dependiendo de la elección de parámetros, podríamos encontrarnos en una situación en la cual las restricciones de liquidez sean tan laxas que no restrinjan a la economía. En este caso, tener la posibilidad de invertir perdería su valor puesto que sería muy fácil canalizar recursos de los ahorradores hacia los inversionistas; nos centraremos en el caso en que sí existe una ventaja para poder invertir13 . Intuitivamente, si la fracción ✓ de capital que se puede comprometer es alta y el capital es muy líquido entonces se perderán las ventajas de ser inversionista y el equilibrio alcanzado será igual al óptimo sin fricciones además de que el dinero no tendría valor. Por otro lado, cuando la economía se encuentra restringida por las fricciones antes mencionadas veremos que, en el equilibrio, el precio del dinero será estrictamente positivo, el precio del capital será estrictamente mayor a uno y los empresarios con oportunidad de invertir optarán por no tener 12 La demostración formal de este resultado se encuentra en Kiyotaki y Moore (2012) pero intuitivamente lo que ocurre es que el retorno esperado tanto del dinero como del capital (en caso de no tener oportunidad de invertir, como es el caso de los trabajadores) es menor que el factor de descuento 1/ por lo que el los trabajadores preferirán consumir su ingreso de este periodo en lugar de ahorrarlo. Por otro lado, los empresarios decidirán ahorrar ya que están esperando tener la oportunidad de invertir. 13 Una condición suficiente para alcanzar un equilibrio de este estilo es que: (1 )✓ + ⇡ < ( )(1 ⇡). Para más detalles sobre esta condición y el equilibrio que genera así como sobre los equilibrios que alcanza el modelo en los casos en que no se cumple véase Kiyotaki y Moore (2012). L UIS S IMON TAMBORREL 41 dinero. La intuición detrás de cada una de estas afirmaciones es la siguiente: primero, si la liquidez de la economía está restringida entonces el dinero será deseable pues es más líquido que el capital con lo que tendrá un precio positivo; segundo, que el precio del capital en el mercado sea estrictamente mayor a uno refleja que sí existe una ventaja de ser inversionista en un periodo dado pues en ese caso el costo del capital para ese empresario sería de uno; por último, si el empresario tiene la posibilidad de invertir entonces decidirá invertir todos sus saldos monetarios pues éstos, a diferencia del capital, no le generan ningún rendimiento. Con estos supuestos podemos reescribir la restricción presupuestal de los inversionistas como cit + (1 ✓qt ) it = (rt + t q t ) nt + pt mt (3.23) Donde usamos el superíndice i para denotar a las variables del inversionista, nótese que n y m no tienen superíndice ya que fueron elegidas el periodo anterior. El lado izquierdo muestra los gastos del inversionista; consume o invierte y la inversión tiene un costo de 1 menos el valor de mercado de la fracción de capital que compromete. El lado derecho muestra la máxima liquidez que un inversionista puede tener y está compuesta por los retornos a su capital, la máxima fracción de su capital no depreciado que puede vender y los saldos monetarios que tuviera del periodo anterior. Una vez que conocemos el capital de este periodo y la inversión, podemos despejar su capital del siguiente periodo. Supondremos que (3.6) y (3.7) se cumplen con igualdad para los inversionistas. Esto quiere decir que los inversionistas no querrán quedarse con dinero pues no les genera ningún retorno y querrán vender todo el capital que les sea posible pues el costo para ellos de invertir en capital nuevo es 1 que es estrictamente menor que el precio del capital en el mercado. Reescribiendo la restricción presupuestal anterior con respecto al capital del próximo periodo y sustituyendo (3.6) y (3.7) obtenemos cit + qtR nit+1 = rt nt + donde ⇥ t qt qtR ⌘ + (1 1 ✓qt 1 ✓ R t ) qt ⇤ nt + pt mt (3.24) (3.25) El término qtR nos refleja el costo real que enfrenta el inversionista al comprar capital, en el numerador tenemos lo que le cuesta al inversionista adquirir una unidad de capital y en el denominador tenemos la fracción que termina quedándose de esta unidad. La restricción presupuestal que acabamos de obtener nos muestra la riqueza del empresario del lado derecho, por un lado tienen el retorno de su capital y sus saldos monetarios pero el término más interesante es el segundo en el que vemos que una fracción t de su capital está valuada al costo del mercado mientras que el resto está valuada al costo efectivo del inversionista para reemplazar su capital. Es decir, la fracción de capital que puede vender está valuda a precio de mercado mientras que la que no puede vender 42 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE está valuada por su costo real de reemplazo. Como supusimos que la utilidad de los empresarios es logarítmica, sabemos que van a consumir una fracción (1 ) de su riqueza y ahorrarán el resto. Así obtenemos cit = (1 ⇥ ) rt n t + t qt + (1 R t ) qt nt + pt mt Si despejamos la inversión de 3.23 obtenemos ⇤ (3.26) + pt mt cit (3.27) 1 ✓qt Donde podemos ver que la inversión de cada periodo corresponde a la liquidez que le sobra al inversionista después del consumo dividida entre el costo de la misma. Ahora pasemos al problema de los empresarios ahorradores, es decir, aquellos sin la posibilidad de invertir. Dado que no tienen oportunidad de invertir, la inversión desaparece de su restricción presupuestal. Supondremos también que las dos restricciones de liquidez no son activas, este supuesto nos refleja la idea de que los ahorradores querrán tener dinero para poder comprar equity y de que, dado que no tienen la posibilidad de invertir, no querrán vender su capital pues no tienen la posibilidad de invertirlo a un costo menor. Su restricción presupuestal se reduce a it = (rt + t q t ) nt cst + qt nst+1 + pt mst+1 = rt nt + qt nt + pt mt La restricción presupuestal escrita de esta manera nos muestra al gasto del ahorrador del lado izquierdo y su riqueza del lado derecho; de manera análoga a lo que se hizo anteriormente, tenemos que el consumo es igual a cst = (1 ) [rt nt + qt nt + pt mt ] Mientras que ahorraría el resto de su ingreso, pero ahora el agente tiene dos opciones, ahorrar a través de capital o de dinero. La división entre capital y dinero será tal que iguale sus costos marginales, es decir, el costo de sacrificar una unidad de consumo a cambio de 1/pt unidades de dinero o a cambio de 1/qt unidades de capital. Un ahorrador querrá tener dinero ya que sabe que, en caso de ser inversionista el siguiente periodo, enfrentará una restricción de liquidez y, como ya mencionamos, el dinero le ayudará a aliviar este problema. De las condiciones de primer orden del problema obtenemos que ⇤ pt+1 ⇥ 0 u (ct ) = E (1 ⇡) u0 (cst+1 ) + ⇡u0 (cit+1 ) pt rt+1 + qt+1 0 s = (1 ⇡) E u (ct+1 ) + (3.28) qt R rt+1 + t+1 qt+1 + (1 t+1 ) qt+1 ⇡E u0 (cit+1 ) qt Esta ecuación nos dice que la utilidad marginal del consumo es igual al valor esperado del dinero en el siguiente periodo, la segunda expresión, y a la L UIS S IMON TAMBORREL 43 ganancia esperada del capital en el siguiente periodo, el tercer término. Como el dinero no genera ningún tipo de interés, el empresario obtiene p, el precio del dinero el periodo siguiente. Además, este término está multiplicado por el factor de descuento, la cantidad (1/pt+1 ) y la utilidad marginal esperada del consumo. La ganancia esperada del capital depende de si es inversionista o no en el siguiente periodo y corresponde a su rendimiento,rt+1 , más el valor esperado del capital no depreciado. El valor esperado del capital no depreciado se valía a su costo de reemplazo o a su valor de mercado dependiendo de qué tipo de empresario sea el próximo periodo. Análogamente, este término está multiplicado por el factor de descuento, la cantidad (1/qt ) y la utilidad marginal esperada del consumo. En el segundo término tenemos el valor esperado del dinero en el periodo siguiente, el dinero no genera ningún tipo de interés entonces el empresario obtiene pt+1 , el precio del dinero en el siguiente periodo, multiplicado por el factor de descuento y después por la utilidad marginal esperada del consumo ponderada por las probabilidades de ser inversionista o no. Lo igualamos con la ganancia esperada del capital adicional, el último término. En esta expresión tenemos el rendimiento si es ahorrador, que corresponde al rendimiento del capital que es rt+1 más el valor esperado del capital no depreciado que es qt+1 multiplicado por la cantidad 1/qt y después por el factor de descuento y la utilidad marginal del consumo del periodo siguiente siendo ahorrador. El segundo término de la expresión tiene la probabilidad de ser inversionista y contiene los mismos elementos que el primero solamente que ahora el valor del capital es igual al que ya habíamos encontrado antes pero en t + 1. El argumento que aquí se presenta es puramente intuitivo pero se puede demostrar que es la solución a la ecuación de Bellman asociada al problema. Ya hemos obtenido las soluciones de los diferentes individuos y por lo tanto ahora podemos pasar a tratar a la economía completa. Nótese que todas las ecuaciones que hemos encontrado hasta ahora, tanto de los inversionistas como de los ahorradores, son lineales en las variables de decisión ct , it , nt+1 , mt+1 lo que nos permite agregarlas de manera muy sencilla. Como ya se mencionó, denotaremos con mayúsculas a las variables agregadas. Como los trabajadores deciden no ahorrar, los agregados de capital y dinero corresponden a los que tienen los empresarios. Esto provoca que, al inicio del periodo t, una fracción⇡ de Kt y de Mt está en manos de los empresarios inversionistas y el resto en manos de los no inversionistas. De (3.23) y sustituyéndole el consumo de los inversionistas y sustituyendo el capital y saldos monetarios individuales por los agregados obtenemos una expresión para la inversión agregada (1 ✓qt ) It = ⇡ ⇥ [(rt + t qt ) Kt + pt M t ] (1 ) (1 t) qtR Kt ⇤ (3.29) Ahora utilizamos la condición de vaciado del mercado de bienes. En este caso necesitamos que la producción sea igual al consumo más la inversión. En la siguiente expresión ya hemos restado a la producción wt lt que corresponde al consumo de los trabajadores y el resultado es C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE 44 rt Kt = at Kt↵ = It +(1 ) ⇥ rt + (1 ⇡ ⇡ t ) qt + ⇡ (1 t) qtR Kt + pt Mt (3.30) = Cti + Cts Donde la primera igualdad se da sustituyendo el valor de rt que ya habíamos encontrado. Por último, necesitamos una manera de agregar la ecuación (3.28). Para lograr esto debemos resaltar el hecho de que, en el periodo t, los inversionistas venden una fracción ✓ de su inversión junto con una fracción t de su capital no depreciado que es ⇡ Kt . Aquí n corresponde a la fracción de empresarios que son inversionistas y Kt es el capital con el que llegan al periodo t. De estas condiciones podemos ver que entonces el capital de los ahorradores se convierte en s Nt+1 ⌘ ✓It + t⇡ Kt + (1 (3.31) ⇡) Kt En esta expresión vemos que los ahorradores tienen, además del capital que ya tenían al inicio del periodo, la parte de la inversión a la que tienen derecho y la fracción de capital que le compraron a los inversionistas. Recordemos también que los ahorradores son los únicos individuos con dinero en el periodo t. El ahorro de éstos debe satisfacer (3.28) lo que resulta en (1 ⇡) E " rt+1 + qt+1 qt pt+1 pt s (rt+1 + qt+1 ) Nt+1 + pt+1 M 2 = ⇡E 4 pt+1 pt rt+1 + t+1 rt+1 + t+1 qt+1 + (1 # = qt+1 +(1 qt t+1 ) t+1 ) R qt+1 R s qt+1 Nt+1 + pt+1 M 3 5 (3.32) Esta ecuación se obtiene sustituyendo la utilidad marginal de la función logarítmica como u0 (x) = 1/x. Del lado izquierdo tenemos los valores de los ahorradores donde el denominador corresponde al consumo y el numerador a los términos que teníamos en la ecuación (3.28) en la parte de los ahorradores. El lado derecho corresponde a los inversionistas y se define análogamente. Los factores de descuento intertemporal se cancelan entre sí. Esta ecuación nos dice que, cuando somos ahorradores, no nos importa la falta de liquidez del capital pues no queremos vender nuestro capital así que el retorno del capital (el lado izquierdo del numerador) es mayor que el retorno del dinero (el lado derecho del numerador) y con esto el lado izquierdo de la ecuación es positivo. Si somos inversionistas, el retorno efectivo del capital (el lado derecho del numerador) es menor que el retorno del dinero (el lado izquierdo del numerador). Estos términos están ponderados por su utilidad marginal (el denominador) y la probabilidad de pertenecer a cada clase de empresario. Por último introducimos la ley del movimiento del capital agregada Kt+1 = Kt + It (3.33) ⇤ L UIS S IMON TAMBORREL 45 El capital es la única variable de estado de la economía, además de los parámetros exógenosAt y t . Recordando que estos dos parámetros tienen proceso estacionarios, el equilibrio competitivo se puede definir de manera recursiva como una secuencia {It , pt , qt , rt , Kt+1 } que depende del estado agregado de la economía dado por {At , t , Kt } que satisfaga las ecuaciones (3.19), (3.29), (3.30), (3.32), (3.33) junto con las leyes de movimiento de At y t . Las trayectorias de estos dos parámetros estarán dados por procesos independientes autorregresivos de primer orden. Dado que At sólo entra en el modelo mediante la transformación at , definiremos estos procesos estocásticos de la siguiente manera at = (1 ⇢a ) a + ⇢a at t = (1 ⇢ ) +⇢ t 1 + "a,t 1+" ,t (3.34) (3.35) En los que supondremos que "i ⇠ iid(0, i2 ), i = {a, }. Tenemos dos procesos estacionarios que se mueven alrededor de a y respectivamente. Cabe mencionar que definido de esta manera, puede tomar valores fuera del intervalo [0, 1] pero estos casos no son relevantes para el presente trabajo. Una solución simple a este problema y que no afectaría los resultados del modelo en experimentos en que estas restricciones pudieran ser activas sería simplemente sustituir valores negativos por 0 y mayores a 1 por exactamente 1. De todos modos, estos casos extremos generalmente no serán interesantes de analizar pues el valor de cero implica que no hay restricción de liquidez y es precisamente ésta la que hace interesante al modelo y el caso de uno implica que el empresario sólo puede comprar capital pero no venderlo entonces los inversionistas estarían impedidos de suavizar su consumo ante choques adversos y se verían obligados a simplemente esperar a que el choque se desvanezca. Los resultados relevantes del modelo se encuentran en valores dentro del intervalo abierto (0, 1). 4. M ODELO CON P OLÍTICA M ONETARIA Con lo visto hasta este momento podemos caracterizar el equilibrio del modelo. Ahora vamos a introducir las modificaciones de política monetaria que queremos analizar. La regla es una que corresponde a la compra de activos por parte del banco central. Es similar a la extensión que proponen Kiyotaki y Moore pero en este caso dejaremos fuera la posibilidad de almacenar bienes para consumirlos en un periodo futuro. Con esto seguimos manteniendo la condición planteada de vaciado del mercado de bienes. Dejamos fuera también el gasto del gobierno, es decir, el único agente del gobierno es el banco central y éste se limita a comprar o vender activos según sea necesario. La regla de política monetaria que sigue el banco central es Ntg = K t (4.1) C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE 46 Donde Ntg representa el capital en manos del gobierno y está dividido por el capital de estado estacionario de la economía con lo que logramos que el banco central compre un porcentaje del total de los activos. Vemos que el banco central decide su política monetaria dependiendo del tamaño de las desviaciones del estado estacionario que sufran las variables. Los parámetros i corresponde a qué tan fuerte será la respuesta del banco ante dichas desviaciones. Es evidente que en el estado estacionario el banco central no mantiene activos en su poder. El banco central tiene acceso a una tecnología gratuita de impresión de dinero para financiar sus compras por lo que su restricción presupuestal es de la siguiente forma qt Ntg Ntg 1 = rt Ntg 1 + (Mt+1 (4.2) M t ) pt El gobierno financia sus compras netas de capital mediante los retornos del capital que ya tena o mediante la impresión de dinero. Ahora la oferta monetaria es una variable endógena además de que introdujimos la variableNtg . Falta imponer una condición más, en el modelo base los empresarios eran los únicos que tenían capital por lo que el agregado de los empresarios correspondía al de la economía. Ahora tenemos que g Kt+1 = Nt+1 + Nt+1 (4.3) Hemos introducido tres variables al modelo(M, N g , K) y tres ecuaciones por lo que seguimos teniendo un equilibrio bien definido. Falta modificar las ecuaciones que lo caracterizan para que incorporen estos nuevos supuestos. Las decisiones de los trabajadores no se modifican con la política monetaria, siguen consumiendo todo su ingreso en cada periodo. Las ecuaciones (3.29), (3.30), (3.32) se modifican a (1 ✓qt ) It = ⇡ at Kt↵ = It + (1 (1 ⇡) E " ) ⇥ [(rt + ⇥ rt + (1 t qt ) Nt ⇡ + pt M t ] ⇡ t ) qt + ⇡ (1 # rt+1 + qt+1 pt+1 qt pt s (rt+1 + qt+1 ) Nt+1 + pt+1 Mt+1 2 = ⇡E 4 pt+1 pt rt+1 + t+1 (1 rt+1 + qt+1 + (1 t+1 ) (1 t) t) qtR Nt ⇤ qtR Nt + pt Mt ⇤ (4.4) (4.5) = R qt+1 +(1 t+1 ) qt+1 qt R s t+1 ) qt+1 Nt+1 + pt+1 Mt+1 3 5 (4.6) En la primera ecuación el único cambio que tenemos es que sustituimos el capital total por el que tienen en sus manos los empresarios. En la segunda L UIS S IMON TAMBORREL 47 ocurre lo mismo con el capital y los saldos monetarios, que ahora son variables. En la última ecuación, a primera vista parece que tenemos los mismos cambios pero en realidad hay uno más; el capital de los ahorradores ahora es diferente puesto que ahora hay que tomar en cuenta el capital que tiene el gobierno y no sólo el de los empresarios. La variable N s se convierte en s Nt+1 ⌘ ✓It + t⇡ ⇡) Nt + Ntg Nt + (1 g Nt+1 (4.7) La primera parte es igual que antes, reemplazando K por N y después restamos las compras netas de capital del gobierno en ese periodo. Con estas modificaciones del modelo ya podemos caracterizar de nuevo el equilibrio. Lo hacemos de manera recursiva como una secuencia de g It , pt , qt , rt , Nt+1 , Nt+1 , Mt+1 , Kt+1 que depende del estado de la economía dado por At , t , Kt , Ntg que satisface las ecuaciones (3.19), (3.33), (4.1), (4.2), (4.3), (4.4), (4.5), (4.6) y las leyes de movimiento de los parámetros estocásticos. Parece difícil pensar en la implementación de una regla de política monetaria basada puramente en choques de liquidez que son difíciles de medir y observar, es por esto que analizaremos los resultados del modelo usando una regla alternativa de política monetaria que dependa de variables observables de la economía, en este caso usaremos a la producción pero una vez que veamos los resultados del modelo podremos darnos cuenta que es irrelevante que elijamos está variable en vez de otra como podría ser K, I, r pues las dinámicas de estas variables están relacionadas entre sí y simplemente habría que cambiar el parámetro de intensidad de la respuesta de política monetaria ( ) para obtener resultados cualitativamente iguales independientemente de qué variable observable elijamos. Cabe mencionar que los resultados sí serán diferentes a cuando se elige la liquidez como parámetro de política monetaria. La nueva regla será simplemente Ntg = Kt y Yt Y Y (4.8) que es igual a la que teníamos antes pero ahora hacemos que la reacción dependa de las desviaciones de la producción de su valor de estado estacionario. Bajo esta nueva regla no hace falta hacer ningún cambio al modelo, el equilibrio sigue estando caracterizado de la misma manera que con la primera regla de política. 5. C ALIBRACIÓN Muchos de los parámetros del modelo son estándar en la literatura y por lo tanto usaremos valores que son aceptados en general, por ejemplo, la depreciación, el factor de descuento, la retribución al trabajo y al capital de la función de producción. Para los experimentos tendremos dos economías que llamaremos Avanzada y Emergente. La primera estará calibrada para Estados Unidos mientras que la segunda será simplemente una economía igual excepto en la mayor 48 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE restricción de liquidez que tiene lo que nos va a ayudar a que ambos modelos sean comparables entre sí. Para calibrar el resto del modelo seguiremos de cerca el trabajo de Del Negro et al. (2011) ya que su modelo incluye muchos de parámetros iguales o muy similares a los nuestros y ellos hacen un riguroso ejercicio de calibración para la economía de Estados Unidos. Los parámetros del modelo que vale la pena destacar son el factor de liquidez y la posibilidad de invertir. Para el factor de liquidez, Del Negro et al. (2011) estima la fracción de activos líquidos en la economía con respecto al capital pero usando una definición amplia de capital (como es el caso de nuestro modelo, en que el capital corresponde al único activo de la economía). Para los activos líquidos utilizan los pasivos del gobierno federal y el resto de los activos de la economía se consideran en la categoría de capital. Una vez que conocen la fracción de activos líquidos en la economía, los autores encuentran que es de alrededor de 13 % en promedio pero que llega a ser de hasta 15.48 % durante la crisis del 2008, pueden calcular un parámetro que refleje la liquidez en su modelo. Para nuespM tro modelo, encontramos que en el estado estacionario qK+pM = 0.148 cuando = 0,193. Con esto, tenemos una proporción de liquidez que se sitúa entre el promedio y el valor de la crisis encontrados por los autores ya mencionados. Notemos que y ✓ tienen una interpretación muy similar en el modelo, el primer parámetro afecta al capital nuevo y el segundo al capital existente, pero lo que hacen ambos es limitar la velocidad de desacumulación del capital. Con esto en mente es que en la calibración asumiremos que = ✓, aunque sea sólo en el estado estacionario, puesto que en los experimentos tendremos choques a . Hacer una estimación similar para México, o en dado caso para una nación emergente, es complicado debido a la escasez de datos de capital en este sentido amplio. México es un país con menos liquidez que Estados Unidos, como se argumentó anteriormente, pero hacer una estimación puntual sobre el tamaño de la diferencia es difícil, es por eso que se ha elegido tomar un valor igual a dos terceras partes del de Estados Unidos para . Este supuesto no es crucial para los resultados pues la dirección de los cambios se mantendría aunque no hagamos una hipótesis puntual sobre la magnitud de los cambios. Para el parámetro n que refleja la probabilidad de ser inversionista, tomaremos un valor de 5 % que es aproximadamente el valor que encuentran Doms y Dunne (1998). Ellos encuentran que alrededor del 20 % de las empresas realizan inversiones en capital cada año, y al estar usando datos trimestrales es que tomamos el 5 %. El resto de los parámetros se eligió tomando valores aceptados generalmente en la literatura; los resultados de las simulaciones no dependen de forma crucial de la elección de éstos y quedan resumidos en el Cuadro (1). Cabe mencionar que la elección del parámetro de participación del capital en la producción, que tiende a ser muy distinto entre las economías avanzadas y emergentes, no cambia los resultados del modelo aun cuando se eligen valores distintos entre las economías para darle mayor participación al trabajo en la economía emergente. Otro parámetro que vale la pena destacar es la elección de y , el parámetro de la regla de reacción de la regla de política monetaria si eligiéramos Y como Para el par·metro ! que reáeja la probabilidad de ser inversionista, tomaremos un valor de 5 % que es aproximadamente el valor que encuentran Doms y Dunne (1998). Ellos encuentran que alrededor del 20 % de las empresas realizan inversiones en capital cada aÒo, y al estar usando datos trimestrales es que tomamos el 5 %. El resto de los par·metros se eligiÛ tomando valores aceptados generalmente en la literatura; los resultados de las simulaciones no dependen de forma crucial de la elecciÛn de Èstos y quedan resumidos en el Cuadro (1). Cabe mencionar que la elecciÛn del par·metro de participaciÛn del capital en la producciÛn, que tiende a ser muy distinto entre las economÌas avanzadas y emergentes, L UIS S IMON TAMBORREL 49 no cambia los resultados del modelo aun cuando se eligen valores distintos entre las economÌas para darle mayor participaciÛn al trabajo en la economÌa emergente. C UADRO 1: E LECCIÓN DE PARÁMETROS PARA LAS S IMULACIONES DEL M ODELO Cuadro 1: ElecciÛn de Par·metros para las Simulaciones del Modelo SÌmbolo Par·metro Valor " factor de descuento 0.99 # participaciÛn del capital en la producciÛn 0.4 $ (Avanzada) fracciÛn de capital nuevo que se puede comprometer 0.193 $ (Emergente) fracciÛn de capital nuevo que se puede comprometer 0.129 % depreciaciÛn 0.975 & inverso de la elasticidad de Frisch 1 ! probabilidad de ser inversionista 0.05 'a persistencia del proceso autorregresivo 0.95 '" persistencia del proceso autorregresivo 0.95 ( (Avanzada) desviaciÛn est·ndar de los errores del proceso estoc·stico 0.15 ( (Emergente) desviaciÛn est·ndar de los errores del proceso estoc·stico 0.05 a intensidad de la respuesta de polÌtica monetaria ante choques en a 0.2 " intensidad de la respuesta de polÌtica monetaria ante choques en + -0.1 y intensidad de la respuesta de polÌtica monetaria ante choques en Y -2.0 ! par·metro de sustituciÛn ocio-consumo 1 A productividad total de los factores 1 M base monetaria en el modelo sin gobierno 1 Otro par·metro que vale la pena destacar es la elecciÛn de y , el par·metro de la regla de reacciÛn de la regla de polÌtica monetaria si eligiÈramos Y como variable para decidir la intervenciÛn del banco variable para decidir la intervención del banco central. Se eligió un valor tal central. Se eligiÛ un valor tal que iguale aproximadamente el tamaÒo total de compras de activos que iguale aproximadamente el tamaño total de compras de activos por parte por parte del gobierno durante todos los periodos. AsÌ, aunque al principio compre m·s capital bajo del gobierno durante todos los periodos. Así, aunque al principio compre más capital bajo la regla original y después bajo la segunda, en el agregado habrá comprado aproximadamente la misma23cantidad de capital. 6. R ESULTADOS Ahora corremos una serie de simulaciones del modelo y presentamos las funciones de impulso-respuesta a un choque de una desviación estándar ( en la lista anterior) a . Para entender la dinámica del modelo, presentamos primero la diferencia en la economía Avanzada con la regla de política monetaria y sin ella. Todos los resultados se presentan en desviaciones porcentuales respecto al estado estacionario, lo que vuelve más fácil comparar las dos economías. El capital del gobierno se presenta como porcentaje del capital agregado de la economía en cada periodo ya que su valor de equilibrio es cero. En la Gráfica (6) claramente podemos ver que la política monetaria sí es efectiva para compensar esta falta de liquidez en la economía. El gobierno entra a compensar la falta de liquidez que se da entre los agentes y que impide que los recursos se canalicen hacia los inversionistas por lo que logra que la caída en producción y consumo sea mucho menor. Vemos que el precio del capital aumenta en el periodo del choque de manera muy importante cuando el banco compra los 50 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE activos pero, como los devuelve a la economía más rápido de lo que el choque permite, estos vuelven a su valor de estado estacionario más rápidamente. En el periodo del choque, la reacción del gobierno provoca un aumento en la demanda de capital lo que, además de aumentar su precio, genera un efecto de crowding out de la inversión privada que observamos que cae más en el periodo inicial que en el caso sin gobierno. A partir del segundo periodo, el efecto del gobierno va en el sentido contrario; mientras que la economía sigue restringida por la persistencia del choque, el gobierno alivia la falta de liquidez al empezar a devolver parte del capital que adquirió el periodo pasado con lo que la inversión se recupera más rápido y en consecuencia ocurre lo mismo con el capital y la producción. En el caso del consumo, el primer periodo vemos un aumento importante de éste para satisfacer la condición de vaciado del mercado de bienes y después su caída es más fuerte y tarda más tiempo en recuperarse en ausencia de la política monetaria. El comportamiento del precio del capital q sigue la misma tendencia que las dinámicas de oferta y demanda del capital, aumenta mucho en el primer periodo pero después regresa al equilibrio más rápido. Por último, el retorno del capital r sigue la dinámica esperada que nos da la productividad marginal del capital, aumenta más en el caso en el que no hay política monetaria y el capital cae más. Cabe mencionar la dinámica poco convencional de algunas de las funciones de impulso-respuesta, se debe a que se usaron aproximaciones de segundo orden para resolver el modelo y por lo tanto la varianza juega un papel en las mismas generando dinámicas que pudieran parecer extrañas. Esto se solucionaría simplemente tomando aproximaciones de primer orden pero con el costo de perder un poco de precisión en la aproximación aunque los resultados del modelo no se alteran. Ahora que hemos visto que la política monetaria sí es efectiva para contrarrestar los choques de liquidez, pasamos al segundo experimento que consiste en comparar las reacciones de la economía Avanzada con la Emergente cuando la regla de política monetaria se define en función de la liquidez. A través de este experimento queremos analizar las ventajas o desventajas que existen en las economías emergentes a la hora de implementar este tipo de políticas. La Gráfica (7) muestra las funciones de impulso-respuesta de un choque de liquidez igual (relativo al tamaño de cada economía). Vemos que claramente la política monetaria implementada es más efectiva en la economía que se encontraba más restringida, es decir, la Emergente. Todas las cantidades, inversión, producción, capital y consumo, se alejan menos de su estado estacionario y regresan más rápido a éste. En consecuencia, el ajuste de los precios también es menor. Además, notemos que el capital en manos del sector privado, N, se aleja menos de su estado estacionario, es decir, el gobierno tiene menos activos relativo al capital que existe en la economía en un momento dado. Este resultado ocurre aunque las dos economías están operando bajo la misma regla de política monetaria ya que ésta se encuentra definida en relación al estado estacionario del capital. No sería tan natural definirla basada en el capital del periodo corriente pues lo que provocaría sería que cuando la economía tiene poco capital, el denominador cae, el gobierno reaccionaría menos, Ng sería menor para mantener la igualdad pero en realidad nosotros esperaríamos que L UIS S IMON TAMBORREL 51 F IGURA 6: M ODELO C ON Y S IN P OLÍTICA M ONETARIA EN E CONOMÍA AVANZADA (A) I (B) K (C) Y (D) C (E) Q (F) R - - - Sin PM Avanzado —– Con PM Avanzado 52 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE entre más severa sea la crisis más enérgica sea la reacción de la política monetaria para contrarrestarla. Y cabe mencionar que si definiéramos la regla de política monetaria de esta manera solamente amplificaría los resultados ya que la reacción del gobierno sería más fuerte en la economía Emergente con lo que los efectos del choque serían incluso menores. La intuición detrás de los resultados radica en que nos encontramos en una economía restringida, estamos en un equilibrio subóptimo y mientras más fuerte sea la restricción de liquidez más nos alejamos del equilibrio eficiente. En este sentido, las acciones del gobierno son más efectivas mientras más lejos estamos del óptimo ya que ahí incluso pequeñas intervenciones tienen efectos significativos en ayudar a una reasignación más eficiente de los recursos. Podemos pensar en el efecto de las acciones del gobierno como teniendo una especie de rendimientos decrecientes a escala, conforme más cerca estamos del óptimo y en consecuencia la economía es más eficiente, menos efectiva es la política monetaria para contrarrestar los choques pues éstos nos alejan menos del óptimo no restringido. Como ya se argumentó anteriormente, resulta difícil medir la liquidez de la economía en el sentido en que la estamos tratando en este modelo. El volumen operado de activos financieros nos da una idea pero es tan sólo una parte de algo más complejo. Con esto en mente es que planteamos el siguiente experimento, definir la regla de política monetaria en función de alguna variable observable, en este caso la producción. En la Gráfica (8) vemos los resultados de la simulación donde claramente la reacción del gobierno es más lenta pues su reacción depende de la producción y ésta va cayendo lentamente conforme el capital se desacumula. Esto ocasiona que al principio la caída sea mayor pero también provoca que el gobierno mantenga los activos durante más tiempo pues la producción no regresa inmediatamente a su estado estacionario una vez que se desvanece el choque sino que regresa paulatinamente. Estas dinámicas generan que las funciones de impulso respuesta se crucen, el choque primero afecta más a la economía porque el gobierno se tarda en reaccionar pero provoca que también se tarde más en normalizar sus medidas de estímulo con lo que la economía se recupera más rápido. Bajo estos supuestos resulta difícil decir qué regla sería mejor para el bienestar de los consumidores y dependerá de la calibración específica de los parámetros en cada experimento aunque, en general, podríamos pensar que preferiríamos la regla original puesto que nos ayuda a suavizar el consumo; evita la fuerte caída inicial que vemos en el caso de la segunda regla. La dinámica de los precios va en línea con lo que nos reflejan las cantidades, primero el retorno al capital r aumenta mucho en el segundo caso como consecuencia de la mayor caída en capital lo que aumenta la productividad marginal del mismo pero igualmente se recupera más rápido. El precio del capital en el mercado, igual que antes, sigue una dinámica inversa a la de la inversión; su ajuste es más suave porque también el ajuste de la inversión es más suave con la nueva regla de política. L UIS S IMON TAMBORREL F IGURA 7: M ODELO C ON P OLÍTICA M ONETARIA EN 53 E CONOMÍA AVANZADA GENTE (A) I (B) N (C) I ( D ) Ng (E) Y (F) C (G) Q (H) R - - - Con PM Avanzado —– Con PM Emergente Y E MER - 54 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE F IGURA 8: M ODELO C ON P OLÍTICA M ONETARIA EN E CONOMÍA AVANZADA GENTE (A) I (B) N (C) I ( D ) Ng (E) Y (F) C (G) Q (H) R - - - Con PM Y Emergente —– Con PM Emergente Y E MER - L UIS S IMON TAMBORREL 7. 55 C ONCLUSIONES Y E XTENSIONES Las simulaciones nos dejan ver que, bajo este modelo, la política monetaria tiene un efecto muy importante para ayudar a la economía a recuperarse de los choques. Este efecto se magnifica conforme más restringida sea la liquidez de estado estacionario de la economía lo que nos sugiere que este tipo de intervenciones podrían ser más efectivas en países como México. Vimos también que, aunque la liquidez es difícil de medir, parece mejor tener una regla definida en función de ésta en lugar de en alguna de las otras variables observables. Así, la recomendación de política derivada del presente trabajo sería la de realizar esfuerzos para medir la liquidez de la economía y para detectar a tiempo desviaciones y choques de la misma, esto con el fin de que la reacción de política monetaria pueda ser oportuna y no se dé una vez que la caída de la producción haya sido mayor. Claramente este trabajo es un primer acercamiento a la implementación de este tipo de políticas en economías emergentes y deja fuera una consideración de suma importancia, la dinámica de la inflación. No es el objetivo de este trabajo analizar la inflación pues su dinámica queda determinada por construcción del modelo: cuando el gobierno compra activos lo hace imprimiendo dinero por lo que el primer periodo es altamente inflacionario y los demás, mientras devuelve activos a la economía son deflacionarios. Esto es una consecuencia natural de que la hoja de balance del banco central en el estado estacionario sea cero y por lo tanto su única manera de comprar activos en el periodo del choque es a través del señoreaje. Una primera extensión que sería interesante analizar sería empatar este modelo con un esquema de metas de inflación. Una regla como la que está definida sobre la producción genera dinámicas más acorde a este esquema pues inicia las compras de activos paulatinamente con lo que la inflación aumenta a lo largo de los periodos en los que el gobierno adquiere activos pero a un ritmo más moderado pues los retornos que le paga el capital que ya tiene le ayudan al gobierno a financiar parte del capital nuevo que adquiere. Para esta extensión podríamos pensar también quizá en un esquema en que el tamaño de la hoja de balance del banco central no sea cero en el estado estacionario con lo que podría haber compras no inflacionarias a través de las reservas internacionales. Estas consideraciones son analizadas por Stone et al. (2011) quienes concluyen, tras analizar la evidencia empírica existente, que los programas de compras de activos han sido realizadas por bancos centrales con alta credibilidad en el combate a la inflación y es por esto que no han resultado en aumentos significativos en la misma pero éste no siempre es el caso en las economías emergentes. En este sentido, la credibilidad de un banco central resulta fundamental para la implementación de este tipo de políticas. Es una condición necesaria para la implementación de políticas no convencionales ya que sin ella los agentes podrían interpretar las acciones del banco central como un abandono del compromiso de estabilidad de precios. Una vez que el banco central ha adquirido credibilidad ante los agentes, entonces puede iniciar este tipo de políticas que, como pretende mostrar el modelo, impulsan la actividad al reducir ciertas fricciones en los mercados a costa de un aumento en el tamaño de la hoja de balance del banco. 56 C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE También existe otro riesgo que queda fuera de los alcances del modelo, una política de este tipo podría prestarse para financiar deuda de los gobiernos y generaría incentivos a que los bancos centrales pierdan tanto su independencia como su credibilidad. En conclusión, aunque aún hay ciertos riesgos que tomar en cuenta, una política monetaria de compra de activos podría potencialmente tener efectos benéficos e incluso mayores en una economía emergente que en una avanzada. Es por esto que debería ser una opción más a considerar dentro del conjunto de herramientas que posee e implementa un banco central en una de estas naciones. R EFERENCIAS [1 ] Banco Central Europeo. "Technical features of Outright Monetary Transactions". Comunicado de Prensa. 06 de septiembre de 2012. www.ecb.int [2 ] Banco Central Europeo. Ïntroductory statement to the press conference". Comunicado de Prensa. 02 de agosto de 2012. www.ecb.int [3 ] Banco de Chile. .En su reunión mensual de política monetaria, el Consejo del Banco Central de Chile acordó reducir la tasa de interés de política monetaria en 25 puntos base hasta 0,50 % anual y adoptar medidas complementarias de política monetaria". Comunicado de prensa. 09 de julio de 2013. www.bcentral.cl [4 ] Banco de Japón. Çomprehensive Monetary Easing". Comunicado de prensa. 05 de octubre de 2010. www.boj.or.jp [5 ] Banco de Japón. Ïntroduction of the Quantitative and Qualitative Monetary Easing". Comunicado de Prensa. 04 de abril de 2013. www.boj.or.jp [6 ] Banco de Japón. Ïntroduction of the ‘Price Stability Target’ and the ’Open-Ended Asset Purchasing Method’ ". Comunicado de Prensa. 22 de enero de 2013. www.boj.or.jp [7 ] Banco de México. Redefinición de los Agregados Monetarios". 1999. www.banxico.org.mx. [8 ] Banco Nacional Checo. "Transcript of the introductory statement from the press conference". Comunicado de prensa. 01 de noviembre de 2012. www.cnb.cz [9 ] Bank of England. "Bank of England Reduces Bank Rate by 0.5 Percentage Points to 0.5 % and Announces £75 Billion Asset Purchase Programme". Comunicado de prensa. 05 de marzo de 2009. www.bankofengland.co.uk [10 ] Bernanke, Ben, Mark Gertler, y Simon Gilchrist. "The financial accelerator in a quantitative business cycle framework". Handbook of macroeconomics 1.1999. Pp. 1341-1393. [11 ] Bernanke, Ben, y Mark Gertler. .Agency costs, net worth, and business fluctuations". The American Economic Review. 1989. Pp. 14-31. [12 ] Board of Governors of the Federal Reserve System. "Federal Reserve issues FOMC statement". Comunicado de prensa. 13 de septiembre de 2012. www. federalreserve.gov [13 ] Board of Governors of the Federal Reserve System. "Federal Reserve announces it will initiate a program to purchase the direct obligations of housing-related government-sponsored enterprises and mortgage-backed securities backed by Fannie Mae, Freddie Mac, and Ginnie Mae". Comunicado de prensa. 25 de noviembre de 2008. www. federalreserve.gov [14 ] Board of Governors of the Federal Reserve System. "FOMC statement and Board approval of discount rate requests of the Federal Reserve Banks of New York, Cleveland, Richmond, Atlanta, Minneapolis, and San Francisco". Comunicado de prensa. 16 de diciembre de 2008. www. federalreserve.gov [15 ] Del Negro, Marco, Gauti Eggertson, Andrea Ferrero y Nobuhiro Kiyotaki. "The Great Escape?: A Quantitative Evaluation of the Fed’s Liquidity Facilities". Staff Reports 520. Federal Reserve Bank of New York. 2011. L UIS S IMON TAMBORREL 57 [16 ] Doms, Mark, y Timothy Dunne. Çapital adjustment patterns in manufacturing plants". Review of Economic Dynamics 1, no. 2. 1998. Pp. 409-429. [17 ] Galati, Gabriele y Richhild Moessner. "Macroprudential Policy – A Literature Review". Journal of Economic Surveys. 2012 [18 ] Ghosh, Atish, Marcos Chamon, Christopher Crowe, Jun Kim y Jonathan Ostry. Çoping with the Crisis: Policy Options for Emerging Market Countries". IMF Staff Position Note 09/08. 2009. [19 ] Ishi, Kotaro, Mark Stone y Etienne Yehoue. Ünconventional Central Bank Measures for Emerging Economies". IMF Working Paper 09/226. 2009. [20 ] Kiyotaki, Nobuhiro, y John Moore. Çredit Cycles". Journal of Political Economy 105, no. 2. 1997. [21 ] Kiyotaki, Nobuhiro, y John Moore. "Liquidity, business cycles, and monetary policy". No. w17934. National Bureau of Economic Research, 2012. [22 ] Panigirtzoglou, Nikolaos. .Are ETFs dangerous?". J.P.Morgan Global Asset Allocation. 05 July 2013. [23 ] Reserve Bank of India. "Second Quarter Review of Monetary Policy 2012-13 Press Statement by Dr. D. Subbarao, Governor, Reserve Bank of India". Comunicado de prensa. 30 de octubre de 2012. www.rbi.org.in [24 ] Reserve Bank of India. "Monetary Policy Statement for 2012-13 Press Statement by Dr. D. Subbarao Governor, RBI". 17 de abril de 2012. www.rbi.org.in [25 ] Stone, Mark, Kenji Fujita y Kotaro Ishi. "Should Unconventional Balance Sheet Policies be Added to the Central Bank Toolkit? A Review of the Experience So Far". IMF Working Paper 11/145. 2011. 58 59 U NA JUSTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA * M IGUEL Z ERECERO** El presente artı́culo introduce una versión simplificada del modelo de Mankiw y Reis (2002) para justificar que los bancos centrales tengan una meta de inflación positiva. Adicionalmente, para una variedad de calibraciones se calcula un nivel de inflación óptimo tomando en cuenta los beneficios y costos que la inflación pueda tener en la economı́a del modelo. Se encuentra que ante un menor nivel de competencia la inflación óptima es mayor. Esto podrı́a justificar que paı́ses en vı́as de desarrollo tengan una meta de inflación mayor en comparación con economı́as avanzadas que pudieran presentar un mayor nivel de competencia. PALABRAS CLAVE : Polı́tica monetaria, inflación óptima, Macreconomı́a, metas de inflación 1. I NTRODUCCI ÓN Un recomendación de polı́tica clásica dentro de la polı́tica monetaria es la regla de Friedman. Dicha regla parte de la intuición de que el costo de oportunidad de tener dinero es igual a la tasa de interés nominal. Por lo tanto, una polı́tica monetaria óptima minimizarı́a dicho costo de oportunidad al igualar la tasa de interés nominal a cero. Eso implica que si existen tasas reales positivas, para lograr una tasa de interés nominal igual a cero, la inflación debe ser negativa e igual en valor absoluto a la tasa de interés real.1 Como Schmitt-Grohé y Uribe (2010) recalcan, aun con esta recomendación clásica de polı́tica, las metas de inflación de los bancos centrales son positivas. En ese mismo trabajo, Schmitt-Grohé y Uribe introducen en distintos modelos una rigidez nominal en la forma de demanda por dinero fiduciario para realizar transacciones (que justificarı́a la regla de Friedman) con otro tipo de fricciones, con el fin de contrastar dichas fricciones e identificar cuál efecto domina a la hora de establecer un nivel óptimo de inflación. Concluyen que la inflación óptima se encuentra, según el modelo, en un intervalo entre el valor negativo de la tasa de interés real (el valor que da la regla de Friedman) a valores insignificantes por arriba de cero. Como objeciones a la regla de Friedman, el principal argumento que se encuentra en la literatura es la rigidez nominal a la baja en los salarios. Desde que Tobin (1972) argumentó que los salarios eran más rı́gidos a la baja que a la alza y por lo tanto la inflación positiva podrı́a ser buena para la economı́a dado que ésta engrasaba al mercado laboral, se ha considerado a la inflación un ingrediente importante para permitir que los salarios reales caigan ante choques * Una versión anterior de este trabajo se presentó en el Concurso de carteles de investigación económica para estudiantes de Economı́a del CEMLA, 2013. ** Economista de la Dirección General de Investigación Económica del Banco de México. Quiero agradecer los comentarios de Jessica Roldán. Además, quiero reconocer a Luis Simon como coautor en las etapas iniciales de este trabajo. Las opiniones expresadas en este artculo son responsabilidad del autor y no necesariamente reflejan la postura del Banco de México. Cualquier error u omisión es responsabilidad del autor. 1 Para un análisis con mayor profundidad sobre la regla de Friedman, se puede consultar Walsh (2003). 60 J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA adversos. Sobre esta idea, ha habido trabajos que refuerzan dichos argumentos, como Akerlof, et al (1996), o que calculan cuál es la inflación óptima bajo esta rigidez, como Kim y Ruge-Murcia (2009). El presente trabajo intenta presentar un nuevo enfoque a este problema y agregar otro ingrediente a la discusión: una rigidez nominal en la forma de la lenta difusión de la información en la economı́a. Dicha rigidez es presentada en el trabajo de Mankiw y Reis (2002) y da entrada a otra justificación para que la inflación óptima sea positiva. La idea detrás es que una fracción de monopolistas no observan el nivel de precios actual de la economı́a sino el anterior, por lo tanto ponen su precio descontando un nivel de precios no actualizado. Si existiera inflación positiva, estos monopolistas no subirı́an su precio acorde a la inflación, por lo que el markup relativo al nivel de precios de la economı́a es menor al que ellos hubieran querido. Esto tiene consecuencias positivas en la economı́a. No obstante, la inflación también genera pérdidas en la economı́a al generar dispersión en los precios relativos. Este enfoque nos permite contrastar entre dos distorsiones, los monopolistas y las rigideces nominales, y un instrumento para intentar contrarrestar ambas, la inflación. El trabajo continúa de la siguiente forma: la segunda sección presenta una versión simplificada del modelo de Mankiw y Reis (2002), la tercera discute cuál es el nivel de inflación óptimo y sus implicaciones, y la cuarta sección concluye. 2. M ODELO El modelo a presentar es una versión simplificada del modelo de Mankiw y Reis (2002). El modelo consta de familias que consumen y ofrecen trabajo, firmas productoras de bienes intermedios que utilizan trabajo como insumo para producir en un ambiente de competencia monopolı́stica, una firma productora de un bien final que utiliza como insumos los bienes intermedios y produce en un ambiente de competencia perfecta, y una autoridad monetaria. Se introduce rigideces nominales al no permitir que una fracción de las firmas productoras de bienes intermedios observen el nivel de precios actual de la economı́a, sino el del periodo anterior. Como mencionan Mankiw y Reis (2002), la introducción de esta rigidez intenta capturar el hecho de que la información en la economı́a se mueve de manera lenta. Esta rigidez permite que las acciones de polı́tica monetaria no sean neutrales. Los monopolistas querrán poner un precio por arriba de su costo marginal nominal, sin embargo, la fracción de empresas que observa el nivel de precios anterior termina escogiendo un precio que se desvı́a de aquél que escogerı́an si observaran el nivel de precios actual. Entonces, con inflación positiva, estos monopolistas escogen un nivel de precios menor al que hubieran escogido, disminuyendo el markup relativo y ocasionando efectos positivos en la economı́a. Aunque la inflación pueda modificar el precio que escoge una fracción de los monopolistas que no observa el nivel de precios actual de la economı́a, ésta no afecta a la fracción que sı́ puede observar el nivel de precios actual de la M IGUEL Z ERECERO 61 economı́a. Además, el que haya inflación ocasiona que la fracción de empresas que sı́ observan el nivel de precios actual ponga precios distintos de los productores que no pudieron observar el nivel de precios contemporáneo. Esta dispersión en los precios puede generar una pérdida en la producción total. Por lo tanto, la inflación puede tener efectos positivos en la economı́a por un lado pero al mismo tiempo generar dispersión en los precios relativos y afectar negativamente a la economı́a. Por ello, es posible encontrar un nivel óptimo de inflación que tome en cuenta estos dos efectos. 2.1 FAMILIAS Las familias consumen ct , ofrecen trabajo lt a un salario dado wt , invierten en un activo libre de riesgo bt que paga un tasa de interés rt y reciben las ganancias por ser dueños de las empresas intermedias monopolı́sticas ⇧t . De manera concreta, el problema de las familias se resume en escoger ct , lt y bt para maximizar la siguiente expresión: 1 X t (ln ct + ln (1 (2.1) lt )) t=0 sujeto a la sucesión de restricciones: ct + bt = wt lt + (1 + rt 1 ) bt 1 + ⇧t (2.2) De dicho problema se pueden obtener las siguientes condiciones de optimalidad para cada t: ct+1 = (1 + rt ) (2.3) ct ct = wt (2.4) 1 lt 2.2 E MPRESA PRODUCTORA DEL BIEN FINAL La empresa productora del bien final opera en una ambiente competitivo y utiliza como insumos bienes intermedios. Dicha empresa escoge Xt (i) 8 i para maximizar la siguiente expresión: Pt Y t Z 1 0 Ptx (i)Xt (i)di sujeto a la tecnologı́a que transforma bienes intermedios en finales: Yt = Z " 1 Xt (i) " 1 " " di 1 (2.5) 0 donde Yt es el bien final y Pt es su precio, Xt (i) es el bien intermedio i y Ptx (i) es su precio. 62 J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA Resolviendo el problema anterior para un bien intermedio genérico Xt (i) se puede obtener la función de demanda para dicho bien: Xt (i) = ✓ Ptx (i) Pt ◆ " (2.6) Yt donde " > 1 es la elasticidad intratemporal de sustitución entre distintas variedades de bienes intermedios. Por lo tanto, ante un mayor nivel de " más sustituibles son los bienes intermedios y el poder de mercado de los monopolistas disminuye. Es decir, se podrı́a interpretar que ante un mayor nivel de ", el nivel de competencia en la economı́a es mayor. 2.3 E MPRESAS PRODUCTORAS DE BIENES INTERMEDIOS Existe un contı́nuo de empresas que producen bienes intermedios, representadas por el intervalo [0, 1] donde cada empresa produce una variedad distinta, lo que les permite tener poder de mercado. Es decir, operan en un ambiente de competencia monopolı́stica. Una caracterı́sitca adicional es que una fracción ↵ de las empresas no pueden observar el nivel de precios contemporáneo de la economı́a a la hora de escoger su precio y en lugar observan el nivel de precios del periodo anterior. El resto de las 1 ↵ empresas observan el nivel de precios contemporáneo. Una empresa intermedia i escoge su precio Ptx (i) y el nivel de trabajo lt (i), tomando como dada la demanda por su tipo de bien y con la restricción de que la producción debe igualar a la demanda dado el precio escogido. Es decir, maximiza la siguiente expresión: Ptx (i) Xt (i) PtE wt lt (i) sujeto a la demanda por dicha variedad (2.6) y a la función de producción: Xt (i) = lt (i) De lo anterior se puede obtener que el monopolista sólo escoge el precio Ptx (i) buscando maximizar la siguiente expresión: Ptx (i) PtE wt ✓ Ptx (i) Pt ◆ " Yt La condición de optimalidad de resolver el problema anterior arroja la siguiente expresión: ✓ ◆✓ E◆ " Pt x Pt (i) = (Pt wt ) " 1 Pt donde: PtE = ⇢ Pt Pt 1 i↵ i>↵ M IGUEL Z ERECERO 63 Es decir, para las ↵ empresas que no observan el nivel de precios contemporáneo, la condición de optimalidad es: pN t y para el resto de las 1 ✓ = Ptx (i) Pt " 1 ◆✓ 1 ⇡t ◆ (2.7) (wt ) ↵ empresas es: pO t donde pN t ⌘ " ✓ = " " 1 ◆ (2.8) (wt ) Ptx (i) Pt 8i > ↵ y ⇡t ⌘ PPt t 1 . ⇣ ⌘⇣ ⌘ ⇣ ⌘ 1 Los monopolistas cobran un markup, " " 1 o " " 1 sobre el costo ⇡t marginal wt . De la ecuación (2.7) se puede notar que una inflación positiva podrı́a reducir el markup de los monopolistas que no observan el nivel de precios adecuado. Lo que darı́a lugar a un aumento por la demanda de trabajo, aumentando el salario real y a su vez la oferta de trabajo. Por lo tanto parecerı́a que una inflación igual a " " 1 serı́a lo ideal. No obstante y como se mostrará más adelante, al sólo ser una fracción ↵ de todas las empresas, la inflación efectivamente reduce el markup de dicha fracción de empresas pero al mismo tiempo genera una dispersión de precios entre la fracción que no observa el nivel de precios contemporáneos y la fracción que sı́ observa el nivel de precios actual. Esta dispersión de precios genera pérdidas en la producción agregada de la economı́a. 8i ↵, pO t ⌘ 2.4 A GREGACI ÓN Del problema de la empresa del bien final, se puede obtener una expresión para el nivel de precios de la economı́a. Sustituyendo (2.6) en (2.5) se obtiene: Pt = Z 1 1 0 1 " Ptx (i)1 " di De esta última expresión se puede obtener: 1 = ↵ pN t 1 " + (1 ↵) pO t 1 " (2.9) Para derivar una restricción agregada de la economı́a se toma la ecuación que iguala la oferta por la demanda para un bien i y se integra sobre todo el dominio Z 1 Z 1✓ x ◆ " Pt (i) lt (i)di = Yt di Pt 0 0 lt = s t Y t (2.10) 64 J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA R1 donde lt = 0 lt (i)di y st es una medida de dispersión de los precios. Se expresa la variable st de la siguiente forma: st = = Z Z 1 0 ↵ 0 ✓ Ptx (i) Pt " pN t ◆ " di di + Z 1 ↵ pO t " di Lo que al final da: s t = ↵ pN t " + (1 ↵) pO t " (2.11) O Si ⇡t = 1, implica que pN t = pt = 1 y por lo tanto st = 1 y no hay costo en la producción por la dispersión de precios. En cambio, si la inflación fuera positiva, la medida de dispersión de precios serı́a mayor a uno generando pérdidas en la producción. Es decir si ⇡ > 1, s > 1. Finalmente, hay que notar que se vacı́a el mercado de bienes finales y se tiene: Yt = c t (2.12) 2.5 E QUILIBRIO Un equilibrio competitivo está definido como los procesos {ct , lt , rt , st , pN t , pO , w , Y } tales que satisfagan las ecuaciones (2.3), (2.4), (2.7), (2.8), (2.9), (2.10), t t t (2.11) y (2.12), donde ⇡t es una variable que el gobierno escoge por medio del banco central. 3. I NFLACI ÓN ÓPTIMA Con el modelo propuesto, se puede obtener un nivel de inflación que maximize el bienestar de las familias. Por un lado, una inflación positiva reduce el markup de una fracción de monopolistas, pero por otro lado, crea una dispersión en los precios generando una pérdida en la producción agregada. En este modelo, la deflación generarı́a mayores pérdidas en bienestar ya que magnificarı́a el markup cobrado por una fracción de los monopolistas y además generarı́a dispersión en los precios relativos. Para evaluar cuál es el valor de la inflación óptima, se escoge el valor de la inflación tal que maximize la utilidad de las familias en el periodo t.2 De manera formal, la inflación óptima se obtendrı́a de resolver el problema O de Ramsey para el banco central el cuál consistirı́a en escoger {ct , lt , st , pN t , pt , wt , Yt , ⇡t } para maximizar (2.1) sujeto a (2.3), (2.4), (2.7), (2.8), (2.9), (2.10), (2.11) 2 Suponiendo que no habrá cambios en la polı́tica y el carácter determinı́stico del modelo, maximizar la utilidad de un sólo periodo implica maximizar el valor presente de la utilidad para las familias. M IGUEL Z ERECERO 65 y (2.12).3 Considero innecesario derivar explı́citamente el problema de Ramsey ya que no hay una solución cerrada para la inflación óptima. No obstante, a continuación explico detalladamente la intuición sobre los determinantes de la inflación óptima. Por el lado de la rigidez nominal y el markup asociado a los monopolistas, una inflación positiva disminuye dicho markup a una fracción de las empresas. Por otro lado, la dispersión que genera la inflación causa pérdidas en la producción agregada. Entonces, los parámetros que definen qué efecto domina son " y ↵. El factor de descuento en esta economı́a, , no tiene importancia a la hora de determinar el valor de la inflación óptima ya que el problema de maximizar el valor presente de la utilidad equivale a maximizar la utilidad en cualquier periodo, lo que implica que la utilidad es la misma en todos los periodos lo que a su vez implica que el consumo es constante y la ecuación de Euler, que contiene al factor de descuento , es irrelevante. Entonces para una combinación de parámetros " y ↵ se obtiene la inflación que maximiza la utilidad de las familias. Las Figuras 1 y 2 en el apéndice A muestran los resultados. La Figura 2 es sólo un acercamiento de la Figura 1 para los valores bajos de ↵. Tres resultados resaltan de las gráficas. En primer lugar, mientras más pequeño sea ", la inflación óptima es mayor. Esto ocurre porque si " es menor, el markup cobrado por los monopolistas es mayor y para disminuirlo la inflación debe ser mayor. Este resultado implica que mientras menor sea el grado de competencia en la economı́a, es decir " sea mayor, la inflación óptima tendrı́a que ser menor. En segundo lugar, mientras la fracción ↵ de los monopolistas que no pueden observar el nivel de precios disminuye, la inflación óptima disminuye también. Es decir, el efecto que tiene la inflación en la dispersión de precios domina al efecto de bajar el markup a la fracción ↵ de monopolistas. En tercer lugar, cuando no hay rigidez nominal, es decir que todos los monopolistas observan el nivel de precios actual de la economı́a (↵ = 0) la inflación es irrelevante ya que no tiene efectos reales. Lo opuesto ocurre cuando todos observan el nivel anterior de precios (↵ = 1), porque el efecto que tiene la inflación para disminuir los markups de los monopolistas domina por completo al efecto de la dispersión en los precios ya que ésta no existe. Como todos los monopolistas observan el nivel de precios anterior a la hora de optimizar, todos escogen el mismo precio y por lo tanto no hay dispersión de precios y la inflación óptima es el inverso del markup. Las lı́neas punteadas en la Figura 2 marcan un intervalo que representan una inflación de entre 2 % y 4 % anual.4 Algunos bancos centrales de distintos 3 Es importante mencionar que el problema relevante es el de Ramsey y no el del planeador central. Un banco central escogerı́a la inflación óptima sujeto a las condiciones del equilibrio competitivo. Por otro lado, la solución al problema del planeador central consistirı́a en escoger la inflación igual a cero y los precios de los monopolistas iguales al costo marginal. De esta forma se elimina la rigidez nominal (con la inflación igual a cero) y la distorsión causada por los monopolistas (precio igual a costo marginal) y se alcanzarı́a el óptimo de Pareto. 4 Los niveles de inflación presentados en la Figura 1 son inflaciones de periodo contra periodo. Siguiendo la convención en la literatura, en este trabajo se toma un periodo como un trimestre. 66 J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA paı́ses, entre ellos Chile, Colombia y México, tienen sus metas de inflación en dicho intervalo. Para varias configuraciones de los parámetros ↵ y ", la meta de inflación en dicho intervalo estarı́a en lı́nea con la inflación óptima. Sin embargo, pueden encontrarse casos donde la competencia sea tan baja que, no importando el nivel de rigideces nominales en la economı́a, la inflación óptima se encuentre por arriba de dicho intervalo. Una estimación de los parámetros ↵ y ", que miden respectivamente el grado de rigidez nominal y de poder de mercado de las empresas en la economı́a, podrı́an dar una idea de si el objetivo de inflación está en lı́nea con la inflación óptima dada por este modelo. No obstante, dicha estimación está fuera de los alcances de este trabajo. Otro punto importante es que en el presente modelo conviven dos distorsiones, la rigidez nominal y la competencia monopolı́stica, pero sólo un instrumento para corregir. Normalmente en los modelos con rigideces nominales a la Calvo, para alcanzar el óptimo de Pareto se otorga un subsidio al trabajo (financiado vı́a impuestos lump sum) para contrarrestar la distorsión de los monopolistas y la inflación se iguala a cero para no tener distorsiones en los precios relativos causadas por las rigideces nominales. En ese tipo de modelos la polı́tica monetaria no puede corregir el problema de los monopolistas y, como demuestran Schmitt-Grohé y Uribe (2010) si la herramienta de polı́tica de los subisidios al trabajo no está disponible, la inflación óptima sigue siendo cero. Este serı́a un escenario más apegado a la realidad dado que los subsidios al trabajo implicarı́an un impuesto negativo al ingreso laboral, lo cuál serı́a una polı́tica poco realista. A diferencia de los modelos con rigideces nominales a la Calvo, en el modelo del presente trabajo, la polı́tica monetaria sı́ puede afectar la distorsión de los monopolistas. Si se tuviera otro instrumento, como los subsidios al trabajo, éstos podrı́an encargarse de la distorsión de los monopolios, y al igualar la inflación a cero se alcanzarı́a el óptimo de Pareto. No obstante, es muy probable que la polı́tica fiscal no opere de dicha forma en la realidad, y la abstracción en el presente modelo de dicho instrumento parece ser más realista, dejando como único instrumento a la polı́tica monetaria. 4. C ONCLUSIONES En este trabajo se presenta una versión simplificada del modelo de Mankiw y Reis (2002) que permite dar una justificación a los bancos centrales de tener una meta de inflación positiva. Otros trabajos han buscado justificar que los bancos centrales mantengan una inflación positiva justificándose principalmente en la rigidez nominal a la baja en los salarios. La justificación que se presenta en este trabajo se basa en otro tipo de rigidez nominal. Por otro lado, además de justificar un objetivo de inflación positivo, el trabajo intenta también tomar en cuenta los aspectos negativos de la inflación capturados en la ineficiente dispersión de precios, en lı́nea con los trabajos de Yun (2005) y de Woodford (2003). Por lo tanto, aunque la inflación en el modelo de Mankiw y Reis (2002) puede tener aspectos positivos al disminuir el markup cobrado por M IGUEL Z ERECERO 67 los monopolistas, ésta también tiene aspectos negativos y da cabida a buscar un nivel de inflación que maximize la utilidad de las familias. Para una combinación de parámetros que representan el nivel de competencia y de rigideces nominales en la economı́a se calcula el nivel de inflación óptimo. Se encuentra que mientras menor sea el nivel de competencia de una economı́a, la inflación óptima es mayor y mientras menores sean las rigideces nominales, la inflación óptima es menor. El objetivo de este trabajo no es asegurar que los objetivos de inflación de los bancos centrales deban de ser positivos y que la regla de Friedman esté descartada. Simplemente es agregar otra consideración al debate de cuál es la inflación óptima, en este caso serı́a el nivel de competencia en una economı́a, utilizando como marco un modelo con rigideces en la propagación de la información en la economı́a. Para poder asegurar cuál debe ser el nivel de inflación óptimo, éstas rigideces deben de ser contrastadas con otras rigideces que justifiquen la aplicación de la regla de Friedman, como por ejemplo introducir una demanda por dinero fiduiciario con el objetivo de realizar transacciones. Igual se debe de contrastar con otro tipo de rigideces, como la rigidez nominal a la baja de los salarios, rigideces en cambio de precios, etcétera. Un modelo que incorporara todos estos tipos de rigideces podrı́a determinar, estimado o bajo calibraciones plausibles, qué efecto domina y cuál debe de ser el nivel de inflación óptima. Al respecto, el trabajo de Kim y Ruge-Murcia (2011) explora qué efecto domina entre dos distorsiones. La primera es una demanda por dinero fiduiciario que mitiga el costo de realizar transacciones, y que sugiere una inflación óptima negativa (regla de Friedman). La segunda distorsión es una rigidez nominal a la baja en los salarios, que sugiere una inflación óptima positiva para, como decı́a Tobin, engrasar al sector laboral. Estos autores que para una estimación con datos de la economı́a de Estados Unidos el efecto de la rigidez en los salarios domina y la inflación óptima es positiva y alrededor de 0.4 %. El presente trabajo, en combinación con los resultados de Kim y RugeMurcia (2011), podrı́a sugerir entonces que es adecuado que paı́ses en vı́as de desarrollo tengan objetivos de inflación mayores a los que sugiere dicho trabajo ya que presentan menor grado de competencia en sus economı́as que en la economı́a de Estados Unidos. R EFERENCIAS [1] Akerlof, G. A., Dickens, W. T., Perry, G. L., Gordon, R. J., & Mankiw, N. G. (1996). The macroeconomics of low inflation. Brookings papers on economic activity, 1996(1), 1-76. [2] Kim, J., & Ruge-Murcia, F. J. (2009). How much inflation is necessary to grease the wheels?. Journal of Monetary Economics, 56(3), 365-377. [3] Kim, J., & Ruge-Murcia, F. J. (2011). Monetary policy when wages are downwardly rigid: Friedman meets Tobin. Journal of Economic Dynamics and Control, 35(12), 2064-2077. [4] Mankiw, N. G., & Reis, R. (2002). Sticky information versus sticky prices: a proposal to replace the New Keynesian Phillips curve. The Quarterly Journal of Economics, 117(4), 1295-1328. [5] Schmitt-Grohé, S., & Uribe, M. (2010). The optimal rate of inflation (No. w16054). National Bureau of Economic Research. J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA 68 [6] Tobin, J. (1972). Inflation and unemployment. American Economic Review, 62(1), 1-18. [7] Yun, T. (2005). Optimal monetary policy with relative price distortions. American Economic Review, 89-109. [8] Walsh, C. E. (2010). Monetary Theory and Policy. MIT Press Books, 1. [9] Woodford, M. (2011). Interest and prices: Foundations of a theory of monetary policy. Princeton University Press. A. F IGURAS F IGURA 1: I NFLACI ÓN QUE MAXIMIZA BIENESTAR 1.20 ε=7 ε=9 ε=11 ε=8 ε=10 ε=12 1.15 1.10 1.20 1.05 1 0.9 0.8 0.7 0.6 1.15 1.00 0.5 0.4 0.3 ε=8 ε=10 ε=12 0.2 0.1 0 ε=7 ε=9 ε=11 1.10 1 0.9 0.8 0.7 ε=12 0.6 ε=11 0.5 ε=10 0.4 ε=9 0.3 ε=8 0.2 ε=7 0.1 0 El eje horizontal representa distintos valores de ↵. 1.05 El eje vertical representa valores de inflación de la forma ⇡t = 1.020 Pt Pt 1 . 1.00 1.015 F IGURA 2: I NFLACI ÓN QUE MAXIMIZA BIENESTAR ( ACERCAMIENTO ) 1.010 ε=7 ε=8 ε=9 ε=10 ε=11 ε=12 1.020 1.005 0.4 0.3 0.2 0.1 0 1.015 1.000 1.010 1.005 0.4 0.3 0.2 0.1 0 1.000 El eje horizontal representa distintos valores de ↵. El eje vertical representa valores de inflación de la forma ⇡t = Pt Pt 1 . 69 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO R OMAN A COSTA ¿Es posible que el votante mexicano se comporte estratégicamente a pesar de tener presente en el momento de la elección la representación proporcional? Para contestar esta pregunta se propone un modelo teórico para representar la distorsión en los incentivos de los votantes introducida por el doble propósito de la boleta electoral México: el de mayorı́a relativa y el de representación proporcional . El trabajo comienza por caracterizar la correspondencia de mejor respuesta de los votantes para después mostrar qué condiciones sobre los parámetros del modelo son necesarias y suficientes para sostener la presencia de voto estratégico por parte de los votantes. A continuación, se muestra que el grado de la proporcionalidad percibido por los votantes del sistema mixto de elección está inversamente relacionado con la posibilidad de que se presente voto estratégico en la elección. Se continúa con una extensión del modelo para finalizar explorando datos de elecciones locales mexicanas para probar la hipótesis derivada del modelo teórico. PALABRAS CLAVE : elección social, sistema mixto, economı́a polı́tica, sistema electoral 1. I NTRODUCCI ÓN El que un votante elija en las urnas a un partido distinto a su favorito se conoce como votar estratégicamente. De acuerdo con Poiré (2000), en las elecciones intermedias de 1997 alrededor del 10 % de la votación emitida por el electorado mexicano se vio motivada por este comportamiento estratégico de los votantes, coloquialmente llamado “voto útil”. Según Poiré, en esta elección el voto útil fue ejercido por los votantes para bloquear al partido que llevaba una clara ventaja en la contienda electoral, el Partido Revolucionario Institucional (PRI). El estudio del comportamiento estratégico de los votantes ha logrado algunos consensos sobre la composición de los sistemas polı́ticos en donde el voto estratégico está presente. Uno de ellos, es la llamada Ley de Duverger. Duverger (1955) expone que en los sistemas electorales que usan la regla de pluralidad en distritos donde se reparte un solo asiento, se tiende a favorecer la conformación de sistemas bipartidistas. El mecanismo detrás de este resultado es el siguiente: el dı́a de la elección los votantes deciden por qué partido emitir su voto de acuerdo a sus preferencias sobre los partidos que compiten en la elección. Bajo la regla de pluralidad sólo hay un ganador por lo que el votante se da cuenta que votar por su partido preferido puede resultar en “desperdiciar” su voto si éste no tiene posibilidades reales de ganar. Ası́, el votante se enfrenta al siguiente dilema: votar por su partido favorito y “desperdiciar” su voto o elegir su segunda mejor opción con posibilidades reales de ganar. Es importante notar que el principal supuesto bajo el cual funciona este mecanismo es la regla de pluralidad. En el caso del sistema electoral mexicano, éste supuesto no se cumple. La Constitución Polı́tica Mexicana dice en su artı́culo 52 lo siguiente: “La Cámara de Diputados estará integrada por 300 diputados electos según el principio de votación mayoritaria relativa, mediante el sistema de distritos electorales 70 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO uninominales, y 200 diputados que serán electos según el principio de representación proporcional, mediante el Sistema de Listas Regionales, votadas en circunscripcionales (sic DOF 15-12-1986) plurinominales”. Es decir, en México el 40 % de los diputados federales se eligen por el principio de representación proporcional. Este hecho sobre la legislación electoral mexicana pone en duda si los incentivos a los que se enfrenta el electorado mexicano en una elección distrital para diputados uninominales son los mismos a los generados por la regla de pluralidad simple (en un contexto sin diputados plurinominales). Un votante mexicano sabe que el partido que obtenga la diputación en su distrito se elegirá por el principio de mayorı́a relativa, sin embargo, su voto también contabilizará a favor de ese mismo partido para calcular la proporción del voto a favor de este último dentro de la votación nacional emitida1 . Esta última consideración podrı́a distorsionar el mecanismo que genera los resultados de la Ley de Duverger. Esta peculiaridad de las elecciones en México se explica por una caracterı́stica del voto. La misma boleta con la que se vota para diputados uninominales forma parte de la votación nacional emitida y es tomada en cuenta en el cálculo a realizarse para la repartición de diputaciones por el principio de la representación proporcional. Es por esta razón que el sistema electoral mexicano puede ser considerado como un sistema de elección mixto como lo mencionan Blais y Massicotte (1999). La principal motivación del presente trabajo es estudiar la distorsión que este doble propósito de la boleta electoral genera en los incentivos de los votantes. En particular, es de interés explorar si los incentivos del votante a no “desperdiciar” su voto podrı́an ser mitigados por el deseo de que su partido favorito gane diputaciones por la vı́a proporcional. En este trabajo de investigación se analiza si es posible que el votante mexicano se comporte estratégicamente a pesar de tener presente en el momento de la elección el factor de representación proporcional. De ser ası́, se estudia qué condiciones son necesarias y/o suficientes para sostener este comportamiento de los votantes. Finalmente, se contrastan los resultados obtenidos del modelo teórico con datos de las elecciones en México. En la Sección 2 se hace una revisión de la literatura sobre sistemas de elección mixtos. En la Sección 3 se desarrolla un modelo sencillo que describe el problema de elección al que se enfrenta un votante mexicano en comicios distritales. En la Sección 4 se hace una extensión del modelo. En la Sección 5 se exploran datos de elecciones locales mexicanas para probar la hipótesis derivada del modelo teórico. En la Sección 6 se concluye. 1 El Código Federal de Instituciones y Procedimientos Electorales define el concepto de votación nacional como “la suma de todos los votos depositados en las urnas”. R OMAN A COSTA 2. 71 R EVISI ÓN DE LA LITERATURA Una de las formas más reconocidas del voto estratégico en la literatura se suscita en las elecciones que usan la regla de pluralidad simple. Duverger (1955) estudió las implicaciones de este comportamiento estratégico en elecciones celebradas en distritos que reparten un solo asiento. La llamada “Ley de Duverger” nos dice que el uso de la regla de pluralidad en elecciones distritales que reparten un solo asiento tienden a producir sistemas bipartidistas, es decir que la votación efectiva se concentrará en dos partidos. Si bien el modelo que proponemos (antes de la extensión a n votantes) sólo considera 3 votantes, en la literatura se encuentran trabajos que utilizan este supuesto. Por ejemplo, Cox (1984) propone un modelo de tres votantes en una elección de dos asientos para comenzar a elucidar el problema de escoger más de un asiento en un distrito. Palfrey (1989) construye un modelo que logra demostrar que los equilibrios resultantes en elecciones con la regla de pluralidad tienen caracterı́sticas duvergianas, en el sentido de que sólo dos partidos obtienen los votos del electorado. A la par encuentra que también es posible que el voto se concentre en tres partidos, siempre y cuando los partidos perdedores estén virtualmente empatados (equilibrios no duvergianos). Un aspecto notable de las conclusiones de Palfrey (1989) es que sugieren que los equilibrios no duvergianos son difı́ciles de sostener. Posteriormente, Cox (1994) generaliza este resultado a elecciones donde se reparten M asientos. En otras palabras, Cox muestra que en una elección donde se reparte un número M de asientos el número de partidos que concentrarán la mayorı́a de los votos será de M + 1. Asimismo, Cox (1994) establece una metodologı́a para buscar evidencia de voto estratégico en datos de elecciones. Esta metodologı́a consiste en construir un ratio de votos del segundo al primer perdedor a nivel distrital. Ratios cercanos a 0 sugieren equilibrios duvergianos y ratios cercanos a 1 sugieren equilibrios no duvergianos. Esta metodologı́a será utilizada en la Sección 4 del presente trabajo. Los resultados anteriores no contemplan el factor de representación proporcional presente en las elecciones mexicanas. La literatura sobre los sistemas que utilizan reglas hı́bridas de representación proporcional y pluralidad es más reciente. Blais y Massicotte (1999) se dieron a la tarea de reunir el trabajo previo al respecto para llegar a una definición de este tipo de sistemas electorales. Ellos deciden nombrar “sistemas mixtos” a los sistemas electorales cuya mecánica involucre la combinación de distintas “fórmulas electorales”, en el caso de México pluralidad y representación proporcional. A pesar de que los sistemas mixtos ya han sido definidos, dentro de este grupo de sistemas electorales existen diferencias en cuanto a la estructura de la boleta electoral ya que en algunas elecciones se usa la misma boleta para la parte proporcional y mayoritaria de la elección. Ferrara (2006), estudiando información de elecciones italianas, encuentra diferencias significativas entre tener dos boletas para cada regla y una sola para ambas como sucede en México. Es por esto que modelos como el de Rozenas y Soskice (2008) donde se 72 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO utilizan boletas distintas para cada fórmula podrı́an dejar de capturar algunas caracterı́sticas importantes de la situación mexicana. El modelo que proponemos para analizar este sistema electoral asume tres partidos que contienden por un asiento en el congreso. Aunque parece un supuesto fuerte no es completamente inusual en la literatura2 . Como expone Martinelli (2002), el supuesto de tres candidatos “reales” en una elección es consistente con algunas elecciones recientes en América Latina; por ejemplo las pasadas elecciones presidenciales en México. Algunos de los trabajos sobre el sistema mixto mexicano son los siguientes: Calvo y Medina (2002) describen como un candidato puede aumentar sus posibilidades de terminar electo si su partido pierde votos bajo el sistema mexicano, Kerevel (2010) analiza la diferencia en participación, organización y disciplina de los partidos en el Congreso a causa del sistema mixto, Molinar y Weldon (2003) hacen un recuento de todo el proceso de reforma del sistema mixto mexicano hasta llegar al actual y Weldon (2003) describe las posibles consecuencias de las últimas reformas electorales en el sistema polı́tico mexicano. Como se expuso en el párrafo anterior, el trabajo realizado sobre el sistema de elección de diputados en México es extenso y toca diversos temas; sin embargo, hasta donde el autor tiene conocimiento, no ha habido intentos por derivar un modelo del sistema mixto mexicano que utilice una sola boleta con una doble función considerando el efecto de la representación proporcional. El presente trabajo tiene como objetivo presentar un modelo sencillo que contribuya a la discusión sobre la presencia del voto estratégico en las elecciones a diputados en México y sus posibles consecuencias sobre los resultados de estos comicios. 3. M ODELO Se supone la existencia de tres votantes i 2 {1, 2, 3} que eligen a un partido entre tres competidores {P1 , P2 , P3 }, bajo la regla de pluralidad simple, es decir, el partido con el mayor número de votos gana la elección. Cada votante i tiene una función de utilidad Ui que se compone de dos partes: la primera es la utilidad que obtiene del triunfo de cada partido en la elección y la segunda es la utilidad que obtiene de votar por su partido favorito, la cual pretende incorporar el efecto de la representación proporcional del sistema electoral en la función de utilidad del individuo. La función de utilidad del individuo i proveniente de su voto y el triunfo de su k-ésimo partido preferido se puede expresar como sigue: ( uik + si i vota por su primer f avorito Ui = uik en cualquier otro caso. 2 Martinelli (2002) y Fey (1997) también utilizan el supuesto de tres candidatos en los modelos que proponen en sus respectivos trabajos mientras que Magaloni (1996) calcula el ı́ndice de Laakso y Taagepera para medir el número efectivo de partidos en las elecciones en México para diputados federales de 1994 el cual es igual a 2.87. R OMAN A COSTA 73 F IGURA 1: N IVEL DE UTILIDAD DEL PRIMER COMPONENTE POR PARTIDO GANADOR Se define al primer componente como sigue3 : sea ui = {ui1 , ui2 , ui3 } donde representa la utilidad que obtiene el individuo i de la victoria del partido k. Se normaliza4 a 1 la utilidad que obtiene al individuo que gane su partido preferido, es decir max{ui } = 1, de igual forma min{ui } = 0, esto para toda i. La utilidad que obtiene del triunfo de su segundo partido favorito será un número u donde 0 < u < 1 y se supondrá que es igual para todos los individuos5 . Debido a que se suponen sólo tres partidos en la elección, se sabe que existen 6 diferentes tipos de perfiles de preferencias: uik – Tipo 1. P1 P2 P3 – Tipo 2. P1 P3 P2 – Tipo 3 .P2 P3 P1 – Tipo 4. P2 P1 P3 – Tipo 5. P3 P2 P1 – Tipo 6. P3 P1 P2 La Figura 1 muestra el nivel de utilidad que obtiene cada tipo de preferencias del primer componente de su utilidad, es decir, de la parte de su utilidad que sólo depende del partido que gane la elección. El segundo componente será el de representación proporcional, > 0 y sólo estará presente cuando el individuo i vote por su primer partido favorito6 . 3 La notación sigue a la de Cox (1994). normalización se propone siguiendo a Cox (1994). 5 Como se verá en la Proposición 1, suponer u igual para todos los votantes le resta al modelo la capacidad de hablar sobre intensidad de voto estratégico en el electorado. Es decir, este supuesto lleva a concluir que bajo ciertas condiciones “todos podrı́an votan estratégicamente” o que “nadie podrı́a votar estratégicamente”. 6 Existen dos consideraciones que vale la pena hacer sobre . Primero, la valoración de un elector de un diputado uninominal y de uno plurinominal puede ser distinto. Por ejemplo, un diputado del distrito de Uruapan podrı́a estar más interesado en temas de la región, como los apoyos a la producción de aguacate, mientras que un diputado plurinominal podrı́a estar más interesado en 4 La 74 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO Se supone que ambos componentes entran a la función de utilidad de manera lineal. En caso de un empate se asume que los tres partidos tienen la misma probabilidad de ganar, y consecuentemente la utilidad es el valor esperado. Antes de continuar introduciremos un poco de notación. Se llamará P ij al j-ésimo partido preferido del individuo i de tal forma que P1i i P2i i P3i , ui1 > ui2 > ui3 . Una de las razones por las que se comenzó el estudio de una elección con este tipo de preferencias es la de averiguar si existe comportamiento estratégico. Esta pregunta se traduce en la siguiente cuestión: bajo este contexto, ¿Los votantes emiten su voto alguna vez por algún partido distinto a su primer favorito?, o en otras palabras, ¿Pertenece P2i a la imagen de la correspondencia de mejor respuesta del votante i? Para responder formalmente esta pregunta se comenzará por definir la correspondencia de mejor respuesta. El espacio de estrategias para cada individuo i es ⌦i , donde !i 2 ⌦i representa una estrategia en el espacio de estrategias ⌦i . En este caso, las estrategias de cada individuo son votar por uno de los partidos contendientes en la elección resaltando que no es posible anular el voto o ausentarse de la votación. Asimismo, ⌦ i representa el espacio de estrategias de los individuos distintos a i y ! i 2 ⌦ i es un vector con las estrategias de los individuos distintos a i, ! i = {!j , !k } donde i 6= k 6= j. Definición 1 (Mejor respuesta). Para cada votante i su correspondencia de Mejor Respuesta M Ri : ⌦ i ! ⌦i . También, !i 2 M Ri (! i ) si Ui (!i , ! i ) Ui (!i⇤ , ! i ) 8 !i⇤ 2 ⌦i . Intuitivamente, la presencia de un factor de representación proporcional ( ) en la utilidad de los votantes podrı́a hacer parecer que no es posible observar comportamiento estratégico por parte de los votantes ya que la representación proporcional refuerza los incentivos del electorado a votar por su favorito. Sin embargo, la Proposición 17 nos dice que esto es posible si se cumplen ciertas condiciones, en particular nos dice que un individuo emitirá un voto a favor de un partido distinto a su favorito si el pago que le deriva el triunfo de su segundo partido preferido (u) es lo suficientemente alto mientras que la utilidad que obtiene del aumento de la proporción de votos de su partido favorito ( ) es lo suficientemente baja. Proposición 1 (Voto estratégico). 8i, P2i = !i 2 M Ri (⌦ i ) () 2u 1 3 seguir la agenda del Ejecutivo Estatal. En segundo lugar, bajo una regla de representación proporcional en un congreso continuo siempre es mejor votar de manera sincera, por lo que el supuesto de que sólo al votar por su favorito el individuo se lleva la utilidad es razonable. 7 La demostración de ésta y de todas las proposiciones subsecuentes se encuentran en el apéndice. R OMAN A COSTA C UADRO 1: U TILIDAD QUE OBTIENE EL INDIVIDUO i 75 DE CADA CONJUNTO DE ESTRA - TEGIAS P1i P2i P3i (P1i , P1i ) 1+ 1 1 (P2i , P2i ) u+ u u (P3i , P3i ) 0 0 (P1i , P2i ) 1+ u (P1i , P3i ) 1+ 1+u 3 0 1+u 3 (P2i , P3i ) 1+u 3 + u 0 El Cuadro 1 ilustra la utilidad del individuo i en todos los posibles escenarios (se omiten los pares de estrategias que son repetitivas). De la inspección visual, es claro que el votante i jamás votará por su tercer partido favorito, ya que en todos los casos obtiene mayor o igual utilidad votando por P2i y estrictamente mayor utilidad en todos los casos votando por P1i . Sin embargo, no es claro si P1i es mejor estrategia que P2i . Esto se debe a que cuando el individuo i se enfrenta a las estrategias (P2i , P3i ) tiene que hacer la comparación de 1+u (votar por P1i ) y u (votar por P2i ). De esta manera 3 + se hace evidente que la única manera en que P2i sea mejor respuesta es si u es mayor a 1+u 3 + , condición que es equivalente a la que estudiamos en la Proposición 1. Una vez que se ha verificado que en este contexto sı́ cabe la posibilidad de observar comportamiento estratégico por parte de los votantes, nuevas preguntas surgen con respecto al sistema de votación que estamos analizando; sin embargo, antes de continuar conviene analizar con más detalle la correspondencia de mejor respuesta de los votantes. Debido a que es de interés estudiar el ambiente con voto estratégico, a lo largo de este trabajo se considerará el supuesto de que es pequeña, i.e. < 2u3 1 . Proposición 2 (Mejor respuesta). Sea ! es una función y M Ri (! i ) = 8 i > < ! i = P2 ; > : !i = P1i ; i si ! 2 ⌦ i . Si i < 2u 1 3 , entonces 8i M Ri 2 {(P2i , P3i ), (P3i , P2i )} en cualquier otro caso. En lo resta del presente trabajo se estudiarán algunas caracterı́sticas del sistema electoral descrito anteriormente. Para esto, se analizarán los posibles resultados electorales caracterizados en este contexto por equilibrios de Nash en estrategias puras. Para poder acotar el estudio de los resultados electorales a los equilibrios de Nash en estrategias puras conviene primero cerciorarse de que en este ambiente siempre será posible encontrar un equilibrio de este tipo. La Proposición 3 garantiza que esto ocurre. Proposición 3 (Existencia). Para cualquier perfil de preferencias existe al menos un equilibrio de Nash en estrategias puras. V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO 76 Una vez que se ha verificado la existencia de equilibrios de Nash en estrategias puras vale la pena detenerse a analizar las implicaciones de estos resultados en una elección que se realiza en este contexto. Lo primero que se nota es que la correspondencia de mejor respuesta observada bajo la regla de pluralidad simple tiene una imagen con una cardinalidad mayor que en el caso de la regla mixta. Esto se debe a que bajo la regla de pluralidad un votante es indiferente ante votar por cualquiera de los tres partidos cuando se enfrenta a una elección que ya está definida, por lo que 8i {P1i , P2i , P3i } 2 M Ri . Cuando pasamos a un sistema con una regla de elección mixta los votantes tienen un incentivo a votar por su partido favorito inclusive cuando la elección ya está definida, reduciendo la cardinalidad de la imagen de su correspondencia de mejor respuesta. Cuando el factor de representación proporcional es pequeño, el tercer partido preferido sale de la imagen de la correspondencia de mejor respuesta de cada votante e incluso convierte a la correspondencia en una función8 mientras que cuando el factor de representación proporcional es grande, el único elemento sobreviviente en la imagen de la mejor respuesta de los votantes es su favorito, y para cualquier perfil de preferencias el único equilibrio en estrategias puras es (!1 , !2 , !3 ) = (P11 , P12 , P13 ). De esta forma es posible concluir que la cardinalidad de la imagen de la correspondencia de mejor respuesta es decreciente respecto a , es decir, un votante ve limitadas sus opciones de voto mientras más grande sea el peso que le asigne a la parte de representación proporcional de su voto. Consecuentemente, esta reducción en su espacio de mejores respuestas reduce el número de equilibrios donde podrı́amos observar voto estratégico (entendido como votar por un partido distinto a su favorito) del electorado. Este resultado se muestra en el siguiente corolario de la Proposición 1 y la Proposición 2. Corolario 1. La cardinalidad de M Ri (⌦ i ) es decreciente en . Demostración. Si = 0 estamos en el caso de pluralidad simple por lo que si una elección está definida al individuo i le da igual por quien votar, por lo que los tres partidos forman parte de la imagen de M Ri . Si 0 < 2u3 1 de la Proposición 2 y la Proposición 1 se sigue que #M Ri (⌦ i ) = 2. Si > 2u 1 por la Proposición 1 sabemos que P2i no forma parte de la imagen del 3 mejor respuesta de i y como los individuos nunca votan por su primer favorito cuando > 0, tenemos que M Ri (! i ) = P1i 8 ! i 2 ⌦ i )#M Ri (⌦ i ) = 1. Otro resultado relacionado con las observaciones anteriores es que el conjunto de los posibles equilibrios de Nash en estrategias puras también disminuye mientras las imágenes de las mejores respuestas se “reducen”. Notemos que mientras u sea mayor a un medio, bajo la regla de pluralidad simple P2i = !i 2 M Ri (P2i , P3i ) ya que u > 12 ) u > 1+u 3 . Si comparamos la correspondencia de mejor respuesta bajo la regla de pluralidad simple (M Rip ) con u > 12 8 Excepto para = 2u 1 , 3 como se observó en la Proposición 2. R OMAN A COSTA 77 m contra la función de mejor respuesta bajo la regla mixta (M Ri ) con < 2u3 1 m podemos notar que M Ri (! i ) 2 M Rip (! i ) 8! i ya que son iguales excepto en los casos donde la elección está definida9,10 : 8 i > < ! i = P2 ; p M Ri (! i ) = !i 2 {P1i , P2i , P3i } > : !i = P1i ; m M Ri (! i ) = 8 i > < ! i = P2 ; > : !i = P1i ; si ! i 2 {(P2i , P3i ), (P3i , P2i )} si ! i 2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )} en cualquier otro caso. si ! i 2 {(P2i , P3i ), (P3i , P2i )} en cualquier otro caso. De esta forma, el factor de representación proporcional funciona como un mecanismo de “depuración” pues elimina aquellos equilibrios donde los votantes son indiferentes debido a que la elección está definida. El siguiente ejemplo ilustra el punto anterior. Siguiendo la discusión de Poiré (2000) y de Magaloni (1996) se toma el siguiente perfil de preferencias: – P RI 1 P AN 1 P RD – P AN 1 P RD 1 P RI – P RD 1 P AN 1 P RI El siguiente cuadro expone algunos equilibrios de Nash con y grande. = 0, pequeña C UADRO 2: E QUILIBRIOS EN ESTRATEGIAS PURAS Pluralidad ( = 0) Regla mixta ( < 2u 1 ) 3 Rep. proporcional ( > 2u 1 ) 3 Equilibrios (PRI,PAN,PAN) (PRI,PRD,PRD) (PAN,PAN,PRD) (PAN,PAN,PAN) (PRD,PRD,PRD) (PRI,PRI,PRI) (PRI,PAN,PAN) (PRI,PRD,PRD) (PAN,PAN,PRD) (PRI,PAN,PRD) Total 6 3 1 9 En la descripción de la mejor respuesta bajo la regla de pluralidad estamos suponiendo que los votantes no eliminan estrategias débilmente dominadas !i = P3i ). 10 Para demostrar que esta es la forma de M Rp (! ) se pueden usar los mismos argumentos i i que en la Proposición 2. Añadiendo el hecho de que cuando la elección está definida, el individuo i se encuentra indiferente por quién votar, por lo que {P1i , P2i , P3i } 2 M Rip (! i ) si ! i 2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )} 78 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO Sabemos que los equilibrios en el caso de > 2u3 1 se reducen a votar de manera sincera. En el caso de < 2u3 1 tenemos equilibrios donde hay voto estratégico. De hecho 2 de 3 equilibrios son anti PRI en el sentido de que los individuos que prefieren al PRI en tercer lugar votan juntos para bloquearlo. Por último, en el caso con con = 0 existen otros posibles equilibrios, incluyendo aquellos existentes bajo la regla mixta11 . Estos equilibrios son los que se presentan cuando la elección está decidida desde el punto de vista del individuo, por lo que votar por cualquier partido es una mejor respuesta. En la siguiente sección se relajará el supuesto de 3 votantes en aras de investigar si los resultados obtenidos en la presente sección se mantienen. 4. E XTENSI ÓN DEL MODELO : n VOTANTES En esta sección se estudia el modelo descrito con anterioridad relajando el supuesto de tres votantes. En particular es de interés saber si el voto estratégico sigue presente en este contexto. Se comienza por mostrar que la misma condición impuesta sobre los parámetros y u es suficiente para observar voto estratégico. Para esto se define M Ri . Proposición 4. Sea n el número de votantes, i 2 {1, 2, ..., n}, con ⌦i y ⌦ i definidas como el modelo con tres votantes12 : M Ri : ⌦ i ! ⌦i , < 2u3 1 , Ai = {!k 2 ⌦ i : !k = P1i }, B i = {!k 2 ⌦ i : !k = P2i } y C i = {!k 2 ⌦ i : !k = P3i }. La mejor respuesta para el votante i es la siguiente: M Ri (! i ) = ( !i = P2i ; !i = P1i ; si (#C i #B i ) 2 {0, 1} y #Ai < #B i en cualquier otro caso De esta manera, es posible constatar que la relación entre el nivel de proporcionalidad en la elección , y la decisión de votar estratégicamente por parte de los individuos se mantiene al relajar el supuesto de tres votantes. En la sección siguiente se presenta un análisis empı́rico de las pasadas elecciones de diputados locales de cada estado de la República Mexicana. El objetivo de la siguiente sección es comenzar la discusión sobre la posibilidad de que el sistema mixto mexicano disuada de forma efectiva el voto estratégico o hablando en términos del modelo estudiado, si el factor de representación proporcional en los diferentes estados del paı́s es lo suficientemente grande como para eliminar la posibilidad de observar el voto estratégico en las elecciones a diputados locales a través de los estados mexicanos. 11 Asumiendo 12 Con u > 12 . la diferencia de que ahora ! i = (!1 , !2 , ..., !i 1 , !i+1 , ..., !n ). R OMAN A COSTA 5. 79 E LECCIONES EN M ÉXICO Para el análisis empı́rico se utilizará la razón de diputados plurinominales a diputados uninominales13 (sea p/u esta razón) para cada estado como un proxy del valor que los votantes asignan al factor de representación proporcional dentro de cada estado. Para determinar la existencia de voto estratégico seguimos la metodologı́a sugerida por Cox (1994): se toma el ratio del número de votos del tercer lugar de la elección al número de votos del segundo lugar en la elección (se llamará a este ratio SF 14 ), en presencia de voto estratégico este ratio deberı́a estar cercano a 0 (equilibrios duvergianos) o cercano a 1 (equilibrios no duvergianos). Como se estudió en la sección anterior, en el modelo no existen equilibrios no duvergianos por lo que el análisis empı́rico se concentrará en los equilibrios duvergianos. Utilizando los datos publicados por cada instituto electoral estatal con respecto a la elección más reciente, se calculó el ratio SF para cada distrito electoral de cada estado de la República Mexicana. Después, de cada ley electoral estatal vigente (o constitución estatal en su caso) se tomaron el número de curules a repartir por representación proporcional y por mayorı́a relativa para calcular el ratio p/ui . Con esta base de datos se estimó la siguiente regresión: sf ratioi = 0 + 1 f repi + "i Donde sf ratioi =SFi y f repi = p/ui . Como se muestra en el cuadro siguiente, sf ratio muestra una variación importante entre cada estado con una media de 41.0 % y una desviación estándar de 29.6 %. En cuanto a f rep no existe una variación muy grande entre estados ya que la desviación estándar es de apenas 10.8 % con una media de 63.8 % siendo Baja California Sur el estado con menor proporción de diputados plurinominales (31.3 %) y Jalisco el estado con mayor proporción de estos últimos (100 %). C UADRO 3: E STAD ÍSTICAS DESCRIPTIVAS Variable sfratio frep Media 0.4095 0.6377 Desv. Estándar 0.2960 0.1078 Min. 0.0269 0.3130 Max. 0.9966 1.0 La Figura 2 muestra la distribución de los distritos locales del paı́s por el nivel de su ratio SF . Se puede apreciar que la distribución no es exactamente bimodal como ocurrirı́a según Cox (1994) bajo la regla de pluralidad simple. De hecho, los distritos con equilibrios no duvergianos son pocos en comparación con los distritos con equilibrios duvergianos. Para estudiar únicamente los 13 Estos 14 Cox son los diputados elegidos por la regla de pluralidad simple. le llama Second loser to First loser ratio, en inglés. 80 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO F IGURA 2: D ISTRIBUCI ÓN DE DISTRITOS equilibrios duvergianos basta con limitar la muestra a aquellos distritos con ratios SF no tan cercanos a 1. De esta forma podemos eliminar un posible sesgo en la estimación del coeficiente de f rep. El Cuadro 4 muestra los resultados de realizar la estimación con mı́nimos cuadrados ordinarios del coeficiente 1 . El coeficiente de f rep tiene el signo esperado por el modelo teórico; sin embargo, al considerar toda la muestra, el resultado está sesgado por los equilibrios no duvergianos que Cox identifica como ratios de sf ratio iguales a 1. Para limpiar este sesgo, se toma una segunda regresión donde se limita la muestra a sólo aquellos distritos con sf ratio < ,95, en este caso se pierden 27 observaciones y el coeficiente de f rep se incrementa en la dirección esperada. La tercera regresión limita la muestra a solo aquellos distritos con sf ratio < ,9. En este caso se pierden 63 observaciones y el coeficiente de sf ratio es ahora significativo. El valor de .227 del coeficiente de f rep es significativo a un nivel de 5 % y nos indica que en promedio, aumentar en 10 puntos porcentuales la razón de diputados plurinominales a uninominales en un estado, aumentarı́a en 2.27 puntos porcentuales el ratio de SF . La última regresión también limita la muestra a sf ratio < ,9 pero incorpora controles por el año en que se realizó la elección, ya que podrı́a existir algún efecto de tener elecciones federales ese año por ejemplo. La dummy d2 es igual a 1 si la elección ocurrió un año antes de elecciones federales. La variable d3 es igual a 1 si la elección ocurre en año electoral federal. El escenario de comparación es tener elecciones un año después de elecciones federales y el efecto lo captura la constante. Como se puede observar en el Cuadro 3, la incorporación de estos controles no cambia el el coeficiente de f rep obtenido en (3). Los resultados obtenidos del ejercicio empı́rico son consistentes con los resultados derivados del modelo teórico. Aún ası́, es la intención del autor continuar con la búsqueda de una estrategia de identificación más sofisticada que R OMAN A COSTA 81 C UADRO 4: R ESULTADOS frep d2 sfratio (1) 0.0433 (0.38) sfratio (2) 0.0693 (0.63) sfratio (3) 0.227** (2.16) d3 Constante 0.382 0.342 0.210 (5.13) (4.75) (3.05) Observaciones 688 661 625 * p<0.1, ** p<0.05, *** p<0.01. Estadı́stico t en paréntesis. sfratio (4) 0.224** (2.16) 0.0706** (1.97) 0.0382* (1.71) 0.183 (2.85) 625 (1) Es la especificación sin limitar el valor de SF con errores robustos. (2) Es la especifiación para valores de SF < ,95 con errores robustos. (3) Es la especifiación para valores de SF < ,9 con errores robustos. (4) Igual a (3) pero con dummies de año en que se realizó la elección. responda con mayor contundencia esta pregunta. 6. C ONCLUSIONES El objetivo principal de este trabajo fue el de analizar el sistema electoral en México poniendo particular atención al efecto que tiene sobre el voto estratégico el hecho de que la boleta electoral tiene la doble función de servir bajo la regla de mayorı́a relativa y contar para la fórmula de repartición de diputados por la vı́a de representación proporcional. Tomando el caso más simple de tres votantes eligiendo entre tres partidos, este trabajo desarrolla un modelo de elección que arroja resultados interesantes. En primer lugar, confirma la intuición de que el grado de representación proporcional se relaciona de manera negativa con la posibilidad de observar voto estratégico en una elección. En segundo lugar, muestra que existen condiciones suficientes para observar este comportamiento estratégico en una elección. Se continúa cone una extensión del modelo relajando el supuesto de tres votantes. Se logra mostrar que la relación entre el voto estratégico y el grado de representación proporcional no cambia al relajar este supuesto. Por último, tomando en cuenta estos resultados se encuentra que los datos de las últimas elecciones locales en los estados mexicanos confirman la hipótesis de que un mayor grado de representación proporcional llevan a observar menor voto estratégico en una elección. R EFERENCIAS [1] Blais, André y Massicotte, Louis, 1999, “Mixed Electoral Systems: A Conceptual and Empirical Survey”, Electoral Studies (1999), 341-366. V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO 82 [2] Calvo, Ernesto y Abal, Juan, 2002, “Institutional gamblers: majoritarian representation, electoral uncertainty, and the coalitional costs of Mexico’s hybrid electoral system”, Electoral Studies 21 (2002), 453-471. [3] Cox, Gary, 1984, “Strategic Electoral Choice in Multi-Member Districts: Approval Voting in Practice?”, American Journal of Political Science, (Noviembre 1984) 722-738. [4] Cox, Gary, 1994, “Strategic Voting Equilibria Under the Single Nontransferable Vote”, The American Political Science Review (Septiembre), 608-621. [5] Cox, Gary, 1997, “Making Votes Count: Strategic Coordination in the World’s Electoral Systems”, Cambridge: Cambridge University Press. [6] Duverger, Maurice, 1955, “Political Parties”, New York: Wiley. [7] Ferrara, Federico, 2006, “Two in one: Party competition in the Italian single ballot mixed system”, Electoral Studies 25 (2006), 329-350. [8] Fey, Mark, 1997, “Stability and Coordination in Duverger’s Law: A Formal Model of Preelection Polls and Strategic Voting”, The American Political Science Review 91 (Marzo), 135-147. [9] Kerevel, Yann, 2010, “The legislative consequences of Mexico’s mixed-member electoral system, 2000–2009”, Electoral Studies 29 (2010), 691-703. [10] Magaloni, Beatris, 1996, “Dominio de partido y dilemas duvergianos en las elecciones presidenciales de 1994 en México”, Polı́tica y Gobierno 3, 281-326. [11] Martinelli, César, “Simple plurality versus plurality runoff with privately informed voters”, Social Choice and Welfare Volume 19, Issue 4, (Octubre 2002), 901-919. [12] Molinar, Juan y Weldon, Jeffrey, 2001, “Reforming Electoral Systems in México”, M. Shugart y M. Wattenberg (eds.), Mixed-Member Electoral Systems: The Best of Both Worlds? Oxford: Oxford University Press. [13] Palfrey, Thomas, 1989, A Mathematical Proof of Duverger’s Law., Models of Strategic Choice in Politics, ed. Peter C. Ordeshook. Ann Arbor: University of Michigan Press. [14] Poiré, Alejandro, 2000, “Un modelo sofisticado de decisión electoral racional: el voto estratégico en México, 1997”, Polı́tica y Gobierno, 353-382. [15] Rozenas, Arturas y Soskice, David, 2008, A Spatial Model for Mixed-Member Majoritarian Electoral Systems, Duke University, M [16] Weldon, Jeffrey, 2001, “The Consequences of Mexico’s Mixed-Member Electoral System, 19881997”, M. Shugart y M. Wattenberg (eds.), Mixed-Member Electoral Systems: The Best of Both Worlds? Oxford: Oxford University Press. A. D EMOSTRACIONES Demostración de la Proposición 1. Voto estratégico. 15 . () por contrapositivo) Supongamos que ¬( 2u3 1 ) es decir – Caso 1. M Ri (! i ) con ! i > 2u 1 3 2 {(P3i , P2i ), (P2i , P3i )} • En ambos casos, el individuo i se enfrenta ante un empate parcial entre P2i y P3i . Votar por P2i le paga u mientras que votar por P1i le 2u 1 paga + 1+u > 2u3 1 ) + 1+u + 1+u 3 . Notemos que 3 > 3 3 = 1+u i u ) + 3 > u por lo tanto P2 = !i 2 / M Ri (! i ). – Caso 2. M Ri (! i ) con ! 15 Vale i 2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )} la pena notar que > 0 ) 2u3 1 > 0 ) u > 12 , ası́ esta condición no sólo le pide a pequeña sino que le pide a u ser lo suficientemente grande. ser R OMAN A COSTA 83 • En estos casos su voto no altera el resultado, sin embargo votar por P1i le da una utilidad extra de a diferencia de sus otras opciones, por lo que P2i = !i 2 / M Ri (! i ). – Caso 3. M Ri (! i ) con ! i = {(P1i , P2i ), (P2i , P1i )}. • En este caso, votar por P1i le paga 1 + mientras que votar por P2i le paga u, por lo tanto P2i = !i 2 / M Ri (! i ). – Caso 4. M Ri (! i ) con ! i = {(P1i , P3i ), (P3i , P1i )}. • En este caso, votar por P1i le paga 1 + mientras que votar por P2i le i paga 1+u / M Ri (! i ). 3 , por lo tanto P2 = !i 2 De esta forma podemos concluir que P2i = !i 2 / M Ri (⌦ i ). (( por reduccion al absurdo) Supongamos que 2u3 1 y que P2i = !i 2 / M Ri (! i ) con ! i = (P2i , P3i ), esto implicarı́a que el votante i obtiene más utilidad de votar por P1i o por P3i lo cual implicarı́a que u < 0 ó u < + 1+u 3 . La primera es una contradicción al supuesto de 0 < u < 1 y la segunda implica también una contradicción al supuesto inicial de 2u3 1 : u < + 1+u ) > 2u3 1 , por lo tanto 3 i i i i P2 = !i 2 M Ri (P2 , P3 ) ) P2 2 M Ri (⌦ i ) . ⇤ Demostración de la Proposición 2. Mejor Respuesta. – Caso 1. M Ri (! i ) con (! i ) 2 {(P3i , P2i ), (P2i , P3i )}. Debido a que estamos asumiendo que < 2u3 1 se sigue de la Proposición 1 que P2i = !i 2 M Ri (! i ). Para mostrar que P1i 2 / M Ri (! i ) asumamos que sı́ lo está, esto implicarı́a que u = + 1+u ) = 2u3 1 lo cual es una contra3 16 i dicción. . Para mostrar que P3 2 / M Ri (! i ) asumamos que sı́ lo está, esto implicarı́a que u = 0 lo cual es una contradicción. Por lo tanto, P2i = !i = M Ri (! i ). – Caso 2. M Ri (! i ) con ! i 2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )} • Caso 2.1 ! i = (P1i , P1i ): Votar por P1i le da 1 + , mientras que al votar por P2i o P3i obtiene 1 en ambos casos, por lo cual P1i = !i = M Ri (! i ). • Caso 2.2 ! i = (P2i , P2i ): Votar por P1i le da u + , mientras que al votar por P2i o P3i obtiene u en ambos casos, por lo cual P1i = !i = M Ri (! i ). • Caso 2.3 ! i = (P3i , P3i ): Votar por P1i le da 0 + , mientras que al votar por P2i o P3i obtiene 0 en ambos casos, por lo cual P1i = !i = M Ri (! i ). 16 Si = 2u 1 3 entonces {P1i , P2i } 2 M Ri (P3i , P2i ) y la M Ri seria una correspondencia. 84 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO – Caso 3. M Ri (! i ) con (! i ) 2 {(P1i , P2i ), (P2i , P1i )}. Votar por P1i le paga 1 + mientras que votar por P2i o P3i le paga u y 1+u 3 respectivamente, por lo cual P1i = !i = M Ri (! i ). – Caso 4. M Ri (! i ) con (! i ) 2 {(P1i , P3i ), (P3i , P1i )}. Votar por P1i le paga 1 + mientras que votar por P2i o P3i le paga 1+u 3 y 0 respectivamente, por lo cual P1i = !i = M Ri (! i ). ⇤ Demostración de la Proposición 3. Existencia. 2u 1 i – Caso 1 3 . En este caso sabemos que P1 = !i 2 M Ri (! i ) 8i, 8! i 2 ⌦ i por lo que para cualquier perfil de preferencias el siguiente es un equilibrio de Nash en estrategias puras: (!1 , !2 , !3 ) = (P11 , P12 , P13 ). – Caso 2 < 2u3 1 . Para este caso conviene separar los posibles perfiles de preferencias en dos tipos. El tipo 1 serán aquellos perfiles donde P11 6= P12 6= P13 y el tipo 2 serán aquellos donde P1i = P1j para algunas j e i tal que j 6= i. Comencemos por el tipo 2: • Caso 2.1 Preferencias tipo 1. En este perfil de preferencias podemos tener dos casos: Caso 2.2.1 P21 6= P22 6= P23 . En este caso proponemos uno de los siguientes equilibrios: (!1 , !2 , !3 ) = (P11 , P22 , P13 ) si P13 = P32 y (!1 , !2 , !3 ) = (P21 , P12 , P13 ) si P13 = P31 . El razonamiento para encontrar estos equilibrios es el siguiente: permitimos que el tercer votante elija a su primer favorito, el cual debe ser el tercer favorito de algún votante, por lo que permitimos que este último votante lo bloquee votando por su segundo favorito. Caso 2.2.2 P2i = P2j para algunas j e i tal que j 6= i. Sin pérdida de generalidad supongamos que P21 = P22 . Podemos ver que esto implica que P11 = P32 y que P13 = P22 por lo que proponemos el siguiente equilibrio de Nash en estrategias puras: (!1 , !2 , !3 ) = (P11 , P22 , P13 ). • Caso 2.2 Preferencias tipo 2. Sin pérdida de generalidad supongamos que P11 = P12 . En este caso podemos proponer (!1 , !2 , !3 ) = (P11 , P12 , P13 ) como un equilibrio de Nash. Los votantes 1 y 2 deciden la elección por su primer favorito, por lo que el votante 3 ya no tiene la capacidad de cambiar el resultado, ası́ su mejor respuesta es votar por su primer favorito. ⇤ Demostración Proposición 4. Primero veamos porqué votar por P2i es la mejor respuesta ante un empate entre P2i y P3i o ante la posibilidad de empatar la elección entre P2i y P3i ; ambos casos cuando P1i no tiene posibilidades en la elección. R OMAN A COSTA 85 – Si el votante i tiene la posibilidad de romper un empate entre P2i y P3i se enfrenta a las siguientes opciones y sus respectivos pagos: P1i le paga u i i i 2 + , P2 le paga u yP3 le paga 0. Notemos que para que P2 sea mejor u respuesta es necesario que 2 + < u. Recordemos que empezamos asu1 2u u u u miendo que < 2u3 1 = 2u < u2 ) + u2 < u. 3 3 < 3 3 = 3 < 2 ) – Si el votante i tiene la posibilidad de empatar la elección entre P2i y P3i cuando P3i va ganando se enfrenta a las siguientes opciones y sus respectivos pagos: P1i le paga , P2i le paga u2 yP3i le paga 0. Notemos que para que P2i sea mejor respuesta es necesario que u2 > , al igual que en el subcaso anterior. Ahora dividiremos las posibles elecciones a las que se podrı́a enfrentar el votante i para demostrar que P1i es la mejor respuesta ante todos los demás casos. Caso 1. Si P1i , P2i ó P3i gana la elección por más de un voto entonces hay 3 subcasos: – Si P1i es el ganador entonces votar por P3i ó P2i le darı́a 1 vs. 1 + de votar por P1i . – Si P2i es el ganador entonces votar por P3i ó P2i le darı́a u vs u + de votar por P1i . – Si P3i es el ganador entonces votar por P3i ó P2i le darı́a 0 vs 0 + por P1i . de votar Ası́, tenemos que votar por P1i es una estrategia dominante siempre que la elección se encuentre decidida o dicho de otra manera, cuando el votante i no tenga oportunidad de cambiar el resultado final de la elección. Caso 2. Puede romper un empate entre cualquiera de los partidos, existen 3 subcasos: – Si tiene que romper un empate entre P1i y P2i votar por P1i le paga 1 + u 1 mientras que votar por P3i le paga (1+u) 2 . Debido a que u < 1 ) 2 < 2 ) (1+u) 1 u > 2 votar por P1i es mejor que votar por P3i . Votar 2 + 2 < 1 ) 1+ por P2i le paga u por lo que prefiere votar por P1i . – Si tiene que romper un empate entre P1i y P3i votar por P1i le paga 1 + mientras que votar por P3i le paga 0. Votar por P2i le paga 12 por lo que prefiere votar por P1i . – Si tiene que romper un empate entre P1i , P2i y P3i votar por P1i le paga 1 + mientras que votar por P3i le paga 0. Votar por P2i le paga u por lo que prefiere votar por P1i . Caso 3. Puede hacer que los partidos empaten, existen 3 subcasos: – Si puede empatar a P1i y P2i 86 V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO • Si P1i va ganando, votar por P1i le paga 1 + mientras que votar por P3i le paga 1. Votar por P2i le paga 1+u 2 por lo que prefiere votar por P1i . • Si P2i va ganando, votar por P1i le paga 1+u 2 + mientras que votar por P3i le paga u. Votar por P2i le paga u por lo que prefiere votar por P1i . – Si puede empatar a P1i y P3i • Si P1i va ganando, votar por P1i le paga 1 + mientras que votar por P3i le paga 1 y votar por P2i le paga 1, prefiere votar por P1i . • Si P3i va ganando, votar por P1i le paga 12 + mientras que votar por P3i le paga 0 y votar por P2i le paga 0, prefiere votar por P1i . – Si puede empatar a P1i , P2i y P3i • Si P1i y P2i van ganando, votar por P1i le paga 1+ mientras que votar i i por P3i le paga 1+u 2 y votar por P2 le paga u, prefiere votar por P1 . • Si P1i y P3i van ganando, votar por P1i le paga 1 + mientras que votar por P3i le paga 0 y votar por P2i le paga u, prefiere votar por P1i . ⇤ S HOULD YOU ASK HER OUT ? J OS É M ANUEL R ODR ÍGUEZ S OTELO⇤ 1. I NTRODUCTION Let’s say that you are feeling like going out tonight. You feel great and decide to go out for a drink with your friends. At the bar, you spot a (randomly selected) cute girl. You decide to start a conversation and, since she seems to be really nice, you wonder if she would accept to go on a date with you. After a couple of hours (and perhaps some drinks), you get the courage to ask her out. Unfortunately, she tells you she has a boyfriend. Discouraged, you return to the table where your friends are and explain the situation. After listening to you, your friends tell you that you should insist. After all, some girls just play hard to get. You struggle to decide what you should do about it. However, you are confident that your knowledge of probability should help you solve this dilemma. 2. P ROBLEM F ORMULATION Suppose that ! is the known proportion of girls that are single and is the known proportion of girls that would lie about their relationship status. For simplicity, suppose also that if a girl is single and you insist, then she will go out with you. In addition, you know that if a girl actually does have a boyfriend, then even if you insist she will not go out with you. Define B as the event ‘the girl has a boyfriend’, A as the event ‘she answers that she has a boyfriend’, and D as the event that she will go out with you. Furthermore, define I as the event ‘you insist’. For each event Z, Z c refers to the complement of Z. The probabilistic statements that describe your situation are: Pr(B) c = 1 (2.1) ! (2.2) Pr(A | B ) = = 1 Pr(D | I, B c , A) = = Pr(D | I, B c ) 0 (2.5) Pr(D | B) = 0 (2.6) Pr(A | B) c Pr(D | I , A) (2.3) = 1 (2.4) ⇤ I would like to thank the anonymous reviewer for her valuable comments and suggestions to improve the quality of this work. The author is also grateful to Lorena Domı́nguez, Diego Jiménez, Eduardo Laguna and Ana C. Perez-Gea for their time in revising and commenting on earlier drafts of this article. All errors remain my own. 87 S HOULD YOU ASK HER OUT ? 88 3. O PTIMIZATION P ROBLEM You face the decision of whether insisting or not. That is, to choose whether to repeat your request or not (ie. i 2 {I, I c }) given that you observed A, so that you maximize the expected utility of your decision: max i2{I,I c } E [U | i, A] where your utility U (d, i) depends both on your decision and the girl’s further action; as it depends on whether she will go out with you and whether you quit or not: U (d, i) u · 1D (d) = c · 1I (i) 1Z (z) refers to the indicator function of set Z, and u > c > 0. We will now analyze what would happen if you insist and if you don’t. 3.1 D ON ’ T I NSIST First, let’s notice that following equation 2.5, if you don’t insist there is no chance that she will go out with you. Therefore, E [U | I c , A] 3.2 = 0 I NSIST Using the Bayes’ Theorem, we have that: Pr(B c | A) = Pr(A | B c ) Pr(B c ) Pr(A | B ) Pr(B c ) + Pr(A | B) Pr(B) c and the assumptions and results stated before, you conclude that: E [U | I, A] = 3.3 u· ·! (1 )·! 1 c R ESULTS Following the expected utility theory, you realize that the decision is quite easy. You should insist when the expected utility of insisting exceeds the expected utility of not doing it, that is: E [U | I, A] u· ·! c 1 (1 )·! > E [U | I c , A] > 0 J OS É M ANUEL R ODR ÍGUEZ S OTELO 3.3.1 89 S ENSITIVITY A NALYSIS A remarkable result is that if were equal to 0, then it would never make sense to insist. An explanation of this fact is that if girls never lied, then the signal A would provide perfect information about their relationship status. As insisting is costly, it would never pay to insist if you already know the truth about their relationship status. Another interesting consequence comes from: @E [U | I, A] @ u · ! · (1 !) (1 (1 ) · !)2 = > 0 were we see that the more likely it is that they lie, the better it is for you to insist. Whoa! the lying strategy backfired for them. 4. H OW MUCH DO GIRLS LIE ? In a world of perfect information, you would be done by now (actually, you would have been done since the beginning of the paper). Also, in a world where both ! and are known, you would have been done by the end of the previous section. Nonetheless, you’re aware that much of the argument used before relies on the fact that is known. This, however, doesn’t seem to be quite realistic. After all, you only have a vague idea of how much girls lie. 4.1 B AYESIAN I NFERENCE From now on, you decide to adopt the Bayesian interpretation of probability according to which probabilities entail degrees of belief about events in the world and data is used to strengthen or weaken those degrees of belief. 4.1.1 P RIOR K NOWLEDGE Now, suppose that is no longer known. Instead of that, you have the (prior) belief that ⇠ Beta(↵, ), where ↵, > 0 are known parameters. Therefore, the probability density function of is: ↵ 1 f( ) = · (1 ) B(↵, ) 1 For example, Figure 1 plots the density function for using different values of the parameters (↵, ). The figure defines four different combinations for the parameters, where each of them corresponds to a different expected value of . We will call each combination of parameters prior beliefs from now on.1 1 In the results shown, the ‘Honest’ scenario corresponds to the prior belief ↵ = .1 and = 1. Similarly, the ‘Neutral’ scenario relates to ↵ = 2 and = 2. The ‘Dishonest’ scenario relates to ↵ = 5 and = 2. Finally, the ‘Liars!’ scenario corresponds to ↵ = 5 and = 1. S HOULD YOU ASK HER OUT ? 90 F IGURE 1: D IFFERENT ALTERNATIVES FOR THE PRIOR DISTRIBUTION . 5 Prior belief: Honest Neutral Dishonest Liars! 4 f(λ) 3 2 1 0 0.00 0.25 0.50 0.75 1.00 λ 4.1.2 L IKELIHOOD F UNCTION In addition, you have observed what happened when you insisted to a sample of similar girls (drawn from the same distribution). In your sample, you have that from n girls to whom you have insisted, x agreed to go out on a date with you. You also recognize that for a given , the likelihood of this happening is: f (x | ) ✓ ◆ n · x = 4.1.3 x )n · (1 x I NFERENCE Now, we use again Bayes’ Theorem, in its Bayesian interpretation, where: Posterior / Likelihood · Prior to obtain: f ( | x) / ↵+x 1 · (1 ) +n x 1 Therefore, you conclude that with the available information, the posterior distribution of is: ⇠ Beta(↵ + x, +n x) Figure 2 shows different alternatives for the posterior distribution depending on the prior belief. Further explanation about how to perform this bayesian updating can be found in Cowles (2013). J OS É M ANUEL R ODR ÍGUEZ S OTELO 91 4 Prior belief: Honest Neutral Dishonest Liars! 4 f(λ | x) f(λ | x) 3 Prior belief: Honest Neutral Dishonest Liars! 2 2 1 0 0 0.00 0.25 0.50 0.75 1.00 0.00 0.25 λ 0.50 0.75 1.00 λ (a) Posterior when n = 5 and x = 1. (b) Posterior when when n = 25 and x = 5. F IGURE 2: D IFFERENT ALTERNATIVES FOR THE POSTERIOR DISTRIBUTION . 4.2 N EW SOLUTION Now, the expected value of insisting has changed a little. The new expected value: Z 1 ·! E [U | I, A, x] = c+u· · f ( | x) d (1 )·! 0 1 can be evaluated numerically. Alternatively, it can be approximated simulating realizations of a Beta distribution. 0.25 Prior belief: Honest Neutral Dishonest Liars! 0.25 E[U | I , A , x ] E[U | I , A ] 0.00 −0.25 −0.50 −0.75 Prior belief: Honest Neutral Dishonest Liars! 0.00 −0.25 −0.50 0.00 0.25 0.50 ω (a) A priori. 0.75 1.00 −0.75 0.00 0.25 0.50 ω 0.75 (b) After observing n = 5 and x = 1. F IGURE 3: E XPECTED VALUE OF INSISTING WHEN u = 1 AND c = .7 1.00 92 S HOULD YOU ASK HER OUT ? 5. F INAL R EMARKS There you go. Now you have all the information and analysis that you need to make the best decision. You should be aware that bayesian analysis is dependent on the subjective prior that you have at the beginning of your search. Moreover, if you still find the model quite simplistic for your situation, there are some alternatives you can try. A natural extension of this simple model is to change equation 2.4 for the following: Pr(D | I, B c , A) = Pr(D | I, B c ) = ✓ where ✓ would reflect the willingness of girls without boyfriend to go out with you after you insist. Again, you would have to perform inference over ✓; but inference on and ✓ would have to be done simultaneously. Finally, don’t forget that the easiest way to actually find someone to go on a date with you is to stop reading this and go out. R EFERENCES [1] Cowles, M.K., “Applied Bayesian Statistics: With R and OpenBUGS Examples,” Springer Texts in Statistics, Springer, 2013. La Gaceta de Economı́a convoca a todos los alumnos, profesores e investigadores interesados en fomentar la investigación económica de alta calidad a publicar documentos de investigación relevantes, con los fines de complementar la preparación académica de los estudiantes y proveer un foro de discusión de la realidad económica de nuestro paı́s y el mundo. CONVOCATORIA El objetivo de la Gaceta de Economı́a es promover la investigación económica de alta calidad y darla a conocer dentro y fuera del ITAM. Esta publicación recibirá contribuciones en teorı́a económica, economı́a aplicada, econometrı́a, desarrollo económico, economı́a polı́tica, historia económica, finanzas y otros temas siempre que sean abordados desde el punto de vista de la ciencia económica. Instrucciones para los autores: 1. Se aceptarán documentos en español e inglés. Para presentar un artı́culo, se debe enviar una copia en formato PDF en la que no sea visible el nombre del autor a la siguiente dirección: gaceco@itam.mx. 2. De ser seleccionado para su publicación, deberá presentarse la versión final del artı́culo en un archivo TeX con el preámbulo de la Gaceta de Economı́a, que será enviado a los autores de artı́culos seleccionados y puede ser solicitado en cualquier momento. 3. Las referencias que se hagan en el artı́culo deberán estar identificadas por el apellido del autor seguido por el año de publicación entre paréntesis. Todas las referencias tendrán que ser listadas de manera completa en la sección de Referencias incluida al final del artı́culo. 4. Se sugiere a los autores que los artı́culos enviados no excedan las 40 páginas a 1.5 espacios. 5. Las gráficas y figuras en el documento no deberán contener bordes ni sombras de ningún tipo. El tı́tulo de la gráfica o tabla deberá ser incluido fuera de la misma. Será necesario que todas las tablas y todas las gráficas estén numeradas. 6. Los editores agradecerán que los artı́culos sean revisados y que no contengan errores gramaticales, ortográficos o de consistencia en las referencias. De esta manera se minimizarán los cambios editoriales y se agilizará la recepción y publicación de los artı́culos. 7. El cierre de edición para el siguiente número es el 21 de agosto de 2014, los artı́culos recibidos en fechas posteriores se tomarán en cuenta para el número consecutivo. Se notificará a los autores la decisión de publicación a más tardar el 15 de octubre de 2014 Atentamente, La Mesa Directiva GACETA DE ECONOMÍA, INSTITUTO TECNOLÓGICO AUTÓNOMO DE MÉXICO, Av. Camino a Santa Teresa Nº 930, Col. Héroes de Padierna, Magdalena Contreras, C.P. 10700, México, D.F. Tel.: (55) 5628-4000, E-mail: gaceco@itam.mx