Download La Gaceta de Economía - Gaceta de Economia

Document related concepts

Frederick Singer wikipedia , lookup

Hippolyta (DC Comics) wikipedia , lookup

Human Relations Area Files wikipedia , lookup

Israel Project wikipedia , lookup

Saab Automobile wikipedia , lookup

Transcript
Índice
1 What is the effect of macroeconomic announcements on the foreign
exchange market? An intraday analysis on the peso/dollar exchange
rate
Roberto Gómez Cram..........................................................................................
1
2 Efecto de una política monetaria de compra de activos en una economía emergente
Luis Simon Tamborrel......................................................................................... 27
3 Una justificación para tener una meta de inflación positiva
Miguel Zerecero .................................................................................................. 59
4 Voto estratégico bajo el sistema mixto mexicano
Román Acosta ..................................................................................................... 69
5 Should you ask her out?
Jose Manuel Rodríguez Sotelo ............................................................................ 87
E DITORIAL
El nuevo equipo editorial de la Gaceta de Economía se complace en presentarles la edición número 32. En esta ocasión, los cinco artículos publicados
son investigaciones originales realizada por alumnos y exalumnos del Instituto Tecnológico Autónomo de México. La selección de artículos abarca diversos temas, mostrando la riqueza de los métodos y herramientas de la ciencia
económica y confirmando que ésta puede dar respuesta a numerosos tipos de
preguntas y analizar una gran variedad de cuestiones.
El artículo What is The Effect of Macroeconomic Announcements on The Foreign
Exchange Market? An Intraday Analysis on The Peso/Dollar Exchange Rate,
de Roberto Gómez Cram, analiza utilizando datos de cada cinco minutos, el
efecto que tienen las noticias relacionadas a los agregados macroeconómicos
fundamentales sobre el tipo de cambio entre el peso mexicano y el dólar.
En el artículo subsecuente, Luis Simon Tamborrel investiga los efectos de
una política monetaria de compra de activos en el contexto de una crisis de
reducción de liquidez de uno de los activos disponibles en la economía. En
particular, investiga la conveniencia de este tipo de acciones para economías
emergentes las cuales enfrentan restricciones de liquidez más importantes que
las economías desarrolladas.
En Una justificación para tener una meta de inflación positiva, Miguel Zerecero
utiliza una simplificación de un modelo de Mankiw y Reis para argumentar
a favor de una meta de inflación positiva para contrarrestar mercados con un
bajo nivel de competencia. El modelo presentado no deja de tomar en cuenta
los efectos negativos de la inflación y considera el problema que una mayor
dispersión de precios tiene sobre la producción.
Dejando de lado la macroeconomía, Román Acosta investiga, en Voto estratégico bajo el sistema mixto mexicano, la posibilidad de que los votantes mexicanos actúen de manera estratégica al momento de elegir a sus representantes
dada la doble implicación de sus votos legislativos, es decir, dada la presencia
de curules plurinominales. Acosta encuentra que efectivamente la representación proporcional reduce los incentivos para el voto estratégico y presenta
datos de elecciones locales que sustentan su hipótesis.
Finalmente, el artículo Should you ask her out?, de José Manuel Rodríguez
Sotelo, muestra un divertida aplicación de estadística bayesiana a un problema
de decisión con comportamiento estratégico: invitar a salir a una persona. Con
un estilo sencillo y una prosa ligera, este articulo resulta didáctico e invita a
usar el pensamiento analítico en temas menos ortodoxos. La cuestión de si la
historia que sirve como pretexto para este artículo es realista o no se deja a
criterio del lector.
El propósito de esta publicación es fomentar la investigación científica de
excelencia sobre temas relacionados con la economía, complementar la formación académica de los estudiantes y ser un foro para la discusión de temas
relevantes para la sociedad; por ello, nos enorgullece presentar esta selección
de artículos de gran calidad. Agradecemos a todos aquéllos que contribuyeron a escribir, seleccionar, editar y comentar el contenido de este número de la
Gaceta. En particular a César Martinelli y Diego Domínguez, así como a todos
los miembros del Consejo Editorial de esta edición. Esperamos que sea de su
agrado e invitamos a la comunidad de economistas a continuar colaborando
con la labor de investigación científica que aquí se presenta.
II
1
W HAT IS T HE E FFECT OF M ACROECONOMIC
A NNOUNCEMENTS ON T HE F OREIGN E XCHANGE
M ARKET ? A N I NTRADAY A NALYSIS ON T HE
P ESO /D OLLAR E XCHANGE R ATE⇤
R OBERTO G ÓMEZ C RAM†
This paper analyzes the effect of unexpected information (surprises) about macroeconomic
fundamentals on the exchange market. For this purpose, we employ peso/dollar exchange rate
data with a five minute frequency as well as a broad variety of US and Mexican macroeconomic
expectations and realizations for the period extending from January 2005 to November 2012.
The results of this study suggest that peso/dollar exchange rate movements are not linked in
the short term to Mexican macroeconomic fundamentals; however, there is evidence of a close
relationship with US fundamentals. In particular, surprises on the majority of the US announcements have an immediate and significant effect on the volatility of the exchange rate returns
which dissipates gradually. On average, the increase in volatility lasts 15 minutes. Additionally,
we identify the macroeconomic announcements that have the greatest impact on exchange rate
volatility; surprises on Change in Nonfarm Payrolls and in the Unemployment Rate have the
most pronounced effect.
En el presente trabajo se examina el efecto que tiene la llegada de información no esperada
(sorpresas) de fundamentales macroeconómicos en el mercado cambiario. Para esto se utilizan
datos del tipo de cambio peso/dólar con una frecuencia de cinco minutos así como una variedad
de expectativas y anuncios macroeconómicos de México y de Estados Unidos para el periodo de
enero de 2005 a noviembre de 2012. Los resultados sugieren que los movimientos en el tipo de
cambio no están vinculados a los fundamentales macroeconómicos mexicanos en el corto plazo
mientras que sí existe una estrecha relación con los fundamentales estadounidenses. En concreto, las sorpresas en la mayoría de los anuncios de Estados Unidos tienen un efecto inmediato
y significativo en la volatilidad de los rendimientos del tipo de cambio. Dicho efecto tarda, en
promedio, 15 minutos en disiparse. Adicionalmente, se identifican aquellos anuncios macroeconómicos que tienen el mayor impacto en la volatilidad del tipo de cambio, en específico, las
sorpresas en el cambio en la nómina no agrícola y en la tasa de desempleo tienen el mayor efecto.
K EYWORDS : exchange rates, expectations data, high-frequency data, macroeconomic news
announcements.
1.
I NTRODUCTION
How do markets price in fundamental macroeconomic news into financial assets? Understanding the relationship between macroeconomic variables and
asset prices as well as the process through which the latter are determined are
of key interest for relevant financial and economic decisions, such as risk management, financial asset pricing, and defining investment portfolios.
⇤ This article is a short version of my ITAM undergraduate thesis: ¿Cuál es el efecto de las noticias
macroeconómicas en el mercado cambiario? Un análisis indradía para el tipo de cambio peso/dólar. My
thesis received the first place at the XXIX Premio Internacional de Investigación Financiera, IMEFErnst Young 2013.
† Research Analyst at the Economics Research Directorate at Banco de México. I would like
to thank Santiago García Verdú, Ignacio Lobato, Diego Domínguez and Carlos Capistrán for their
invaluable advice and comments throughout all of the research process. I have also benefitted from
discussions with Miguel Zerecero, Juan Arroyo, Mauricio Torres and Alexandro Jara. The views
presented in this work are exclusively of the author and do not necessarily reflect those of Banco
de México. All errors remain my own. Email: rgomezcram@gmail.com.
2
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
This paper studies this relationship in the case of the foreign exchange market in an effort to determine to what extent peso/dollar exchange rate movements are linked to Mexican and US macroeconomic fundamentals.1 This
is important to the extent that it makes it possible to identify the potential
macroeconomic determinants that generate systemic risk in the exchange market. On the other hand, the importance of analyzing the exchange rate resides
in the role it plays in any economy as a facilitator of commerce, investment and
cross-border financial transactions.
We focus on the conditional volatility of peso/dollar exchange rate returns
and we address a central question in exchange rate economics: What is the
effect of unexpected information (surprises) about macroeconomic fundamentals on the foreign exchange market? To answer this question, we employed
peso/dollar exchange rate data with a five minute frequency as well as a broad
variety of US and Mexican macroeconomic fundamental expectations and announcements for the period extending from January 2005 to November 2012.
The reason for restricting our study to surprises rather than considering
directly the announcements is that the market has already discounted the expected value of the macroeconomic realizations. That is, only relevant unanticipated news of fundamentals should induce exchange rate movements. This is
line with Malkiel’s (1992) definition of market efficiency in which a market is
efficient if it fully and correctly reflects all relevant information in determining
security prices; in this case the exchange rate ought to adjust rapidly as new
relevant information arrives. In this paper we approximate this unexpected information -how much of the announcement was not anticipated by the marketthrough the standardized difference between the expectations and realizations.
The advantage of using a database with such a high frequency is the extent
to which it makes it possible to isolate more precisely the effect on exchange
rate movements in response to macroeconomic news surprises as opposed to
any other significant developments that may have occurred on the same day
as the surprises. This is especially useful in the case of the US and Mexican
macroeconomic announcements as the day and time of release are known in
advance.
We estimate the effect of surprises on the volatility of the returns via ordinary least squares and we use heteroskedasticity and serial correlation consistent standard errors using the kernel proposed by Newey-West (1987). It is
also necessary to control for the seasonal behavior displayed by the volatility
returns at such high frequencies.We use the theoretical framework of Andersen
and Bollerslev (1997) in order to deseasonalize the volatility series.2
The results of this study suggest that the peso/dollar exchange rate move1 In this case macroeconomic fundamentals should be understood as aggregate indicators that
summarize the current state of the economy. These announcements usually refer to the following economic variables: real activity, consumption, investment, government, foreign trade, prices,
forward-looking and monetary announcements
2 A failure to take into account this seasonal behavior before analyzing the impact of unexpected
macroeconomic news on yield volatility can lead to a statistically erroneous analysis. We address
this matter in section 3.
R OBERTO G ÓMEZ C RAM
3
ments are not linked in the short term to Mexican macroeconomic fundamentals, but there is strong evidence of a close relationship with US fundamentals.
To this end, we not only consider the contemporaneous effect on volatility but
we also analyze how persistent it is. In particular, US macroeconomic news
surprises immediately increase peso/dollar exchange rate return volatility and
the effect dissipates gradually. On average, the increase in volatility lasts 15
minutes. More specifically, the effect of surprises in Change in Nonfarm Payrolls and the Unemployment Rate endure for more than 45 minutes after they
are released.
We also identified the macroeconomic announcements that exert the greatest impact on peso/dollar exchange rate volatility. We find that the effect depends in large part on the date of the release of the news relative to those
of other indicators that measure similar segments of the US economy. The
intuition of this result is as follows: Agents observe the value of the initial
announcements and on the basis of that information they adjust their expectations regarding the content of subsequent indicators that assess the performance of similar segments. In this way, the deviations in expectations surrounding these observed values from the most recent announcements tend to
be less pronounced with the degree of volatility they stoke successively tapering off. Surprises in the following macroeconomic indicators have the greatest
effect: Change in Nonfarm Payrolls, the Unemployment Rate, the Consumer
Price Index, Construction Spending, ISM Manufacturing and Advance Retail
Sales, in that same statistical order.
Several studies have examined the response of different asset prices to public announcements of economic news. Ederington and Lee (1993) and Balduzzi
et al. (2001), for example, analyze intraday patterns in Treasury bond prices
and trading around announcement times. The work most similar to ours is
Andersen et al. (2003), since in both cases we study the effect of macroeconomic news in the foreign exchange market. Andersen et al. (2003) focus on
the performance of the exchange rate returns, whereas we focus on studying
the impact on the volatility of returns.3 Our analysis extends theirs in the sense
that we consider a much broader set of macroeconomic announcements (51
instead of 41) and a longer sample period (eight years instead of six years).
However, Andersen et al. (2003) make a more detailed study of the exchange
market since they analyze the effect in five different exchange rates.
Our findings provide a new perspective on the relative importance that financial agents assign to the performance of the Mexican economy in the short
3 Despite the advantages there are in studying directly exchange rate conditional means as opposed to conditional variances, the a priori exchange rate movement to news announcements it is
not entirely clear. A depreciation or appreciation of the exchange rate may depend on the current
agent beliefs of the reaction of the Central Bank. For instance, one would expect that a positive
surprise in Change in Nonfarm Payrolls (an announce value greater than the expected one) would
depreciate the peso/dollar rate since it is a good sign of the US economic conditions. However,
when we look at the peso/dollar movements immediately after a positive surprise, we actually
see an appreciation. The most reasonable explanation for this is that in the aftermath of the recent
financial crisis the Fed’s decision of tapering QE greatly depends on the positive performance of
this particular indicator.
4
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
term. To our knowledge, there is no intraday study that analyzes news effects
on the price of any asset related to the Mexican economy, and in particular on
the peso/dollar exchange rate. Cermeño and Solis (2011), present an empirical
evaluation of the link between the releases of macroeconomic announcements
and the stock market. In their analysis they use daily returns of a portofolio composed of shares from the Mexican Stock Market. However, Ederington
and Lee (1993) suggest that data even with a one hour frequency are of too low
frequency to accurately measure the effect of news on volatility asset returns.
Regarding the effect of US announcements our results are quite consistent
with prior related work: Volatility increases immediately after the arrival of
unexpected information and dissipates gradually. Balduzzi et al. (2001) and
Andersen et al. (2003) find that US news announcements are the most important ones measured by the induced effect in asset prices. Our findings in
this particular aspect may be viewed as providing confirmation to their work.
Along these lines, James and Kasikov (2008) conclude that US indicators have
a greater impact on market movements compared to the effect caused by data
from countries such as Japan, Switzerland or the European Union.
The rest of the paper is organized as follows. In section 2 we provide an
analysis of the database and a characterization of both intraday peso/dollar
exchange rate returns as well as their volatility in the period under study. We
also describe the basis of the macroeconomic variable expectations and realizations contemplated in the study. In section 3, we explain the methodology
we employ to calculate the seasonal component of peso/dollar exchange rate
return volatility. This variable serves as control on the econometric model we
describe in section 4, which details the exercises we present to evaluate the
impact of unexpected information about macroeconomic fundamentals on the
volatility of the exchange rate returns. The conclusions appear in section 5.
2.
D ATA D ESCRIPTION
This study uses intraday peso/dollar exchange rate returns as well as data
regarding US and Mexican macroeconomic expectations and realizations. In
subsection 2.1 we describe how we constructed the high frequency peso/dollar
exchange rate database and we provide a basic statistical description of their
returns and volatility. In subsection 2.2 we describe the database we used regarding the macroeconomic variables.
2.1
E XCHANGE R ATE
Our primary data set consists of 5-minute returns of the peso/dollar spot exchange rate and we obtained it from Olsen & Associates (O&A).4 The entire
sample extends from January 1, 2005 to November 30, 2012, for a total of
832, 608 (= 2, 891 days ⇥ 288 minute intervals per day) high frequency foreign
4 Dacorogna et al. (1990), Andersen and Bollerslev (1998) and Andersen et al. (2003) are
some of the studies that have employed data from this firm. For an exhaustive list, see
http://www.olsendata.com/about_us/research/
R OBERTO G ÓMEZ C RAM
5
exchange return observations. As in Dacorogna et al. (1990) and Andersen et
al. (2003), we use all the interbank quotes that appeared in the Reuters screens
during the sample period to construct our 5-minute returns. Each quote consists of a bid and an ask price together with the time it was registered to the
nearest second. For each day, t, and for each five minute interval, n, we obtained the median of the average of the bid and ask prices, Pt,n . This data was
filtered by O&A for outliers and other anomalies.5
Out of the entire 832, 608 sample observations, in 386, 398 cases no interbank quote was registered while in the remaining 446, 210 observations a total
of 24, 783, 660 quotes were recorded. When we analyze the number of quotes
registered for the entire sample, we realize that the market activity is similar
throughout the week and each day’s trading patterns are consistent with the
exception of weekends and Friday evenings (Saturday in Asian markets), when
activity diminishes considerably. As a result of this, we restrict the sample in
order to obtain the 5-minute returns. In line with Andersen and Bollerslev
(1997), we explicitly exclude the quotes registered on weekends; all observations between Friday, 21:05 hours Greenwich Mean Time (GMT) and Sunday
21:00 GMT were not taken into account. As we previously mentioned, this
particular definition of the weekend is primarily in response to the activity patterns observed in the exchange market and keeps the daily periodicity intact
(see Bollerslev and Domowitz (1993)).
In addition, we did not take into account several non-working days, including Christmas, New Years, Constitution Day, Benito Juárez’s Birthday, Easter
Thursday and Friday, May Day, Mexican Independence Day, Day of the Dead,
Day of the Mexican Revolution and Virgin of Guadalupe Day. With respect to
the US calendar, we removed the 4th of July, Labor Day, Thanksgiving Day, and
Memorial Day.6 Although our cuts do not account for all of the holiday market slowdowns, we think that we capture the most important daily calendar
effects.
We obtain our 5-minute returns in the subinterval n of day t, Rt,n , using the logarithmic difference between the price registered in two contiguous
Pt,n
subintervals, that is, Rt,n = log( Pt,n
)100. To that end, we did not include
1
the subintervals for the days in which no quote was registered or they were
registered in an isolated manner. As is standard in the literature, we measure
the exchange rate volatility, Vt,n , by means of the absolute return values.
In the end we are left with to 1, 999 days of data, containing 390, 371 highfrequency peso/dollar exchange rate return observations, which equal to 97%
of all quote prices observed during the reference period. A basic statistical description shows that the 5-minute returns are not significantly different from
zero. Furthermore, we observed that they are not normally distributed. They
are approximately symmetric, however, they exhibit excess kurtosis. At the
5 Given that prices are indicative and not necessarily trading prices,
there is a need to filter them
as the quotes are not binding, thus raising the possibility that frivolous or erroneous prices might
appear. This problem is especially severe when we are dealing with high frequency data as the
risk of an input error increases.
6 On all these days, we cut from 21:05 GMT the night before to 21:00GMT that evening.
6
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
same time, the maximum and minimum returns registered in the sample were
2.96% and -3.24%, respectively, which does not suggest the presence of pronounced returns discontinuities. The ‘robusticized’ Box-Pierce statistic, Q⇤K ,
suggests the existence of a serial correlation both in returns and absolute returns.7 This serial correlation is consistent with the one found in other studies that analyze the returns on various types of exchange rates at similar frequencies (see for example Bollerslev and Domowitz (1993) and Andersen et al.
(2003)). This is principally due to the fact that market activity is very similar in
contiguous time intervals given that price changes are registered in a relatively
brief period of time. For instance, we computed Q⇤K for the 10-minute returns
and we are not able to rejected the null hypothesis of white noise.
In order to evaluate the intraday frequency of exchange rate absolute returns, Figure 1a displays their sample average for each 5-minute subinterval in
the day. Significant differences in volatility can be seen, ranging from 0.010%
at 3:30 GMT (interval 47) to 0.054% at 12:30 GMT (interval 151). This pattern
is similar to the ones calculated by other authors in relation to other currencies8 and is closely linked to the cycle of market activity. Volatility begins at a
relatively high level followed by a slow decay. Volatility increases around 6:00
GMT (interval 73) as activity intensifies with the opening of the European markets and the mid-day session, following the lunch hour, in Tokyo and Hong
Kong. Thereafter, volatility remains constant until the European lunch hour
at 11:30 GMT (interval 139) before increasing considerably with the overlap of
activity in Europe and arrival of Mexico and the United States to market at
around 12:00 GMT (interval 145). After the close of markets in Europe, volatility decreases monotonically.9 In contrast, the sample average of the returns for
each 5-minute subinterval in the day, are centered around zero and there is no
evidence of a systematic peso/dollar exchange rate appreciation or depreciation.
In order to assess the economic relevance of the temporal dependencies in
the absolute returns series, Figure 1b shows their sample autocorrelations up
to a day (288 lags). The sample autocorrelation of absolute returns are surprisingly regular, they display a slow decay and pronounced diurnal variations,
which forms a U.10 On the other hand, the raw returns, only display statistically significant serial correlation in the first lag. This intraday return and
7 In practice, the statistic Q⇤ (see Lobato et al. (2001)) is preferred over the Box-Pierce or LjungK
Box test, Q, given that it is robust to conditional heteroskedasticity. Concretely, it is defined as
P
PT
⇢
ˆ2
Q⇤K = T K
˜2j , in which ⇢˜2j = j with ⌧ˆj = ˆ12 ( T1
Ȳ )2 (Yt j
Ȳ )2 ), and
j=1 ⇢
t=1+j (Yt
⌧
ˆj
0
under the null hypothesis (H0 : ⇢1 =⇢2 =...=⇢K =0) Q⇤K !d 2K . We computed the statistic for
different values of K and all suggest the existence of a serial correlation in returns as well as in
their absolute value.
8 See, for example, Anderson and Bollerslev (1997).
9 It is important to mention, that we observe the same pattern over the course of the week, with
the greatest volatility when markets in Europe, the United States and Mexico are open. In the same
way, volatility diminishes at the end of the day and revives when markets reopen on the next day.
10 The behavior of the sample autocorrelation throughout the week (up to 1,405 lags) is similar
to what we observed in Figure 1b, with the cycle remaining notably regular.
R OBERTO G ÓMEZ C RAM
7
F IGURE 1: AVERAGE AND C ORRELOGRAM OF I NTRADAY V OLATILITY OF R ETURNS
Avg. Volatility (%)
0.06
a)
0.04
0.02
0
0
0.5
100
150
Five Minute Interval
200
250
50
100
200
250
b)
0.4
Correlation
50
0.3
0.2
0.1
0
0
150
Five Minute Lag
Note: This figure shows average 5-minute peso/dollar exchange rate return volatility (Fig. 1a, 288
observations) and the sample correlation over the course of the day (Fig. 1b, up to 288 lags). The
period under study extends from January 2005 to November 2012.
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
8
volatility patterns for the peso/dollar exchange rate are consistent with those
reported in the more detailed analysis of Dacorogna et al. (1993), Anderesen
and Bollerslev (1997) and Andersen et al. (2003) for various types of exchange
rates.
While this intraday volatility patterns may be irrelevant for standard studies of the return dynamics based on observed prices in daily or monthly frequencies, empirical studies on return volatility at such high-frequencies are
probably subject to severe distortions given the strong periodicity observed in
Figure 1.
The pronounced fluctuations in the absolute return correlogram provide a
first signal of how inconvenient it is to directly model intraday return volatility based on ARCH models, just as Andersen and Bollerslev (1997) noted,
a conclusion that this study reaches in relation to the peso/dollar exchange
rate. Standard ARCH models imply a geometric decrease in the autocorrelation structure of the returns and simply cannot accommodate the regular cycle
in the pattern shown in Figures 1. We address this issue in the next section.
Before we move on to the next subsection in which we describe the US
and Mexican economic news announcements, it is important to mention that
a possible disadvantage of our data set is that we use quotation prices rather
than transaction prices. As a result, it is not possible to obtain trading volume
data or information about the quantity of buying and selling conducted at any
point in time. This makes it impossible to study the joint dynamics between
volume and prices, or order flow and prices. However, Danielsson and Payne
(2002) find that the basic characteristics of returns calculated based on those
quote prices are tightly related with those that can be obtained from transaction
prices, which are generally not available in the foreign exchange market. In
addition, we are implicitly assuming that our quotes are representative of all
transactions on a global scale.
2.2
M ACROECONOMIC F UNDAMENTAL E XPECTATIONS AND R EALIZATIONS
In this subsection we describe the expectations and announcements used to
construct the surprises about the macroeconomic fundamentals under consideration. In addition, we analyze the prospect that the expectations of those
surveyed did not contain valuable information about the forecasted variable
or that they are biased, a possibility that we discarded.
We obtain the expected and realized macroeconomic fundamentals related
to the US and Mexican economies from Bloomberg. Agent expectations were
drawn from the surveys conducted with various agencies and the median forecasts, the standard deviation and the number of those surveyed for each survey
are reported.11 Usually the surveys are conducted two weeks prior to the pub11 It was not possible to obtain from the survey the standard deviation for 5 US macroeconomic
variables and 2 for Mexico, so an approximation was made based on the difference between the
high and low values reported and were divided by six. For the United States the cases were: FOMC
Rate Decision, GDP QoQ (Annualized), Consumer Confidence from the University of Michigan,
Personal Consumption, Nonfarm Productivity. For Mexico they were Bi-Weekly CPI and the Bi-
R OBERTO G ÓMEZ C RAM
9
lication of the announcement and those polled can modify their estimates up
to 5 minutes before the news is released.
We employed 36 economic variables that measure different fundamentals
of the US economy, as well as 15 for the economy of Mexico. Overall, we used
3,452 expectations and corresponding macroeconomic news items in the case
of the United States and 1,192 for Mexico. On average, for each announcement,
57.5 economic institutions were interviewed for the United States and 12.7 for
Mexico. Tables 1 and 2 provide a brief descriptions of the announcements,
which are divided into eight categories according to the economic sector to
which they refer: real activity, consumption, investment, government, foreign
trade, prices, forward-looking and monetary announcements. Within each of
these categories, we listed each macroeconomic indicator in the order of each
one’s relative importance.12
Tables 1 and 2 list for each macroeconomic variable that we employed (Announcement), the agency in charge of its publication (Source), the range of publication dates (Date), the frequency with which is released (Freq.), the time of
the day in which it is published Mexico City time (Hour), the total number of
observations (Obs.) as well as the average number of analysts surveyed for
each economic variable in question (Nr.). In the United States, 17 announcements are made at 7:30 am; two at 8:15 am; 13, at 9:00 am and four more announcements at 8:45 am, 1:00 pm, 1:15 pm and 2:00 pm, respectively. In the
sample used, a change to the hour of publication was made for two indicators
and most of them appear on a monthly basis. In contrast, 12 announcements
in Mexico are published at 8:00 am, and another three at 9:00 am, 12:00 pm and
2:30 pm, respectively. Eleven of the indicators are monthly, three quarterly and
one is release every 15 days. The hour of publication changed twice in the case
of 12 announcements and once in the case of another indicator.
The announcements in the sample tend to be published at the end of the
week and uniformly in the months over the course of the year, with the only
exception being the month of December in which there are fewer publications
on average. Lastly, the distribution of the announcements is similar in each of
the countries considered.
Before we turn to describe the estimation of the seasonal component that we
use as a control variable in section 4, it is worthwhile analyzing the possibility
that the Bloomberg forecasts may not capture all information regarding the
announced value. This is important since information still arrives between the
time the forecast is done and the time the macroeconomic variable is published;
hence there exists the possibility that the expectations are outdated. In order
to assess if the Bloomberg forecasts are systematically biased, we estimated the
following regression:
weekly Core CPI.
12 Bloomberg assigned to each macroeconomic announcement a number between 0 and 1 according to the relative quantity of alert subscriptions that exist in each country. The bigger the number,
the greater the number of subscribers. We used this variable as criteria for assigning the relative
importance for each announcement.
10
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
ek,t =
k
+ uk,t
(2.1)
Where ek,t is the error of the median forecast for announcement k and it
is measured by the difference between the announcement value, Akt,n , and the
k
market expected value, Et,n
, for each indicator k published in the five minute
interval n on day t.
Under the null hypothesis, H0 : k = 0, the Bloomberg forecasts are systematically unbiased. On the other hand, if k is positive (negative) and statistically
different from zero the forecast errors have a positive (negative) bias, so that
the forecasts systematically underestimate (overestimate) the macroeconomic
variable of interest. Table 3 shows the estimates of equation (1) using robust
standard errors.13
For 31 out 36 variables for the United States, it is not possible to reject the
hypothesis that k is equal to zero and for Mexico in all cases we reject the null
hypothesis. This suggests that the surveys contain real information regarding
the forecast variable in question and in most cases, the survey is not biased.
Despite the results we report in this section and given that in section 4
we use arrivals of unexpected information about macroeconomic fundamental rather than the survey per se, errors may exist in measuring the surprise.
These errors, without a doubt, may bias our estimations. In addition, we are
assuming that the survey is representative of market expectations and while
we are not including all US and Mexican economic indicators, we think we are
considering the most important ones.
3.
S EASONAL C OMPONENT
This section explains the methodology we use to estimate the seasonal component of peso/dollar exchange rate return volatility. This variable will serve as
control in the econometric model described in the following section that quantifies the volatility impact of the arrival unexpected information about US and
Mexican macroeconomic fundamentals.
In this paper, we use the theoretical framework of Andersen and Bollerslev
(1997)14 in order to deseasonalize the volatility series. In general, they assume
that the volatility process is driven by the simultaneous interaction of the components associated with calendar effects, intraday cyclical patterns and an unobserved, persistent, latent factor. Given their theoretical framework, it is possible to use standard regression techniques to simultaneously account for each
volatility component separately with the objective of isolating the dynamic behavior of volatility around each macroeconomic announcement surprises.
13 Since the surveys are conducted at most two weeks prior to the publication and given that
the forecaster will know the most recent value of the variable that she will try to predict in future
surveys, it is considered that the forecast errors do not have an autocorrelation structure, such as a
moving average, and therefore there is no need to controlled by it in equation (1).
14 Various studies have adopted the same method for modeling the periodic structure of intraday
exchange rate volatility. See, for example, Dominguez (2006).
R OBERTO G ÓMEZ C RAM
11
Andersen and Bollerslev (1997) decompose the five-minute returns into the
following expression:
t Zt,n
(3.1)
1
N2
where E(Rt,n ) denotes the unconditional mean, so that Rt,n E(Rt,n ), measures the excess returns, st,n represents the periodic component for the nth
intraday interval on the trading day t, t is a daily volatility factor and Zt,n is
an i.i.d. mean zero unit variance innovation term and N refers to the number
of return intervals per day.
Given the lack of consensus on the sort of theoretical framework that could
serve as a guide to stipulate a particular parametric form for the periodic structure of intraday exchange rate volatility, a flexible parametric procedure seems
natural. Following Andersen and Bollerslev (1997), and defining xt,n from
equation (2) as:
Rt,n
xt,n ⌘ 2 log[|Rt,n
E(Rt,n ) = st,n
E(Rt,n )|]
log(
2
t)
2
+ log(N ) = log(s2t,n ) + log(Zt,n
) (3.2)
the modeling approach is then based on a non-linear regression in the intraday
time interval, n, and the daily volatility factor, t2
xt,n = f (✓;
t , n)
(3.3)
+ ut,n
2
2
in which the error term, ut,n ⌘ log(Zt,n
) E(log(Zt,n
)) is i.i.d. mean zero.
In practice, given the strong seasonal pattern in the five-minute rate volatility (see Fig. 1), it appears appropriate to approximate the non-linear regression
function f (✓; t , n), by means of the following Fourier series introduced by
Gallant (1981):
f (✓;
t , n)
=
J
X
j
t [µ0
+ µ1
i=1
µ2
n
+
N1
D
n2 X
+
N2 i=1
i n=di
+
P
X
p=1
(
p
cos(
pn2⇡
)+
N
p
sin(
pn2⇡
))]
N
(3.4)
where N is the number of returns intervals per day, N1 ⌘ N2+1 and N2 ⌘
(N +1)(N +2)
are normalizes constants, P determines the order of expansion of
6
the Fourier series and J 1 allows for an interaction effect between t and the
shape of the periodic pattern. The Fourier’s flexible form is parameterized by
quadratic components, (with coefficients µ0 , µ1 and µ3 ), a number of sinusoids,
(with coefficients p and p ) and time-specific dummies (the i coefficients) that
take into account certain intraday intervals that do not adjust with the general
periodic behavior of exchange rate volatility.
The estimation involves a two-step procedure. First, it is necessary to generate xt,n , call it, x̂t,n , by replacing E(Rt,n ), in equation (3) with the sample mean
of the returns and t for the estimate from a daily volatility model. By making
12
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
this substitution and treating x̂t,n as the dependent variable in the regression
defined by equations (4) and (5), the parameters of interest can be estimated by
ˆ ˆ , n) as the result of the previous
ordinary least squares. Defining fˆt,n ⌘ f (✓;
estimate and normalizing, the estimator of the intraday periodic component
for the interval n on day t is given by,
ŝt,n = P
T
T · exp(
PN
t=1
fˆt,n
2 )
n=1 exp(
fˆt,n
2 )
(3.5)
in which T is the number of days of the sample.
In this paper, the daily volatility factor, t , is estimated from a MA(1)GARCH(1,1) model, using daily peso/dollar exchange rate returns over the
course of 2, 252 days between January 2004 and December 2012. Intuitively,
t , tries to capture the level of average volatility over the course of day t and
it makes sense to construct it based on ARCH models as it has been shown
that they provide good approximations of daily volatility in asset return.15 We
include the MA(1) term to take into account the significant, first-order autocorrelation in daily returns.16
We determined the number of interaction terms J (J = 0) and the order of
the Fourier expansion P (P = 8) using the Schwarz and Akaike information
criteria.17 Since J = 0, the periodic seasonal component, ŝt,n , is simplified to
ˆ
exp( f2n )
ŝn = P
in which fˆn and hence ŝn no longer depends on day t. In adˆ
N
n=1
exp( f2n )
dition, we used indicative variables for the opening and closing of markets in
Tokyo, London and New York. Figure 2 depicts the observed volatility and the
dotted line denotes the estimated intraday periodic component, ŝn , which does
a god job in approximating the periodicity of intraday volatility in peso/dollar
exchange rate returns.
4.
P ESO / DOLLAR AND F UNDAMENTALS
This section analyzes whether movements in the peso/dollar exchange rate are
linked to fundamentals. To that end we measure the immediate effect on return
volatility of unexpected information about macroeconomic fundamentals. The
results of this section suggest that peso/dollar exchange rate movements are
not linked in the short term to Mexican macroeconomic fundamentals; however, there is strong evidence of a close relationship with US fundamentals. To
gauge that relationship we conducted an additional exercises were we examine
15 For
a summary of GARCH models see Bollerslev, Chou and Kroner (1992).
is important to mention that this first order autocorrelation in the returns is not significant if
we use robust standard errors.
17 Andersen et al. (2003) finds that J = 0 and P = 4 properly adjusts exchange rate data for
Deutsche Mark /dollar, pound sterling /dollar, Japanese yen/dollars and Swiss francs /dollars.
Andersen and Bollerslev (1997, 1998) choose J = 0 and P = 6 for Deutsche marks/dollars. Alternatively, Dominguez (2006) uses J = 0 and P = 8.
16 It
R OBERTO G ÓMEZ C RAM
13
F IGURE 2: AVERAGE I NTRADAY V OLATILITY AND F OURIER A PPROXIMATION
0.06
Volatility
Seasonal Component
Avg. Volatility (%)
0.05
0.04
0.03
0.02
0.01
0
0
50
100
150
Five Minute Interval
200
250
Note: This figure shows average 5-minute volatility in the peso/dollar exchange rate over the
course of the day (288 observations) and the dotted line shows the average estimate seasonal performance. The period under study extends from January 2005 to November 2012.
14
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
how persistent the effect is.18
As a check on the robustness of the results we present in this section, we
conducted the same exercises for two different time periods. Those additional
exercises were needed primarily because the sample period under consideration includes two major events that could affect the obtained results: the financial crisis of December 2007 to June 200919 and the period when Mexico joined
the Continuous Linked Settlement System (CLS).20
The first of these periods extends from January 2005 to November 2007
while the second extends from December 2007 to November 2012. There was
no qualitative change in results between the two timeframes although the effect of some indicators was more pronounced in the second period. However,
as volatility in exchange rate returns increased considerably in the second of
these time periods,21 we estimate the seasonal component separately for each
period, which is to say, ŝn = ŝ1n 1 + ŝ2n 2 , in which ŝjn is the estimated periodic
component for the period j and j is a dummy variable that takes the value of
one in period j and the value of zero in another case with j✏{1, 2}.
4.1
C ONTEMPORANEOUS V OLATILITY R ESPONSE
The first exercise consists of quantifying the peso/dollar exchange rate volatility response immediately after the arrival of unexpected information from various announcements, which is measured by the difference between the ank
nouncement value, Akt,n , and the market expected value, Et,n
, for each indicator k published in the five minute interval n on day t. This difference is stank
dardized by means of the standard deviation of each particular survey, t,n
.
Which is to say,
'kt,n =
Akt,n
k
Et,n
k
t,n
.
(4.1)
Use of standardized news facilitates the comparison of the responses of the
volatility to different economic variables. In this case, this is especially important because units of measurement vary across macroeconomic indicators.
Balduzzi et al. (2001), Andersen et al. (2003) and Evans and Lyons (2005) also
use standardized news, however, those works standardize the error of median
k
forecast, Akt,n Et,n
, for each indicator k by means of its historical standard
deviation. The principal motivation that led these authors to use standardized
18 We conducted the same exercise for the Mexican indicators, however, we did not find a significant effect.
19 This period was chosen based on the dates published by the National Bureau of Economic
Research.
20 CLS plays a fundamental role in the foreign exchange (FX) market. Their stated mission is
to enhance financial stability by providing risk mitigation services to the global FX market. The
Mexican peso, joined in May 2008.
21 The increase in volatility in peso/dollar exchange rate returns in the second period was confirmed by the test of Levine’s equality of variances, which is robust under non-normality. There
is evidence to reject the null hypothesis of equality of variance between these two periods with a
95% level of significance.
R OBERTO G ÓMEZ C RAM
15
news is to compare the effect between announcements and not under information criteria. By considering the dispersion of agent beliefs regarding each
announcement in a specific time period, it is possible to achieve a more precise
measure of the information that is really arriving the market.22
Operationally, we estimate the effect by regressing the exchange rate return
volatility Vt,n on the arrival of unexpected information, 'kt,n , by means of the
following econometric model:
Vt,n = ↵0 + ↵1 ŝn +
2
X
i=1
i i
+
X
k
k
k |'t,n |
+ "t,n
(4.2)
where ŝn is the volatility seasonal component estimated for the nth interval of
the day and "t,n is the error term. We estimate equation 8 via ordinary least
squares using heteroskedasticity and serial correlation consistent (HAC) standard errors. To that end, we use the kernel proposed by Newey-West (1987)
to estimate the asymptotic variance of estimators. In addition, we use dummy
variables of the recent financial crisis, 1 , as well as the period when Mexico
joined the CLS indicated by 2 .23 We report the results in Table 4.
As seen in Table 4, many US indicators (23 of 36) have a significant and
positive effect on volatility. It is important to note the instantaneous volatility
effect generated by the arrival of unexpected information from ten macroeconomic news items. A surprise of one standard deviation in the case of Change
in Nonfarm Payrolls increases volatility in 0.0700%, an effect followed in level
of intensity by surprises of the same magnitude in the Unemployment Rate
(0.0637%), Consumer Price Index (0.0310%), Construction Spending (0.0208%),
the ISM Manufacturing (0.0202%), Advance Retail Sales (0.0198%), Consumer
Confidence (0.0146%), Leading indicators (0.0145%), Existing Home Sales (0.0135%) and Durable Goods Orders (0.0129%).24
With regard to the surprise effect, for example, from Change in Nonfarm
Payrolls, an increase of 0.07% is a sizeable move, from both a statistical and
economic perspective. On the statistical side, only less than 8.1% of the sample
registered a value greater or equal to 0.07%. From an economic perspective,
0.07% is relatively high compared to the sample’s average peso/dollar spread
of 0.008.
It is important to note that the similarity between distinct macroeconomic
indicators that are published over the course of a month leads to a certain redundancy of the information transmitted to the market. Agents observe the
value of the first publications and based on that information they adjust their
22 As a robustness check, the same definition of news was used as that of Balduzzi et al. (2001),
Andersen et al. (2003) and Evans and Lyons (2005). The general results were maintained; however,
all the estimated coefficients are greater under their definition of news and in one case (Nonfarm
Productivity) the estimated effect proved significant that had not been previously.
23
1 takes the value of one if day t is contained in one of the days between December 2007 and
June of 2009 and the zero value on another occasion. Similarly, 2 takes the value of one as of May
of 2008 and the zero value on another occasion.
24 All these coefficients are significant at 1 %, see Table 4.
16
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
expectations of subsequent indicators that evaluate the development of similar segments. As a result of this learning, agents in the market are capable
of improving their predictions regarding future announcements so that deviations in expectations relative to those announcements tend to narrow, thereby
diminishing the impact on volatility.
This could be a possible explanation of why it was shown that surprises in
labor market indicators (Change in Nonfarm Payrolls and the Unemployment
Rate) have a greater effect on return volatility relative to the estimated impact
of other indicators. Change in Nonfarm Payrolls and the Unemployment Rate
are some of the first hard data (e.g. information not gleaned from surveys),
that are published at the start of the month immediately following the one to
which the data refers. Agents can use this information to infer whether it had
been a good or bad month for the economy and update their expectations regarding the rest of the macroeconomic news. On the other hand, the greater
effect that was uncovered in the case of a surprise in Change in Nonfarm Payrolls relative to the Unemployment Rate may be a result of the fact that the first
announcement is a variable that more precisely gauges labor market behavior,
given that it is not contaminated by the economically active population, which
is the denominator of the Unemployment Rate.25
Along these lines, Advance Retail Sales data is used as a leading indicator
of what consumers are spending (Personal Consumption), so that one would
expect the market to react more aggressively to the first indicator. This can be
confirmed by comparing the estimated coefficient of both indicators; that of
retail sales is significantly greater than that of personal consumption to standard levels of significance. A second example is that of Durable Goods Orders
and Factory Orders; despite their being distinct, they are closely related26 and,
given that Durable Goods Orders are published earlier in the month, the information obtained from that index can reveal certain information about Factory
Orders. When we compare the effect of these two indicators, it is possible to
observe how the former variable has a significant impact on volatility. In a
similar vein, it is possible to compare the effect on volatility of the ISM Manufacturing and Industrial Production, which appears two weeks after the former
of these two indicators.
In sharp contrast to the large number of US macroeconomic indicators whose
surprises affect the peso/dollar rate, no Mexican macroeconomic indicator has
a significant effect at the 5% level and only one variable, Consumer Prices, is
significant at 10%.
Andersen et al. (2003), analyze a similar problem and find that most of
the US macroeconomic news under consideration significantly affect Deutsche
mark/dollar exchange rate returns, however, only two German macroeconomic
25 Note that the Unemployment Rate can vary due to changes in the number of people unemployed as well as to the size of the economically active population, as well as movement in both
variables.
26 Factory Orders are an economic indicator for which dollar totals are reported for new orders
for both durable and nondurable goods. The Factory Orders indicator is usually released two
weeks after the publication of data on Durable Goods Orders.
R OBERTO G ÓMEZ C RAM
17
variables (M3 and Industrial Production) have a significant effect. They conjectured that the disparity may be due the fact that the release time of US macroeconomic announcements are known exactly (day and time) but only inexactly
for Germany (day but not time).
Uncertainty regarding the hour of publication can contribute to a reduction in market liquidity and in trading around the time of the announcement,
which would also undercut the effect the information exerts in this window
of time, which ultimately leads to a more gradual adjustment of volatility following publication. However, this is not the case for the Mexican indicators
as the exact day and time of publication is made known beforehand and the
announcement for the same indicator has been made recurrently at the same
time, as can be seen in Tables 1 and 2.
Alternatively, it could be that the measure of information used is not fine
enough to detect the effect of Mexican macroeconomic variable surprises on
peso/dollar exchange rate volatility. This may be due, in part, to the considerably lesser number of survey respondents Bloomberg polls on the Mexican
economy as opposed to those it surveys in relation to United States indicators,
as Tables 1 and 2 indicate. That disparity could affect the representativity of
the surveys. However, this is a controversial point as the analysis presented
in section 2.2 suggests that the surveys on Mexican announcements contain
information and in all cases they are not biased.
Another possible explanation for why a significant effect was not found is
that, according to the predictions of the theory of rational expectations, relevant unexpected shocks in economic fundamentals ought to affect the pesodollar exchange rate. This suggests that when financial agents manage their
portfolios they assign more weight to the performance of the United States
economy relative to the Mexican economy. In this sense it is worth recalling
that most of the Mexican pesos trade takes place outside of Mexico.27
Lastly, note that the estimated coefficients for the crisis of December 2007
to June of 2009 and Mexico’s incorporation to the Continuous Linked Settlement significantly increased exchange rate volatility, however, in most cases
the increase is less than the estimated by the arrival of US unexpected macroeconomic fundamental information.
Before moving on to the next exercise, in which we measure the persistence of the effect on volatility of surprises, it is necessary to clarify the potential existence of at least two econometric problems that are cause for concern:
multicollinearity and endogeneity. However, we believe that neither of these
problems appear in this study.
Although we use variables that share the same day and hour of publication,
such as occurs with a pair of US announcements, there is no serious problem of
multicollinearity as the announcements measure different segments of both the
US and Mexican economies and the correlation between surprises from these
27 For instance, the 2010 Triennial Central Bank Survey of Foreign Exchange and Derivatives
Market Activity reported by the Bank of International Settlements posits that 67% of the Mexican
peso trade was made outside of Mexico.
18
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
variables is close to zero.28 Neither does there appear to be a problem of endogeneity given that the announcements published in period t measure various
aspects of the economy that occurred in t 1, while return volatility occurs in
t. On the other hand, it is possible that volatility in t 1 may affect some aspect
of the economy in t. For example, exchange rate return volatility in t 1 could
affect the trade balance in t as the exchange rate appreciates or depreciates
with their possible effect on imports and/or exports. These changes would be
reflected in the publication of the corresponding announcements. Nevertheless, agents will take into consideration this factor at the moment they report
between the period t 1 and t their expectations regarding the variable in
question and considering that this study contemplates surprises and not announcements, this potential source of endogeneity is discarded.
4.2
P ERSISTENCE OF V OLATILITY
In the previous subsection, we found evidence in favor of a contemporaneous effect on peso/dollar exchange rate volatility from unexpected information from a majority of the US indicators included in this study. From there,
a natural next step is to analyze the persistence of that effect in volatility. To
measure the persistence of volatility in response to the arrival of unexpected
information we employ the same definition of variables in subsection 4.1 and
we estimate the following regression:
Vt,n = ↵0 + ↵1 ŝn +
2
X
i=1
i i
+
XX
k
i
k
k,i |'t,n |
+ "t,n
(4.3)
where k,i now represents the effect of a one standard deviation surprise from
the indicator k on volatility in i (i=1,...I) periods going forward. Once again,
just as in equation (8) we use HAC standard errors. After experimenting with
different values of I, we arrived at the conclusion that I=12 is sufficient to measure the persistence in volatility. We experimented with negative values of
I to consider the possibility that the surveys published by Bloomberg failed
to capture all the available information prior to the announcement, however,
this proved to be unnecessary. This conclusion is in line with the findings of
Balduzzi et al. (2001) that MMS surveys capture all available information immediately prior to the announcement.
In theory, volatility can increase before the realization of the announcement.
This can happen if the arrival of the information helps to clear up certain uncertainties and/or disagreements among market participants. This would stoke
volatility before the announcement just as Pasquariello (2007) suggests. Our
results are more in line with the analysis of Ross (1989), which suggests that
in an arbitrage free economy, price volatility is related to the arrival of information in efficient markets, so it is expected that the effect on volatility will be
28 The indicators that are published at the same time on the same day are Changes in Nonfarm
Payrolls and the Unemployment Rate; Personal Income and Personal Consumption; Industrial
Production and Capacity Utilization, which have a correlation of -0.04, 0.05 and 0.25, respectively.
R OBERTO G ÓMEZ C RAM
19
greater following the news announcement.
Figure 3, shows the results of the regression and the confidence interval at
95% for each indicator considered. The figure shows that the rise in volatility
occurs not only during the exact moment of the realization of the news but
also extends through various minutes thereafter. This means that volatility
adjusts gradually rather than abruptly, although the most pronounced effect is
contemporaneous. On average, the effect is statistically significant, indicators
do not have an impact on volatility before the release of the announcement
and conditional on being significant, the effect lasts on average 15 minutes
following the publication. It is worth noting the persistence of the effect on
volatility of a standard deviation surprise from Change in Nonfarm Payrolls;
exchange rate return volatility provoked by this variable endures as long as 50
minutes following its release.
Lastly, Table 5 shows both the persistence of increased volatility in response
to the surprise as well as the accumulated effect for each considered variable.
It is worth emphasizing that the accumulated effect of the Change in Nonfarm
Payrolls and in the Unemployment Rate, whose effect is more than 0.1%
5.
C ONCLUSION
This paper analyzes the effect of unexpected information about macroeconomic
fundamentals on the volatility of the 5-minute returns of the peso/dollar exchange rate. To that end we employed peso/dollar exchange rate quotations
generated in the interbank market. The database used for the expectations of
agents regarding published macroeconomic news made it possible to capture
the surprise component of an announcement in order to quantify its effect on
the exchange market. Due to the high-frequency of the data, it is necessary to
control for the seasonal component of peso/dollar exchange rate return volatility.
We did not find evidence to support the idea that peso/dollar exchange
rate movements are linked in the short term to Mexican macroeconomic fundamentals though we find evidence in favor of a close linkage with the US
macroeconomic variables. Most of the US macroeconomic news considered in
the study have an immediate effect on the peso/dollar exchange rate volatility
and this impact lasts for 15 minutes on average. This finding is in line with the
hypothesis of market efficiency in which actual asset prices incorporate past as
well as breaking news so that the exchange rate ought to rapidly adjust to a
new value with the arrival of relevant new information.
In addition, we indentify the most important announcements in terms of
their potential effect on the exchange rate. In descending order of importance,
the most significant impact comes from surprises in Changes in Nonfarm Payrolls, in the Unemployment Rate, Consumer Price Index, Construction Spending, the ISM Manufacturing and in Advance Retail Sales.
20
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
R EFERENCES
[1] Andersen, T., & Bollerslev, T., (1997) “Intraday Periodicity and Volatility Persistence in Financial Markets,” Journal of Empirical Finance 4, 115-158.
[2] Andersen, T., & Bollerslev, T., (1998) “Deustche mark-dollar Volatility: Intraday Activity Patterns, Macroeconomic Announcements, and Longer-Run Dependencies,” Journal of Finance
1, 219-265.
[3] Andersen, T., Bollerslev, T., Diebold, F.X. & Vega, C. (2003), “Micro Effects of Macro Announcements: Real-Time Price Discovery in Foreign Exchange,” American Economic Review,
93, 38-62.
[4] Balduzzi, P., Elton, E.J. & Green, T.C. (2001), “Economic News and Bond Prices: Evidence
From the US Treasury Market,” Journal of Financial and Quantitative Analysis, 36, 523-543.
[5] Bollerslev, T., Chou, R.Y. & Kroner, K.F. (1992), “ARCH Modeling in Finance: A Selective
Review of the Theory and Empirical Evidence,” Journal of Econometrics, 52, 5-59.
[6] Bollerslev, T. & Domowitz, I. (1993), “Trading Patterns and Prices in the Interbank Foreign
Exchange Market,” Journal of Finance, 48, 1421-1443.
[7] Cermeño, R., & Solís, P. (2011) “Impacto de Sorpresas Macroeconómicas de México y Estados
Unidos sobre el Mercado Accionario Mexicano, ” EconomÌa Mexicana Nueva . . . poca, XXI,
35-67.
[8] Dacorogna, M.M., M¸ller, U.A., Naglerm R.J., Olsen, R.B. & Pictet, O.V. (1993), “A Geographical Model for the Daily and Weekly Seasonal Volatility in the Foreign Exchange Market,”
Journal of International Money and Finance, 12, 413-438.
[9] Danielsson, J. & Payne, R. (2002), “Real Trading Patterns and Prices in Spot Foreign Exchange
Markets,” Journal of International Money and Finance, 21, 203-222.
[10] Dominguez, K. (2006) “When do Central Bank Interventions Influence Intra-Daily and
Longer-Term Exchange Rate Movements?” Journal of International Money and Finance 25,
1051-1071.
[11] Ederington L. & Lee, J. (1993), “How Markets Process Information: News Releases and
Volatility,” Journal of Finance, 48, 1161-1191.
[12] Evans, M., & Lyons, T. (2005), “Do Currency Markets Absorb News Quickly?” Journal of
International Money and Finance 24, 197-217.
[13] Gallant, A. (1981), “On the Bias in Flexible Functional Forms and an Essentially Unbiased
Form: The Fourier Flexible Form”, Journal of Econometrics, 15, 211-245.
[14] Hayashi, R. (2000), “Econometrics", Princeton University Press, Princeton, NJ.
[15] James, J. & Kasikov, K. (2008), “Impact of Economic Data Surprises on Exchange Rates in the
Inter-Dealer Market,” Quantitative Finance, 8, 5-15.
[16] Lobato, I., Nankervis J.C., Savin N. E. (2001), "Testing for autocorrelation using a modified
Box-Pierce Q test,” International Economic Review 42, 187-205.
[17] Malkiel, B., (1992), “Efficient Market Hypothesis” in Newman, P., M. Milgate and Eatwell
(eds.), New Palgrave Dictionary of Money and Finance, Macmillan, London.
[18] Newey, W., & West, K. (1987), "Hypothesis Testing with Efficient Method of Moments Estimation,” International Economic Review, 28, 777-787.
[19] Pasquariello, P. (2007) “Imperfect Competition, Information Heterogeneity, and Financial
Contagion.” Review of Financial Studies, 20, 391-426.
[20] Ross, S. (1989), “Information and Volatility: The No-Arbitrage Martingale Approach to Timing and Resolution Irrelevancy,” The Journal of Finance, 44, 1-17.
ISM
BC
BLS
FRB
BEA
ISM
ISM
ISM
FRB
FRB
BLS
BC
NAR
BEA
NAR
BEA
BC
BC
BC
BC
BC
CBO
ISM Manufacturing
Advance Retail Sales
Unemployment Rate
Industrial Production
Personal Income
Empire Manufacturing
Chicago Purchasing Manager
ISM Non-Manf. Composite
Capacity Utilization
Consumer Credit
Nonfarm Productivity
New Home Sales
Existing Home Sales
Personal Spending
Pending Home Sales MoM
Personal Consumption
Durable Goods Orders
Factory Orders
Wholesale Inventories
Construction Spending MoM
Business Inventories
Monthly Budget Statement
BLS
BLS
BLS
ISM
Consumer Price Index (MoM)
Producer Price Index (MoM)
Employment Cost Index
ISM Prices Paid
Prices
BEA/BC
BEA/BC
Trade Balance
Current Account Balance
Foreign Trade
Government
Investment
Consumption
ETA
BLS
BEA
Source1
Initial Jobless Claims
Change in Nonfarm Payrolls
GDP QoQ (Annualized)
Real Activity
Announcement
14/01/2005 - 14/11/2012
28/01/2005 - 31/10/2012
01/03/2005 - 01/11/2012
19/01/2005 - 15/11/2012
12/01/2005 - 08/11/2012
16/03/2005 - 18/09/2012
12/01/2005 - 13/11/2012
27/01/2005 - 27/11/2012
04/01/2005 - 04/10/2012
10/01/2005 - 09/11/2012
01/03/2005 - 01/11/2012
14/01/2005 - 14/11/2012
31/01/2005 - 28/11/2012
23/03/2005 - 19/10/2012
31/01/2005 - 30/11/2012
01/06/2005 - 19/11/2012
30/03/2005 -29/11/2012
31/01/2005 - 30/11/2012
05/02/2008 - 05/11/2012
14/01/2005 - 16/11/2012
07/01/2005 - 07/11/2012
03/02/2005 - 01/11/2012
01/03/2005 - 01/11/2012
13/01/2005 - 14/11/2012
07/01/2005 - 05/10/2012
14/01/2005 - 16/11/2012
31/01/2005 - 30/11/2012
18/01/2005 - 15/11/2012
06/01/2005 - 29/11/2012
07/01/2005 - 05/10/2012
28/01/2005 - 29/11/2012
Date2
United States
TABLE 1: N EWS A NNOUNCEMENTS
Monthly
Monthly
Monthly
Monthly
Monthly
Quarterly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Monthly
Weekly
Monthly
Monthly
Freq.3
7:30am
7:30am
9:00am
7:30am
7:30am
7:30am
1:00pm
7:30am
9:00am
9:00am
9:00am
9:00am
92
32
83
91
92
27
90
93
90
95
85
90
94
90
90
90
92
97
58
88
92
62
9:00am / 8:45am7
9:00am
8:15am
2:00pm
7:30am
9:00am
9:00am
7:30am
9:00am
7:30am
92
91
88
88
90
88
404
88
94
Obs.5
9:00am
7:30am
7:30am
8:15am
7:30am
7:30am
7:30am
7:30am
7:30am
Hour4
72.7
55.2
17.1
76.7
71.5
43.0
30.7
72.7
62.6
33.4
48.3
50.6
69.3
68.3
71.1
29.8
13.8
54.9
70.5
65.3
33.8
63.4
73.9
76.4
77.4
75.4
67.1
48.3
41.3
80.5
76.4
Nr.6
R OBERTO G ÓMEZ C RAM
21
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
22
INEGI
INEGI
INEGI
INEGI
INEGI
INEGI
INEGI
FRB
CB
UMICH
BC
CB
Source1
04/02/2005-29/05/2009
14/01/2005-07/11/2012
11/01/2005 -12/11/2012
26/01/2005-21/11/2012
20/10/2005-23/11/2012
10/01/2005-16/11/2012
24/05/2005-23/11/2012
03/09/2009-01/11/2012
02/02/2005-24/10/2012
22/02/2005-27/11/2012
21/11/2005 -02/11/2012
19/01/2005-20/11/2012
20/01/2005-21/11/2012
Date2
Bi-Weekly
Quarterly
Quarterly
Monthly
Monthly
Monthly
Monthly
Monthly
Quarterly
Monthly
2:30pm/9:00am/8:00am15
2:30pm/9:00am16
2:30pm
2:30pm/9:00am/8:00am14
2:30pm/9:00am/8:00am9
2:30pm/9:00am/8:00am10
2:30pm/9:00am/8:00am11
2:30pm/9:00am/8:00am12
2:30pm/9:00am/8:00am13
12:00pm
6-Week
1:15pm
Mexico
Monthly
Bi-Weekly
Monthly
Monthly
2:30pm/9:00am/8:00am17
2:30pm/9:00am/8:00am18
2:30pm/9:00am/8:00am19
2:30pm/9:00am/8:00am20
96
94
104
92
79
138
31
32
95
95
89
87
96
29
35
59
94
184
95
93
Obs.5
7.9
13.5
15.3
16.0
13.5
10.8
12.3
4.7
12.5
15.7
14.2
14.1
14.5
6.4
4.9
86.2
67.9
60.9
17.5
54.6
Nr.6
TABLE 2: N EWS A NNOUNCEMENTS (C ONT.)
SHCP
07/01/2005 -26/11/2012
24/05/2005-23/11/2012
Monthly
Monthly
Monthly
Monthly
2:30pm/9:00am/8:00am21
Hour4
INEGI
INEGI
07/01/2005-08/11/2012
14/01/2005-22/11/2012
09/03/2005-08/11/2012
22/03/2007-22/11/2012
Monthly
Freq.3
Estados Unidos
INEGI
INEGI
INEGI
INEGI
06/01/2005-05/11/2012
Announcement
Forward-Looking
Consumer Confidence
U. of Michigan Confidence
Housing Starts
Leading Indicators
Monetary
FOMC Rate Decision
INEGI
9:00am
8:45am/8:55am/9:00am8
7:30am
9:00am
Real Activity
Industrial Production (YoY)
Retail Sales (INEGI)
Unemployment Rate
Global Economic Indicator IGAE
GDP Current $ YoY
IMEF Non Manufacturing Index
Investment
Gross Fixed Investment
Government
Public Balance (MXP)
Foreign Trade
Trade Balance
Current Account Balance
Prices
Consumer Prices (YoY)
Bi-Weekly CPI
Consumer Prices Core (MoM)
Bi-Weekly Core CPI
Forward-Looking
Consumer Confidence
Notes: 1. Bureau of Economic Analysis (BEA), Bureau of the Census (BC), Bureau of Labor Statistics (BLS), Federal Reserve
Board (FRB), Conference Board (CB), Institute for Supply Management (ISM), National Association of Realtors (NAR),
Congressional Budget Office (CBO), University of Michigan (UMICH), Instituto Nacional de EstadÌstica y GeografÌa (INEGI),
SecretarÌa de Hacienda y Crédito Público. 2. Date denotes the range of publication dates 3. Freq. refers to the frequency with
which is released 4. Hour stands for the time of the day in which it is published (Mexico City time). 5. Obs. denotes the total
number of observations 6. Nr. is the average number of analysts surveyed. 7. In 31/01/2007 the announcement time moved to
8:45am 8. In 13/10/2006 the announcement time moved to 8:55am and in 15/1/2010 was released regulary at 9:00am . 9. In
12/01/2010 was released at 9:00am and in 12/11/2012 at 8:00am. 10. In 25/01/2010 was released at 9:00am and in 26/01/2011
at 8:00am. 11. In 22/01/2010 was released at 9:00am and in 21/01/2011 at 8:00am. 12. In 14/01/2010 was released at 9:00am and
in 10/01/2011 at 8:00am. 13. In 24/02/2010 was released regulary at 9:00am and in 25/02/2011 at 8:00am. 14. In 12/01/2010 was
released regulary at 9:00am and in 11/01/2011 at 8:00am. 15. In 22/01/2010 was released regulary at 9:00am and in 25/01/2011 at
8:00am. 16. In 24/08/2007 was released regulary at 9:00am. 17. In 09/07/2007 was released regulary at 9:00am and in 9/8/2011 at
8:00am. 18. In 24/07/2007 was released regulary at 9:00am and in 22/07/2012 at 8:00am.19 In 09/07/2007 was released regulary at
9:00am and in 09/08/2011 at 8:00am. 20. In 24/07/2007 was released regulary at 9:00am and in 22/07/2011 at 8:00am. 21. In was
released regulary at 9:00am and in 04/08/2010 at 8:00am.
0.979**
Monthly Budget Statement
-0.0281
Consumer Price Index (MoM)
(0.0270)
(1.082)
(0.482)
(0.426)
(0.0744)
(0.357)
(1.015)
(0.0551)
(0.0949)
(0.0457)
(0.0528)
(0.0216)
(0.0340)
(0.0149)
(0.957)
(6.878)
(0.00633)
(0.0432)
(0.517)
(0.225)
(0.0150)
(0.205)
(0.256)
(5.532)
(0.0570)
(0.0175)
(8.155)
(0.0225)
Std. Error
Monetary
Consumer Confidence
Forward-Looking
Consumer Prices (YoY)
Bi-Weekly CPI
Consumer Prices Core (MoM)
Bi-Weekly Core CPI
Prices
Trade Balance
Current Account Balance
Foreign Trade
Public Balance (MXP)
Government
Gross Fixed Investment
-0.0281
0.0232
0.0500
0.00111
0.0600
-0.0273
3.516
-0.0121
-4
-0.00644
-0.0638
-0.150
-0.00110
-0.152
-0.219
Industrial Production (YoY)
Retail Sales (INEGI)
Unemployment Rate
Global Economic Indicator IGAE
GDP Current $ YoY
IMEF Non Manufacturing Index
Investment
Coef. ( ˆ )
Mexico
Announcement
Real Activity
FOMC Rate Decision
-0.00989
-0.0174
-0.0693*
-0.0151
0.268***
Consumer Confidence
U. of Michigan Confidence
Housing Starts
Leading Indicators
Forward-Looking
-0.0207
0.881
-0.171
Coef. ( ˆ )
Producer Price Index (MoM)
Employment Cost Index
ISM Prices Paid
Announcement
Prices (Cont.)
(0.0270)
(0.0216)
(0.0340)
(0.0149)
(0.0744)
(0.0175)
(8.155)
(0.0570)
(5.532)
(0.00633)
(0.0432)
(0.517)
(0.0150)
(0.205)
(0.256)
Std. Error
(0.0223)
(0.0379)
(0.0392)
(0.716)
(0.0867)
(0.274)
(1.384)
(0.655)
Std. Error
Robust standard errors in parenthesis, *** p<0.01, ** p<0.05, * p<0.1
In order to assess if the Bloomberg forecasts are systematically biased, the following regression is estimated:
ek,t = k + uk,t , where ek,t is the error of the median forecast for announcement k and it is measured by the
k
difference between the announcement value, Akt,n , and the market expected value, Et,n
, for each indicator k published
in the five minute interval n on day t. The period under study extends from January 2005 to November 2012.
Prices
0.646
0.416
Trade Balance
Current Account Balance
Foreign Trade
Government
0.0600
0.0913
0.109
0.0445
0.0553
Durable Goods Orders
Factory Orders
Wholesale Inventories
Construction Spending MoM
Business Inventories
Investment
New Home Sales
Existing Home Sales
Personal Spending
Pending Home Sales MoM
Personal Consumption
-0.0977**
0.0630
0.0232
0.0500
0.00111
1.260
-14.05**
-0.00644
-0.0638
-0.150
0.0561
-0.00110
-0.152
-0.219
-4
-0.0121
-0.0273
3.516
-0.0148
Initial Jobless Claims
Change in Nonfarm Payrolls
GDP QoQ (Annualized)
ISM Manufacturing
Advance Retail Sales
Unemployment Rate
Industrial Production
Personal Income
Empire Manufacturing
Chicago Purchasing Manager
ISM Non-Manf. Composite
Capacity Utilization
Consumer Credit
Nonfarm Productivity
Consumption
Coef. ( ˆ )
United States
Announcement
Real Activity
TABLE 3: B IAS T EST IN M ACROECONOMIC E XPECTATIONS
R OBERTO G ÓMEZ C RAM
23
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
24
Std. Error
(0.00171)
(0.01015)
(0.00313)
(0.00573)
(0.00580)
(0.01614)
(0.00435)
(0.00379)
(0.00208)
(0.00207)
(0.00250)
(0.00419)
(0.00119)
(0.00313)
(0.00224)
(0.00419)
(0.00239)
(0.00630)
(0.00112)
(0.00340)
(0.00294)
(0.00202)
(0.00801)
(0.00274)
(0.00382)
(0.00280)
(0.00778)
(0.01208)
(0.00257)
(0.01059)
(0.00320)
-0.00226
0.00281
0.00161
0.012560
0.00225
-0.00126
-0.00145
-0.00112
(0.00003)
(0.00338)
(0.00155)
(0.00506)
(0.00187)
(0.01195)
(0.00208)
(0.00093)
(0.00152)
(0.00140)
Std. Error
-0.00004
-0.00426
(0.00635)
(0.00058)
(0.00485)
(0.00071)
Coef.
0.01195*
0.00048
0.00295
-0.00017
(0.00063)
Coef.
Std. Error
(0.00237)
(0.00173)
(0.00189)
(0.00607)
-0.00099
(0.00046)
(0.00018)
(.06148)
0.01460***
0.00456***
0.00698***
0.01455**
Announcement
Forward-Looking
Consumer Confidence
U. of Michigan Confidence
Housing Starts
Leading Indicators
Monetary
FOMC Rate Decision
Mexico
Announcement
Real Activity
Industrial Production (YoY)
Retail Sales (INEGI)
Unemployment Rate
Global Economic Indicator IGAE
GDP Current $ YoY
IMEF Non Manufacturing Index
Investment
Gross Fixed Investment
Government
Public Balance (MXP)
Foreign Trade
Trade Balance
Current Account Balance
Prices
Consumer Prices (YoY)
Bi-Weekly CPI
Consumer Prices Core (MoM)
Bi-Weekly Core CPI
Forward-Looking
Consumer Confidence
0.01345***
0.01840***
4.65254***
(0.00041)
(0.04536)
Crisis 2007.12-2009.06
CLS
Seasonal Component, ŝt,n
-0.01193***
390,231
0.03914
Constant
Observations
TABLE 4: C ONTEMPORANEOUS V OLATILITY R ESPONSE TO US AND M EXICAN A NNOUNCEMENT S URPRISES
United States
Announcement
Coef.
Real Activity
Initial Jobless Claims
0.00854***
Change in Nonfarm Payrolls
0.07001***
GDP QoQ (Annualized)
0.01108***
ISM Manufacturing
0.02026***
Advance Retail Sales
0.01987***
Unemployment Rate
0.06378***
Industrial Production
0.00585
Personal Income
0.00474
Empire Manufacturing
0.00799***
Chicago Purchasing Manager
0.00592***
ISM Non-Manf. Composite
0.00421*
Capacity Utilization
0.00364
Consumer Credit
0.00122
Nonfarm Productivity
0.00355
Consumption
New Home Sales
0.00815***
Existing Home Sales
0.01356***
Personal Spending
0.00023
Pending Home Sales MoM
0.01064*
Personal Consumption
0.00246**
Investment
Durable Goods Orders
0.01294***
Factory Orders
0.00318
Wholesale Inventories
0.00302
Construction Spending MoM
0.02086***
Business Inventories
-0.00007
Government
Monthly Budget Statement
0.00072
Foreign Trade
Trade Balance
0.00585**
Current Account Balance
0.0067
Prices
Consumer Price Index (MoM)
0.03108***
Producer Price Index (MoM)
0.00986***
Employment Cost Index
0.01435
ISM Prices Paid
0.00930***
k
HAC standard errors in parenthesis, *** p<0.01, ** p<0.05, * p<0.1
In order to quantify the contemporaneous response of exchange rate volatility the following model was estimated:
P2
P
k
Vt,n = ↵0 + ↵1 ŝn + i=1
i i+
k |'t,n | + "t,n . Where Vt,n is the 5-minute exchange rate volatility, ŝn
k
is the volatility seasonal componentand 't,n
is the standardized surprise corresponding to announcement k (k=1, ..., 51)
and i with i = 1, 2 are dummy variables for 2007.12-2009.06 crisis as well as the period when Mexico joined the CLS.
0.00815***
0.01839***
0.01064*
0.00246**
5
10
5
5
i
0.01386***
0.18641***
0.02355***
0.03900***
0.02779***
0.16564***
0.01508***
0.00592***
0.00421*
-
Acum.2
10
50
15
15
10
45
10
5
5
-
k
Min.1
(0.00224)
(0.00550)
(0.00630)
(0.00112)
(0.00257)
(0.02311)
(0.00633)
(0.01006)
(0.00794)
(0.02806)
(0.00400)
(0.00207)
(0.00250)
-
Std.
Error
Investment
Durable Goods Orders
Factory Orders
Wholesale Inventories
Construction Spending MoM
Business Inventories
Government
Monthly Budget Statement
Foreign Trade
Trade Balance
Current Account Balance
Prices
Consumer Price Index (MoM)
Producer Price Index (MoM)
Employment Cost Index
ISM Prices Paid
Forward-Looking
Consumer Confidence
U. of Michigan Confidence
Housing Starts
Leading Indicators
Monetary
FOMC Rate Decision
Announcement
0.01294***
0.05420***
0.00585**
0.03108**
0.01459***
0.02730***
0.02429***
0.01361***
0.01204***
0.01455***
-
5
5
10
20
10
25
10
5
-
Acum.2
5
25
-
Min.1
-
(0.00488)
(0.00354)
(0.00370)
(0.00607)
(0.01208)
(0.00402)
(0.00796)
(0.00280)
-
-
(0.00340)
(0.01660)
-
Std.
Error
is the volatility seasonal componentand 'kt,n is the standardized surprise corresponding to announcement k (k=1, ..., 36)
and i with i = 1, 2 are dummy variables for 2007.12-2009.06 crisis as well as the period when Mexico joined the CLS.
HAC standard errors in parenthesis, *** p<0.01, ** p<0.05, * p<0.1
Notes: 1. Min shows the persistence in minutes of increased volatility in response to the surprise. 2. Depicts the accumulated effect
for each macroeconomic surpirse.
In order to quantify the persistence of exchange rate volatility to news the following model was estimated:
P
PP
k
Vt,n = ↵0 + ↵1 ŝn + 2i=1 i i +
k,i |'t,n | + "t,n ,where Vt,n is the five-minute exchange rate volatility, ŝn
Real Activity
Initial Jobless Claims
Change in Nonfarm Payrolls
GDP QoQ (Annualized)
ISM Manufacturing
Advance Retail Sales
Unemployment Rate
Industrial Production
Personal Income
Empire Manufacturing
Chicago Purchasing Manager
ISM Non-Manf. Composite
Capacity Utilization
Consumer Credit
Nonfarm Productivity
Consumo
Venta de Casas Nuevas
Venta de Casas Existentes
Gasto Personal
Ventas de Casas Pendientes
Consumo Personal
Announcement
TABLE 5: V OLATILITY P ERSISTANCE TO US A NNOUNCEMENT S URPRISES
R OBERTO G ÓMEZ C RAM
25
T HE E FFECT OF M ACROECONOMIC N EWS ON T HE FX M ARKET
26
5 Min.
5
10
10
Industrial Production
5 Min.
5
ISM Manufacturing
10
Initial Jobless Claims
Real Activity
0.005
0
−0.005
0
0.05
0
−0.05
0
0.05
0
5 Min.
5
10
10
Wholesale Inventories
5 Min.
5
Personal Consumption
−0.05
0
0.005
0
−0.005
0
0.02
0
5 Min.
5
10
10
10
10
10
10
10
0.02
0
−0.02
0
0.01
0
−0.01
0
0.05
0
−0.05
0
10
GDP QoQ (Annualized)
5
5 Min.
10
Unemployment Rate
5
5 Min.
10
Empire Manufacturing
5 Min.
5
10
Factory Orders
5
5 Min.
10
Business Inventories
5 Min.
5
5 Min.
5
10
Current Account Balance
−0.005
0
0
0.005
−0.1
0
0
0.1
−0.02
0
0
0.02
0
−0.005
0
0.005
0
−0.005
0
0.05
0
−0.05
0
0
−0.1
0
0.02
0
−0.02
0
0
0.02
−0.02
0
5 Min.
10
10
Consumer Credit
5
5 Min.
10
Existing Home Sales
5 Min.
5
5
5 Min.
10
10
ISM Prices Paid
5 Min.
5
10
Housing Starts
5 Min.
5
0.01
0
5
5 Min.
10
10
Nonfarm Productivity
5
5 Min.
10
Personal Spending
5 Min.
5
10
0.1
0
−0.1
0
10
Capacity Utilization
5 Min.
5
10
New Home Sales
5 Min.
5
5 Min.
5
10
10
Employment Cost Index
5
5 Min.
Pending Home Sales MoM
0
0
0.2
−0.2
0
5 Min.
5
10
10
FOMC Rate Decision
5 Min.
5
U. of Michigan Confidence
−0.005
0
0
0.005
−0.05
0
0
0.05
−0.02
0
0.02
0.04
−0.02
0
0
0.02
Consumption
ISM Non−Manf. Composite
−0.01
0
0.02
0
−0.02
0
0.02
0
−0.02
0
0
5
5 Min.
10
Consumer Confidence
5 Min.
5
10
Leading Indicators
5 Min.
5
Monetary
Producer Price Index (MoM)
0.02
−0.02
0
−0.05
0
0
0.05
−0.02
0
0
0.02
Forward−Looking
Consumer Price Index (MoM)
0.1
Prices
5
Chicago Purchasing Manager
0.005
F IGURE 3: V OLATILITY P ERSISTANCE TO US A NNOUNCEMENT S URPRISES
5
Durable Goods Orders
5 Min.
5
Personal Income
5 Min.
5
Advance Retail Sales
5 Min.
5
Change in Nonfarm Payrolls
0.1
0
−0.1
0
0.05
0
−0.05
0
0.02
0
−0.02
0
0.02
Investment
0
−0.02
0
5 Min.
5 Min.
5
Trade Balance
5 Min.
5
Construction Spending MoM
0.05
0
−0.05
0
−0.02
0
0
0.02
Foreign Trade
Monthly Budget Statement
−0.02
0
0.02
Government
0
5 Min.
5
P2
P P
k
Note: To quantify the persistence of exchange rate volatility to news the following model was estimated: Vt,n = ↵0 +↵1 ŝn + i=1
i i+
k
i k,i |'t,n |+
k is the standardized surprise corresponding to
"t,n , where Vt,n is the five-minute exchange rate volatility, ŝn is the volatility seasonal component and 't,n
announcement k. (k =1, ..., 36) and i with i = 1, 2 are dummy variables for 2007.12-2009.06 crisis as well as the period when Mexico joined the CLS. HAC
standard erros where used and the confidence interval is at the 95% level.
−0.02
0
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
%
27
E FECTO DE UNA P OLÍTICA M ONETARIA DE C OMPRA
DE A CTIVOS EN UNA E CONOMÍA E MERGENTE *
L UIS S IMON TAMBORREL**
En este trabajo se analiza el efecto de una política de compra de activos por parte del banco
central como respuesta a una crisis en una economía monetaria. Existen dos tipos de activos, uno
líquido y otro con restricciones de liquidez y la crisis que se estudia es tal que exacerba esta falta
de liquidez. Se analizan los efectos que podría tener una política de este estilo sobre una economía emergente bajo distintas reglas de intervención y se compara con la reacción que habría en
una economía avanzada en la que es más fácil canalizar los recursos a los agentes con capacidad
de invertir. Siguiendo el modelo base de Kiyotaki y Moore (2012) se concluye que este tipo de
políticas son potencialmente benéficas y menos costosas para las economías emergentes aunque
existen ciertos riesgos que se deben tomar en cuenta para su implementación. Así, se sugiere
que en México deben estudiarse ciertos aspectos de los mercados financieros con el objetivo de
detectar a tiempo choques de liquidez y reaccionar oportunamente aminorando los efectos adversos de dicho choque.
PALABRAS CLAVE : política monetaria, economías emergentes, DSGE, política monetaria no
convencional, liquidez
1.
I NTRODUCCIÓN
En este trabajo se pretende analizar el efecto que podría tener una política
monetaria no convencional en una economía emergente durante una crisis. El
tipo de política que se va a analizar es una de compra de activos con el fin de
proveer de liquidez a la economía una vez que ha habido una crisis de liquidez y el dinero no se puede canalizar hacia los empresarios con posibilidad de
invertir en acumulación de capital. El hecho de que la política monetaria sea
no convencional radica en el hecho de que los activos adquiridos por el banco
central no son solamente pasivos de corto plazo del gobierno federal como es
usual sino que se extiende a activos de mayor plazo, mayor riesgo, menor liquidez, etc. Además, implica un aumento de la hoja de balance del banco central.
En el presente trabajo, este tipo de políticas serán modeladas como compras de
capital en lugar de solamente movimientos en la base monetaria. Este análisis
está motivado por la crisis del 2008 y por la reacción que tuvieron las principales economías avanzadas una vez que sus tasas de interés llegaron a niveles
extraordinariamente bajos y tuvieron que buscar otras medidas para aliviar
la fuerte desaceleración económica. Un claro ejemplo de esto son las medidas
anunciadas en Estados Unidos por la Reserva Federal con sus tres programas
de Quantitative Easing (QE) de los cuales el primero inició en diciembre de
* Este trabajo resultó ganador del concurso de carteles de estudiantes de Economía del CEMLA,
2013.
** Economista de la Dirección General de Investigación Económica del Banco de México y estudiante de la Maestría en Teoría Económica del ITAM. Agradezco a Alejandro Hernández, Daniel
Sámano, Manuel Sánchez y de forma muy especial a Carlos Urrutia por sus comentarios que mejoraron y enriquecieron de forma importante el presente trabajo. Agradezco también los comentarios
de los jueces del concurso de carteles del CEMLA. Las opiniones expresadas en este artículo son
responsabilidad del autor y no necesariamente reflejan la postura del Banco de México. Cualquier
error u omisión es responsabilidad del autor. Email: luis.simon.t@gmail.com
28
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
2008 y el último en septiembre de 20121 . Además de Estados Unidos, otros bancos centrales de economías avanzadas han tomado este tipo de medidas como
los bancos de Inglaterra (Asset Purchase Facility, APF)2 , Japón (Asset Purchase
Program, APP, y actualmente Quantitative and Qualitative Easing, QQE)3 y la
Eurozona (Outright Monetary Transactions, OMT)4 .
Cada programa tiene ciertas características particulares así como objetivos
que pueden variar. Sin embargo, términos generales podemos decir que el fin
de estos programas de estímulo monetario era el de proveer de liquidez a la
economía una vez que ésta había sufrido una crisis de confianza a costa de
un importante aumento del tamaño de la hoja de balance del banco central.
Además, al aumentar dramáticamente la demanda por ciertos activos de renta
fija, empujan hacia abajo las tasas de interés, especialmente las de largo plazo.
Durante la presente crisis, estos programas de estímulo monetario han jugado
un papel central para tratar de regresar la confianza a los mercados financieros y para aminorar, en el corto plazo, los efectos de la fuerte desaceleración
económica. En Estados Unidos, durante el QE1, se anunciaron compras hasta
por 1.25 billones de dólares en activos respaldados por hipotecas (MortgageBacked Securities, MBS) así como compras hasta por 100 mil millones de dólares de las agencias de financiamiento inmobiliario (Fannie Mae y Freddie Mac)
y hasta 300 mil millones de dólares de bonos del Tesoro de largo plazo con
el fin de disminuir la parte larga de la curva de rendimientos una vez que la
parte corta estaba prácticamente en cero. Las Gráficas (1) y (2) muestran el tamaño de esta medida en relación a la hoja de balance del banco y a la tasa de
acumulación de activos que se había venido observando. Queda claro que fue
una medida extraordinaria pero esto obedece a que se trató de una crisis de
dimensiones extraordinarias, como podemos ver en la Gráfica (2), que muestra
el cambio en la tasa de crecimiento del PIB de Estados Unidos.
1 El QE1 se anunció mediante un comunicado de prensa el 25 de noviembre de 2008 y posteriormente se presentó formalmente por el Comité de Mercado Abierto (FOMC) junto con la decisión
de política monetaria del 16 de diciembre de 2008; entró en vigor en enero de 2009. El QE3 se
anunció en el comunicado de decisión de política monetaria del 13 de septiembre de 2012.
2 El APF fue anunciado en enero de 2009 con el fin de proveer de liquidez a la economía y como
una herramienta de política monetaria más en manos del banco central. Empezó a operar en marzo
de 2009 anunciando compras por 75 mil millones de libras junto con el comunicado de la decisión
de tasa de interés y posteriormente aumentó en varias ocasiones hasta llegar a 375 mil millones de
libras.
3 El APP se anunció el 05 de octubre de 2010 y el QQE el 04 de abril de 2013. El primer programa
se anunció por 35 billones de yenes pero fue aumentando hasta que en enero de 2013 se anunció
que no tendría un fin predeterminado sino que se extendería mientras fuera necesario. El QQE
llegó a reemplazar este programa y fue mucho más agresivo desde el comienzo pues anunció
compras por alrededor de 50 billones de yenes anuales además de que cambió el instrumento
objetivo del Banco de Japón a los agregados monetarios en lugar de la tasa de interés.
4 El OMT fue anunciado por el Banco Central Europeo el 02 de agosto de 2012 en la conferencia
de prensa posterior a la decisión de política monetaria de ese día. Posteriormente, se publicaron
los detalles el 06 de septiembre de 2012. Este programa es un poco distinto a los otros que se han
mencionado ya que, aunque el mecanismo de compra de activos es muy similar, se anunció que las
compras iban a ser esterilizadas por lo que la liquidez que se inyectara se iba a retirar del mercado.
Su objetivo principal es reducir las primas de riesgo de los países de los cuales compre bonos y con
esto reducir los diferenciales de tasas de interés de deuda soberana ante el resto de la eurozona.
L UIS S IMON TAMBORREL
29
F IGURA 1: H OJA DE B ALANCE DE LA R ESERVA F EDERAL
( A ) N IVELES (M ILLONES DE D ÓLARES )
( B ) TASA DE C RECIMIENTO A NUAL
Fuente: Reserva Federal.
F IGURA 2: TASA DE C RECIMIENTO DEL PIB
Fuente: Haver Analytics.
DE
EUA
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
30
1.1
I MPORTANCIA DE UNA P OLÍTICA DE C OMPRA DE A CTIVOS EN E CONOMÍAS
E MERGENTES
A través de este trabajo se pretende analizar cuál sería el efecto de una política monetaria similar en una economía emergente. Antes de esto, es necesario
aclarar por qué podría ser necesaria esta política o bajo qué circunstancias podría una economía emergente querer recurrir a esto. La razón más obvia sería
decir que una economía se encuentra en un caso similar al de las economías
avanzadas en el que sus tasas de interés ya son muy bajas pero su economía
requiere de mayor estímulo. Aunque sea un caso que a primera vista parezca
poco común, tenemos ejemplos como el de Chile cuando en julio de 2009 llevó
su tasa a 0.50 por ciento y el banco reconoció que, aunque la tasa de interés
se encontraba en niveles mínimos, era necesario un mayor estímulo monetario por lo que tomó medidas adicionales5 . Otro ejemplo de esta situación es la
que está ocurriendo actualmente en la República Checa. Este país ha llevado su
tasa de interés a cero (oficialmente es 0.05 %) además de que ha venido mencionando que podría empezar a intervenir en el mercado cambiario con el fin de
depreciar su moneda6 . Actualmente la economía checa está estancada además
de que tiene una inflación baja y controlada por lo que podría ser deseable un
mayor estímulo monetario dadas las malas perspectivas de crecimiento hacia
delante. Otro caso que podría ameritar una política de compra de activos sería
si la economía tuviera problemas de liquidez pero también tuviera problemas
de alta inflación. En este caso, proveer liquidez mediante el canal tradicional
de política monetaria podría no ser conveniente pues aumentaría las presiones inflacionarias, mientras que una política no convencional podría ayudar a
aliviar los problemas de liquidez en algunos mercados específicos sin generar
presiones inflacionarias adicionales. Este es el caso de India en 2012 en el que
su M37 crecía de manera menor a lo proyectado y tanto la inversión como el
crédito mostraban debilidad. Todo esto se dio en un entorno de inflación superior al siete por ciento8 . Fue este panorama el que llevó al banco de India a
mantener sin cambio su tasa de política durante los últimos tres trimestres del
año aunque sí hizo ajustes en sus requerimientos de reservas9 . En general, podemos pensar que una política no convencional de compra de activos podría
ser deseable cuando una economía tiene choques de liquidez, por ejemplo, en
5 Entre ellas una facilidad de liquidez de corto plazo para los bancos. El comunicado es el que
corresponde a la decisión del 9 de julio de 2009.
6 El banco central anunció el 1 de noviembre de 2012 el recorte en la tasa que la llevó a 0.05 %
y fue en esta misma reunión que el gobernador anunció en la conferencia de prensa que podrían
venir intervenciones del mercado cambiario.
7 El Banco de México define M3 a partir de M2 y M1 como: La definición actual del agregado monetario estrecho (M1) considera a los billetes y monedas en poder del público, así como a las cuentas de cheques
en monedas nacional y extranjera... El agregado monetario M2 incluye a M1 y a los instrumentos bancarios
a plazo de hasta un año. Por su parte, el agregado monetario M3 incluye, en adición a M2, a los instrumentos
no bancarios de plazo menor a un año (principalmente valores gubernamentales).
8 Véase, por ejemplo, el comunicado del 30 de octubre de 2012 del banco de India.
9 El único recorte de tasa del banco de India fue de medio punto porcentual en abril de 2012 para
llevarla a 8.0 %. Por otro lado, los requerimientos de reservas iniciaron el año en 6.0 % y terminaron
en 4.25 %.
L UIS S IMON TAMBORREL
31
escenarios de aversión al riesgo o crisis de confianza y que además la economía tiene alta inflación o un tipo de cambio depreciado por lo que podrían no
querer recortar la tasa de referencia. Otra opción podría ser que existiera un sistema financiero poco desarrollado, por lo que ante choques adversos sería más
difícil reubicar los activos hacia otros sectores de la economía y en ese caso el
banco central podría ayudar a aliviar esa falta de liquidez. Estos ejemplos y situaciones muestran la importancia de estudiar y entender políticas no convencionales tomando en cuenta las particularidades de las economías emergentes
y no sólo dentro del marco de las avanzadas como se ha hecho generalmente.
En México ya han habido políticas similares de compra de activos como por
ejemplo durante la crisis del 2008 con la compra de valores del Instituto de
Protección al Ahorro Bancario (IPAB). De manera conjunta, el Banco de México y la Secretaría de Hacienda y Crédito Público (SHCP) anunciaron una serie
de medidas destinadas a preservar la estabilidad financiera del país durante la
turbulencia internacional10 . El propósito de esta medida fue el de proveer de
liquidez a las sociedades de inversión ante el choque externo que sufrió nuestro país. Existe una diferencia importante entre esta medida y las que se van a
analizar en el presente trabajo y es el aumento en la hoja de balance del banco
central a la hora de implementar la compra de activos; en el caso de México,
esta medida trajo un cambio en la composición de la hoja de balance más no en
el tamaño11 . Dejando esto de lado, la finalidad es la misma: el banco absorbe
un activo con poca liquidez y regresa a la economía un activo más líquido con
el fin de aminorar el efecto del choque de liquidez ocasionado, en este caso, por
un escenario de aversión al riesgo y de dificultad para obtener financiamiento
por parte de las instituciones financieras locales. La Gráfica (3) muestra el tamaño del programa como porcentaje de los activos totales en poder del Banco
de México. El resultado de este choque lo podemos ver reflejado en el saldo
neto de la cuenta financiera y en el rubro de la misma que corresponde a la inversión en portafolios. La Gráfica (4) muestra que ambas variables tuvieron un
importante déficit en el primer trimestre de 2009 reflejando la salida de capital
extranjero en este escenario de aversión al riesgo y fue esta salida de capitales
la que ocasionó la menor liquidez y en consecuencia la mayor dificultad para
obtener financiamiento.
Se ha mencionado porque pudieran ser deseables este tipo de medidas, pero también conllevan riesgos. Entre éstos podemos destacar la pérdida de credibilidad del banco central, pues este tipo de acciones podrían ser interpretadas como un abandono al compromiso de estabilidad de precios, lo que podría
desanclar las expectativas de inflación. Así, debemos mencionar que la credi10 La SHCP publicó un comunicado el 27 de octubre de 2008 en el que anunciaron las medidas
que se iban a implementar para contrarrestar los efectos de la crisis. Entre ellas destaca la reestructuración de las subastas de deuda gubernamental favoreciendo la emisión de títulos de corto plazo,
subastas de swaps de tasas de interés y un programa de endeudamiento con organismos financieros internacionales como el Banco Mundial y el Banco Interamericano de Desarrollo, además de la
mencionada compra de valores del IPAB.
11 El Informe Anual de 2008 del Banco de México menciona que este programa vino acompalado de una disminución del crédito a intermediarios financieros lo que ocasionó que no hubiera
cambios en el tamaño de la hoja de balance del banco central como consecuencia de este programa.
32
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
F IGURA 3: M EDIDAS ADOPTADAS POR EL B ANCO DE M ÉXICO EN LA C RISIS DE 2008
Valores del IPAB como Porcentaje de los Activos Totales del Banco de México
Fuente: Cálculos propios con datos del Banco de México.
F IGURA 4: C UENTA F INANCIERA E I NVERSIÓN EN P ORTAFOLIOS
Cuenta Financiera e Inversión en Portafolios como Porcentaje del PIB Valores
del IPAB como Porcentaje de los Activos Totales del Banco de México
Fuente: Cálculos propios con datos del Banco de México.
L UIS S IMON TAMBORREL
33
bilidad del banco central es indispensable para que estas políticas puedan ser
exitosas. Además, se han cuestionado las implicaciones de un aumento de gran
magnitud en la hoja de balance del banco central sobre la estabilidad de precios y cambiaria por lo que otra vez la credibilidad y la comunicación efectiva
de las intenciones son importantes. Otro riesgo que vale la pena mencionar es
que estas políticas podrían usarse para financiar el endeudamiento e incentivar una política fiscal irresponsable por lo que la autonomía del banco central
también resulta una condición fundamental para este tipo de programas.
1.2
U NA E CONOMÍA E MERGENTE T IENDE A S ER M ENOS L ÍQUIDA QUE UNA
E CONOMÍA AVANZADA
La idea de que una economía emergente es menos líquida que una economía avanzada será un supuesto clave en el presente trabajo. Como veremos, es
difícil medir la liquidez de una economía y cuantificar qué proporción de sus
activos son líquidos con respecto al total. La liquidez se refiere a qué tan fácil
es convertir un activo en efectivo y en nuestro modelo la liquidez estará caracterizada por cuánto capital podemos vender en el mercado en un momento
dado. Un primer acercamiento a la liquidez de un activo en particular puede
ser el volumen operado, pero, como menciona Panigirtzoglou (2013), ésta es
sólo una pieza de un rompecabezas más complejo. Existen otros aspectos del
mercado que nos dan información sobre la liquidez como la diferencia entre
los bids y los asks o el efecto sobre los precios que puede tener un solo intercambio. Otra manera de ver la liquidez es viendo cuánto tiene que bajar el precio
que esté dispuesto a aceptar alguien que quiera ejecutar una orden grande y
qué tan fácil lo puede hacer. Todas estas medidas nos muestran la dificultad de
dar una sola medida de liquidez para un activo en particular, la tarea se vuelve
mucho más compleja al tratar de cuantificarla para la economía en su conjunto. No trataremos de cuantificar la liquidez de las economías sino simplemente
mostrar el hecho estilizado que, en general, las economías emergentes son menos líquidas que las avanzadas, destacando entre éstas el caso de México. Esto
lo veremos a través de algunos indicadores que pudiéramos pensar que son
representativos de toda la economía. La Gráfica (5) muestra indicadores del tamaño de los mercados financieros de México en comparación con otros países
o grupos de países. Por un lado, tener bolsas de valores de menor tamaño relativo a la economía nos indica que existen menos empresas cuyos títulos se
pueden intercambiar de manera fácil y rápida; para las empresas que no cotizan en bolsa es más difícil hacer transferencias de la propiedad de los activos o
canalizarles recursos para aumentar su producción. Vemos también que, además de ser más pequeña, en las bolsa de valores de México se intercambian
menos acciones de las empresas que ya están listadas. Así, podemos concluir
que algunas economías emergentes, y México en particular, tienden a ser menos líquidas que las economías avanzadas con lo que podríamos suponer que
una mayor penetración financiera facilitaría el tránsito de recursos en la economía hacia una asignación más eficiente. Esta diferencia en liquidez que queda
clara para el caso de México será un supuesto clave durante el resto del trabajo.
34
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
F IGURA 5: TAMAÑO DE LAS B OLSAS DE VALORES DE D ISTINTOS PAÍSES
( A ) C APITALIZACIÓN DE M ERCADO COMO P ORCENTAJE DEL PIB (C IERRE DE A ÑO )
( B ) VALOR DE LAS A CCIONES I NTERCAMBIADAS EN D ÓLARES C ORRIENTES COMO P CT. DEL PIB
( C ) VALOR T OTAL DE LAS A CCIONES I NTERCAMBIADAS E NTRE C APITALIZACIÓN P ROM . DEL P ERIODO
Nota: La clasificación de los países según su ingreso corresponde a la que da
el Banco Mundial. Datos para 2012. Fuente: Banco Mundial.
L UIS S IMON TAMBORREL
2.
35
R EVISIÓN DE LA L ITERATURA
Hasta el momento, la literatura sobre medidas de política monetaria no convencionales mediante compra de activos en economías emergentes es escasa.
Podemos encontrar trabajos como el de Ghosh et al. (2009) que analiza las opciones de política monetaria de naciones emergentes a través de la posición
del Fondo Monetario Internacional, e Ishi (2009) que hace una recopilación de
los países emergentes que han tomado acciones no convencionales, pero sin
un análisis basado en un modelo teórico explícito detrás sino que más bien se
limita a documentar estos hechos. Donde sí existe más investigación respecto a
medidas no convencionales en economías emergentes, en especial debido a la
crisis del 2008, es en las medidas macroprudenciales. El objetivo principal de
estas medidas es fomentar la estabilidad financiera a través de mecanismos como los requerimientos de reservas de los bancos, requerimientos de reservas en
moneda extranjera, variaciones en el colateral entre muchos otros instrumentos
(véase Galati y Moessner (2012) para un análisis detallado tanto de los instrumentos macroprudenciales como de sus objetivos y del estado general de estas
políticas en la literatura y en la práctica). Para el presente análisis se recurrirá
a un modelo de ciclos reales de negocios que introduce diferencias de liquidez
entre los activos. La literatura de ciclos reales de negocios utiliza modelos dinámicos estocásticos de equilibrio general (DSGE por sus siglas en inglés) con
el fin de explicar las fluctuaciones que sufre una economía en el corto plazo.
El modelo que se va a adoptar es el de Kiyotaki y Moore (2012), que a su vez
es una modificación de Kiyotaki y Moore (2001). La obra de estos dos autores,
junto con la de Bernanke y Gertler, son modelos ya clásicos de fricciones financieras. Bernanke y Gertler (1986) introducen fricciones financieras a través
del mercado de crédito donde hacen que el costo de financiamiento dependa
del valor de cada empresa. En este mismo sentido encontramos una obra canónica para tratar fricciones financieras que es la del acelerador financiero de
Bernanke et. al. (1999) en la que los autores nos muestran como las fricciones
del mercado crediticio pueden amplificar choques macroeconómicos. El antecedente directo del modelo que vamos a usar corresponde a Kiyotaki y Moore
(1997) donde la fricción en el mercado de crédito aparece mediante el colateral que necesitan las empresas para endeudarse; una vez que desarrollemos el
modelo veremos que las fricciones que usaremos son muy similares y pueden
tener la misma interpretación: las empresas sólo podrán financiar una parte de
su capital con recursos que no tienen en ese momento. El lugar en la literatura que ocupa este trabajo es precisamente a la mitad entre el ya mencionado
modelo de Kiyotaki y Moore (2012) y el que muestran Del Negro et al. (2011).
Ambos modelos son similares pero el primero es un ejercicio teórico mientras
que el segundo tiene un enfoque claramente práctico que pretende analizar el
efecto del QE sobre la economía de Estados Unidos. Aquí seguiremos un planteamiento similar al del primero pero desde un enfoque que nos ayude a dar
predicciones más claras sobre las efectos en una economía emergente y las diferencias en los resultados con una economía avanzada, además de que nos
ayude a generar hipótesis contrafactuales para teorizar sobre la efectividad de
36
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
este tipo de política monetaria en una economía emergente como es el caso de
México. El modelo de Del Negro et. al. (2011) incluye más elementos en la economía que pueden ayudar a hacerlo más realista pero que no son necesarios
para este primer acercamiento aunque por su orientación claramente práctica
y predictiva podría ser interesante hacer un ejercicio similar para México. El
objetivo principal de este trabajo es dar un primer acercamiento al efecto de
políticas monetarias no convencionales en el caso de una crisis similar a la que
observamos en el 2008 en Estados Unidos. Aunque esta crisis ha sido de escala
mundial, mencionamos el caso de Estados Unidos por la reacción del banco
central ante este escenario y no por alguna otra característica particular de la
crisis. La idea principal es mostrar que existen situaciones que podrían ameritar un programa de este tipo y que vale la pena considerarlos, estudiar más a
detalle sus características y sus posibles costos y beneficios. Queremos destacar
que ésta es una opción más que agregar a la lista de herramientas que posee un
banco central en una economía emergente para hacer política monetaria.
3.
M ODELO B ASE
En el modelo, las fricciones en el mercado financiero vendrán por diferencias en la liquidez de los activos. Como veremos con detalle más adelante, la
diferencia entre las dos economías, avanzada y emergente, se modelará a través
de diferencias en liquidez entre estas economías y será esta diferencia la que genere las diferentes dinámicas en cada una. El dinero será deseable porque será
más líquido que el capital y será esta característica la que haga que tenga un
precio estrictamente positivo. Otra fricción que usaremos en el modelo será que
no todos los empresarios tienen la posibilidad de invertir en cada periodo por
lo que será necesario canalizar los recursos hacia los inversionistas con el fin
de acumular capital e incrementar rendimientos futuros. Así, el dinero servirá
para impulsar la actividad ya que permite mover los recursos hacia el sector
productivo de la economía. En este escenario, las crisis corresponden a choques de liquidez. Cuando la economía sufre un choque, se vuelve más difícil
canalizar el dinero hacia los inversionistas para que acumulen capital y es aquí
donde entra el banco central, que sigue una regla de política monetaria distinta
a las reglas de Taylor que estamos acostumbrados; su regla de intervención depende del choque observado en la liquidez y la reacción no corresponde a las
tasas de interés o a la oferta monetaria, sino que vendrá a través de la compra
de capital para intentar aliviar esta falta de liquidez. Tenemos una economía
con infinitos periodos y dos tipos de agente: empresarios y trabajadores. La
economía incluye trabajo, producción, dinero y capital. Los empresarios producen usando su capital y el trabajo de los trabajadores; el capital se deprecia y
para reemplazarlo hace falta invertir. Para invertir, el empresario deberá gastar
dinero o capital y suponemos que el capital es menos líquido que el dinero, en
particular, suponemos que un empresario puede vender a lo más una fracción
de su capital en cada periodo. En el modelo, la decisión de invertir solamente se le concede a los empresarios con cierta probabilidad por lo que se vuelve
L UIS S IMON TAMBORREL
37
necesario transferir recursos de los empresarios no-inversionistas (a partir de
ahora les llamaremos ahorradores) a los inversionistas. Los inversionistas pueden comprometer a lo más una fracción ✓ de sus ganancias futuras para poder
invertir más de lo que tienen en capital nuevo. Podemos pensar en ✓ como la
fracción máxima que el inversionista puede comprometer creíblemente sobre
las ganancias futuras del capital que va a adquirir. Este supuesto permite a los
empresarios ser dueños de capital que está en otra empresa. Para simplificar el
análisis, vamos a suponer que el capital se puede vender a la misma tasa sea
de su propia empresa o de otra lo que convierte a estos dos tipos de capital
en perfectos sustitutos. Así, los empresarios serán indiferentes entre invertir en
su empresa o en otra ya que reciben los mismos rendimientos y el capital está
sujeto a la misma restricción de liquidez. De esta manera podemos utilizar el
término capital sin tener que hacer distinción sobre si el empresario lo tiene en
su empresa o no. El valor del dinero aparece porque ayuda a financiar la parte
de la inversión que no puede ser financiada mediante emisión de capital para
vender a otros inversionistas o por capital viejo que está sujeto a la restricción
de liquidez. Aquí, el dinero pasa a ser el medio que canaliza los recursos hacia dónde se pueden invertir. El problema de los empresarios (que no trabajan,
sólo son dueños de la empresa) es
máx E
1
X
t
log(ct )
(3.1)
t=0
Los empresarios sólo son dueños del capital y producen mediante la tecnología
yt = At kt lt1
(3.2)
El parámetro de la productividad total de los factores es igual para todos los
inversionistas pero supondremos que sigue un proceso estocástico estacionario
autorregresivo de primer orden. El capital se deprecia a tasa y por conveniencia definiremos
⌘1
(3.3)
w t l t = rt k t
(3.4)
Bajo el supuesto de competencia perfecta, podemos definir los beneficios
de las empresas como
yt
Los empresarios tienen una probabilidad n de poder invertir. Cuando pueden invertir tienen acceso a una tecnología de rendimientos constantes que
produce it unidades de capital a partir del mismo número de unidades del
bien de consumo. La inversión de este periodo se puede utilizar hasta el siguiente periodo con lo cual obtenemos la siguiente regla de movimiento del
capital
kt+1 = kt + it
(3.5)
38
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
Para poder financiar la inversión, el inversionista puede comprometer parte
de los beneficios que obtendrá del nuevo capital. Una unidad de capital en t nos
dará los rendimientos rt+1 en el periodo t+1, rt+2 en t+2 y así sucesivamente.
Pero suponemos que el empresario inversionista puede comprometer a lo más
una fracción ✓ de su nuevo capital. Mientras más pequeña sea esta fracción,
más fuerte es la restricción que enfrenta el inversionista y tendrá que vender
más capital para financiarla.
El capital no es tan líquido como el dinero y suponemos que sólo puede
vender t < 1 del capital que posee en otros empresarios. t sigue un proceso
igual al de la productividad, estacionarios y centrados en A y respectivamente. Con esto permitimos que haya dos tipos de choques en la economía, uno de
productividad y uno de liquidez. Nos vamos a centrar solamente en choques
de liquidez por lo que podríamos deshacernos de la variable de la productividad total de los factores y sustituirla por su valor de estado estacionario. Esta
simplificación no reduce la complejidad del modelo pero nos limita en cuanto
al tipo de choques que puede sufrir nuestra economía. Es por esta razón que
se mantiene el término At aunque en nuestras simulaciones no reciba ningún
tipo de choque. El modelo puede analizarse de la misma manera que lo vamos a hacer pero con choques en la productividad sin hacerle ningún tipo de
modificación. Estos supuestos ocasionan que un empresario tenga tres tipos de
activos: dinero, capital en otra empresa, y la fracción no comprometida (1 ✓)
de su propio capital. Denotamos por nt al capital y por mt al dinero de un
empresario que enfrenta dos restricciones de liquidez:
mt+1
0
nt+1
(1
(3.6)
✓t )it + (1
t ) nt
(3.7)
La primera restricción simplemente nos dice que los saldos monetarios no
pueden ser negativos. La segunda nos limita la velocidad a la que un empresario puede desacumular capital. El término del lado izquierdo es el capital
del próximo periodo y éste no puede ser menor que la fracción máxima que
no comprometida de su capital nuevo más la fracción restante suponiendo que
vende la mayor cantidad posible de su capital acumulado no depreciado. No
olvidemos que el primer término del lado derecho puede ser cero en caso de
que el empresario no tenga la posibilidad de invertir. A priori no podemos
asegurar que el dinero tenga un precio positivo puesto que su función en la
economía es sustituir la falta de liquidez del capital pero podríamos estar en
una situación en que el capital tenga la liquidez necesaria por lo que el dinero
perdería su valor. Como veremos más adelante, éste no será el caso pero aun
así definiremos el precio del dinero en términos de bienes y no viceversa como
es la costumbre, denotaremos al precio del dinero por pt . Para denotar al precio
del capital, igualmente en términos de bienes de consumo, usaremos qt . Ahora
podemos expresar la restricción presupuestal del empresario en cada periodo
como
ct + qt (nt+1 it
nt ) + it + pt (mt+1 mt ) = rt nt
(3.8)
L UIS S IMON TAMBORREL
39
Su ingreso, del lado derecho, corresponde a los beneficios obtenidos del capital. Del lado izquierdo, el gasto se distribuye entre consumo, inversión, compra de capital a otros empresarios y cambio en los saldos monetarios. Ahora
pasamos a caracterizar a los trabajadores, quienes maximizan
máx E
1
X
t
! 01+⌫
l
)
1+⌫ t
u(c0t
t=0
;
! > 0, ⌫ > 0
(3.9)
Donde usamos x0 para denotar a las variables de los trabajadores y así distinguirlas de las de los empresarios. La restricción presupuestal que enfrentan
los trabajadores es
c0t + qt (n0t+1
n0t ) + pt (m0t+1
m0t ) = wt lt0 + rt n0t
(3.10)
Donde vemos que la restricción es muy similar a la de los empresarios solamente que los trabajadores no tienen posibilidad de invertir y además reciben
un salario por su trabajo. Aunque los trabajadores no puedan invertir, pueden
comprar capital (y dinero) en el mercado. Suponemos también que los trabajadores no se pueden endeudar y añadiendo la restricción de no-negatividad de
los saldos monetarios tenemos que
m0t+1
0
(3.11)
n0t+1
0
(3.12)
De las condiciones de primer orden del trabajador podemos obtener la función de oferta de trabajo sin necesidad de suponer una forma explícita de la
función de utilidad. Tenemos que las condiciones de primer orden con respecto al consumo y al trabajo respectivamente son
t 0
u (c0t
t 0
u (c0t
! 01+⌫
l
)=
1+⌫ t
! 01+⌫ 0⌫
l
)!lt =
1+⌫ t
(3.13)
t
t wt
(3.14)
Y despejando el trabajo obtenemos
⇣ w ⌘1/⌫
t
(3.15)
!
El problema de cada empresa es un problema de maximización de beneficios estándar de la forma
lt =
máx At kt lt1
w t lt
(3.16)
De donde podemos obtener la demanda de trabajo de cada empresa en función del capital que tenga y del salario
lt =
✓
(1
)At
wt
◆1/
kt
(3.17)
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
40
Y dado que todas las empresas son iguales y la demanda es lineal en el
capital, podemos agregar fácilmente las demandas para obtener la de toda la
economía, igualándola con la oferta tenemos que
⇣ w ⌘1/⌫
t
!
=
✓
(1
)At
wt
◆1/
Kt
(3.18)
Donde usamos variables en mayúsculas para denotar a las variables agregadas. Así, podemos despejar el salario de equilibrio y sustituirlo en (3.4) con
lo que obtenemos las ganancias de la empresa en equilibrio
rt kt = at Kt↵
1
(3.19)
kt
donde
at
⌘
↵
⌘
✓
1
!
(1 + ⌫)
+⌫
◆ 1 +⌫
+⌫
At1+⌫
(3.20)
(3.21)
Supondremos que, en la vecindad del estado estacionario, los trabajadores
no tendrán capital y consumirán únicamente su ingreso laboral12 .
Con esto, su restricción presupuestal se convierte en
c0t = wt lt0
(3.22)
Ahora regresamos al problema de los empresarios. Dependiendo de la elección de parámetros, podríamos encontrarnos en una situación en la cual las
restricciones de liquidez sean tan laxas que no restrinjan a la economía. En este
caso, tener la posibilidad de invertir perdería su valor puesto que sería muy
fácil canalizar recursos de los ahorradores hacia los inversionistas; nos centraremos en el caso en que sí existe una ventaja para poder invertir13 . Intuitivamente, si la fracción ✓ de capital que se puede comprometer es alta y el capital
es muy líquido entonces se perderán las ventajas de ser inversionista y el equilibrio alcanzado será igual al óptimo sin fricciones además de que el dinero no
tendría valor. Por otro lado, cuando la economía se encuentra restringida por
las fricciones antes mencionadas veremos que, en el equilibrio, el precio del
dinero será estrictamente positivo, el precio del capital será estrictamente mayor a uno y los empresarios con oportunidad de invertir optarán por no tener
12 La demostración formal de este resultado se encuentra en Kiyotaki y Moore (2012) pero intuitivamente lo que ocurre es que el retorno esperado tanto del dinero como del capital (en caso
de no tener oportunidad de invertir, como es el caso de los trabajadores) es menor que el factor
de descuento 1/ por lo que el los trabajadores preferirán consumir su ingreso de este periodo en
lugar de ahorrarlo. Por otro lado, los empresarios decidirán ahorrar ya que están esperando tener
la oportunidad de invertir.
13 Una condición suficiente para alcanzar un equilibrio de este estilo es que: (1
)✓ + ⇡
<
(
)(1 ⇡). Para más detalles sobre esta condición y el equilibrio que genera así como sobre los
equilibrios que alcanza el modelo en los casos en que no se cumple véase Kiyotaki y Moore (2012).
L UIS S IMON TAMBORREL
41
dinero. La intuición detrás de cada una de estas afirmaciones es la siguiente:
primero, si la liquidez de la economía está restringida entonces el dinero será
deseable pues es más líquido que el capital con lo que tendrá un precio positivo; segundo, que el precio del capital en el mercado sea estrictamente mayor
a uno refleja que sí existe una ventaja de ser inversionista en un periodo dado
pues en ese caso el costo del capital para ese empresario sería de uno; por último, si el empresario tiene la posibilidad de invertir entonces decidirá invertir
todos sus saldos monetarios pues éstos, a diferencia del capital, no le generan
ningún rendimiento.
Con estos supuestos podemos reescribir la restricción presupuestal de los
inversionistas como
cit + (1
✓qt ) it = (rt +
t q t ) nt
+ pt mt
(3.23)
Donde usamos el superíndice i para denotar a las variables del inversionista, nótese que n y m no tienen superíndice ya que fueron elegidas el periodo
anterior. El lado izquierdo muestra los gastos del inversionista; consume o invierte y la inversión tiene un costo de 1 menos el valor de mercado de la fracción de capital que compromete. El lado derecho muestra la máxima liquidez
que un inversionista puede tener y está compuesta por los retornos a su capital, la máxima fracción de su capital no depreciado que puede vender y los
saldos monetarios que tuviera del periodo anterior. Una vez que conocemos
el capital de este periodo y la inversión, podemos despejar su capital del siguiente periodo. Supondremos que (3.6) y (3.7) se cumplen con igualdad para
los inversionistas. Esto quiere decir que los inversionistas no querrán quedarse
con dinero pues no les genera ningún retorno y querrán vender todo el capital
que les sea posible pues el costo para ellos de invertir en capital nuevo es 1 que
es estrictamente menor que el precio del capital en el mercado. Reescribiendo
la restricción presupuestal anterior con respecto al capital del próximo periodo
y sustituyendo (3.6) y (3.7) obtenemos
cit + qtR nit+1 = rt nt +
donde
⇥
t qt
qtR ⌘
+ (1
1 ✓qt
1 ✓
R
t ) qt
⇤
nt + pt mt
(3.24)
(3.25)
El término qtR nos refleja el costo real que enfrenta el inversionista al comprar capital, en el numerador tenemos lo que le cuesta al inversionista adquirir
una unidad de capital y en el denominador tenemos la fracción que termina
quedándose de esta unidad. La restricción presupuestal que acabamos de obtener nos muestra la riqueza del empresario del lado derecho, por un lado tienen
el retorno de su capital y sus saldos monetarios pero el término más interesante
es el segundo en el que vemos que una fracción t de su capital está valuada al
costo del mercado mientras que el resto está valuada al costo efectivo del inversionista para reemplazar su capital. Es decir, la fracción de capital que puede
vender está valuda a precio de mercado mientras que la que no puede vender
42
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
está valuada por su costo real de reemplazo. Como supusimos que la utilidad
de los empresarios es logarítmica, sabemos que van a consumir una fracción
(1
) de su riqueza y ahorrarán el resto. Así obtenemos
cit = (1
⇥
) rt n t +
t qt
+ (1
R
t ) qt
nt + pt mt
Si despejamos la inversión de 3.23 obtenemos
⇤
(3.26)
+ pt mt cit
(3.27)
1 ✓qt
Donde podemos ver que la inversión de cada periodo corresponde a la liquidez que le sobra al inversionista después del consumo dividida entre el costo de la misma. Ahora pasemos al problema de los empresarios ahorradores, es
decir, aquellos sin la posibilidad de invertir. Dado que no tienen oportunidad
de invertir, la inversión desaparece de su restricción presupuestal. Supondremos también que las dos restricciones de liquidez no son activas, este supuesto
nos refleja la idea de que los ahorradores querrán tener dinero para poder comprar equity y de que, dado que no tienen la posibilidad de invertir, no querrán
vender su capital pues no tienen la posibilidad de invertirlo a un costo menor.
Su restricción presupuestal se reduce a
it =
(rt +
t q t ) nt
cst + qt nst+1 + pt mst+1 = rt nt + qt nt + pt mt
La restricción presupuestal escrita de esta manera nos muestra al gasto del
ahorrador del lado izquierdo y su riqueza del lado derecho; de manera análoga
a lo que se hizo anteriormente, tenemos que el consumo es igual a
cst = (1
) [rt nt + qt nt + pt mt ]
Mientras que ahorraría el resto de su ingreso, pero ahora el agente tiene
dos opciones, ahorrar a través de capital o de dinero. La división entre capital
y dinero será tal que iguale sus costos marginales, es decir, el costo de sacrificar
una unidad de consumo a cambio de 1/pt unidades de dinero o a cambio de
1/qt unidades de capital. Un ahorrador querrá tener dinero ya que sabe que,
en caso de ser inversionista el siguiente periodo, enfrentará una restricción de
liquidez y, como ya mencionamos, el dinero le ayudará a aliviar este problema.
De las condiciones de primer orden del problema obtenemos que

⇤
pt+1 ⇥
0
u (ct ) = E
(1 ⇡) u0 (cst+1 ) + ⇡u0 (cit+1 )
pt

rt+1 + qt+1 0 s
= (1 ⇡) E
u (ct+1 ) +
(3.28)
qt

R
rt+1 + t+1 qt+1 + (1
t+1 ) qt+1
⇡E
u0 (cit+1 )
qt
Esta ecuación nos dice que la utilidad marginal del consumo es igual al valor esperado del dinero en el siguiente periodo, la segunda expresión, y a la
L UIS S IMON TAMBORREL
43
ganancia esperada del capital en el siguiente periodo, el tercer término. Como
el dinero no genera ningún tipo de interés, el empresario obtiene p, el precio
del dinero el periodo siguiente. Además, este término está multiplicado por el
factor de descuento, la cantidad (1/pt+1 ) y la utilidad marginal esperada del
consumo. La ganancia esperada del capital depende de si es inversionista o no
en el siguiente periodo y corresponde a su rendimiento,rt+1 , más el valor esperado del capital no depreciado. El valor esperado del capital no depreciado
se valía a su costo de reemplazo o a su valor de mercado dependiendo de qué
tipo de empresario sea el próximo periodo. Análogamente, este término está
multiplicado por el factor de descuento, la cantidad (1/qt ) y la utilidad marginal esperada del consumo. En el segundo término tenemos el valor esperado
del dinero en el periodo siguiente, el dinero no genera ningún tipo de interés
entonces el empresario obtiene pt+1 , el precio del dinero en el siguiente periodo, multiplicado por el factor de descuento y después por la utilidad marginal
esperada del consumo ponderada por las probabilidades de ser inversionista
o no. Lo igualamos con la ganancia esperada del capital adicional, el último
término. En esta expresión tenemos el rendimiento si es ahorrador, que corresponde al rendimiento del capital que es rt+1 más el valor esperado del capital
no depreciado que es qt+1 multiplicado por la cantidad 1/qt y después por el
factor de descuento y la utilidad marginal del consumo del periodo siguiente siendo ahorrador. El segundo término de la expresión tiene la probabilidad
de ser inversionista y contiene los mismos elementos que el primero solamente
que ahora el valor del capital es igual al que ya habíamos encontrado antes pero
en t + 1. El argumento que aquí se presenta es puramente intuitivo pero se puede demostrar que es la solución a la ecuación de Bellman asociada al problema.
Ya hemos obtenido las soluciones de los diferentes individuos y por lo tanto
ahora podemos pasar a tratar a la economía completa. Nótese que todas las
ecuaciones que hemos encontrado hasta ahora, tanto de los inversionistas como de los ahorradores, son lineales en las variables de decisión ct , it , nt+1 , mt+1
lo que nos permite agregarlas de manera muy sencilla. Como ya se mencionó,
denotaremos con mayúsculas a las variables agregadas. Como los trabajadores
deciden no ahorrar, los agregados de capital y dinero corresponden a los que
tienen los empresarios. Esto provoca que, al inicio del periodo t, una fracción⇡
de Kt y de Mt está en manos de los empresarios inversionistas y el resto en
manos de los no inversionistas. De (3.23) y sustituyéndole el consumo de los
inversionistas y sustituyendo el capital y saldos monetarios individuales por
los agregados obtenemos una expresión para la inversión agregada
(1
✓qt ) It = ⇡
⇥
[(rt +
t qt ) Kt
+ pt M t ]
(1
) (1
t)
qtR Kt
⇤
(3.29)
Ahora utilizamos la condición de vaciado del mercado de bienes. En este
caso necesitamos que la producción sea igual al consumo más la inversión. En
la siguiente expresión ya hemos restado a la producción wt lt que corresponde
al consumo de los trabajadores y el resultado es
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
44
rt Kt = at Kt↵ = It +(1
)
⇥
rt + (1
⇡
⇡ t ) qt + ⇡ (1
t)
qtR Kt + pt Mt
(3.30)
= Cti + Cts
Donde la primera igualdad se da sustituyendo el valor de rt que ya habíamos encontrado. Por último, necesitamos una manera de agregar la ecuación
(3.28). Para lograr esto debemos resaltar el hecho de que, en el periodo t, los inversionistas venden una fracción ✓ de su inversión junto con una fracción t de
su capital no depreciado que es ⇡ Kt . Aquí n corresponde a la fracción de empresarios que son inversionistas y Kt es el capital con el que llegan al periodo
t. De estas condiciones podemos ver que entonces el capital de los ahorradores
se convierte en
s
Nt+1
⌘ ✓It +
t⇡
Kt + (1
(3.31)
⇡) Kt
En esta expresión vemos que los ahorradores tienen, además del capital que
ya tenían al inicio del periodo, la parte de la inversión a la que tienen derecho
y la fracción de capital que le compraron a los inversionistas. Recordemos también que los ahorradores son los únicos individuos con dinero en el periodo t.
El ahorro de éstos debe satisfacer (3.28) lo que resulta en
(1
⇡) E
"
rt+1 + qt+1
qt
pt+1
pt
s
(rt+1 + qt+1 ) Nt+1
+ pt+1 M
2
= ⇡E 4
pt+1
pt
rt+1 +
t+1
rt+1 +
t+1
qt+1 + (1
#
=
qt+1 +(1
qt
t+1 )
t+1 )
R
qt+1
R
s
qt+1
Nt+1
+ pt+1 M
3
5
(3.32)
Esta ecuación se obtiene sustituyendo la utilidad marginal de la función
logarítmica como u0 (x) = 1/x. Del lado izquierdo tenemos los valores de los
ahorradores donde el denominador corresponde al consumo y el numerador a
los términos que teníamos en la ecuación (3.28) en la parte de los ahorradores.
El lado derecho corresponde a los inversionistas y se define análogamente. Los
factores de descuento intertemporal se cancelan entre sí. Esta ecuación nos dice
que, cuando somos ahorradores, no nos importa la falta de liquidez del capital pues no queremos vender nuestro capital así que el retorno del capital (el
lado izquierdo del numerador) es mayor que el retorno del dinero (el lado derecho del numerador) y con esto el lado izquierdo de la ecuación es positivo. Si
somos inversionistas, el retorno efectivo del capital (el lado derecho del numerador) es menor que el retorno del dinero (el lado izquierdo del numerador).
Estos términos están ponderados por su utilidad marginal (el denominador) y
la probabilidad de pertenecer a cada clase de empresario. Por último introducimos la ley del movimiento del capital agregada
Kt+1 = Kt + It
(3.33)
⇤
L UIS S IMON TAMBORREL
45
El capital es la única variable de estado de la economía, además de los parámetros exógenosAt y t . Recordando que estos dos parámetros tienen proceso
estacionarios, el equilibrio competitivo se puede definir de manera recursiva
como una secuencia {It , pt , qt , rt , Kt+1 } que depende del estado agregado de
la economía dado por {At , t , Kt } que satisfaga las ecuaciones (3.19), (3.29),
(3.30), (3.32), (3.33) junto con las leyes de movimiento de At y t . Las trayectorias de estos dos parámetros estarán dados por procesos independientes autorregresivos de primer orden. Dado que At sólo entra en el modelo mediante
la transformación at , definiremos estos procesos estocásticos de la siguiente
manera
at
=
(1
⇢a ) a + ⇢a at
t
=
(1
⇢ ) +⇢
t
1
+ "a,t
1+"
,t
(3.34)
(3.35)
En los que supondremos que "i ⇠ iid(0, i2 ), i = {a, }. Tenemos dos procesos estacionarios que se mueven alrededor de a y respectivamente. Cabe
mencionar que definido de esta manera, puede tomar valores fuera del intervalo [0, 1] pero estos casos no son relevantes para el presente trabajo. Una
solución simple a este problema y que no afectaría los resultados del modelo
en experimentos en que estas restricciones pudieran ser activas sería simplemente sustituir valores negativos por 0 y mayores a 1 por exactamente 1. De
todos modos, estos casos extremos generalmente no serán interesantes de analizar pues el valor de cero implica que no hay restricción de liquidez y es precisamente ésta la que hace interesante al modelo y el caso de uno implica que
el empresario sólo puede comprar capital pero no venderlo entonces los inversionistas estarían impedidos de suavizar su consumo ante choques adversos y
se verían obligados a simplemente esperar a que el choque se desvanezca. Los
resultados relevantes del modelo se encuentran en valores dentro del intervalo
abierto (0, 1).
4.
M ODELO CON P OLÍTICA M ONETARIA
Con lo visto hasta este momento podemos caracterizar el equilibrio del modelo. Ahora vamos a introducir las modificaciones de política monetaria que
queremos analizar. La regla es una que corresponde a la compra de activos por
parte del banco central. Es similar a la extensión que proponen Kiyotaki y Moore pero en este caso dejaremos fuera la posibilidad de almacenar bienes para
consumirlos en un periodo futuro. Con esto seguimos manteniendo la condición planteada de vaciado del mercado de bienes. Dejamos fuera también el
gasto del gobierno, es decir, el único agente del gobierno es el banco central
y éste se limita a comprar o vender activos según sea necesario. La regla de
política monetaria que sigue el banco central es
Ntg
=
K
t
(4.1)
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
46
Donde Ntg representa el capital en manos del gobierno y está dividido por el
capital de estado estacionario de la economía con lo que logramos que el banco
central compre un porcentaje del total de los activos. Vemos que el banco central decide su política monetaria dependiendo del tamaño de las desviaciones
del estado estacionario que sufran las variables. Los parámetros i corresponde a qué tan fuerte será la respuesta del banco ante dichas desviaciones. Es
evidente que en el estado estacionario el banco central no mantiene activos en
su poder. El banco central tiene acceso a una tecnología gratuita de impresión
de dinero para financiar sus compras por lo que su restricción presupuestal es
de la siguiente forma
qt Ntg
Ntg
1
= rt Ntg
1
+ (Mt+1
(4.2)
M t ) pt
El gobierno financia sus compras netas de capital mediante los retornos del
capital que ya tena o mediante la impresión de dinero. Ahora la oferta monetaria es una variable endógena además de que introdujimos la variableNtg . Falta
imponer una condición más, en el modelo base los empresarios eran los únicos
que tenían capital por lo que el agregado de los empresarios correspondía al
de la economía. Ahora tenemos que
g
Kt+1 = Nt+1
+ Nt+1
(4.3)
Hemos introducido tres variables al modelo(M, N g , K) y tres ecuaciones
por lo que seguimos teniendo un equilibrio bien definido. Falta modificar las
ecuaciones que lo caracterizan para que incorporen estos nuevos supuestos.
Las decisiones de los trabajadores no se modifican con la política monetaria,
siguen consumiendo todo su ingreso en cada periodo. Las ecuaciones (3.29),
(3.30), (3.32) se modifican a
(1
✓qt ) It = ⇡
at Kt↵ =
It + (1
(1
⇡) E
"
)
⇥
[(rt +
⇥
rt + (1
t qt ) Nt
⇡
+ pt M t ]
⇡ t ) qt + ⇡ (1
#
rt+1 + qt+1
pt+1
qt
pt
s
(rt+1 + qt+1 ) Nt+1
+ pt+1 Mt+1
2
= ⇡E 4
pt+1
pt
rt+1 +
t+1
(1
rt+1 +
qt+1 + (1
t+1
) (1
t)
t)
qtR Nt
⇤
qtR Nt + pt Mt
⇤
(4.4)
(4.5)
=
R
qt+1 +(1
t+1 ) qt+1
qt
R
s
t+1 ) qt+1 Nt+1 +
pt+1 Mt+1
3
5
(4.6)
En la primera ecuación el único cambio que tenemos es que sustituimos
el capital total por el que tienen en sus manos los empresarios. En la segunda
L UIS S IMON TAMBORREL
47
ocurre lo mismo con el capital y los saldos monetarios, que ahora son variables.
En la última ecuación, a primera vista parece que tenemos los mismos cambios
pero en realidad hay uno más; el capital de los ahorradores ahora es diferente
puesto que ahora hay que tomar en cuenta el capital que tiene el gobierno y no
sólo el de los empresarios. La variable N s se convierte en
s
Nt+1
⌘ ✓It +
t⇡
⇡) Nt + Ntg
Nt + (1
g
Nt+1
(4.7)
La primera parte es igual que antes, reemplazando K por N y después restamos las compras netas de capital del gobierno en ese periodo. Con estas modificaciones del modelo ya podemos caracterizar de nuevo el equilibrio. Lo hacemos
de
manera
recursiva
como
una
secuencia
de
g
It , pt , qt , rt , Nt+1 , Nt+1
, Mt+1 , Kt+1 que depende del estado de la economía
dado por At , t , Kt , Ntg que satisface las ecuaciones (3.19), (3.33), (4.1), (4.2),
(4.3), (4.4), (4.5), (4.6) y las leyes de movimiento de los parámetros estocásticos.
Parece difícil pensar en la implementación de una regla de política monetaria basada puramente en choques de liquidez que son difíciles de medir y
observar, es por esto que analizaremos los resultados del modelo usando una
regla alternativa de política monetaria que dependa de variables observables
de la economía, en este caso usaremos a la producción pero una vez que veamos los resultados del modelo podremos darnos cuenta que es irrelevante que
elijamos está variable en vez de otra como podría ser K, I, r pues las dinámicas
de estas variables están relacionadas entre sí y simplemente habría que cambiar el parámetro de intensidad de la respuesta de política monetaria ( ) para
obtener resultados cualitativamente iguales independientemente de qué variable observable elijamos. Cabe mencionar que los resultados sí serán diferentes
a cuando se elige la liquidez como parámetro de política monetaria. La nueva
regla será simplemente
Ntg
=
Kt
y
Yt
Y
Y
(4.8)
que es igual a la que teníamos antes pero ahora hacemos que la reacción
dependa de las desviaciones de la producción de su valor de estado estacionario. Bajo esta nueva regla no hace falta hacer ningún cambio al modelo, el
equilibrio sigue estando caracterizado de la misma manera que con la primera
regla de política.
5.
C ALIBRACIÓN
Muchos de los parámetros del modelo son estándar en la literatura y por lo
tanto usaremos valores que son aceptados en general, por ejemplo, la depreciación, el factor de descuento, la retribución al trabajo y al capital de la función de
producción. Para los experimentos tendremos dos economías que llamaremos
Avanzada y Emergente. La primera estará calibrada para Estados Unidos mientras que la segunda será simplemente una economía igual excepto en la mayor
48
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
restricción de liquidez que tiene lo que nos va a ayudar a que ambos modelos sean comparables entre sí. Para calibrar el resto del modelo seguiremos de
cerca el trabajo de Del Negro et al. (2011) ya que su modelo incluye muchos
de parámetros iguales o muy similares a los nuestros y ellos hacen un riguroso
ejercicio de calibración para la economía de Estados Unidos. Los parámetros
del modelo que vale la pena destacar son el factor de liquidez y la posibilidad
de invertir. Para el factor de liquidez, Del Negro et al. (2011) estima la fracción
de activos líquidos en la economía con respecto al capital pero usando una definición amplia de capital (como es el caso de nuestro modelo, en que el capital
corresponde al único activo de la economía). Para los activos líquidos utilizan
los pasivos del gobierno federal y el resto de los activos de la economía se consideran en la categoría de capital. Una vez que conocen la fracción de activos
líquidos en la economía, los autores encuentran que es de alrededor de 13 %
en promedio pero que llega a ser de hasta 15.48 % durante la crisis del 2008,
pueden calcular un parámetro que refleje la liquidez en su modelo. Para nuespM
tro modelo, encontramos que en el estado estacionario qK+pM
= 0.148 cuando
= 0,193. Con esto, tenemos una proporción de liquidez que se sitúa entre el
promedio y el valor de la crisis encontrados por los autores ya mencionados.
Notemos que y ✓ tienen una interpretación muy similar en el modelo, el primer parámetro afecta al capital nuevo y el segundo al capital existente, pero lo
que hacen ambos es limitar la velocidad de desacumulación del capital. Con
esto en mente es que en la calibración asumiremos que = ✓, aunque sea sólo
en el estado estacionario, puesto que en los experimentos tendremos choques
a . Hacer una estimación similar para México, o en dado caso para una nación emergente, es complicado debido a la escasez de datos de capital en este
sentido amplio. México es un país con menos liquidez que Estados Unidos, como se argumentó anteriormente, pero hacer una estimación puntual sobre el
tamaño de la diferencia es difícil, es por eso que se ha elegido tomar un valor
igual a dos terceras partes del de Estados Unidos para . Este supuesto no es
crucial para los resultados pues la dirección de los cambios se mantendría aunque no hagamos una hipótesis puntual sobre la magnitud de los cambios. Para
el parámetro n que refleja la probabilidad de ser inversionista, tomaremos un
valor de 5 % que es aproximadamente el valor que encuentran Doms y Dunne (1998). Ellos encuentran que alrededor del 20 % de las empresas realizan
inversiones en capital cada año, y al estar usando datos trimestrales es que tomamos el 5 %. El resto de los parámetros se eligió tomando valores aceptados
generalmente en la literatura; los resultados de las simulaciones no dependen
de forma crucial de la elección de éstos y quedan resumidos en el Cuadro (1).
Cabe mencionar que la elección del parámetro de participación del capital en
la producción, que tiende a ser muy distinto entre las economías avanzadas y
emergentes, no cambia los resultados del modelo aun cuando se eligen valores
distintos entre las economías para darle mayor participación al trabajo en la
economía emergente.
Otro parámetro que vale la pena destacar es la elección de y , el parámetro
de la regla de reacción de la regla de política monetaria si eligiéramos Y como
Para el par·metro ! que reáeja la probabilidad de ser inversionista, tomaremos un valor de
5 % que es aproximadamente el valor que encuentran Doms y Dunne (1998). Ellos encuentran que
alrededor del 20 % de las empresas realizan inversiones en capital cada aÒo, y al estar usando datos
trimestrales es que tomamos el 5 %.
El resto de los par·metros se eligiÛ tomando valores aceptados generalmente en la literatura;
los resultados de las simulaciones no dependen de forma crucial de la elecciÛn de Èstos y quedan
resumidos en el Cuadro (1). Cabe mencionar que la elecciÛn del par·metro de participaciÛn del
capital en la producciÛn, que tiende a ser muy distinto entre las economÌas avanzadas y emergentes,
L UIS S IMON TAMBORREL
49
no cambia los resultados del modelo aun cuando se eligen valores distintos entre las economÌas para
darle mayor participaciÛn al trabajo en la economÌa emergente.
C UADRO 1: E LECCIÓN DE PARÁMETROS PARA LAS S IMULACIONES DEL M ODELO
Cuadro 1: ElecciÛn de Par·metros para las Simulaciones del Modelo
SÌmbolo
Par·metro
Valor
"
factor de descuento
0.99
#
participaciÛn del capital en la producciÛn
0.4
$ (Avanzada)
fracciÛn de capital nuevo que se puede comprometer
0.193
$ (Emergente)
fracciÛn de capital nuevo que se puede comprometer
0.129
%
depreciaciÛn
0.975
&
inverso de la elasticidad de Frisch
1
!
probabilidad de ser inversionista
0.05
'a
persistencia del proceso autorregresivo
0.95
'"
persistencia del proceso autorregresivo
0.95
( (Avanzada)
desviaciÛn est·ndar de los errores del proceso estoc·stico
0.15
( (Emergente)
desviaciÛn est·ndar de los errores del proceso estoc·stico
0.05
a
intensidad de la respuesta de polÌtica monetaria ante choques en a
0.2
"
intensidad de la respuesta de polÌtica monetaria ante choques en +
-0.1
y
intensidad de la respuesta de polÌtica monetaria ante choques en Y
-2.0
!
par·metro de sustituciÛn ocio-consumo
1
A
productividad total de los factores
1
M
base monetaria en el modelo sin gobierno
1
Otro par·metro que vale la pena destacar es la elecciÛn de y , el par·metro de la regla de reacciÛn
de la regla de polÌtica monetaria si eligiÈramos Y como variable para decidir la intervenciÛn del banco
variable para decidir la intervención del banco central. Se eligió un valor tal
central. Se eligiÛ un valor tal que iguale aproximadamente el tamaÒo total de compras de activos
que iguale aproximadamente el tamaño total de compras de activos por parte
por parte del gobierno durante todos los periodos. AsÌ, aunque al principio compre m·s capital bajo
del gobierno durante todos los periodos. Así, aunque al principio compre más
capital bajo la regla original y después bajo la segunda, en el agregado habrá
comprado aproximadamente la misma23cantidad de capital.
6.
R ESULTADOS
Ahora corremos una serie de simulaciones del modelo y presentamos las
funciones de impulso-respuesta a un choque de una desviación estándar ( en
la lista anterior) a . Para entender la dinámica del modelo, presentamos primero la diferencia en la economía Avanzada con la regla de política monetaria
y sin ella.
Todos los resultados se presentan en desviaciones porcentuales respecto al
estado estacionario, lo que vuelve más fácil comparar las dos economías. El
capital del gobierno se presenta como porcentaje del capital agregado de la
economía en cada periodo ya que su valor de equilibrio es cero. En la Gráfica
(6) claramente podemos ver que la política monetaria sí es efectiva para compensar esta falta de liquidez en la economía. El gobierno entra a compensar la
falta de liquidez que se da entre los agentes y que impide que los recursos se
canalicen hacia los inversionistas por lo que logra que la caída en producción
y consumo sea mucho menor. Vemos que el precio del capital aumenta en el
periodo del choque de manera muy importante cuando el banco compra los
50
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
activos pero, como los devuelve a la economía más rápido de lo que el choque permite, estos vuelven a su valor de estado estacionario más rápidamente.
En el periodo del choque, la reacción del gobierno provoca un aumento en la
demanda de capital lo que, además de aumentar su precio, genera un efecto
de crowding out de la inversión privada que observamos que cae más en el
periodo inicial que en el caso sin gobierno. A partir del segundo periodo, el
efecto del gobierno va en el sentido contrario; mientras que la economía sigue
restringida por la persistencia del choque, el gobierno alivia la falta de liquidez
al empezar a devolver parte del capital que adquirió el periodo pasado con lo
que la inversión se recupera más rápido y en consecuencia ocurre lo mismo con
el capital y la producción. En el caso del consumo, el primer periodo vemos un
aumento importante de éste para satisfacer la condición de vaciado del mercado de bienes y después su caída es más fuerte y tarda más tiempo en recuperarse en ausencia de la política monetaria. El comportamiento del precio del
capital q sigue la misma tendencia que las dinámicas de oferta y demanda del
capital, aumenta mucho en el primer periodo pero después regresa al equilibrio más rápido. Por último, el retorno del capital r sigue la dinámica esperada
que nos da la productividad marginal del capital, aumenta más en el caso en el
que no hay política monetaria y el capital cae más. Cabe mencionar la dinámica
poco convencional de algunas de las funciones de impulso-respuesta, se debe a
que se usaron aproximaciones de segundo orden para resolver el modelo y por
lo tanto la varianza juega un papel en las mismas generando dinámicas que
pudieran parecer extrañas. Esto se solucionaría simplemente tomando aproximaciones de primer orden pero con el costo de perder un poco de precisión en
la aproximación aunque los resultados del modelo no se alteran.
Ahora que hemos visto que la política monetaria sí es efectiva para contrarrestar los choques de liquidez, pasamos al segundo experimento que consiste
en comparar las reacciones de la economía Avanzada con la Emergente cuando la regla de política monetaria se define en función de la liquidez. A través
de este experimento queremos analizar las ventajas o desventajas que existen
en las economías emergentes a la hora de implementar este tipo de políticas.
La Gráfica (7) muestra las funciones de impulso-respuesta de un choque de liquidez igual (relativo al tamaño de cada economía). Vemos que claramente la
política monetaria implementada es más efectiva en la economía que se encontraba más restringida, es decir, la Emergente. Todas las cantidades, inversión,
producción, capital y consumo, se alejan menos de su estado estacionario y
regresan más rápido a éste. En consecuencia, el ajuste de los precios también
es menor. Además, notemos que el capital en manos del sector privado, N, se
aleja menos de su estado estacionario, es decir, el gobierno tiene menos activos
relativo al capital que existe en la economía en un momento dado. Este resultado ocurre aunque las dos economías están operando bajo la misma regla de
política monetaria ya que ésta se encuentra definida en relación al estado estacionario del capital. No sería tan natural definirla basada en el capital del
periodo corriente pues lo que provocaría sería que cuando la economía tiene poco capital, el denominador cae, el gobierno reaccionaría menos, Ng sería
menor para mantener la igualdad pero en realidad nosotros esperaríamos que
L UIS S IMON TAMBORREL
51
F IGURA 6: M ODELO C ON Y S IN P OLÍTICA M ONETARIA EN E CONOMÍA AVANZADA
(A) I
(B) K
(C) Y
(D) C
(E) Q
(F) R
- - - Sin PM Avanzado —– Con PM Avanzado
52
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
entre más severa sea la crisis más enérgica sea la reacción de la política monetaria para contrarrestarla. Y cabe mencionar que si definiéramos la regla de
política monetaria de esta manera solamente amplificaría los resultados ya que
la reacción del gobierno sería más fuerte en la economía Emergente con lo que
los efectos del choque serían incluso menores. La intuición detrás de los resultados radica en que nos encontramos en una economía restringida, estamos
en un equilibrio subóptimo y mientras más fuerte sea la restricción de liquidez más nos alejamos del equilibrio eficiente. En este sentido, las acciones del
gobierno son más efectivas mientras más lejos estamos del óptimo ya que ahí
incluso pequeñas intervenciones tienen efectos significativos en ayudar a una
reasignación más eficiente de los recursos. Podemos pensar en el efecto de las
acciones del gobierno como teniendo una especie de rendimientos decrecientes
a escala, conforme más cerca estamos del óptimo y en consecuencia la economía es más eficiente, menos efectiva es la política monetaria para contrarrestar
los choques pues éstos nos alejan menos del óptimo no restringido.
Como ya se argumentó anteriormente, resulta difícil medir la liquidez de la
economía en el sentido en que la estamos tratando en este modelo. El volumen
operado de activos financieros nos da una idea pero es tan sólo una parte de
algo más complejo. Con esto en mente es que planteamos el siguiente experimento, definir la regla de política monetaria en función de alguna variable
observable, en este caso la producción. En la Gráfica (8) vemos los resultados
de la simulación donde claramente la reacción del gobierno es más lenta pues
su reacción depende de la producción y ésta va cayendo lentamente conforme
el capital se desacumula. Esto ocasiona que al principio la caída sea mayor pero también provoca que el gobierno mantenga los activos durante más tiempo
pues la producción no regresa inmediatamente a su estado estacionario una
vez que se desvanece el choque sino que regresa paulatinamente. Estas dinámicas generan que las funciones de impulso respuesta se crucen, el choque primero afecta más a la economía porque el gobierno se tarda en reaccionar pero
provoca que también se tarde más en normalizar sus medidas de estímulo con
lo que la economía se recupera más rápido. Bajo estos supuestos resulta difícil
decir qué regla sería mejor para el bienestar de los consumidores y dependerá
de la calibración específica de los parámetros en cada experimento aunque, en
general, podríamos pensar que preferiríamos la regla original puesto que nos
ayuda a suavizar el consumo; evita la fuerte caída inicial que vemos en el caso de la segunda regla. La dinámica de los precios va en línea con lo que nos
reflejan las cantidades, primero el retorno al capital r aumenta mucho en el segundo caso como consecuencia de la mayor caída en capital lo que aumenta la
productividad marginal del mismo pero igualmente se recupera más rápido.
El precio del capital en el mercado, igual que antes, sigue una dinámica inversa a la de la inversión; su ajuste es más suave porque también el ajuste de la
inversión es más suave con la nueva regla de política.
L UIS S IMON TAMBORREL
F IGURA 7: M ODELO C ON P OLÍTICA M ONETARIA
EN
53
E CONOMÍA AVANZADA
GENTE
(A) I
(B) N
(C) I
( D ) Ng
(E) Y
(F) C
(G) Q
(H) R
- - - Con PM Avanzado —– Con PM Emergente
Y
E MER -
54
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
F IGURA 8: M ODELO C ON P OLÍTICA M ONETARIA
EN
E CONOMÍA AVANZADA
GENTE
(A) I
(B) N
(C) I
( D ) Ng
(E) Y
(F) C
(G) Q
(H) R
- - - Con PM Y Emergente —– Con PM
Emergente
Y
E MER -
L UIS S IMON TAMBORREL
7.
55
C ONCLUSIONES Y E XTENSIONES
Las simulaciones nos dejan ver que, bajo este modelo, la política monetaria
tiene un efecto muy importante para ayudar a la economía a recuperarse de los
choques. Este efecto se magnifica conforme más restringida sea la liquidez de
estado estacionario de la economía lo que nos sugiere que este tipo de intervenciones podrían ser más efectivas en países como México. Vimos también que,
aunque la liquidez es difícil de medir, parece mejor tener una regla definida en
función de ésta en lugar de en alguna de las otras variables observables. Así,
la recomendación de política derivada del presente trabajo sería la de realizar
esfuerzos para medir la liquidez de la economía y para detectar a tiempo desviaciones y choques de la misma, esto con el fin de que la reacción de política
monetaria pueda ser oportuna y no se dé una vez que la caída de la producción haya sido mayor. Claramente este trabajo es un primer acercamiento a la
implementación de este tipo de políticas en economías emergentes y deja fuera
una consideración de suma importancia, la dinámica de la inflación. No es el
objetivo de este trabajo analizar la inflación pues su dinámica queda determinada por construcción del modelo: cuando el gobierno compra activos lo hace
imprimiendo dinero por lo que el primer periodo es altamente inflacionario y
los demás, mientras devuelve activos a la economía son deflacionarios. Esto
es una consecuencia natural de que la hoja de balance del banco central en el
estado estacionario sea cero y por lo tanto su única manera de comprar activos
en el periodo del choque es a través del señoreaje. Una primera extensión que
sería interesante analizar sería empatar este modelo con un esquema de metas
de inflación. Una regla como la que está definida sobre la producción genera
dinámicas más acorde a este esquema pues inicia las compras de activos paulatinamente con lo que la inflación aumenta a lo largo de los periodos en los
que el gobierno adquiere activos pero a un ritmo más moderado pues los retornos que le paga el capital que ya tiene le ayudan al gobierno a financiar parte
del capital nuevo que adquiere. Para esta extensión podríamos pensar también
quizá en un esquema en que el tamaño de la hoja de balance del banco central
no sea cero en el estado estacionario con lo que podría haber compras no inflacionarias a través de las reservas internacionales. Estas consideraciones son
analizadas por Stone et al. (2011) quienes concluyen, tras analizar la evidencia
empírica existente, que los programas de compras de activos han sido realizadas por bancos centrales con alta credibilidad en el combate a la inflación y
es por esto que no han resultado en aumentos significativos en la misma pero éste no siempre es el caso en las economías emergentes. En este sentido, la
credibilidad de un banco central resulta fundamental para la implementación
de este tipo de políticas. Es una condición necesaria para la implementación
de políticas no convencionales ya que sin ella los agentes podrían interpretar
las acciones del banco central como un abandono del compromiso de estabilidad de precios. Una vez que el banco central ha adquirido credibilidad ante
los agentes, entonces puede iniciar este tipo de políticas que, como pretende
mostrar el modelo, impulsan la actividad al reducir ciertas fricciones en los
mercados a costa de un aumento en el tamaño de la hoja de balance del banco.
56
C OMPRA DE A CTIVOS EN UNA E CONOMÍA E MERGENTE
También existe otro riesgo que queda fuera de los alcances del modelo, una
política de este tipo podría prestarse para financiar deuda de los gobiernos y
generaría incentivos a que los bancos centrales pierdan tanto su independencia
como su credibilidad. En conclusión, aunque aún hay ciertos riesgos que tomar
en cuenta, una política monetaria de compra de activos podría potencialmente
tener efectos benéficos e incluso mayores en una economía emergente que en
una avanzada. Es por esto que debería ser una opción más a considerar dentro
del conjunto de herramientas que posee e implementa un banco central en una
de estas naciones.
R EFERENCIAS
[1 ] Banco Central Europeo. "Technical features of Outright Monetary Transactions". Comunicado de Prensa. 06 de septiembre de 2012. www.ecb.int
[2 ] Banco Central Europeo. Ïntroductory statement to the press conference". Comunicado de
Prensa. 02 de agosto de 2012. www.ecb.int
[3 ] Banco de Chile. .En su reunión mensual de política monetaria, el Consejo del Banco Central
de Chile acordó reducir la tasa de interés de política monetaria en 25 puntos base hasta
0,50 % anual y adoptar medidas complementarias de política monetaria". Comunicado de
prensa. 09 de julio de 2013. www.bcentral.cl
[4 ] Banco de Japón. Çomprehensive Monetary Easing". Comunicado de prensa. 05 de octubre
de 2010. www.boj.or.jp
[5 ] Banco de Japón. Ïntroduction of the Quantitative and Qualitative Monetary Easing". Comunicado de Prensa. 04 de abril de 2013. www.boj.or.jp
[6 ] Banco de Japón. Ïntroduction of the ‘Price Stability Target’ and the ’Open-Ended Asset
Purchasing Method’ ". Comunicado de Prensa. 22 de enero de 2013. www.boj.or.jp
[7 ] Banco de México. Redefinición de los Agregados Monetarios". 1999. www.banxico.org.mx.
[8 ] Banco Nacional Checo. "Transcript of the introductory statement from the press conference". Comunicado de prensa. 01 de noviembre de 2012. www.cnb.cz
[9 ] Bank of England. "Bank of England Reduces Bank Rate by 0.5 Percentage Points to 0.5 %
and Announces £75 Billion Asset Purchase Programme". Comunicado de prensa. 05 de marzo de 2009. www.bankofengland.co.uk
[10 ] Bernanke, Ben, Mark Gertler, y Simon Gilchrist. "The financial accelerator in a quantitative
business cycle framework". Handbook of macroeconomics 1.1999. Pp. 1341-1393.
[11 ] Bernanke, Ben, y Mark Gertler. .Agency costs, net worth, and business fluctuations". The
American Economic Review. 1989. Pp. 14-31.
[12 ] Board of Governors of the Federal Reserve System. "Federal Reserve issues FOMC statement". Comunicado de prensa. 13 de septiembre de 2012. www. federalreserve.gov
[13 ] Board of Governors of the Federal Reserve System. "Federal Reserve announces it will
initiate a program to purchase the direct obligations of housing-related government-sponsored
enterprises and mortgage-backed securities backed by Fannie Mae, Freddie Mac, and Ginnie Mae". Comunicado de prensa. 25 de noviembre de 2008. www. federalreserve.gov
[14 ] Board of Governors of the Federal Reserve System. "FOMC statement and Board approval
of discount rate requests of the Federal Reserve Banks of New York, Cleveland, Richmond,
Atlanta, Minneapolis, and San Francisco". Comunicado de prensa. 16 de diciembre de 2008.
www. federalreserve.gov
[15 ] Del Negro, Marco, Gauti Eggertson, Andrea Ferrero y Nobuhiro Kiyotaki. "The Great Escape?: A Quantitative Evaluation of the Fed’s Liquidity Facilities". Staff Reports 520. Federal
Reserve Bank of New York. 2011.
L UIS S IMON TAMBORREL
57
[16 ] Doms, Mark, y Timothy Dunne. Çapital adjustment patterns in manufacturing plants".
Review of Economic Dynamics 1, no. 2. 1998. Pp. 409-429.
[17 ] Galati, Gabriele y Richhild Moessner. "Macroprudential Policy – A Literature Review".
Journal of Economic Surveys. 2012
[18 ] Ghosh, Atish, Marcos Chamon, Christopher Crowe, Jun Kim y Jonathan Ostry. Çoping
with the Crisis: Policy Options for Emerging Market Countries". IMF Staff Position Note
09/08. 2009.
[19 ] Ishi, Kotaro, Mark Stone y Etienne Yehoue. Ünconventional Central Bank Measures for
Emerging Economies". IMF Working Paper 09/226. 2009.
[20 ] Kiyotaki, Nobuhiro, y John Moore. Çredit Cycles". Journal of Political Economy 105, no. 2.
1997.
[21 ] Kiyotaki, Nobuhiro, y John Moore. "Liquidity, business cycles, and monetary policy". No.
w17934. National Bureau of Economic Research, 2012.
[22 ] Panigirtzoglou, Nikolaos. .Are ETFs dangerous?". J.P.Morgan Global Asset Allocation. 05
July 2013.
[23 ] Reserve Bank of India. "Second Quarter Review of Monetary Policy 2012-13 Press Statement by Dr. D. Subbarao, Governor, Reserve Bank of India". Comunicado de prensa. 30 de
octubre de 2012. www.rbi.org.in
[24 ] Reserve Bank of India. "Monetary Policy Statement for 2012-13 Press Statement by Dr. D.
Subbarao Governor, RBI". 17 de abril de 2012. www.rbi.org.in
[25 ] Stone, Mark, Kenji Fujita y Kotaro Ishi. "Should Unconventional Balance Sheet Policies
be Added to the Central Bank Toolkit? A Review of the Experience So Far". IMF Working
Paper 11/145. 2011.
58
59
U NA JUSTIFICACI ÓN PARA TENER UNA META DE
INFLACI ÓN POSITIVA *
M IGUEL Z ERECERO**
El presente artı́culo introduce una versión simplificada del modelo de Mankiw y Reis (2002)
para justificar que los bancos centrales tengan una meta de inflación positiva. Adicionalmente,
para una variedad de calibraciones se calcula un nivel de inflación óptimo tomando en cuenta
los beneficios y costos que la inflación pueda tener en la economı́a del modelo. Se encuentra
que ante un menor nivel de competencia la inflación óptima es mayor. Esto podrı́a justificar que
paı́ses en vı́as de desarrollo tengan una meta de inflación mayor en comparación con economı́as
avanzadas que pudieran presentar un mayor nivel de competencia.
PALABRAS CLAVE : Polı́tica monetaria, inflación óptima, Macreconomı́a, metas de inflación
1.
I NTRODUCCI ÓN
Un recomendación de polı́tica clásica dentro de la polı́tica monetaria es la
regla de Friedman. Dicha regla parte de la intuición de que el costo de oportunidad de tener dinero es igual a la tasa de interés nominal. Por lo tanto, una
polı́tica monetaria óptima minimizarı́a dicho costo de oportunidad al igualar la
tasa de interés nominal a cero. Eso implica que si existen tasas reales positivas,
para lograr una tasa de interés nominal igual a cero, la inflación debe ser negativa e igual en valor absoluto a la tasa de interés real.1 Como Schmitt-Grohé y
Uribe (2010) recalcan, aun con esta recomendación clásica de polı́tica, las metas de inflación de los bancos centrales son positivas. En ese mismo trabajo,
Schmitt-Grohé y Uribe introducen en distintos modelos una rigidez nominal
en la forma de demanda por dinero fiduciario para realizar transacciones (que
justificarı́a la regla de Friedman) con otro tipo de fricciones, con el fin de contrastar dichas fricciones e identificar cuál efecto domina a la hora de establecer
un nivel óptimo de inflación. Concluyen que la inflación óptima se encuentra,
según el modelo, en un intervalo entre el valor negativo de la tasa de interés
real (el valor que da la regla de Friedman) a valores insignificantes por arriba
de cero.
Como objeciones a la regla de Friedman, el principal argumento que se encuentra en la literatura es la rigidez nominal a la baja en los salarios. Desde
que Tobin (1972) argumentó que los salarios eran más rı́gidos a la baja que a la
alza y por lo tanto la inflación positiva podrı́a ser buena para la economı́a dado
que ésta engrasaba al mercado laboral, se ha considerado a la inflación un ingrediente importante para permitir que los salarios reales caigan ante choques
* Una versión anterior de este trabajo se presentó en el Concurso de carteles de investigación
económica para estudiantes de Economı́a del CEMLA, 2013.
** Economista de la Dirección General de Investigación Económica del Banco de México. Quiero
agradecer los comentarios de Jessica Roldán. Además, quiero reconocer a Luis Simon como coautor
en las etapas iniciales de este trabajo. Las opiniones expresadas en este artculo son responsabilidad
del autor y no necesariamente reflejan la postura del Banco de México. Cualquier error u omisión
es responsabilidad del autor.
1 Para un análisis con mayor profundidad sobre la regla de Friedman, se puede consultar Walsh
(2003).
60
J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA
adversos. Sobre esta idea, ha habido trabajos que refuerzan dichos argumentos, como Akerlof, et al (1996), o que calculan cuál es la inflación óptima bajo
esta rigidez, como Kim y Ruge-Murcia (2009).
El presente trabajo intenta presentar un nuevo enfoque a este problema y
agregar otro ingrediente a la discusión: una rigidez nominal en la forma de la
lenta difusión de la información en la economı́a. Dicha rigidez es presentada
en el trabajo de Mankiw y Reis (2002) y da entrada a otra justificación para que
la inflación óptima sea positiva. La idea detrás es que una fracción de monopolistas no observan el nivel de precios actual de la economı́a sino el anterior,
por lo tanto ponen su precio descontando un nivel de precios no actualizado.
Si existiera inflación positiva, estos monopolistas no subirı́an su precio acorde
a la inflación, por lo que el markup relativo al nivel de precios de la economı́a
es menor al que ellos hubieran querido. Esto tiene consecuencias positivas en
la economı́a. No obstante, la inflación también genera pérdidas en la economı́a
al generar dispersión en los precios relativos. Este enfoque nos permite contrastar entre dos distorsiones, los monopolistas y las rigideces nominales, y un
instrumento para intentar contrarrestar ambas, la inflación.
El trabajo continúa de la siguiente forma: la segunda sección presenta una
versión simplificada del modelo de Mankiw y Reis (2002), la tercera discute
cuál es el nivel de inflación óptimo y sus implicaciones, y la cuarta sección
concluye.
2.
M ODELO
El modelo a presentar es una versión simplificada del modelo de Mankiw y
Reis (2002). El modelo consta de familias que consumen y ofrecen trabajo, firmas productoras de bienes intermedios que utilizan trabajo como insumo para
producir en un ambiente de competencia monopolı́stica, una firma productora
de un bien final que utiliza como insumos los bienes intermedios y produce en
un ambiente de competencia perfecta, y una autoridad monetaria.
Se introduce rigideces nominales al no permitir que una fracción de las firmas productoras de bienes intermedios observen el nivel de precios actual de la
economı́a, sino el del periodo anterior. Como mencionan Mankiw y Reis (2002),
la introducción de esta rigidez intenta capturar el hecho de que la información
en la economı́a se mueve de manera lenta. Esta rigidez permite que las acciones de polı́tica monetaria no sean neutrales. Los monopolistas querrán poner
un precio por arriba de su costo marginal nominal, sin embargo, la fracción
de empresas que observa el nivel de precios anterior termina escogiendo un
precio que se desvı́a de aquél que escogerı́an si observaran el nivel de precios
actual. Entonces, con inflación positiva, estos monopolistas escogen un nivel
de precios menor al que hubieran escogido, disminuyendo el markup relativo
y ocasionando efectos positivos en la economı́a.
Aunque la inflación pueda modificar el precio que escoge una fracción de
los monopolistas que no observa el nivel de precios actual de la economı́a, ésta
no afecta a la fracción que sı́ puede observar el nivel de precios actual de la
M IGUEL Z ERECERO
61
economı́a. Además, el que haya inflación ocasiona que la fracción de empresas que sı́ observan el nivel de precios actual ponga precios distintos de los
productores que no pudieron observar el nivel de precios contemporáneo. Esta
dispersión en los precios puede generar una pérdida en la producción total.
Por lo tanto, la inflación puede tener efectos positivos en la economı́a por un
lado pero al mismo tiempo generar dispersión en los precios relativos y afectar
negativamente a la economı́a. Por ello, es posible encontrar un nivel óptimo de
inflación que tome en cuenta estos dos efectos.
2.1
FAMILIAS
Las familias consumen ct , ofrecen trabajo lt a un salario dado wt , invierten en un activo libre de riesgo bt que paga un tasa de interés rt y reciben las
ganancias por ser dueños de las empresas intermedias monopolı́sticas ⇧t . De
manera concreta, el problema de las familias se resume en escoger ct , lt y bt
para maximizar la siguiente expresión:
1
X
t
(ln ct + ln (1
(2.1)
lt ))
t=0
sujeto a la sucesión de restricciones:
ct + bt = wt lt + (1 + rt
1 ) bt 1
+ ⇧t
(2.2)
De dicho problema se pueden obtener las siguientes condiciones de optimalidad para cada t:
ct+1
= (1 + rt )
(2.3)
ct
ct
= wt
(2.4)
1 lt
2.2
E MPRESA PRODUCTORA DEL BIEN FINAL
La empresa productora del bien final opera en una ambiente competitivo y
utiliza como insumos bienes intermedios. Dicha empresa escoge Xt (i) 8 i para
maximizar la siguiente expresión:
Pt Y t
Z
1
0
Ptx (i)Xt (i)di
sujeto a la tecnologı́a que transforma bienes intermedios en finales:
Yt =
Z
"
1
Xt (i)
"
1
"
"
di
1
(2.5)
0
donde Yt es el bien final y Pt es su precio, Xt (i) es el bien intermedio i y Ptx (i)
es su precio.
62
J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA
Resolviendo el problema anterior para un bien intermedio genérico Xt (i)
se puede obtener la función de demanda para dicho bien:
Xt (i) =
✓
Ptx (i)
Pt
◆
"
(2.6)
Yt
donde " > 1 es la elasticidad intratemporal de sustitución entre distintas variedades de bienes intermedios. Por lo tanto, ante un mayor nivel de " más
sustituibles son los bienes intermedios y el poder de mercado de los monopolistas disminuye. Es decir, se podrı́a interpretar que ante un mayor nivel de ",
el nivel de competencia en la economı́a es mayor.
2.3
E MPRESAS PRODUCTORAS DE BIENES INTERMEDIOS
Existe un contı́nuo de empresas que producen bienes intermedios, representadas por el intervalo [0, 1] donde cada empresa produce una variedad distinta, lo que les permite tener poder de mercado. Es decir, operan en un ambiente de competencia monopolı́stica. Una caracterı́sitca adicional es que una
fracción ↵ de las empresas no pueden observar el nivel de precios contemporáneo de la economı́a a la hora de escoger su precio y en lugar observan el
nivel de precios del periodo anterior. El resto de las 1 ↵ empresas observan
el nivel de precios contemporáneo.
Una empresa intermedia i escoge su precio Ptx (i) y el nivel de trabajo lt (i),
tomando como dada la demanda por su tipo de bien y con la restricción de
que la producción debe igualar a la demanda dado el precio escogido. Es decir,
maximiza la siguiente expresión:
Ptx (i)
Xt (i)
PtE
wt lt (i)
sujeto a la demanda por dicha variedad (2.6) y a la función de producción:
Xt (i) = lt (i)
De lo anterior se puede obtener que el monopolista sólo escoge el precio Ptx (i)
buscando maximizar la siguiente expresión:

Ptx (i)
PtE
wt
✓
Ptx (i)
Pt
◆
"
Yt
La condición de optimalidad de resolver el problema anterior arroja la siguiente expresión:
✓
◆✓ E◆
"
Pt
x
Pt (i) =
(Pt wt )
" 1
Pt
donde:
PtE
=
⇢
Pt
Pt
1
i↵
i>↵
M IGUEL Z ERECERO
63
Es decir, para las ↵ empresas que no observan el nivel de precios contemporáneo, la condición de optimalidad es:
pN
t
y para el resto de las 1
✓
=
Ptx (i)
Pt
"
1
◆✓
1
⇡t
◆
(2.7)
(wt )
↵ empresas es:
pO
t
donde pN
t ⌘
"
✓
=
"
"
1
◆
(2.8)
(wt )
Ptx (i)
Pt
8i > ↵ y ⇡t ⌘ PPt t 1 .
⇣
⌘⇣ ⌘ ⇣
⌘
1
Los monopolistas cobran un markup, " " 1
o " " 1 sobre el costo
⇡t
marginal wt . De la ecuación (2.7) se puede notar que una inflación positiva
podrı́a reducir el markup de los monopolistas que no observan el nivel de precios adecuado. Lo que darı́a lugar a un aumento por la demanda de trabajo,
aumentando el salario real y a su vez la oferta de trabajo. Por lo tanto parecerı́a que una inflación igual a " " 1 serı́a lo ideal. No obstante y como se mostrará más adelante, al sólo ser una fracción ↵ de todas las empresas, la inflación
efectivamente reduce el markup de dicha fracción de empresas pero al mismo
tiempo genera una dispersión de precios entre la fracción que no observa el nivel de precios contemporáneos y la fracción que sı́ observa el nivel de precios
actual. Esta dispersión de precios genera pérdidas en la producción agregada
de la economı́a.
8i  ↵, pO
t ⌘
2.4
A GREGACI ÓN
Del problema de la empresa del bien final, se puede obtener una expresión
para el nivel de precios de la economı́a. Sustituyendo (2.6) en (2.5) se obtiene:
Pt =
Z
1
1
0
1
"
Ptx (i)1 " di
De esta última expresión se puede obtener:
1 = ↵ pN
t
1 "
+ (1
↵) pO
t
1 "
(2.9)
Para derivar una restricción agregada de la economı́a se toma la ecuación
que iguala la oferta por la demanda para un bien i y se integra sobre todo el
dominio
Z 1
Z 1✓ x ◆ "
Pt (i)
lt (i)di =
Yt di
Pt
0
0
lt = s t Y t
(2.10)
64
J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA
R1
donde lt = 0 lt (i)di y st es una medida de dispersión de los precios. Se expresa
la variable st de la siguiente forma:
st
=
=
Z
Z
1
0
↵
0
✓
Ptx (i)
Pt
"
pN
t
◆
"
di
di +
Z
1
↵
pO
t
"
di
Lo que al final da:
s t = ↵ pN
t
"
+ (1
↵) pO
t
"
(2.11)
O
Si ⇡t = 1, implica que pN
t = pt = 1 y por lo tanto st = 1 y no hay costo en la
producción por la dispersión de precios. En cambio, si la inflación fuera positiva, la medida de dispersión de precios serı́a mayor a uno generando pérdidas
en la producción. Es decir si ⇡ > 1, s > 1.
Finalmente, hay que notar que se vacı́a el mercado de bienes finales y se
tiene:
Yt = c t
(2.12)
2.5
E QUILIBRIO
Un equilibrio competitivo está definido como los procesos {ct , lt , rt , st , pN
t ,
pO
,
w
,
Y
}
tales
que
satisfagan
las
ecuaciones
(2.3),
(2.4),
(2.7),
(2.8),
(2.9),
(2.10),
t
t
t
(2.11) y (2.12), donde ⇡t es una variable que el gobierno escoge por medio del
banco central.
3.
I NFLACI ÓN ÓPTIMA
Con el modelo propuesto, se puede obtener un nivel de inflación que maximize el bienestar de las familias. Por un lado, una inflación positiva reduce
el markup de una fracción de monopolistas, pero por otro lado, crea una dispersión en los precios generando una pérdida en la producción agregada. En
este modelo, la deflación generarı́a mayores pérdidas en bienestar ya que magnificarı́a el markup cobrado por una fracción de los monopolistas y además
generarı́a dispersión en los precios relativos. Para evaluar cuál es el valor de la
inflación óptima, se escoge el valor de la inflación tal que maximize la utilidad
de las familias en el periodo t.2
De manera formal, la inflación óptima se obtendrı́a de resolver el problema
O
de Ramsey para el banco central el cuál consistirı́a en escoger {ct , lt , st , pN
t , pt ,
wt , Yt , ⇡t } para maximizar (2.1) sujeto a (2.3), (2.4), (2.7), (2.8), (2.9), (2.10), (2.11)
2 Suponiendo que no habrá cambios en la polı́tica y el carácter determinı́stico del modelo, maximizar la utilidad de un sólo periodo implica maximizar el valor presente de la utilidad para las
familias.
M IGUEL Z ERECERO
65
y (2.12).3 Considero innecesario derivar explı́citamente el problema de Ramsey
ya que no hay una solución cerrada para la inflación óptima. No obstante, a
continuación explico detalladamente la intuición sobre los determinantes de la
inflación óptima.
Por el lado de la rigidez nominal y el markup asociado a los monopolistas,
una inflación positiva disminuye dicho markup a una fracción de las empresas. Por otro lado, la dispersión que genera la inflación causa pérdidas en la
producción agregada. Entonces, los parámetros que definen qué efecto domina son " y ↵. El factor de descuento en esta economı́a, , no tiene importancia
a la hora de determinar el valor de la inflación óptima ya que el problema de
maximizar el valor presente de la utilidad equivale a maximizar la utilidad en
cualquier periodo, lo que implica que la utilidad es la misma en todos los periodos lo que a su vez implica que el consumo es constante y la ecuación de
Euler, que contiene al factor de descuento , es irrelevante. Entonces para una
combinación de parámetros " y ↵ se obtiene la inflación que maximiza la utilidad de las familias. Las Figuras 1 y 2 en el apéndice A muestran los resultados.
La Figura 2 es sólo un acercamiento de la Figura 1 para los valores bajos de ↵.
Tres resultados resaltan de las gráficas. En primer lugar, mientras más pequeño sea ", la inflación óptima es mayor. Esto ocurre porque si " es menor, el
markup cobrado por los monopolistas es mayor y para disminuirlo la inflación
debe ser mayor. Este resultado implica que mientras menor sea el grado de
competencia en la economı́a, es decir " sea mayor, la inflación óptima tendrı́a
que ser menor.
En segundo lugar, mientras la fracción ↵ de los monopolistas que no pueden observar el nivel de precios disminuye, la inflación óptima disminuye también. Es decir, el efecto que tiene la inflación en la dispersión de precios domina
al efecto de bajar el markup a la fracción ↵ de monopolistas.
En tercer lugar, cuando no hay rigidez nominal, es decir que todos los monopolistas observan el nivel de precios actual de la economı́a (↵ = 0) la inflación es irrelevante ya que no tiene efectos reales. Lo opuesto ocurre cuando
todos observan el nivel anterior de precios (↵ = 1), porque el efecto que tiene
la inflación para disminuir los markups de los monopolistas domina por completo al efecto de la dispersión en los precios ya que ésta no existe. Como todos
los monopolistas observan el nivel de precios anterior a la hora de optimizar,
todos escogen el mismo precio y por lo tanto no hay dispersión de precios y la
inflación óptima es el inverso del markup.
Las lı́neas punteadas en la Figura 2 marcan un intervalo que representan
una inflación de entre 2 % y 4 % anual.4 Algunos bancos centrales de distintos
3 Es importante mencionar que el problema relevante es el de Ramsey y no el del planeador
central. Un banco central escogerı́a la inflación óptima sujeto a las condiciones del equilibrio competitivo.
Por otro lado, la solución al problema del planeador central consistirı́a en escoger la inflación
igual a cero y los precios de los monopolistas iguales al costo marginal. De esta forma se elimina la
rigidez nominal (con la inflación igual a cero) y la distorsión causada por los monopolistas (precio
igual a costo marginal) y se alcanzarı́a el óptimo de Pareto.
4 Los niveles de inflación presentados en la Figura 1 son inflaciones de periodo contra periodo.
Siguiendo la convención en la literatura, en este trabajo se toma un periodo como un trimestre.
66
J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA
paı́ses, entre ellos Chile, Colombia y México, tienen sus metas de inflación en
dicho intervalo. Para varias configuraciones de los parámetros ↵ y ", la meta de inflación en dicho intervalo estarı́a en lı́nea con la inflación óptima. Sin
embargo, pueden encontrarse casos donde la competencia sea tan baja que, no
importando el nivel de rigideces nominales en la economı́a, la inflación óptima
se encuentre por arriba de dicho intervalo. Una estimación de los parámetros
↵ y ", que miden respectivamente el grado de rigidez nominal y de poder de
mercado de las empresas en la economı́a, podrı́an dar una idea de si el objetivo de inflación está en lı́nea con la inflación óptima dada por este modelo. No
obstante, dicha estimación está fuera de los alcances de este trabajo.
Otro punto importante es que en el presente modelo conviven dos distorsiones, la rigidez nominal y la competencia monopolı́stica, pero sólo un instrumento para corregir. Normalmente en los modelos con rigideces nominales
a la Calvo, para alcanzar el óptimo de Pareto se otorga un subsidio al trabajo (financiado vı́a impuestos lump sum) para contrarrestar la distorsión de los
monopolistas y la inflación se iguala a cero para no tener distorsiones en los
precios relativos causadas por las rigideces nominales. En ese tipo de modelos la polı́tica monetaria no puede corregir el problema de los monopolistas y,
como demuestran Schmitt-Grohé y Uribe (2010) si la herramienta de polı́tica
de los subisidios al trabajo no está disponible, la inflación óptima sigue siendo
cero. Este serı́a un escenario más apegado a la realidad dado que los subsidios
al trabajo implicarı́an un impuesto negativo al ingreso laboral, lo cuál serı́a una
polı́tica poco realista.
A diferencia de los modelos con rigideces nominales a la Calvo, en el modelo del presente trabajo, la polı́tica monetaria sı́ puede afectar la distorsión de
los monopolistas. Si se tuviera otro instrumento, como los subsidios al trabajo,
éstos podrı́an encargarse de la distorsión de los monopolios, y al igualar la inflación a cero se alcanzarı́a el óptimo de Pareto. No obstante, es muy probable
que la polı́tica fiscal no opere de dicha forma en la realidad, y la abstracción
en el presente modelo de dicho instrumento parece ser más realista, dejando
como único instrumento a la polı́tica monetaria.
4.
C ONCLUSIONES
En este trabajo se presenta una versión simplificada del modelo de Mankiw y Reis (2002) que permite dar una justificación a los bancos centrales de
tener una meta de inflación positiva. Otros trabajos han buscado justificar que
los bancos centrales mantengan una inflación positiva justificándose principalmente en la rigidez nominal a la baja en los salarios. La justificación que se
presenta en este trabajo se basa en otro tipo de rigidez nominal. Por otro lado,
además de justificar un objetivo de inflación positivo, el trabajo intenta también tomar en cuenta los aspectos negativos de la inflación capturados en la
ineficiente dispersión de precios, en lı́nea con los trabajos de Yun (2005) y de
Woodford (2003). Por lo tanto, aunque la inflación en el modelo de Mankiw y
Reis (2002) puede tener aspectos positivos al disminuir el markup cobrado por
M IGUEL Z ERECERO
67
los monopolistas, ésta también tiene aspectos negativos y da cabida a buscar
un nivel de inflación que maximize la utilidad de las familias. Para una combinación de parámetros que representan el nivel de competencia y de rigideces
nominales en la economı́a se calcula el nivel de inflación óptimo. Se encuentra
que mientras menor sea el nivel de competencia de una economı́a, la inflación
óptima es mayor y mientras menores sean las rigideces nominales, la inflación
óptima es menor.
El objetivo de este trabajo no es asegurar que los objetivos de inflación de
los bancos centrales deban de ser positivos y que la regla de Friedman esté descartada. Simplemente es agregar otra consideración al debate de cuál es la inflación óptima, en este caso serı́a el nivel de competencia en una economı́a,
utilizando como marco un modelo con rigideces en la propagación de la información en la economı́a.
Para poder asegurar cuál debe ser el nivel de inflación óptimo, éstas rigideces deben de ser contrastadas con otras rigideces que justifiquen la aplicación
de la regla de Friedman, como por ejemplo introducir una demanda por dinero
fiduiciario con el objetivo de realizar transacciones. Igual se debe de contrastar
con otro tipo de rigideces, como la rigidez nominal a la baja de los salarios, rigideces en cambio de precios, etcétera. Un modelo que incorporara todos estos
tipos de rigideces podrı́a determinar, estimado o bajo calibraciones plausibles,
qué efecto domina y cuál debe de ser el nivel de inflación óptima. Al respecto,
el trabajo de Kim y Ruge-Murcia (2011) explora qué efecto domina entre dos
distorsiones. La primera es una demanda por dinero fiduiciario que mitiga el
costo de realizar transacciones, y que sugiere una inflación óptima negativa
(regla de Friedman). La segunda distorsión es una rigidez nominal a la baja en
los salarios, que sugiere una inflación óptima positiva para, como decı́a Tobin,
engrasar al sector laboral. Estos autores que para una estimación con datos de
la economı́a de Estados Unidos el efecto de la rigidez en los salarios domina y
la inflación óptima es positiva y alrededor de 0.4 %.
El presente trabajo, en combinación con los resultados de Kim y RugeMurcia (2011), podrı́a sugerir entonces que es adecuado que paı́ses en vı́as de
desarrollo tengan objetivos de inflación mayores a los que sugiere dicho trabajo ya que presentan menor grado de competencia en sus economı́as que en la
economı́a de Estados Unidos.
R EFERENCIAS
[1] Akerlof, G. A., Dickens, W. T., Perry, G. L., Gordon, R. J., & Mankiw, N. G. (1996). The macroeconomics of low inflation. Brookings papers on economic activity, 1996(1), 1-76.
[2] Kim, J., & Ruge-Murcia, F. J. (2009). How much inflation is necessary to grease the wheels?.
Journal of Monetary Economics, 56(3), 365-377.
[3] Kim, J., & Ruge-Murcia, F. J. (2011). Monetary policy when wages are downwardly rigid: Friedman meets Tobin. Journal of Economic Dynamics and Control, 35(12), 2064-2077.
[4] Mankiw, N. G., & Reis, R. (2002). Sticky information versus sticky prices: a proposal to replace
the New Keynesian Phillips curve. The Quarterly Journal of Economics, 117(4), 1295-1328.
[5] Schmitt-Grohé, S., & Uribe, M. (2010). The optimal rate of inflation (No. w16054). National
Bureau of Economic Research.
J USTIFICACI ÓN PARA TENER UNA META DE INFLACI ÓN POSITIVA
68
[6] Tobin, J. (1972). Inflation and unemployment. American Economic Review, 62(1), 1-18.
[7] Yun, T. (2005). Optimal monetary policy with relative price distortions. American Economic
Review, 89-109.
[8] Walsh, C. E. (2010). Monetary Theory and Policy. MIT Press Books, 1.
[9] Woodford, M. (2011). Interest and prices: Foundations of a theory of monetary policy. Princeton
University Press.
A.
F IGURAS
F IGURA 1: I NFLACI ÓN QUE MAXIMIZA BIENESTAR
1.20
ε=7
ε=9
ε=11
ε=8
ε=10
ε=12
1.15
1.10
1.20
1.05
1
0.9
0.8
0.7
0.6
1.15
1.00
0.5
0.4
0.3
ε=8
ε=10
ε=12
0.2
0.1
0
ε=7
ε=9
ε=11
1.10
1
0.9
0.8
0.7
ε=12
0.6
ε=11
0.5
ε=10
0.4
ε=9
0.3
ε=8
0.2
ε=7
0.1
0
El eje horizontal representa distintos valores de ↵.
1.05
El eje vertical representa valores de inflación
de la forma ⇡t =
1.020
Pt
Pt 1 .
1.00
1.015
F IGURA 2: I NFLACI ÓN QUE MAXIMIZA BIENESTAR ( ACERCAMIENTO )
1.010
ε=7
ε=8
ε=9
ε=10
ε=11
ε=12
1.020
1.005
0.4
0.3
0.2
0.1
0
1.015
1.000
1.010
1.005
0.4
0.3
0.2
0.1
0
1.000
El eje horizontal representa distintos valores de ↵.
El eje vertical representa valores de inflación de la forma ⇡t =
Pt
Pt 1 .
69
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO
MEXICANO
R OMAN A COSTA
¿Es posible que el votante mexicano se comporte estratégicamente a pesar de tener presente en el momento de la elección la representación proporcional? Para contestar esta pregunta
se propone un modelo teórico para representar la distorsión en los incentivos de los votantes
introducida por el doble propósito de la boleta electoral México: el de mayorı́a relativa y el de
representación proporcional . El trabajo comienza por caracterizar la correspondencia de mejor
respuesta de los votantes para después mostrar qué condiciones sobre los parámetros del modelo son necesarias y suficientes para sostener la presencia de voto estratégico por parte de los
votantes. A continuación, se muestra que el grado de la proporcionalidad percibido por los votantes del sistema mixto de elección está inversamente relacionado con la posibilidad de que se
presente voto estratégico en la elección. Se continúa con una extensión del modelo para finalizar
explorando datos de elecciones locales mexicanas para probar la hipótesis derivada del modelo
teórico.
PALABRAS CLAVE : elección social, sistema mixto, economı́a polı́tica, sistema electoral
1.
I NTRODUCCI ÓN
El que un votante elija en las urnas a un partido distinto a su favorito se
conoce como votar estratégicamente. De acuerdo con Poiré (2000), en las elecciones intermedias de 1997 alrededor del 10 % de la votación emitida por el
electorado mexicano se vio motivada por este comportamiento estratégico de
los votantes, coloquialmente llamado “voto útil”. Según Poiré, en esta elección
el voto útil fue ejercido por los votantes para bloquear al partido que llevaba
una clara ventaja en la contienda electoral, el Partido Revolucionario Institucional (PRI).
El estudio del comportamiento estratégico de los votantes ha logrado algunos consensos sobre la composición de los sistemas polı́ticos en donde el
voto estratégico está presente. Uno de ellos, es la llamada Ley de Duverger.
Duverger (1955) expone que en los sistemas electorales que usan la regla de
pluralidad en distritos donde se reparte un solo asiento, se tiende a favorecer la
conformación de sistemas bipartidistas. El mecanismo detrás de este resultado
es el siguiente: el dı́a de la elección los votantes deciden por qué partido emitir
su voto de acuerdo a sus preferencias sobre los partidos que compiten en la
elección. Bajo la regla de pluralidad sólo hay un ganador por lo que el votante
se da cuenta que votar por su partido preferido puede resultar en “desperdiciar” su voto si éste no tiene posibilidades reales de ganar. Ası́, el votante se
enfrenta al siguiente dilema: votar por su partido favorito y “desperdiciar” su
voto o elegir su segunda mejor opción con posibilidades reales de ganar.
Es importante notar que el principal supuesto bajo el cual funciona este
mecanismo es la regla de pluralidad. En el caso del sistema electoral mexicano, éste supuesto no se cumple. La Constitución Polı́tica Mexicana dice en su
artı́culo 52 lo siguiente:
“La Cámara de Diputados estará integrada por 300 diputados electos según el
principio de votación mayoritaria relativa, mediante el sistema de distritos electorales
70
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
uninominales, y 200 diputados que serán electos según el principio de representación
proporcional, mediante el Sistema de Listas Regionales, votadas en circunscripcionales
(sic DOF 15-12-1986) plurinominales”.
Es decir, en México el 40 % de los diputados federales se eligen por el principio de representación proporcional. Este hecho sobre la legislación electoral
mexicana pone en duda si los incentivos a los que se enfrenta el electorado mexicano en una elección distrital para diputados uninominales son los mismos a
los generados por la regla de pluralidad simple (en un contexto sin diputados
plurinominales).
Un votante mexicano sabe que el partido que obtenga la diputación en su
distrito se elegirá por el principio de mayorı́a relativa, sin embargo, su voto
también contabilizará a favor de ese mismo partido para calcular la proporción del voto a favor de este último dentro de la votación nacional emitida1 .
Esta última consideración podrı́a distorsionar el mecanismo que genera los resultados de la Ley de Duverger.
Esta peculiaridad de las elecciones en México se explica por una caracterı́stica del voto. La misma boleta con la que se vota para diputados uninominales forma parte de la votación nacional emitida y es tomada en cuenta
en el cálculo a realizarse para la repartición de diputaciones por el principio
de la representación proporcional. Es por esta razón que el sistema electoral
mexicano puede ser considerado como un sistema de elección mixto como lo
mencionan Blais y Massicotte (1999).
La principal motivación del presente trabajo es estudiar la distorsión que
este doble propósito de la boleta electoral genera en los incentivos de los votantes. En particular, es de interés explorar si los incentivos del votante a no
“desperdiciar” su voto podrı́an ser mitigados por el deseo de que su partido
favorito gane diputaciones por la vı́a proporcional.
En este trabajo de investigación se analiza si es posible que el votante mexicano se comporte estratégicamente a pesar de tener presente en el momento
de la elección el factor de representación proporcional. De ser ası́, se estudia
qué condiciones son necesarias y/o suficientes para sostener este comportamiento de los votantes. Finalmente, se contrastan los resultados obtenidos del
modelo teórico con datos de las elecciones en México.
En la Sección 2 se hace una revisión de la literatura sobre sistemas de elección mixtos. En la Sección 3 se desarrolla un modelo sencillo que describe el
problema de elección al que se enfrenta un votante mexicano en comicios distritales. En la Sección 4 se hace una extensión del modelo. En la Sección 5 se
exploran datos de elecciones locales mexicanas para probar la hipótesis derivada del modelo teórico. En la Sección 6 se concluye.
1 El Código Federal de Instituciones y Procedimientos Electorales define el concepto de votación
nacional como “la suma de todos los votos depositados en las urnas”.
R OMAN A COSTA
2.
71
R EVISI ÓN DE LA LITERATURA
Una de las formas más reconocidas del voto estratégico en la literatura
se suscita en las elecciones que usan la regla de pluralidad simple. Duverger
(1955) estudió las implicaciones de este comportamiento estratégico en elecciones celebradas en distritos que reparten un solo asiento. La llamada “Ley de
Duverger” nos dice que el uso de la regla de pluralidad en elecciones distritales que reparten un solo asiento tienden a producir sistemas bipartidistas, es
decir que la votación efectiva se concentrará en dos partidos.
Si bien el modelo que proponemos (antes de la extensión a n votantes) sólo
considera 3 votantes, en la literatura se encuentran trabajos que utilizan este
supuesto. Por ejemplo, Cox (1984) propone un modelo de tres votantes en una
elección de dos asientos para comenzar a elucidar el problema de escoger más
de un asiento en un distrito.
Palfrey (1989) construye un modelo que logra demostrar que los equilibrios
resultantes en elecciones con la regla de pluralidad tienen caracterı́sticas duvergianas, en el sentido de que sólo dos partidos obtienen los votos del electorado.
A la par encuentra que también es posible que el voto se concentre en tres partidos, siempre y cuando los partidos perdedores estén virtualmente empatados
(equilibrios no duvergianos). Un aspecto notable de las conclusiones de Palfrey (1989) es que sugieren que los equilibrios no duvergianos son difı́ciles de
sostener.
Posteriormente, Cox (1994) generaliza este resultado a elecciones donde se
reparten M asientos. En otras palabras, Cox muestra que en una elección donde
se reparte un número M de asientos el número de partidos que concentrarán
la mayorı́a de los votos será de M + 1. Asimismo, Cox (1994) establece una
metodologı́a para buscar evidencia de voto estratégico en datos de elecciones.
Esta metodologı́a consiste en construir un ratio de votos del segundo al primer
perdedor a nivel distrital. Ratios cercanos a 0 sugieren equilibrios duvergianos
y ratios cercanos a 1 sugieren equilibrios no duvergianos. Esta metodologı́a
será utilizada en la Sección 4 del presente trabajo.
Los resultados anteriores no contemplan el factor de representación proporcional presente en las elecciones mexicanas. La literatura sobre los sistemas que utilizan reglas hı́bridas de representación proporcional y pluralidad
es más reciente. Blais y Massicotte (1999) se dieron a la tarea de reunir el trabajo
previo al respecto para llegar a una definición de este tipo de sistemas electorales. Ellos deciden nombrar “sistemas mixtos” a los sistemas electorales cuya
mecánica involucre la combinación de distintas “fórmulas electorales”, en el
caso de México pluralidad y representación proporcional.
A pesar de que los sistemas mixtos ya han sido definidos, dentro de este
grupo de sistemas electorales existen diferencias en cuanto a la estructura de
la boleta electoral ya que en algunas elecciones se usa la misma boleta para
la parte proporcional y mayoritaria de la elección. Ferrara (2006), estudiando
información de elecciones italianas, encuentra diferencias significativas entre
tener dos boletas para cada regla y una sola para ambas como sucede en México. Es por esto que modelos como el de Rozenas y Soskice (2008) donde se
72
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
utilizan boletas distintas para cada fórmula podrı́an dejar de capturar algunas
caracterı́sticas importantes de la situación mexicana.
El modelo que proponemos para analizar este sistema electoral asume tres
partidos que contienden por un asiento en el congreso. Aunque parece un supuesto fuerte no es completamente inusual en la literatura2 . Como expone
Martinelli (2002), el supuesto de tres candidatos “reales” en una elección es
consistente con algunas elecciones recientes en América Latina; por ejemplo
las pasadas elecciones presidenciales en México.
Algunos de los trabajos sobre el sistema mixto mexicano son los siguientes: Calvo y Medina (2002) describen como un candidato puede aumentar sus
posibilidades de terminar electo si su partido pierde votos bajo el sistema mexicano, Kerevel (2010) analiza la diferencia en participación, organización y
disciplina de los partidos en el Congreso a causa del sistema mixto, Molinar
y Weldon (2003) hacen un recuento de todo el proceso de reforma del sistema mixto mexicano hasta llegar al actual y Weldon (2003) describe las posibles
consecuencias de las últimas reformas electorales en el sistema polı́tico mexicano.
Como se expuso en el párrafo anterior, el trabajo realizado sobre el sistema de elección de diputados en México es extenso y toca diversos temas; sin
embargo, hasta donde el autor tiene conocimiento, no ha habido intentos por
derivar un modelo del sistema mixto mexicano que utilice una sola boleta con
una doble función considerando el efecto de la representación proporcional.
El presente trabajo tiene como objetivo presentar un modelo sencillo que
contribuya a la discusión sobre la presencia del voto estratégico en las elecciones a diputados en México y sus posibles consecuencias sobre los resultados
de estos comicios.
3.
M ODELO
Se supone la existencia de tres votantes i 2 {1, 2, 3} que eligen a un partido
entre tres competidores {P1 , P2 , P3 }, bajo la regla de pluralidad simple, es decir, el partido con el mayor número de votos gana la elección. Cada votante i
tiene una función de utilidad Ui que se compone de dos partes: la primera es
la utilidad que obtiene del triunfo de cada partido en la elección y la segunda
es la utilidad que obtiene de votar por su partido favorito, la cual pretende incorporar el efecto de la representación proporcional del sistema electoral en la
función de utilidad del individuo.
La función de utilidad del individuo i proveniente de su voto y el triunfo
de su k-ésimo partido preferido se puede expresar como sigue:
(
uik +
si i vota por su primer f avorito
Ui =
uik
en cualquier otro caso.
2 Martinelli (2002) y Fey (1997) también utilizan el supuesto de tres candidatos en los modelos
que proponen en sus respectivos trabajos mientras que Magaloni (1996) calcula el ı́ndice de Laakso
y Taagepera para medir el número efectivo de partidos en las elecciones en México para diputados
federales de 1994 el cual es igual a 2.87.
R OMAN A COSTA
73
F IGURA 1: N IVEL DE UTILIDAD DEL PRIMER COMPONENTE POR PARTIDO GANADOR
Se define al primer componente como sigue3 : sea ui = {ui1 , ui2 , ui3 } donde
representa la utilidad que obtiene el individuo i de la victoria del partido
k. Se normaliza4 a 1 la utilidad que obtiene al individuo que gane su partido
preferido, es decir max{ui } = 1, de igual forma min{ui } = 0, esto para toda i.
La utilidad que obtiene del triunfo de su segundo partido favorito será un
número u donde 0 < u < 1 y se supondrá que es igual para todos los individuos5 . Debido a que se suponen sólo tres partidos en la elección, se sabe que
existen 6 diferentes tipos de perfiles de preferencias:
uik
– Tipo 1. P1
P2
P3
– Tipo 2. P1
P3
P2
– Tipo 3 .P2
P3
P1
– Tipo 4. P2
P1
P3
– Tipo 5. P3
P2
P1
– Tipo 6. P3
P1
P2
La Figura 1 muestra el nivel de utilidad que obtiene cada tipo de preferencias
del primer componente de su utilidad, es decir, de la parte de su utilidad que
sólo depende del partido que gane la elección.
El segundo componente será el de representación proporcional, > 0 y
sólo estará presente cuando el individuo i vote por su primer partido favorito6 .
3 La
notación sigue a la de Cox (1994).
normalización se propone siguiendo a Cox (1994).
5 Como se verá en la Proposición 1, suponer u igual para todos los votantes le resta al modelo la
capacidad de hablar sobre intensidad de voto estratégico en el electorado. Es decir, este supuesto
lleva a concluir que bajo ciertas condiciones “todos podrı́an votan estratégicamente” o que “nadie
podrı́a votar estratégicamente”.
6 Existen dos consideraciones que vale la pena hacer sobre . Primero, la valoración de un elector
de un diputado uninominal y de uno plurinominal puede ser distinto. Por ejemplo, un diputado
del distrito de Uruapan podrı́a estar más interesado en temas de la región, como los apoyos a la
producción de aguacate, mientras que un diputado plurinominal podrı́a estar más interesado en
4 La
74
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
Se supone que ambos componentes entran a la función de utilidad de manera
lineal.
En caso de un empate se asume que los tres partidos tienen la misma probabilidad de ganar, y consecuentemente la utilidad es el valor esperado.
Antes de continuar introduciremos un poco de notación. Se llamará P ij al
j-ésimo partido preferido del individuo i de tal forma que P1i i P2i i P3i ,
ui1 > ui2 > ui3 .
Una de las razones por las que se comenzó el estudio de una elección con
este tipo de preferencias es la de averiguar si existe comportamiento estratégico. Esta pregunta se traduce en la siguiente cuestión: bajo este contexto, ¿Los
votantes emiten su voto alguna vez por algún partido distinto a su primer favorito?, o en otras palabras, ¿Pertenece P2i a la imagen de la correspondencia
de mejor respuesta del votante i? Para responder formalmente esta pregunta
se comenzará por definir la correspondencia de mejor respuesta.
El espacio de estrategias para cada individuo i es ⌦i , donde !i 2 ⌦i representa una estrategia en el espacio de estrategias ⌦i . En este caso, las estrategias
de cada individuo son votar por uno de los partidos contendientes en la elección resaltando que no es posible anular el voto o ausentarse de la votación.
Asimismo, ⌦ i representa el espacio de estrategias de los individuos distintos
a i y ! i 2 ⌦ i es un vector con las estrategias de los individuos distintos a i,
! i = {!j , !k } donde i 6= k 6= j.
Definición 1 (Mejor respuesta). Para cada votante i su correspondencia de Mejor
Respuesta M Ri : ⌦ i ! ⌦i . También, !i 2 M Ri (! i ) si Ui (!i , ! i ) Ui (!i⇤ , ! i )
8 !i⇤ 2 ⌦i .
Intuitivamente, la presencia de un factor de representación proporcional ( )
en la utilidad de los votantes podrı́a hacer parecer que no es posible observar
comportamiento estratégico por parte de los votantes ya que la representación
proporcional refuerza los incentivos del electorado a votar por su favorito. Sin
embargo, la Proposición 17 nos dice que esto es posible si se cumplen ciertas
condiciones, en particular nos dice que un individuo emitirá un voto a favor
de un partido distinto a su favorito si el pago que le deriva el triunfo de su segundo partido preferido (u) es lo suficientemente alto mientras que la utilidad
que obtiene del aumento de la proporción de votos de su partido favorito ( )
es lo suficientemente baja.
Proposición 1 (Voto estratégico).
8i, P2i = !i 2 M Ri (⌦ i ) ()

2u
1
3
seguir la agenda del Ejecutivo Estatal. En segundo lugar, bajo una regla de representación proporcional en un congreso continuo siempre es mejor votar de manera sincera, por lo que el supuesto
de que sólo al votar por su favorito el individuo se lleva la utilidad es razonable.
7 La demostración de ésta y de todas las proposiciones subsecuentes se encuentran en el apéndice.
R OMAN A COSTA
C UADRO 1: U TILIDAD
QUE OBTIENE EL INDIVIDUO
i
75
DE CADA CONJUNTO DE ESTRA -
TEGIAS
P1i
P2i
P3i
(P1i , P1i )
1+
1
1
(P2i , P2i )
u+
u
u
(P3i , P3i )
0
0
(P1i , P2i )
1+
u
(P1i , P3i )
1+
1+u
3
0
1+u
3
(P2i , P3i )
1+u
3 +
u
0
El Cuadro 1 ilustra la utilidad del individuo i en todos los posibles escenarios (se omiten los pares de estrategias que son repetitivas). De la inspección
visual, es claro que el votante i jamás votará por su tercer partido favorito, ya
que en todos los casos obtiene mayor o igual utilidad votando por P2i y estrictamente mayor utilidad en todos los casos votando por P1i .
Sin embargo, no es claro si P1i es mejor estrategia que P2i . Esto se debe a
que cuando el individuo i se enfrenta a las estrategias (P2i , P3i ) tiene que hacer
la comparación de 1+u
(votar por P1i ) y u (votar por P2i ). De esta manera
3 +
se hace evidente que la única manera en que P2i sea mejor respuesta es si u
es mayor a 1+u
3 + , condición que es equivalente a la que estudiamos en la
Proposición 1.
Una vez que se ha verificado que en este contexto sı́ cabe la posibilidad
de observar comportamiento estratégico por parte de los votantes, nuevas preguntas surgen con respecto al sistema de votación que estamos analizando; sin
embargo, antes de continuar conviene analizar con más detalle la correspondencia de mejor respuesta de los votantes. Debido a que es de interés estudiar
el ambiente con voto estratégico, a lo largo de este trabajo se considerará el
supuesto de que es pequeña, i.e. < 2u3 1 .
Proposición 2 (Mejor respuesta). Sea !
es una función y
M Ri (! i ) =
8
i
>
< ! i = P2 ;
>
:
!i = P1i ;
i
si !
2 ⌦ i . Si
i
<
2u 1
3 ,
entonces 8i M Ri
2 {(P2i , P3i ), (P3i , P2i )}
en cualquier otro caso.
En lo resta del presente trabajo se estudiarán algunas caracterı́sticas del sistema electoral descrito anteriormente. Para esto, se analizarán los posibles resultados electorales caracterizados en este contexto por equilibrios de Nash en
estrategias puras. Para poder acotar el estudio de los resultados electorales a
los equilibrios de Nash en estrategias puras conviene primero cerciorarse de
que en este ambiente siempre será posible encontrar un equilibrio de este tipo.
La Proposición 3 garantiza que esto ocurre.
Proposición 3 (Existencia). Para cualquier perfil de preferencias existe al menos un
equilibrio de Nash en estrategias puras.
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
76
Una vez que se ha verificado la existencia de equilibrios de Nash en estrategias puras vale la pena detenerse a analizar las implicaciones de estos resultados en una elección que se realiza en este contexto. Lo primero que se nota
es que la correspondencia de mejor respuesta observada bajo la regla de pluralidad simple tiene una imagen con una cardinalidad mayor que en el caso
de la regla mixta. Esto se debe a que bajo la regla de pluralidad un votante es
indiferente ante votar por cualquiera de los tres partidos cuando se enfrenta a
una elección que ya está definida, por lo que 8i {P1i , P2i , P3i } 2 M Ri .
Cuando pasamos a un sistema con una regla de elección mixta los votantes
tienen un incentivo a votar por su partido favorito inclusive cuando la elección
ya está definida, reduciendo la cardinalidad de la imagen de su correspondencia de mejor respuesta. Cuando el factor de representación proporcional es
pequeño, el tercer partido preferido sale de la imagen de la correspondencia
de mejor respuesta de cada votante e incluso convierte a la correspondencia
en una función8 mientras que cuando el factor de representación proporcional
es grande, el único elemento sobreviviente en la imagen de la mejor respuesta
de los votantes es su favorito, y para cualquier perfil de preferencias el único
equilibrio en estrategias puras es (!1 , !2 , !3 ) = (P11 , P12 , P13 ).
De esta forma es posible concluir que la cardinalidad de la imagen de la
correspondencia de mejor respuesta es decreciente respecto a , es decir, un
votante ve limitadas sus opciones de voto mientras más grande sea el peso que
le asigne a la parte de representación proporcional de su voto. Consecuentemente, esta reducción en su espacio de mejores respuestas reduce el número de
equilibrios donde podrı́amos observar voto estratégico (entendido como votar
por un partido distinto a su favorito) del electorado. Este resultado se muestra
en el siguiente corolario de la Proposición 1 y la Proposición 2.
Corolario 1. La cardinalidad de M Ri (⌦ i ) es decreciente en .
Demostración. Si = 0 estamos en el caso de pluralidad simple por lo que si
una elección está definida al individuo i le da igual por quien votar, por lo
que los tres partidos forman parte de la imagen de M Ri . Si 0 <
 2u3 1
de la Proposición 2 y la Proposición 1 se sigue que #M Ri (⌦ i ) = 2. Si >
2u 1
por la Proposición 1 sabemos que P2i no forma parte de la imagen del
3
mejor respuesta de i y como los individuos nunca votan por su primer favorito
cuando > 0, tenemos que M Ri (! i ) = P1i 8 ! i 2 ⌦ i )#M Ri (⌦ i ) =
1.
Otro resultado relacionado con las observaciones anteriores es que el conjunto de los posibles equilibrios de Nash en estrategias puras también disminuye mientras las imágenes de las mejores respuestas se “reducen”. Notemos que mientras u sea mayor a un medio, bajo la regla de pluralidad simple
P2i = !i 2 M Ri (P2i , P3i ) ya que u > 12 ) u > 1+u
3 . Si comparamos la correspondencia de mejor respuesta bajo la regla de pluralidad simple (M Rip ) con u > 12
8 Excepto
para
=
2u 1
,
3
como se observó en la Proposición 2.
R OMAN A COSTA
77
m
contra la función de mejor respuesta bajo la regla mixta (M Ri ) con < 2u3 1
m
podemos notar que M Ri (! i ) 2 M Rip (! i ) 8! i ya que son iguales excepto
en los casos donde la elección está definida9,10 :
8
i
>
< ! i = P2 ;
p
M Ri (! i ) = !i 2 {P1i , P2i , P3i }
>
:
!i = P1i ;
m
M Ri
(! i ) =
8
i
>
< ! i = P2 ;
>
:
!i = P1i ;
si ! i 2 {(P2i , P3i ), (P3i , P2i )}
si ! i 2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )}
en cualquier otro caso.
si !
i
2 {(P2i , P3i ), (P3i , P2i )}
en cualquier otro caso.
De esta forma, el factor de representación proporcional funciona como un
mecanismo de “depuración” pues elimina aquellos equilibrios donde los votantes son indiferentes debido a que la elección está definida. El siguiente ejemplo ilustra el punto anterior. Siguiendo la discusión de Poiré (2000) y de Magaloni (1996) se toma el siguiente perfil de preferencias:
– P RI
1
P AN
1
P RD
– P AN
1
P RD
1
P RI
– P RD
1
P AN
1
P RI
El siguiente cuadro expone algunos equilibrios de Nash con
y grande.
= 0,
pequeña
C UADRO 2: E QUILIBRIOS EN ESTRATEGIAS PURAS
Pluralidad ( = 0)
Regla mixta ( <
2u 1
)
3
Rep. proporcional ( >
2u 1
)
3
Equilibrios
(PRI,PAN,PAN)
(PRI,PRD,PRD)
(PAN,PAN,PRD)
(PAN,PAN,PAN)
(PRD,PRD,PRD)
(PRI,PRI,PRI)
(PRI,PAN,PAN)
(PRI,PRD,PRD)
(PAN,PAN,PRD)
(PRI,PAN,PRD)
Total
6
3
1
9 En la descripción de la mejor respuesta bajo la regla de pluralidad estamos suponiendo que
los votantes no eliminan estrategias débilmente dominadas !i = P3i ).
10 Para demostrar que esta es la forma de M Rp (! ) se pueden usar los mismos argumentos
i
i
que en la Proposición 2. Añadiendo el hecho de que cuando la elección está definida, el individuo i se encuentra indiferente por quién votar, por lo que {P1i , P2i , P3i } 2 M Rip (! i ) si ! i 2
{(P1i , P1i ), (P2i , P2i ), (P3i , P3i )}
78
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
Sabemos que los equilibrios en el caso de > 2u3 1 se reducen a votar de
manera sincera. En el caso de < 2u3 1 tenemos equilibrios donde hay voto
estratégico. De hecho 2 de 3 equilibrios son anti PRI en el sentido de que los individuos que prefieren al PRI en tercer lugar votan juntos para bloquearlo. Por
último, en el caso con con = 0 existen otros posibles equilibrios, incluyendo
aquellos existentes bajo la regla mixta11 . Estos equilibrios son los que se presentan cuando la elección está decidida desde el punto de vista del individuo,
por lo que votar por cualquier partido es una mejor respuesta.
En la siguiente sección se relajará el supuesto de 3 votantes en aras de investigar si los resultados obtenidos en la presente sección se mantienen.
4.
E XTENSI ÓN DEL MODELO : n VOTANTES
En esta sección se estudia el modelo descrito con anterioridad relajando el
supuesto de tres votantes. En particular es de interés saber si el voto estratégico
sigue presente en este contexto.
Se comienza por mostrar que la misma condición impuesta sobre los parámetros y u es suficiente para observar voto estratégico. Para esto se define M Ri .
Proposición 4. Sea n el número de votantes, i 2 {1, 2, ..., n}, con ⌦i y ⌦ i definidas
como el modelo con tres votantes12 : M Ri : ⌦ i ! ⌦i , < 2u3 1 , Ai = {!k 2 ⌦ i :
!k = P1i }, B i = {!k 2 ⌦ i : !k = P2i } y C i = {!k 2 ⌦ i : !k = P3i }. La mejor
respuesta para el votante i es la siguiente:
M Ri (! i ) =
(
!i = P2i ;
!i = P1i ;
si (#C i #B i ) 2 {0, 1} y #Ai < #B i
en cualquier otro caso
De esta manera, es posible constatar que la relación entre el nivel de proporcionalidad en la elección , y la decisión de votar estratégicamente por parte
de los individuos se mantiene al relajar el supuesto de tres votantes.
En la sección siguiente se presenta un análisis empı́rico de las pasadas elecciones de diputados locales de cada estado de la República Mexicana. El objetivo de la siguiente sección es comenzar la discusión sobre la posibilidad de
que el sistema mixto mexicano disuada de forma efectiva el voto estratégico o
hablando en términos del modelo estudiado, si el factor de representación proporcional en los diferentes estados del paı́s es lo suficientemente grande como
para eliminar la posibilidad de observar el voto estratégico en las elecciones a
diputados locales a través de los estados mexicanos.
11 Asumiendo
12 Con
u > 12 .
la diferencia de que ahora !
i
= (!1 , !2 , ..., !i
1 , !i+1 , ..., !n ).
R OMAN A COSTA
5.
79
E LECCIONES EN M ÉXICO
Para el análisis empı́rico se utilizará la razón de diputados plurinominales a diputados uninominales13 (sea p/u esta razón) para cada estado como un
proxy del valor que los votantes asignan al factor de representación proporcional dentro de cada estado.
Para determinar la existencia de voto estratégico seguimos la metodologı́a
sugerida por Cox (1994): se toma el ratio del número de votos del tercer lugar
de la elección al número de votos del segundo lugar en la elección (se llamará a
este ratio SF 14 ), en presencia de voto estratégico este ratio deberı́a estar cercano a 0 (equilibrios duvergianos) o cercano a 1 (equilibrios no duvergianos).
Como se estudió en la sección anterior, en el modelo no existen equilibrios no
duvergianos por lo que el análisis empı́rico se concentrará en los equilibrios
duvergianos.
Utilizando los datos publicados por cada instituto electoral estatal con respecto a la elección más reciente, se calculó el ratio SF para cada distrito electoral de cada estado de la República Mexicana. Después, de cada ley electoral
estatal vigente (o constitución estatal en su caso) se tomaron el número de curules a repartir por representación proporcional y por mayorı́a relativa para
calcular el ratio p/ui .
Con esta base de datos se estimó la siguiente regresión:
sf ratioi =
0
+
1 f repi
+ "i
Donde sf ratioi =SFi y f repi = p/ui .
Como se muestra en el cuadro siguiente, sf ratio muestra una variación importante entre cada estado con una media de 41.0 % y una desviación estándar
de 29.6 %. En cuanto a f rep no existe una variación muy grande entre estados
ya que la desviación estándar es de apenas 10.8 % con una media de 63.8 %
siendo Baja California Sur el estado con menor proporción de diputados plurinominales (31.3 %) y Jalisco el estado con mayor proporción de estos últimos
(100 %).
C UADRO 3: E STAD ÍSTICAS DESCRIPTIVAS
Variable
sfratio
frep
Media
0.4095
0.6377
Desv. Estándar
0.2960
0.1078
Min.
0.0269
0.3130
Max.
0.9966
1.0
La Figura 2 muestra la distribución de los distritos locales del paı́s por el
nivel de su ratio SF . Se puede apreciar que la distribución no es exactamente
bimodal como ocurrirı́a según Cox (1994) bajo la regla de pluralidad simple.
De hecho, los distritos con equilibrios no duvergianos son pocos en comparación con los distritos con equilibrios duvergianos. Para estudiar únicamente los
13 Estos
14 Cox
son los diputados elegidos por la regla de pluralidad simple.
le llama Second loser to First loser ratio, en inglés.
80
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
F IGURA 2: D ISTRIBUCI ÓN DE DISTRITOS
equilibrios duvergianos basta con limitar la muestra a aquellos distritos con ratios SF no tan cercanos a 1. De esta forma podemos eliminar un posible sesgo
en la estimación del coeficiente de f rep.
El Cuadro 4 muestra los resultados de realizar la estimación con mı́nimos
cuadrados ordinarios del coeficiente 1 . El coeficiente de f rep tiene el signo esperado por el modelo teórico; sin embargo, al considerar toda la muestra, el resultado está sesgado por los equilibrios no duvergianos que Cox identifica como ratios de sf ratio iguales a 1. Para limpiar este sesgo, se toma una segunda
regresión donde se limita la muestra a sólo aquellos distritos con sf ratio < ,95,
en este caso se pierden 27 observaciones y el coeficiente de f rep se incrementa
en la dirección esperada.
La tercera regresión limita la muestra a solo aquellos distritos con sf ratio <
,9. En este caso se pierden 63 observaciones y el coeficiente de sf ratio es ahora
significativo. El valor de .227 del coeficiente de f rep es significativo a un nivel
de 5 % y nos indica que en promedio, aumentar en 10 puntos porcentuales la
razón de diputados plurinominales a uninominales en un estado, aumentarı́a
en 2.27 puntos porcentuales el ratio de SF .
La última regresión también limita la muestra a sf ratio < ,9 pero incorpora
controles por el año en que se realizó la elección, ya que podrı́a existir algún
efecto de tener elecciones federales ese año por ejemplo. La dummy d2 es igual
a 1 si la elección ocurrió un año antes de elecciones federales. La variable d3 es
igual a 1 si la elección ocurre en año electoral federal. El escenario de comparación es tener elecciones un año después de elecciones federales y el efecto lo
captura la constante. Como se puede observar en el Cuadro 3, la incorporación
de estos controles no cambia el el coeficiente de f rep obtenido en (3).
Los resultados obtenidos del ejercicio empı́rico son consistentes con los resultados derivados del modelo teórico. Aún ası́, es la intención del autor continuar con la búsqueda de una estrategia de identificación más sofisticada que
R OMAN A COSTA
81
C UADRO 4: R ESULTADOS
frep
d2
sfratio
(1)
0.0433
(0.38)
sfratio
(2)
0.0693
(0.63)
sfratio
(3)
0.227**
(2.16)
d3
Constante
0.382
0.342
0.210
(5.13)
(4.75)
(3.05)
Observaciones
688
661
625
* p<0.1, ** p<0.05, *** p<0.01. Estadı́stico t en paréntesis.
sfratio
(4)
0.224**
(2.16)
0.0706**
(1.97)
0.0382*
(1.71)
0.183
(2.85)
625
(1) Es la especificación sin limitar el valor de SF con errores robustos.
(2) Es la especifiación para valores de SF < ,95 con errores robustos.
(3) Es la especifiación para valores de SF < ,9 con errores robustos.
(4) Igual a (3) pero con dummies de año en que se realizó la elección.
responda con mayor contundencia esta pregunta.
6.
C ONCLUSIONES
El objetivo principal de este trabajo fue el de analizar el sistema electoral
en México poniendo particular atención al efecto que tiene sobre el voto estratégico el hecho de que la boleta electoral tiene la doble función de servir bajo
la regla de mayorı́a relativa y contar para la fórmula de repartición de diputados por la vı́a de representación proporcional. Tomando el caso más simple
de tres votantes eligiendo entre tres partidos, este trabajo desarrolla un modelo
de elección que arroja resultados interesantes.
En primer lugar, confirma la intuición de que el grado de representación
proporcional se relaciona de manera negativa con la posibilidad de observar
voto estratégico en una elección.
En segundo lugar, muestra que existen condiciones suficientes para observar este comportamiento estratégico en una elección.
Se continúa cone una extensión del modelo relajando el supuesto de tres
votantes. Se logra mostrar que la relación entre el voto estratégico y el grado
de representación proporcional no cambia al relajar este supuesto.
Por último, tomando en cuenta estos resultados se encuentra que los datos
de las últimas elecciones locales en los estados mexicanos confirman la hipótesis de que un mayor grado de representación proporcional llevan a observar
menor voto estratégico en una elección.
R EFERENCIAS
[1] Blais, André y Massicotte, Louis, 1999, “Mixed Electoral Systems: A Conceptual and Empirical Survey”, Electoral Studies (1999), 341-366.
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
82
[2] Calvo, Ernesto y Abal, Juan, 2002, “Institutional gamblers: majoritarian representation, electoral uncertainty, and the coalitional costs of Mexico’s hybrid electoral system”, Electoral Studies 21 (2002), 453-471.
[3] Cox, Gary, 1984, “Strategic Electoral Choice in Multi-Member Districts: Approval Voting in
Practice?”, American Journal of Political Science, (Noviembre 1984) 722-738.
[4] Cox, Gary, 1994, “Strategic Voting Equilibria Under the Single Nontransferable Vote”, The
American Political Science Review (Septiembre), 608-621.
[5] Cox, Gary, 1997, “Making Votes Count: Strategic Coordination in the World’s Electoral Systems”, Cambridge: Cambridge University Press.
[6] Duverger, Maurice, 1955, “Political Parties”, New York: Wiley.
[7] Ferrara, Federico, 2006, “Two in one: Party competition in the Italian single ballot mixed system”, Electoral Studies 25 (2006), 329-350.
[8] Fey, Mark, 1997, “Stability and Coordination in Duverger’s Law: A Formal Model of Preelection Polls and Strategic Voting”, The American Political Science Review 91 (Marzo), 135-147.
[9] Kerevel, Yann, 2010, “The legislative consequences of Mexico’s mixed-member electoral system, 2000–2009”, Electoral Studies 29 (2010), 691-703.
[10] Magaloni, Beatris, 1996, “Dominio de partido y dilemas duvergianos en las elecciones presidenciales de 1994 en México”, Polı́tica y Gobierno 3, 281-326.
[11] Martinelli, César, “Simple plurality versus plurality runoff with privately informed voters”,
Social Choice and Welfare Volume 19, Issue 4, (Octubre 2002), 901-919.
[12] Molinar, Juan y Weldon, Jeffrey, 2001, “Reforming Electoral Systems in México”, M. Shugart
y M. Wattenberg (eds.), Mixed-Member Electoral Systems: The Best of Both Worlds? Oxford:
Oxford University Press.
[13] Palfrey, Thomas, 1989, A Mathematical Proof of Duverger’s Law., Models of Strategic Choice
in Politics, ed. Peter C. Ordeshook. Ann Arbor: University of Michigan Press.
[14] Poiré, Alejandro, 2000, “Un modelo sofisticado de decisión electoral racional: el voto estratégico en México, 1997”, Polı́tica y Gobierno, 353-382.
[15] Rozenas, Arturas y Soskice, David, 2008, A Spatial Model for Mixed-Member Majoritarian
Electoral Systems, Duke University, M
[16] Weldon, Jeffrey, 2001, “The Consequences of Mexico’s Mixed-Member Electoral System, 19881997”, M. Shugart y M. Wattenberg (eds.), Mixed-Member Electoral Systems: The Best of Both
Worlds? Oxford: Oxford University Press.
A.
D EMOSTRACIONES
Demostración de la Proposición 1. Voto estratégico. 15 .
() por contrapositivo) Supongamos que ¬(  2u3 1 ) es decir
– Caso 1. M Ri (! i ) con !
i
>
2u 1
3
2 {(P3i , P2i ), (P2i , P3i )}
• En ambos casos, el individuo i se enfrenta ante un empate parcial
entre P2i y P3i . Votar por P2i le paga u mientras que votar por P1i le
2u 1
paga + 1+u
> 2u3 1 ) + 1+u
+ 1+u
3 . Notemos que
3 >
3
3 =
1+u
i
u ) + 3 > u por lo tanto P2 = !i 2
/ M Ri (! i ).
– Caso 2. M Ri (! i ) con !
15 Vale
i
2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )}
la pena notar que > 0 ) 2u3 1 > 0 ) u > 12 , ası́ esta condición no sólo le pide a
pequeña sino que le pide a u ser lo suficientemente grande.
ser
R OMAN A COSTA
83
• En estos casos su voto no altera el resultado, sin embargo votar por
P1i le da una utilidad extra de a diferencia de sus otras opciones,
por lo que P2i = !i 2
/ M Ri (! i ).
– Caso 3. M Ri (! i ) con !
i
= {(P1i , P2i ), (P2i , P1i )}.
• En este caso, votar por P1i le paga 1 + mientras que votar por P2i le
paga u, por lo tanto P2i = !i 2
/ M Ri (! i ).
– Caso 4. M Ri (! i ) con !
i
= {(P1i , P3i ), (P3i , P1i )}.
• En este caso, votar por P1i le paga 1 + mientras que votar por P2i le
i
paga 1+u
/ M Ri (! i ).
3 , por lo tanto P2 = !i 2
De esta forma podemos concluir que P2i = !i 2
/ M Ri (⌦ i ).
(( por reduccion al absurdo)
Supongamos que  2u3 1 y que P2i = !i 2
/ M Ri (! i ) con ! i = (P2i , P3i ),
esto implicarı́a que el votante i obtiene más utilidad de votar por P1i o por P3i
lo cual implicarı́a que u < 0 ó u < + 1+u
3 . La primera es una contradicción al supuesto de 0 < u < 1 y la segunda implica también una contradicción al supuesto inicial de  2u3 1 : u < + 1+u
) > 2u3 1 , por lo tanto
3
i
i
i
i
P2 = !i 2 M Ri (P2 , P3 ) ) P2 2 M Ri (⌦ i ) .
⇤
Demostración de la Proposición 2. Mejor Respuesta.
– Caso 1. M Ri (! i ) con (! i ) 2 {(P3i , P2i ), (P2i , P3i )}. Debido a que estamos
asumiendo que < 2u3 1 se sigue de la Proposición 1 que P2i = !i 2
M Ri (! i ). Para mostrar que P1i 2
/ M Ri (! i ) asumamos que sı́ lo está,
esto implicarı́a que u = + 1+u
)
= 2u3 1 lo cual es una contra3
16
i
dicción. . Para mostrar que P3 2
/ M Ri (! i ) asumamos que sı́ lo está,
esto implicarı́a que u = 0 lo cual es una contradicción. Por lo tanto,
P2i = !i = M Ri (! i ).
– Caso 2. M Ri (! i ) con !
i
2 {(P1i , P1i ), (P2i , P2i ), (P3i , P3i )}
• Caso 2.1 ! i = (P1i , P1i ): Votar por P1i le da 1 + , mientras que al
votar por P2i o P3i obtiene 1 en ambos casos, por lo cual P1i = !i =
M Ri (! i ).
• Caso 2.2 ! i = (P2i , P2i ): Votar por P1i le da u + , mientras que al
votar por P2i o P3i obtiene u en ambos casos, por lo cual P1i = !i =
M Ri (! i ).
• Caso 2.3 ! i = (P3i , P3i ): Votar por P1i le da 0 + , mientras que al
votar por P2i o P3i obtiene 0 en ambos casos, por lo cual P1i = !i =
M Ri (! i ).
16 Si
=
2u 1
3
entonces {P1i , P2i } 2 M Ri (P3i , P2i ) y la M Ri seria una correspondencia.
84
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
– Caso 3. M Ri (! i ) con (! i ) 2 {(P1i , P2i ), (P2i , P1i )}. Votar por P1i le paga
1 + mientras que votar por P2i o P3i le paga u y 1+u
3 respectivamente, por
lo cual P1i = !i = M Ri (! i ).
– Caso 4. M Ri (! i ) con (! i ) 2 {(P1i , P3i ), (P3i , P1i )}. Votar por P1i le paga 1 + mientras que votar por P2i o P3i le paga 1+u
3 y 0 respectivamente,
por lo cual P1i = !i = M Ri (! i ).
⇤
Demostración de la Proposición 3. Existencia.
2u 1
i
– Caso 1
3 . En este caso sabemos que P1 = !i 2 M Ri (! i ) 8i, 8! i 2
⌦ i por lo que para cualquier perfil de preferencias el siguiente es un
equilibrio de Nash en estrategias puras: (!1 , !2 , !3 ) = (P11 , P12 , P13 ).
– Caso 2
< 2u3 1 . Para este caso conviene separar los posibles perfiles de preferencias en dos tipos. El tipo 1 serán aquellos perfiles donde
P11 6= P12 6= P13 y el tipo 2 serán aquellos donde P1i = P1j para algunas
j e i tal que j 6= i. Comencemos por el tipo 2:
• Caso 2.1 Preferencias tipo 1. En este perfil de preferencias podemos
tener dos casos:
Caso 2.2.1 P21 6= P22 6= P23 . En este caso proponemos uno de
los siguientes equilibrios: (!1 , !2 , !3 ) = (P11 , P22 , P13 ) si P13 =
P32 y (!1 , !2 , !3 ) = (P21 , P12 , P13 ) si P13 = P31 . El razonamiento
para encontrar estos equilibrios es el siguiente: permitimos que
el tercer votante elija a su primer favorito, el cual debe ser el
tercer favorito de algún votante, por lo que permitimos que este
último votante lo bloquee votando por su segundo favorito.
Caso 2.2.2 P2i = P2j para algunas j e i tal que j 6= i. Sin pérdida
de generalidad supongamos que P21 = P22 . Podemos ver que
esto implica que P11 = P32 y que P13 = P22 por lo que proponemos el siguiente equilibrio de Nash en estrategias puras:
(!1 , !2 , !3 ) = (P11 , P22 , P13 ).
• Caso 2.2 Preferencias tipo 2. Sin pérdida de generalidad supongamos que P11 = P12 . En este caso podemos proponer (!1 , !2 , !3 ) =
(P11 , P12 , P13 ) como un equilibrio de Nash. Los votantes 1 y 2 deciden la elección por su primer favorito, por lo que el votante 3 ya
no tiene la capacidad de cambiar el resultado, ası́ su mejor respuesta es votar por su primer favorito.
⇤
Demostración Proposición 4.
Primero veamos porqué votar por P2i es la mejor respuesta ante un empate
entre P2i y P3i o ante la posibilidad de empatar la elección entre P2i y P3i ; ambos
casos cuando P1i no tiene posibilidades en la elección.
R OMAN A COSTA
85
– Si el votante i tiene la posibilidad de romper un empate entre P2i y P3i
se enfrenta a las siguientes opciones y sus respectivos pagos: P1i le paga
u
i
i
i
2 + , P2 le paga u yP3 le paga 0. Notemos que para que P2 sea mejor
u
respuesta es necesario que 2 + < u. Recordemos que empezamos asu1
2u
u
u
u
miendo que < 2u3 1 = 2u
< u2 ) + u2 < u.
3
3 < 3
3 = 3 < 2 )
– Si el votante i tiene la posibilidad de empatar la elección entre P2i y P3i cuando
P3i va ganando se enfrenta a las siguientes opciones y sus respectivos pagos: P1i le paga , P2i le paga u2 yP3i le paga 0. Notemos que para que P2i
sea mejor respuesta es necesario que u2 > , al igual que en el subcaso
anterior.
Ahora dividiremos las posibles elecciones a las que se podrı́a enfrentar el votante i para demostrar que P1i es la mejor respuesta ante todos los demás casos.
Caso 1. Si P1i , P2i ó P3i gana la elección por más de un voto entonces hay 3
subcasos:
– Si P1i es el ganador entonces votar por P3i ó P2i le darı́a 1 vs. 1 + de votar
por P1i .
– Si P2i es el ganador entonces votar por P3i ó P2i le darı́a u vs u + de votar
por P1i .
– Si P3i es el ganador entonces votar por P3i ó P2i le darı́a 0 vs 0 +
por P1i .
de votar
Ası́, tenemos que votar por P1i es una estrategia dominante siempre que la elección se encuentre decidida o dicho de otra manera, cuando el votante i no tenga
oportunidad de cambiar el resultado final de la elección.
Caso 2. Puede romper un empate entre cualquiera de los partidos, existen
3 subcasos:
– Si tiene que romper un empate entre P1i y P2i votar por P1i le paga 1 +
u
1
mientras que votar por P3i le paga (1+u)
2 . Debido a que u < 1 ) 2 < 2 )
(1+u)
1
u
> 2 votar por P1i es mejor que votar por P3i . Votar
2 + 2 < 1 ) 1+
por P2i le paga u por lo que prefiere votar por P1i .
– Si tiene que romper un empate entre P1i y P3i votar por P1i le paga 1 +
mientras que votar por P3i le paga 0. Votar por P2i le paga 12 por lo que
prefiere votar por P1i .
– Si tiene que romper un empate entre P1i , P2i y P3i votar por P1i le paga
1 + mientras que votar por P3i le paga 0. Votar por P2i le paga u por lo
que prefiere votar por P1i .
Caso 3. Puede hacer que los partidos empaten, existen 3 subcasos:
– Si puede empatar a P1i y P2i
86
V OTO ESTRAT ÉGICO BAJO EL SISTEMA MIXTO MEXICANO
• Si P1i va ganando, votar por P1i le paga 1 + mientras que votar por
P3i le paga 1. Votar por P2i le paga 1+u
2 por lo que prefiere votar por
P1i .
• Si P2i va ganando, votar por P1i le paga 1+u
2 + mientras que votar
por P3i le paga u. Votar por P2i le paga u por lo que prefiere votar por
P1i .
– Si puede empatar a P1i y P3i
• Si P1i va ganando, votar por P1i le paga 1 + mientras que votar por
P3i le paga 1 y votar por P2i le paga 1, prefiere votar por P1i .
• Si P3i va ganando, votar por P1i le paga 12 + mientras que votar por
P3i le paga 0 y votar por P2i le paga 0, prefiere votar por P1i .
– Si puede empatar a P1i , P2i y P3i
• Si P1i y P2i van ganando, votar por P1i le paga 1+ mientras que votar
i
i
por P3i le paga 1+u
2 y votar por P2 le paga u, prefiere votar por P1 .
• Si P1i y P3i van ganando, votar por P1i le paga 1 + mientras que
votar por P3i le paga 0 y votar por P2i le paga u, prefiere votar por
P1i .
⇤
S HOULD YOU ASK HER OUT ?
J OS É M ANUEL R ODR ÍGUEZ S OTELO⇤
1.
I NTRODUCTION
Let’s say that you are feeling like going out tonight. You feel great and decide
to go out for a drink with your friends. At the bar, you spot a (randomly selected) cute girl. You decide to start a conversation and, since she seems to be
really nice, you wonder if she would accept to go on a date with you. After
a couple of hours (and perhaps some drinks), you get the courage to ask her
out. Unfortunately, she tells you she has a boyfriend. Discouraged, you return
to the table where your friends are and explain the situation. After listening to
you, your friends tell you that you should insist. After all, some girls just play
hard to get. You struggle to decide what you should do about it. However, you
are confident that your knowledge of probability should help you solve this
dilemma.
2.
P ROBLEM F ORMULATION
Suppose that ! is the known proportion of girls that are single and is the
known proportion of girls that would lie about their relationship status. For
simplicity, suppose also that if a girl is single and you insist, then she will
go out with you. In addition, you know that if a girl actually does have a
boyfriend, then even if you insist she will not go out with you.
Define B as the event ‘the girl has a boyfriend’, A as the event ‘she answers
that she has a boyfriend’, and D as the event that she will go out with you.
Furthermore, define I as the event ‘you insist’. For each event Z, Z c refers to
the complement of Z. The probabilistic statements that describe your situation
are:
Pr(B)
c
=
1
(2.1)
!
(2.2)
Pr(A | B )
=
=
1
Pr(D | I, B c , A)
=
=
Pr(D | I, B c )
0
(2.5)
Pr(D | B)
=
0
(2.6)
Pr(A | B)
c
Pr(D | I , A)
(2.3)
=
1
(2.4)
⇤ I would like to thank the anonymous reviewer for her valuable comments and suggestions to
improve the quality of this work. The author is also grateful to Lorena Domı́nguez, Diego Jiménez,
Eduardo Laguna and Ana C. Perez-Gea for their time in revising and commenting on earlier drafts
of this article. All errors remain my own.
87
S HOULD YOU ASK HER OUT ?
88
3.
O PTIMIZATION P ROBLEM
You face the decision of whether insisting or not. That is, to choose whether to
repeat your request or not (ie. i 2 {I, I c }) given that you observed A, so that
you maximize the expected utility of your decision:
max
i2{I,I c }
E [U | i, A]
where your utility U (d, i) depends both on your decision and the girl’s further
action; as it depends on whether she will go out with you and whether you
quit or not:
U (d, i)
u · 1D (d)
=
c · 1I (i)
1Z (z) refers to the indicator function of set Z, and u > c > 0. We will now
analyze what would happen if you insist and if you don’t.
3.1
D ON ’ T I NSIST
First, let’s notice that following equation 2.5, if you don’t insist there is no
chance that she will go out with you. Therefore,
E [U | I c , A]
3.2
=
0
I NSIST
Using the Bayes’ Theorem, we have that:
Pr(B c | A)
=
Pr(A | B c ) Pr(B c )
Pr(A | B ) Pr(B c ) + Pr(A | B) Pr(B)
c
and the assumptions and results stated before, you conclude that:
E [U | I, A]
=
3.3
u· ·!
(1
)·!
1
c
R ESULTS
Following the expected utility theory, you realize that the decision is quite easy.
You should insist when the expected utility of insisting exceeds the expected
utility of not doing it, that is:
E [U | I, A]
u· ·!
c
1 (1
)·!
>
E [U | I c , A]
>
0
J OS É M ANUEL R ODR ÍGUEZ S OTELO
3.3.1
89
S ENSITIVITY A NALYSIS
A remarkable result is that if were equal to 0, then it would never make sense
to insist. An explanation of this fact is that if girls never lied, then the signal A
would provide perfect information about their relationship status. As insisting
is costly, it would never pay to insist if you already know the truth about their
relationship status. Another interesting consequence comes from:
@E [U | I, A]
@
u · ! · (1 !)
(1 (1
) · !)2
=
>
0
were we see that the more likely it is that they lie, the better it is for you to
insist. Whoa! the lying strategy backfired for them.
4.
H OW MUCH DO GIRLS LIE ?
In a world of perfect information, you would be done by now (actually, you
would have been done since the beginning of the paper). Also, in a world
where both ! and are known, you would have been done by the end of the
previous section. Nonetheless, you’re aware that much of the argument used
before relies on the fact that is known. This, however, doesn’t seem to be
quite realistic. After all, you only have a vague idea of how much girls lie.
4.1
B AYESIAN I NFERENCE
From now on, you decide to adopt the Bayesian interpretation of probability
according to which probabilities entail degrees of belief about events in the
world and data is used to strengthen or weaken those degrees of belief.
4.1.1
P RIOR K NOWLEDGE
Now, suppose that is no longer known. Instead of that, you have the (prior)
belief that ⇠ Beta(↵, ), where ↵, > 0 are known parameters. Therefore,
the probability density function of is:
↵ 1
f( )
=
· (1
)
B(↵, )
1
For example, Figure 1 plots the density function for using different values
of the parameters (↵, ). The figure defines four different combinations for the
parameters, where each of them corresponds to a different expected value of .
We will call each combination of parameters prior beliefs from now on.1
1 In the results shown, the ‘Honest’ scenario corresponds to the prior belief ↵ = .1 and
= 1.
Similarly, the ‘Neutral’ scenario relates to ↵ = 2 and = 2. The ‘Dishonest’ scenario relates to
↵ = 5 and = 2. Finally, the ‘Liars!’ scenario corresponds to ↵ = 5 and = 1.
S HOULD YOU ASK HER OUT ?
90
F IGURE 1: D IFFERENT ALTERNATIVES FOR THE PRIOR DISTRIBUTION .
5
Prior belief:
Honest
Neutral
Dishonest
Liars!
4
f(λ)
3
2
1
0
0.00
0.25
0.50
0.75
1.00
λ
4.1.2
L IKELIHOOD F UNCTION
In addition, you have observed what happened when you insisted to a sample
of similar girls (drawn from the same distribution). In your sample, you have
that from n girls to whom you have insisted, x agreed to go out on a date with
you. You also recognize that for a given , the likelihood of this happening is:
f (x | )
✓ ◆
n
·
x
=
4.1.3
x
)n
· (1
x
I NFERENCE
Now, we use again Bayes’ Theorem, in its Bayesian interpretation, where:
Posterior
/
Likelihood · Prior
to obtain:
f ( | x)
/
↵+x 1
· (1
)
+n x 1
Therefore, you conclude that with the available information, the posterior distribution of is:
⇠
Beta(↵ + x,
+n
x)
Figure 2 shows different alternatives for the posterior distribution depending
on the prior belief. Further explanation about how to perform this bayesian
updating can be found in Cowles (2013).
J OS É M ANUEL R ODR ÍGUEZ S OTELO
91
4
Prior belief:
Honest
Neutral
Dishonest
Liars!
4
f(λ | x)
f(λ | x)
3
Prior belief:
Honest
Neutral
Dishonest
Liars!
2
2
1
0
0
0.00
0.25
0.50
0.75
1.00
0.00
0.25
λ
0.50
0.75
1.00
λ
(a) Posterior when n = 5 and x = 1.
(b) Posterior when when n = 25 and x = 5.
F IGURE 2: D IFFERENT ALTERNATIVES FOR THE POSTERIOR DISTRIBUTION .
4.2
N EW SOLUTION
Now, the expected value of insisting has changed a little. The new expected
value:
Z 1
·!
E [U | I, A, x]
=
c+u·
· f ( | x) d
(1
)·!
0 1
can be evaluated numerically. Alternatively, it can be approximated simulating
realizations of a Beta distribution.
0.25
Prior belief:
Honest
Neutral
Dishonest
Liars!
0.25
E[U | I , A , x ]
E[U | I , A ]
0.00
−0.25
−0.50
−0.75
Prior belief:
Honest
Neutral
Dishonest
Liars!
0.00
−0.25
−0.50
0.00
0.25
0.50
ω
(a) A priori.
0.75
1.00
−0.75
0.00
0.25
0.50
ω
0.75
(b) After observing n = 5 and x = 1.
F IGURE 3: E XPECTED VALUE OF INSISTING WHEN u = 1 AND c = .7
1.00
92
S HOULD YOU ASK HER OUT ?
5.
F INAL R EMARKS
There you go. Now you have all the information and analysis that you need to
make the best decision. You should be aware that bayesian analysis is dependent on the subjective prior that you have at the beginning of your search.
Moreover, if you still find the model quite simplistic for your situation,
there are some alternatives you can try. A natural extension of this simple
model is to change equation 2.4 for the following:
Pr(D | I, B c , A)
=
Pr(D | I, B c )
=
✓
where ✓ would reflect the willingness of girls without boyfriend to go out with
you after you insist. Again, you would have to perform inference over ✓; but
inference on and ✓ would have to be done simultaneously.
Finally, don’t forget that the easiest way to actually find someone to go on
a date with you is to stop reading this and go out.
R EFERENCES
[1] Cowles, M.K., “Applied Bayesian Statistics: With R and OpenBUGS Examples,” Springer Texts
in Statistics, Springer, 2013.
La Gaceta de Economı́a convoca a todos los alumnos, profesores e investigadores interesados en fomentar la
investigación económica de alta calidad a publicar documentos de investigación relevantes, con los fines de
complementar la preparación académica de los estudiantes y proveer un foro de discusión de la realidad
económica de nuestro paı́s y el mundo.
CONVOCATORIA
El objetivo de la Gaceta de Economı́a es promover la investigación económica de alta calidad y darla a conocer
dentro y fuera del ITAM. Esta publicación recibirá contribuciones en teorı́a económica, economı́a aplicada, econometrı́a, desarrollo económico, economı́a polı́tica, historia económica, finanzas y otros temas siempre que sean
abordados desde el punto de vista de la ciencia económica.
Instrucciones para los autores:
1. Se aceptarán documentos en español e inglés. Para presentar un artı́culo, se debe enviar una copia en
formato PDF en la que no sea visible el nombre del autor a la siguiente dirección: gaceco@itam.mx.
2. De ser seleccionado para su publicación, deberá presentarse la versión final del artı́culo en un archivo TeX
con el preámbulo de la Gaceta de Economı́a, que será enviado a los autores de artı́culos seleccionados y
puede ser solicitado en cualquier momento.
3. Las referencias que se hagan en el artı́culo deberán estar identificadas por el apellido del autor seguido por
el año de publicación entre paréntesis. Todas las referencias tendrán que ser listadas de manera completa
en la sección de Referencias incluida al final del artı́culo.
4. Se sugiere a los autores que los artı́culos enviados no excedan las 40 páginas a 1.5 espacios.
5. Las gráficas y figuras en el documento no deberán contener bordes ni sombras de ningún tipo. El tı́tulo de
la gráfica o tabla deberá ser incluido fuera de la misma. Será necesario que todas las tablas y todas las
gráficas estén numeradas.
6. Los editores agradecerán que los artı́culos sean revisados y que no contengan errores gramaticales, ortográficos o de consistencia en las referencias. De esta manera se minimizarán los cambios editoriales y se
agilizará la recepción y publicación de los artı́culos.
7. El cierre de edición para el siguiente número es el 21 de agosto de 2014, los artı́culos recibidos en fechas
posteriores se tomarán en cuenta para el número consecutivo. Se notificará a los autores la decisión de
publicación a más tardar el 15 de octubre de 2014
Atentamente,
La Mesa Directiva
GACETA DE ECONOMÍA, INSTITUTO TECNOLÓGICO AUTÓNOMO DE MÉXICO, Av. Camino a Santa Teresa Nº 930,
Col. Héroes de Padierna, Magdalena Contreras, C.P. 10700, México, D.F. Tel.: (55) 5628-4000, E-mail: gaceco@itam.mx