Download 4 - UAB

Document related concepts

Mínimos cuadrados ordinarios wikipedia , lookup

Variable instrumental wikipedia , lookup

Regresión no lineal wikipedia , lookup

Regresión semiparamétrica wikipedia , lookup

Regresión lineal wikipedia , lookup

Transcript
Econometría I
Tema 2: El modelo de regresión simple
Ejercicios
1. Considera el siguiente gráfico en el cual esta representada la relación entre los años de
existencia del mercado de valores (A) y el rendimiento real anual (R) para una muestra
de 39 países.
Rendimiento real anual (R)
Años existencia del mercado (A)
(a) Dada la información que tenemos en el gráfico, crees que hay una relación determinista entre el rendimiento real de un mercado (R) y los años de existencia del
mismo (A)? Razona la respuesta.
(b) Escribe un modelo de regresión lineal en el cual se pueda analizar el comportamiento esperado del rendimiento medio (R) en relación a los años de existencia
(A).
(c) Escoge dos elementos que hayas incluido en la especificación del modelo en la
pregunta anterior. Explica brevemente que capta cada uno de estos elementos,
haciendo referencia específica en el ejemplo que estemos considerando.
2. Considera el siguiente modelo que relaciona la renta per cápita, en miles de dólares,
de un país i (RCi ), con su porcentaje de población en el sector agrícola (P Ai ):
M odelo :
RCi = β0 + β1 P Ai + ui
1
(a) Explica con palabras como interpretar los parámetros β0 y β1 . ¿Qué signeo crees
que tendran?
(b) Dibuja la recta de regresión poblacional (RRP) asocia a este modelo suponiendo
que los parámetros β0 y β1 tienen el signo que has indicado en el apartado anterior.
¿Qué información te da esta recta? Comenta rigurosamente.
3. Considera el siguiente modelo:
yi = β0 + β1 xi + ui
Para estimar este modelo tenemos la siguiente muestra:
xi
0
1
4
5
yi
2
1
3
2
(a) Estima por MCO los parámetros β0 y β1 , utilizando las expresiones siguientes:
n
P
β̂1 =
(xi − x̄)(yi − ȳ)
i=1
n
P
(xi − x̄)2
i=1
β̂0 = ȳ − β̂1 x̄
Utiliza la ayuda de una Hoja de cálcul (Excel o similar) para hacer loss cálculos.
(b) Estima por MCO els paràmetres β0 y β1 , utilizando la expresión:
β̂ = (X 0 X)−1 X 0 Y
Utiliza la ayuda de Gretl para hacer los cálculos.
(c) Calcula los residuos MCO sin utilizar álgebra matricial y utilizando álgebra matricial. Comprueba que coinciden.
n
X
(d) Comprueba que
ûi = 0.
i=1
4. Considera que se propone el siguiente modelo de regresión para analizar el comportamiento de la variable y :
M odelo(1)
yi = β0 + ui
i = 1, ..., n.
(a) ¿Cuántos parámetros tiene este modelo? ¿Cuántos regresores? Según el modelo
propuesto, que puedes decir sobre el comportamiento de la variable y?
2
(b) Deriva, resolviendo el problema de optimazición corresponendiente, la expresión
del estimador MCO del parámetro de este modelo sin utilizar álgebra matricial.
¿Te sorprende el resultado?
(c) Si escribimos la expresión del M odelo(1) en álgebra matricial como y = Xβ + u.
¿Qué elementos incluiría y? ¿Y X? ¿Y u?
(d) Comprueba que la expresión que has encontrado del estimador en (b) coincide con
la que encontrarias si aplicasemos la expresión general en álgebra matricial:
β̂ = (X 0 X)−1 X 0 y
5. Considera que se propone el seguiente modelo de regresión para analizar el comportamiento de la variable y:
M odel(2)
yi = β1 xi + ui
i = 1, ..., n.
(a) ¿Cuántos parámetros tiene este modelo? ¿Cuántos regresores? Según el modelo
propuesto, ¿qué puedes decir sobre el comportamiento de la variable y?
(b) Deriva, resolviendo el problema de optimización correspondiente, la expresión del
estimador MQO del parámetreo β1 sin utilizar álgebra matricial.
(c) Si escribimos el modelo anterior en álgebra matricial como y = Xβ + u. ¿Qué
elementos incluiría y? ¿Y X? ¿Y u?
(d) Comprueba que la expresión del estimador que has encontrado en (b) coincide con
la que encontrarías si aplicamos la expresión general en álgebra matricial:
β̂ = (X 0 X)−1 X 0 y
6. Discute que problema tendrías para estimar los parámetros de un modelo de regresión
simple
yi = β0 + β1 xi + ui
para MCO utilizando la siguiente muestra:
x
3
3
3
3
3
3
3
y
2
1
3
2
5
4
2
7. Considera los siguientes modelos:
M odelo 1 :
yi = β0 + β1 xi + ui
3
M odelo 2 :
yi = β0∗ + β1∗ x∗i + ui
Queremos ver como queda afectado el estimador de MCO cuando variamos las unidades
de medida de la variable explicativa xi . Si redefinimos el regresor como x∗i = axi , como
se relacionaría la estimación por MCO de β0 y β1 del Modelo 1 con la estimación per
MCO de β0∗ y β1∗ del Modelo 2 ?
(a) Analita como afectaría este cambio a la estimación de los parámetros sin utilizar
álgebra matricial.
(b) Repite el apartado anterior utilizando ahora álgebra matricial.
8. Queremos estimar los parámetros de este modelo:
yi = β0 + β1 xi + ui
i = 1, ..., 10
con los datos del fichero mostra1.xls.
(a) Con la ayuda de Gretl haz un plot de las observaciones.
(b) Con la ayuda de un guión de instrucciones de Gretl, estima los parámetros β0 y
β1 del modelo, aplicando la expresión:
β̂ = (X 0 X)−1 X 0 y
(c) Vuelve a estimar el modelo, ahora usando la opción del menú de Gretl para
estimar por MCO. Comprueba que los valores obtenidos son los mismos que has
obtenido en el apartado (b).
(d) Utilizando una hoja de cálculo, calcula el coeficiente de determinación utilizando
las dos siguientes expresiones:
n
X
R2 =
SEC
= i=1
n
X
ST C
(ŷi − ȳ)2
(yi − ȳ)2
i=1
n
X
R2 = 1 −
ûi 2
SRC
= 1 − n i=1
X
ST C
(yi − ȳ)2
i=1
Comprueba que coincide con el reproducido en el output de Gretl. dan el mismo
valor para este coeficiente
4
9. Tenemos los datos de la siguiente tabla sobre las horas de estudio (H) y las calificaciones
obtenidas para una muestra de 8 estudiantes (G):
estudiante
1
2
3
4
5
6
7
8
H
G
21
7
24 8,5
26 7,5
27 8,75
29
9
25 7,5
25
6
30 9,25
(a) Escribe un modelo de regresión que te permita estudiar el comportamiento de
la nota de un estudiante en función de las horas de estudio. Interpreta cada
elemento.
(b) Con la ayuda de la opción del menu de Gretl estima el modelo. Interpreta los
coeficientes estimados y la bondad de ajuste.
(c) ¿Qué predicción darías de la nota esperada de un estudiante que ha estudiado 20
hores?
10. Considera el siguiente mecanismo de generación de datos (mgd):
yi = 10 + 2xi + ui , ui /x ∼ i.i.N (0, σ 2 )
donde las observaciones de x se generan a partir de una distribución uniforme (0, 30).
(a) Escribe un guión de comandos de Gretl que genere una muestra de 80 observaciones de este mecanismo para el caso de σ 2 = 144. Incluye el comando set seed
123.
(b) Ejecuta el guión. Haz un plot (scatter) con las 80 observaciones (xi , yi ) generadas.
¿Te sorprende? Comenta.
(c) Repite los apartados (a) y (b) para el caso de σ 2 = 16. Compara los gráficos y
comenta.
11. Considera el siguiente mecanismo de generación de datos:
yi = 2 + 0, 5xi + ui , ui /x ∼ i.i.N (0, 16)
donde las observaciones del regresor xi salen de una distribución uniforme (0,50).
(a) Con la ayuda de un guión de instrucciones de Gretl, genera una muestra de 30
observaciones de este mecanismeo, utilizando el comando 1234 (set seed 1234).
Dibuja la muestra generada en un plot (x,y).
(b) Ahora estima el siguiente modelo de regresión con la muestra generada:
yi = β0 + β1 xi + ui
¿Qué estimador obtienes para β0 ? ¿Para β1 ?
5
(c) Dado que conocemos el valor real de β0 y β1 , puedes decir si la estimación anterior
sobreestima o subestima estos parámetros.
(d) Considera ahora que queremos utilizar el mismo mecanismo de generación de datos
para generar 10.000 muestras de 30 observaciones cada una. Con cada muestra,
estimamos el siguiente modelo:
yi = β0 + β1 xi + ui
(e) ¿Cuántas estimaciones de β0 hemos obtenido? ¿Y de β1 ?
(f) Escribe un guión de instrucciones de Gretl que (i ) genere 10.000 observaciones
de acuerdo con el proceso de generación de datos incluido arriba, utilizando los
mismos valores de las observaciones de x para cada muestra, (ii ) con cada muestra
estima la regresión del modelo indicado arriba y (iii ) guarda las estimaciones del
parámetro β1 en el archivo b1est.gdt. Incluye la instrucción set seed 1234 justo
después de la instrucción nulldata. Guarda este guión como Script1.
(g) Abre el archivo b1est.gdt. Calcula la media de las 10.000 estimaciones obtenidas
de β1 . ¿Es este valor como esperabas?
(h) Dibuja un histograma con las 10.000 estimaciones obtenidas de β1 . ¿Es este gráfico
como esperabas?
(i) ¿Qué propiedad nos demuestra el gráfico anterior? Justifica la respuesta.
(j) Si en lugar de 10.000 muestras fuesemos capaces de generar el mayor número de
muestras posibles con este mecanismo (todos con las mismas observaciones de x),
¿Qué títolo darías a este gráfico?
12. El fichero de datos employment.xls incluye datos sobre la tasa de crecimiento anual
de la ocupación (employment) y la tasa de crecimiento económico anual (gdp) para
25 países durante los años 90. Para estudiar la creación de ocupación en relación al
crecimiento económico en este periode, se propone el siguiente modelo de regresión
lineal:
employmenti = β0 + β1 gdpi + ui
(a) Con la ayuda de Gretl (via menus) estima el modelo indicado.
(b) ¿Ha salido el signo de la estimación del parámetro β1 tal como esperabas?
(c) Comenta la bondad de ajuste.
(d) Presenta la recta de regresión ajustada de forma analítica. Debajo de cada estimación incluye las desviaciones estandar estimadas.
(e) Haz un plot de los datos. Incluye en el plot la recta ajustada.
13. El ficherro lexp2003.gdt incluye datos para 180 països sobre su renta per cápita (PPP)
anual en dólares (R) y la esperanza de vida al nacer en años (LE), para el año 2003.
Para extraer información de esta muestra sobre el comportamiento de la esperanza
de vida en relación al nivel de renta per cápita, se propone el siguiente modelo de
regresión:
LEi = β0 + β1 ln(Ri ) + ui
6
(a) Sobre los datos: ¿Qué país tiene la esperanza de vida más grande? ¿Y más
pequeña? ¿Qué país tiene la renta per cápita más grande? ¿Y más pequeña?
¿Cuál es la renta per cápita media?
(b) Haz un plot de los datos en el plano (R, LE). (Es decir, la variable R en el eje
horizontal y LE en el eje vertical.) Comenta sobre la relación entre estas variables.
¿Parece lineal? Haz un plot ahora en el plano(lnR, LE). Comenta. Dados los
gráficos, ¿Crees que es razonable la regresión planteada en el enunciado? Comenta.
(c) ¿Qué signo crees que tendrá el parámetro β1 ? Razona brevemente.
(d) Con la ayuda de Gretl (via menus), estima el modelo anterior por M CO. (Atención, fijate que la variable explicativa del modelo es ln(R) y no R, así, antes de
estimar, has de generar la variable correspondiente). Incluye como respuesta una
cópia del output de Gretl.
(e) Con la ayuda de un guión de instrucciones de Gretl y construyendo las matrices
correspondientes, verifica el cálculo de la estimación de β0 y β1 y de las desviaciones estandar estimadas del estimador de cada uno de estos parámetros.
(f) Presenta la recta de regresión ajustada en forma analítica. Debajo de cada estimación incluye las desviaciones estandar estimadas.
(g) Con la ayuda de Gretl haz un gráfico de las observaciones y de la recta ajustada
en el plano (lnR, LE).
(h) Interpreta la estimación obtenida de β1 .
(i) ¿Cuál es el valor del coeficiente de determinación ? Da la expresión exacta que
se ha de hacer servir para calcularlo, haciendo referencia a las variables incluidas
en este modelo.
(j) Según la estimación obtenida, si un país tiene una renta per cápita un 1% más
alta, ¿Cómo esperamos que varíe la esperanza de vida de su población?
(k) ¿Qué estimación harías sobre la esperanza de vida de un país que tiene una renta
per cápita de 15000 dolars al año?
(l) ¿Crees que esta regresión serviría para medir el efecto que tiene la renta per cápita
sobre la esperanza de vida ? Comenta de forma breve pero rigurosa.
14. El artículo de Sachs & Wagner (2001) en la European Economic Review es uno de
los primeros en contrastar empíricamente la llamada "maledicción de los recursos naturales”, que sostiene que los países con abundancia de recursos naturales tienden a
tener un crecimiento económico bajo. El fichero nr97m.gdt contiene los datos de 71
países utilizados por estos autores para contrastar esta hipótesis. Los autores utilizan
el peso de las exportaciones de recursos naturales sobre el PNB para 1980 (sxp80)
como medida de la abundancia de los recursos naturales de un país. Como indicador
del crecimiento económico, utilizan el promedio de las tasas de crecimiento económico
anuales entre 1970 y 1990 (gea7090).
(a) Escribe un modelo de regresión que te permita estudiar el comportamiento del
crecimiento económico (gea7090) en relación a la abundancia de recursos naturales
(sxp80). Bajo la hipótesis de la "maledicción de los recursos naturales”, ¿qué signo
esperarías que tuviera el parámetro asociado a sxp80?
(b) Con la ayuda de Gretl, estima el modelo que has propuesto en el apartado anterior
por M CO. Comenta.
7
15. El fichero ees2010.gdt incluye datos provenientes de la Encuesta de Estructura Salarial
sobre salario y nivel educativo de 5000 personas para España, 2010. Entre las variables
incluidas encontramos el salario en euros por hora (SALARIOHORA) y una variable
fictícia que toma el valor 1 si la persona tiene estudios superiores y 0 si no tiene
(SU P ERIORES).
(a) Con la opción de Gretl correspondiente, encuentra los estadísticos de estadística descriptiva de todas las variables incluidas en la muestra. Comenta. ¿Qué
estadísticos no tienen sentido?
(b) Utilitzando los estadísticos de estadística descriptiva correspondientes, da una
estimaciób de la diferencia promedio del salario hora en euros entre una persona
con estudios superiores y una sin estudios superiores. Justifica tu respuesta.
(c) Considera que definimos el siguiente modelo de regresión:
SALARIHORAi = β0 + β1 SU P ERIORESi + ui
Con la ayuda de Gretl estima este modelo por M CO. Interpreta los resultados:
signo y valor de los coeficientes estimados y la bondad del ajuste.
(d) Utilitzando los estadísticos de estadística descriptiva correspondientes, da una
estimación de la diferencia promedio del salario hora en porcentaje entre una persona con estudios superiores y una sin estudios superiores. Justifica tu respuesta.
(e) Considera que definimos el siguiente modelo de regresión:
lnSALARIHORAi = β0 + β1 SU P ERIORESi + ui
Con la ayuda de Gretl estima este modelo por M CO. Interpreta los resultados:
signo y valor de los coeficientes estimados y la bondad del ajuste.
(f) En el mismo fichero de datos tenemos la variable ESCOLARIDAD, que corresponde al número de años de escolarización, siendo el valor 6 el correspondiente a
una persona sin estudios. Considera ahora que definimos el siguiente modelo de
regresión:
lnSALARIHORAi = β0 + β1 ESCOLARIDADi + ui
Con la ayuda de Gretl estima este modelo por M CO. Interpreta los resultados:
signo y valor de los coeficientes estimados y la bondad del ajuste.
16. El fichero epf 2012.gdt incluye datos provenientes de la Encuesta de Presupuestos Familiares sobre el gasto y nivel de renta anual de 21.808 hogares españoles para 2012.
El fichero incluye la renta anual en euros (IN GRESOS) y el gasto anual (GAST O).
(a) Con estos datos estima el siguiente modelo de regresión:
GAST Oi = β0 + β1 IN GRESOSi + ui
(b) ¿Qué estimación has obtenido de la propensión marginal a consumir? ¿Cómo ha
salido la bondad de ajuste? Comenta.
(c) Con la ayuda de Gretl haz un plot de las observaciones (scatter). Comenta.
8