Download La lógica de covarianza

Document related concepts
no text concepts found
Transcript
La lógica de covarianza
miércoles 2 de febrero de 2011
Métodos Cuantitativos Avanzados
David Crow, DEI
Temario
•
•
•
•
•
•
Tipología de variables
Tipología de modelos estadísticos
Covarianza
Correlación parcial
Variables supresoras
“Control” estadístico
Varianza y desviación típica
• Varianza: medida de dispersión de valores
alrededor de la media
n
1
Var (Y )   Y2   (Yi  Y ) 2
n 1
• Desviación típica:
1 n
2
sd (Y )   Y 
(
Y

Y
)
 Var (Y )

i
n 1
Covarianza
• Covarianza: Intuición
– cuando varían los valores de una variable,
cambian también los valores asociados de otra
variable; medida de qué tanto dos variables
cambian (linealmente) juntos.
– Puede ser positiva o negativa
• Covarianza:
Cov( X , Y )   XY
1 n
  ( X i  X )(Yi  Y )
n 1
Coeficiente de correlación
• Correlación: covarianza estandarizada (o
normalizada) al dividir entre el producto de las
desviaciones típicas
• Coeficiente de correlación:
rXY 
Cov( X , Y )
 XY
Correlación parcial
• Intuición: La relación entre dos variables se encuentra
mediada o influida por otra variable.
• Cuando tres o más variables se correlacionan entre sí, se
afecta la correlación marginal (o “simple” o de “orden
cero”) entre cualesquiera de dos de esas variables
– La magnitud de la afectación depende de la magnitud de las
sendas correlaciones
– Normalmente, la magnitud de la correlación marginal
disminuye, pero puede aumentarse
– Incluso, la dirección de la correlación marginal puede cambiar
• Coeficiente de correlación parcial:
r12.3 
r12  r13r23
(1  r132 )(1  r232 )
Variables supresoras
• Definición clásica: no existe correlación
marginal entre la variable dependiente (el
“criterio”) y una variable dependiente, pero sí
aparece una correlación cuando la correlación
se condiciona a una tercera variable. O sea:
1) rYX1 = 0
2) rYX1.X2 > 0
• Ello se da cuando rX1,X2 < 0
Control estadístico
• “Controlamos por” los efectos mediadores de
otras variables al incluir éstas en un modelo
estadístico  la estimación del efecto de una
variable sobre otra se “purga” de los efectos que
se deben a terceras variables mediante la
correlación parcial
• Intuición: sólo comparamos a individuos
similares, o sea, dentro de un mismo nivel de un
covariado
Heterogeneidad no observada
• Una población (o muestra) es “heterogénea” si 1) hay
diferencias entre los subgrupos componentes que
componen la población respecto a covariados
relevantes y 2) si estos covariados están
correlacionados con el resultado que nos interesa
• Experimentos:
– asignación aleatoria de sujetos a los grupos de control y
tratamiento
– pero en un estudio observacional, puede persistir la
heterogeneidad