Download independiente o predictora

Document related concepts

Coeficiente de determinación wikipedia , lookup

Regresión lineal wikipedia , lookup

Diagrama de dispersión wikipedia , lookup

Regresión segmentada wikipedia , lookup

Multicolinealidad wikipedia , lookup

Transcript
Regresión lineal
Es un modelo matemático para predecir el efecto
de una variable sobre otra, ambas cuantitativas.
Una variable es la dependiente y otra la
independiente
Se grafica con el diagrama de dispersión.
Dice cómo es la relación entre las dos variables.
El análisis consiste en encontrar la “mejor” línea
recta de esos puntos.
Supuestos
• La variable X o independiente o predictora (está bajo el
control del investigador), la variable Y es la variable
dependiente o predicha.
• Los valores de X son fijos (seleccionados previamente por el
investigador).
• Para cada X, existe un conjunto de valores de Y, que deben
seguir una distribución normal (es decir, los valores de Y
deben ser normales), para aplicar con validez los
procedimientos de inferencia y/o estimación.
• Todas las varianzas de las subpoblaciones de Y son iguales.
El modelo de regresión lineal
• La relación se puede representar gráficamente
mediante una línea recta.
Se supone que el error sigue una distribución
normal con media cero y varianza sigma2.
• El modelo de regresión completo es
y    x  e
Y es el valor de la variable dependiente
A o alfa es el intercepto, donde cruza el eje Y
B o beta es la pendiente o inclinación
Diagrama de dispersión
Diagrama de dispersión y recta
Prueba de hipótesis
• Prueba de Ho: beta=0, mediante el estadístico F.
• El modelo lineal proporciona un buen
ajuste para los datos, pero un modelo
curvilíneo podría proporcionar un mejor
ajuste.
Estudio de la significancia
• Tiene dos grandes partes:
– el análisis de varianza, que dice si el modelo es
significativo como un todo
– el estudio de los coeficientes individuales por
medio de una prueba t. La prueba t permite
probar hipótesis y construir intervalos de
confianza para los coeficientes del modelo
Ejemplo: regresión lineal simple
Ejemplo: regresión lineal simple
Tasa de mortalidad por
100,000
Temperatura media anual y tasa de mortalidad por
100,000 habitantes
y = -0,0592x + 4,6146
R2 = 0,8395
2,5
2
1,5
1
0,5
0
-0,5
0
20
40
60
Tem peratura
80
100
Correlación simple
Correlación simple
•
•
•
•
•
Es una extensión de la regresión simple.
Mide la calidad del ajuste de una línea.
Dice cuánto se relacionan las dos variables
r es el coeficiente de correlación
r2 es el coeficiente de determinación
var iación exp licada
r 
var iación total
2
Prueba de hipótesis
Ho: r=0, mediante la estadística F
• Si r es igual a cero, se concluye que no existe
correlación lineal entre las variables, pero
puede ser no lineal (exponencial, curva, etc.)
Coeficiente r de Pearson
Puede variar de –1 a +1
• -1 correlación negativa perfecta
• -0.9 correlación negativa muy fuerte
• -0.75 correlación negativa considerable
• -0.5 correlación negativa media
• -0.1 correlación negativa débil
• 0.0 no existe correlación entre las variables
Los programas reportan el valor de p del coeficiente para evaluar
la significancia de la correlación