Download independiente o predictora
Document related concepts
Transcript
Regresión lineal Es un modelo matemático para predecir el efecto de una variable sobre otra, ambas cuantitativas. Una variable es la dependiente y otra la independiente Se grafica con el diagrama de dispersión. Dice cómo es la relación entre las dos variables. El análisis consiste en encontrar la “mejor” línea recta de esos puntos. Supuestos • La variable X o independiente o predictora (está bajo el control del investigador), la variable Y es la variable dependiente o predicha. • Los valores de X son fijos (seleccionados previamente por el investigador). • Para cada X, existe un conjunto de valores de Y, que deben seguir una distribución normal (es decir, los valores de Y deben ser normales), para aplicar con validez los procedimientos de inferencia y/o estimación. • Todas las varianzas de las subpoblaciones de Y son iguales. El modelo de regresión lineal • La relación se puede representar gráficamente mediante una línea recta. Se supone que el error sigue una distribución normal con media cero y varianza sigma2. • El modelo de regresión completo es y x e Y es el valor de la variable dependiente A o alfa es el intercepto, donde cruza el eje Y B o beta es la pendiente o inclinación Diagrama de dispersión Diagrama de dispersión y recta Prueba de hipótesis • Prueba de Ho: beta=0, mediante el estadístico F. • El modelo lineal proporciona un buen ajuste para los datos, pero un modelo curvilíneo podría proporcionar un mejor ajuste. Estudio de la significancia • Tiene dos grandes partes: – el análisis de varianza, que dice si el modelo es significativo como un todo – el estudio de los coeficientes individuales por medio de una prueba t. La prueba t permite probar hipótesis y construir intervalos de confianza para los coeficientes del modelo Ejemplo: regresión lineal simple Ejemplo: regresión lineal simple Tasa de mortalidad por 100,000 Temperatura media anual y tasa de mortalidad por 100,000 habitantes y = -0,0592x + 4,6146 R2 = 0,8395 2,5 2 1,5 1 0,5 0 -0,5 0 20 40 60 Tem peratura 80 100 Correlación simple Correlación simple • • • • • Es una extensión de la regresión simple. Mide la calidad del ajuste de una línea. Dice cuánto se relacionan las dos variables r es el coeficiente de correlación r2 es el coeficiente de determinación var iación exp licada r var iación total 2 Prueba de hipótesis Ho: r=0, mediante la estadística F • Si r es igual a cero, se concluye que no existe correlación lineal entre las variables, pero puede ser no lineal (exponencial, curva, etc.) Coeficiente r de Pearson Puede variar de –1 a +1 • -1 correlación negativa perfecta • -0.9 correlación negativa muy fuerte • -0.75 correlación negativa considerable • -0.5 correlación negativa media • -0.1 correlación negativa débil • 0.0 no existe correlación entre las variables Los programas reportan el valor de p del coeficiente para evaluar la significancia de la correlación