Download Diapositiva 1
Document related concepts
no text concepts found
Transcript
Tema 6: Análisis de la Varianza (2ª parte: ANOVA multifactorial) 4. Anova multifactorial: planteamiento general PROBLEMA: Dada una variable cuantitativa continua Y, varias variables cualitativas F1, F2,…, Fn, determínese cuáles de ellas influyen en Y, y cuáles no (es decir, cuáles guardan relación con Y). Y: variable respuesta (numérica) F1, F2,…, Fn : factores (cualitativas) Ejemplo: Y tiempo de cura, F1 medicamento administrado, F2 grupo sanguíneo; Y nº de visitas a una página web, F1 nivel de estudios, F2 sexo. Si Fi influye en el valor de Y (si existen diferencias significativas en Y según los distintos valores de Fi) decimos que Fi es SIGNIFICATIVO. Por tanto, un primer problema consiste en determinar cuáles de los factores considerados en un cierto estudio, son significativos. Dos modelos: 1. Sin interacción: consideramos que los efectos de los factores se suman, sin que la combinación de factores produzca cambios cualitativos. PROBLEMA: Determinar factores significativos. 2. Con interacción: consideramos la posibilidad de que la combinación de factores produzca cambios cualitativos. PROBLEMA 1: Determinar factores significativos. PROBLEMA 2: Determinar la existencia de “interacción” entre factores (es decir, qué combinaciones de factores pueden tener un efecto cualitativo distinto a la mera suma de efectos). Un intento de visualizar qué implica que un factor sea o no significativo…. Y 1 2 F2 B A F1 Las medias en A y B parecen muy Y diferentes; por tanto, F1 significativo. µB µA 1 2 F2 B A F1 µ1 Y µ2 1 2 F2 B A F1 Las medias en 1 y 2 parecen muy similares; por tanto, F2 NO significativo. 5. Modelo de ANOVA multifactorial sin interacción - Modelo: PIZARRA - Requisitos del modelo: suponemos que F1 tiene “a” niveles, y F2 tiene “b” niveles. Por tanto, en total hay a.b subgrupos. 1.- Cada uno de los subgrupos es normal. 2.- La varianza es la misma en todos ellos (Homocedasticidad) 3.- Independencia de las observaciones (residuos aleatorios) 1 + 2 + 3 = Residuos normales N(0,σ); σ: error experimental Esto es lo que, en este caso, debemos comprobar Descomposición de la variabilidad (dos factores): VT = VE(α) + VE(β) + VNE Variabilidad total Explicada por el primer factor No explicada o residual Explicada por el primer factor Un factor será significativo si está “explicando” una parte significativa de la variabilidad total… Ejemplo (Selectividad): Coeficiente de determinación (dos factores): Es una medida de la “bondad” del modelo (se entiende que realizamos el ANOVA para explicar las diferencias encontradas en la variable respuesta; este coeficiente mide el porcentaje de variabilidad que estamos explicando). VE VE ( ) VE ( ) R R2 R2 VT VT 2 total parciales, asociados a los distintos factores. Análogamente, si tenemos más de dos factores… ¿Por qué no aplicar varios ANOVAS simples? Con un ANOVA simple, toda la variabilidad que no es explicada por un factor queda camuflada como “azar”; por tanto, con varios ANOVAS simples, los factores más potentes son visibles, pero otros pueden quedar “escondidos”. efectos “uno a uno” “todos juntos” F1 F2 F3 factores 6. Modelo de ANOVA multifactorial con interacción Decimos que existe INTERACCION si los factores no son independientes, es decir, si el efecto de alguno de ellos depende del nivel en que esté el otro. Idea intuitiva de lo que supone la existencia de interacción… Y B A 1 2 1 2 F2 B A F1 Y NO hay interacción B A 1 2 1 2 F2 B A F1 Y A B 1 2 1 2 F2 B A F1 Y SI hay interacción A B 1 2 1 2 F2 B A F1 - Modelo: PIZARRA - Requisitos del modelo: 1,2,3 como en el caso sin interacción (ojo, los residuos no son los mismos en uno y otro caso). 1 + 2 + 3 = Residuos normales N(0,σ); σ: error experimental Esto es lo que, en este caso, debemos comprobar - IMPORTANTE: para poder estudiar la interacción, necesitamos tener al menos una observación por cada combinación de niveles entre los factores (es decir, es un modelo más completo, pero también más “caro”). Descomposición de la variabilidad (dos factores): VT = VE(α) + VE(β) + VE(αβ) + VNE Variabilidad total Explicada por Explicada por el primer factor el primer factor No explicada o residual Explicada por la interacción Un factor (resp. interacción) será significativo si está “explicando” una parte significativa de la variabilidad total… Statgraphics