Download Diapositiva 1

Document related concepts
no text concepts found
Transcript
Tema 6: Análisis de la Varianza
(2ª parte: ANOVA multifactorial)
4. Anova multifactorial: planteamiento general
PROBLEMA: Dada una variable cuantitativa continua Y, varias variables
cualitativas F1, F2,…, Fn, determínese cuáles de ellas influyen en Y, y cuáles
no (es decir, cuáles guardan relación con Y).
Y: variable respuesta (numérica)
F1, F2,…, Fn : factores (cualitativas)
Ejemplo: Y tiempo de cura, F1 medicamento administrado, F2 grupo
sanguíneo; Y nº de visitas a una página web, F1 nivel de estudios,
F2 sexo.
Si Fi influye en el valor de Y (si existen diferencias significativas en Y
según los distintos valores de Fi) decimos que Fi es SIGNIFICATIVO.
Por tanto, un primer problema consiste en determinar cuáles de
los factores considerados en un cierto estudio, son significativos.
Dos modelos:
1. Sin interacción: consideramos que los efectos de los factores se suman,
sin que la combinación de factores produzca cambios cualitativos.
PROBLEMA: Determinar factores significativos.
2. Con interacción: consideramos la posibilidad de que la combinación de
factores produzca cambios cualitativos.
PROBLEMA 1: Determinar factores significativos.
PROBLEMA 2: Determinar la existencia de “interacción” entre
factores (es decir, qué combinaciones de factores
pueden tener un efecto cualitativo distinto a la
mera suma de efectos).
Un intento de visualizar qué implica que un factor sea o no significativo….
Y
1
2
F2
B
A
F1
Las medias en A y B parecen muy
Y
diferentes; por tanto, F1 significativo.
µB
µA
1
2
F2
B
A
F1
µ1
Y
µ2
1
2
F2
B
A
F1
Las medias en 1 y 2 parecen muy
similares; por tanto, F2 NO significativo.
5. Modelo de ANOVA multifactorial sin interacción
- Modelo: PIZARRA
- Requisitos del modelo: suponemos que F1 tiene “a” niveles,
y F2 tiene “b” niveles. Por tanto, en total hay a.b subgrupos.
1.- Cada uno de los subgrupos es normal.
2.- La varianza es la misma en todos ellos (Homocedasticidad)
3.- Independencia de las observaciones (residuos aleatorios)
1 + 2 + 3 = Residuos normales N(0,σ); σ: error experimental
Esto es lo que, en este caso, debemos
comprobar
Descomposición de la variabilidad (dos factores):
VT = VE(α) + VE(β) + VNE
Variabilidad
total
Explicada por
el primer factor
No explicada o
residual
Explicada por
el primer factor
Un factor será significativo si está “explicando” una
parte significativa de la variabilidad total…
Ejemplo (Selectividad):
Coeficiente de determinación (dos factores):
Es una medida de la “bondad” del modelo (se entiende
que realizamos el ANOVA para explicar las diferencias
encontradas en la variable respuesta; este coeficiente
mide el porcentaje de variabilidad que estamos
explicando).
VE VE ( )  VE (  )
R 

 R2  R2
VT
VT
2
total
parciales,
asociados a
los distintos
factores.
Análogamente, si tenemos más de dos factores…
¿Por qué no aplicar varios ANOVAS simples?
Con un ANOVA simple, toda la variabilidad que no es explicada por un
factor queda camuflada como “azar”; por tanto, con varios ANOVAS
simples, los factores más potentes son visibles, pero otros pueden
quedar “escondidos”.
efectos
“uno a uno”
“todos juntos”
F1 F2 F3
factores
6. Modelo de ANOVA multifactorial con interacción
Decimos que existe INTERACCION si los factores no son independientes, es decir, si el efecto de alguno de ellos depende del nivel en
que esté el otro.
Idea intuitiva de lo que supone
la existencia de interacción…
Y
B
A
1
2
1
2
F2
B
A
F1
Y
NO hay interacción
B
A
1
2
1
2
F2
B
A
F1
Y
A
B
1
2
1
2
F2
B
A
F1
Y
SI hay interacción
A
B
1
2
1
2
F2
B
A
F1
- Modelo: PIZARRA
- Requisitos del modelo: 1,2,3 como en el caso sin interacción (ojo, los
residuos no son los mismos en uno y otro caso).
1 + 2 + 3 = Residuos normales N(0,σ); σ: error experimental
Esto es lo que, en este caso, debemos
comprobar
- IMPORTANTE: para poder estudiar la interacción, necesitamos tener
al menos una observación por cada combinación de niveles entre los
factores (es decir, es un modelo más completo, pero también más
“caro”).
Descomposición de la variabilidad (dos factores):
VT = VE(α) + VE(β) + VE(αβ) + VNE
Variabilidad
total
Explicada por Explicada por
el primer factor el primer factor
No explicada o
residual
Explicada por la
interacción
Un factor (resp. interacción) será significativo si está
“explicando” una parte significativa de la variabilidad
total…
Statgraphics