Download anova

Document related concepts
no text concepts found
Transcript
USAP
Estadística Administrativa II
2016-1
1
𝜎
2
ANOVA
Análisis de varianza
2
La prueba
ANOVA
A menudo se necesitan hacer comparaciones para más
de dos medias y para ello se utilizan la metodología del
análisis de varianza (ANOVA), que recurre a la
distribución F.
3
Principio
Experimentos en agricultura
- Variación de tratamiento
- Variación aleatoria
Muestra 1
Muestra 2
Muestra 3
Muestra 4
4
Variación de tratamiento
“VARIACIÓN DE TRATAMIENTO: Suma de las
diferencias entre la media de cada tratamiento y la
media global elevada al cuadrado.” (Lind |Marchal
|Wathen, 2008, p.331).
- Media aritmética global
- Media aritmética de cada muestra
𝑋𝑖
𝑋=
𝑛
5
Variación de tratamiento
𝑉𝑇 = 𝑛1
𝑋𝑚1 − 𝑋𝑔
2
+ 𝑛2
𝑋𝑚2 − 𝑋𝑔
2
+…
• Calcular la media aritmética de cada
muestra
• Calcular la media aritmética de todos los
datos en análisis
• La diferencia entre la media muestral y la
media global; se eleva al cuadrado
• Se suman todas las diferencias cuadradas6
Ejemplo . . . (sin demostrar hipótesis)
El gerente de un centro financiero regional desea
comparar la productividad, medida por el número
de clientes atendidos, de 3 de sus empleados.
Selecciona 4 días en forma aleatoria y registra el
número de clientes que atendió cada empleado.
Los resultados obtenidos fueron:
LOBO
55
54
59
56
BLANCO CÓRDOVA
66
47
76
51
67
46
71
48
7
. . . Ejemplo
224
𝑋𝐿 =
= 56
4
280
𝑋𝐵 =
= 70
4
192
𝑋𝐶 =
= 48
4
696
𝑋𝑔 =
= 58
12
8
. . . Ejemplo
𝑋𝑚 − 𝑋𝑔
2
𝑉𝑇 = 992
9
Variación Aleatoria
“VARIACIÓN ALEATORIA: Suma de las
diferencias entre cada observación y su media
de tratamiento, elevada al cuadrado.” (Lind
|Marchal |Wathen, 2008, p.331).
- Observación ≡ Dato de una muestra
- Media aritmética de cada muestra
𝑋𝑖
𝑋=
𝑛
10
Variación Aleatoria
𝑉𝐴 =
𝑋𝑖 − 𝑋𝑚1
2
+
𝑋𝑗 − 𝑋𝑚2
2
+…
• Calcular la media aritmética de cada
muestra
• La diferencia entre el dato observado y la
media de la muestra se eleva al cuadrado
• Se suman todas las diferencias cuadradas
11
Ejemplo 1 . . . (sin demostrar hipótesis)
El gerente de un centro financiero regional desea
comparar la productividad, medida por el número
de clientes atendidos, de 3 de sus empleados.
Selecciona 4 días en forma aleatoria y registra el
número de clientes que atendió cada empleado.
Los resultados obtenidos fueron:
LOBO
55
54
59
56
224
56
BLANCO CÓRDOVA
66
47
76
51
67
46
71
48
280
192
70
48
696
58
12
. . . Ejemplo 1
𝑋𝑖 − 𝑋𝑚
2
𝑉𝐴 = 90
13
Distribución F para
ANOVA
𝑠12
𝐹= 2
𝑠2
14
Distribución F para Anova
𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠
𝑉𝑇
𝑒𝑛𝑡𝑟𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠
𝐹=
= 𝑘−1
𝑉𝐴
𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙
𝑛−𝑘
𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛
𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑜 𝑒𝑟𝑟𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 (𝑀𝑆𝐸)
• 𝑘 es el total de muestras en análisis
• 𝑛 es el total de elementos en análisis
15
Tabla resumen ANOVA
2
Variación
∑
Tratamiento
VT
Aleatoria
VA
Estimación
Varianza
Datos
gl
k
k-1
𝑉𝑇
𝑘 −1
n-k
𝑉𝐴
𝑛−𝑘
n
F
𝑉𝑇
𝑘 −1
𝑉𝐴
𝑛−𝑘
Error medio cuadrado
MSE
16
Ejemplo 1 . . .
El gerente de un centro financiero regional desea
comparar la productividad, medida por el número
de clientes atendidos, de 3 de sus empleados.
Selecciona 4 días en forma aleatoria y registra el
número de clientes que atendió cada empleado.
Con los datos observados, se
LOBO BLANCO CÓRDOVA
obtuvo una variación de
55
66
47
tratamiento de 992 y una
54
76
51
variación aleatoria de 90. Los
59
67
46
resultados se obtuvieron de las 56
71
48
siguientes muestras:
¿Existe alguna diferencia entre las medias de la
17
población con nivel de significancia de 0.10?
. . . Ejemplo 1
• Paso 1: Hipótesis nula y alternativa
𝐻0 : 𝜇𝑙𝑜𝑏𝑜 = 𝜇𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇𝑐ó𝑟𝑑𝑜𝑏𝑎
𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
• Paso 2: Nivel de significancia
𝛼 = 0.10
• Paso 3: Estadístico de prueba
𝑠12
𝐹= 2
𝑠2
18
. . . Ejemplo 1
• Paso 4: Regla de decisión
𝐻0 : 𝜇𝑙𝑜𝑏𝑜 = 𝜇𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇𝑐ó𝑟𝑑𝑜𝑏𝑎
2 𝑐𝑜𝑙𝑎𝑠
0.10
𝛼=
= 0.05
2
𝑘 = 3 𝑔𝑙1 = 3 − 1 = 2
𝑛 = 12 𝑔𝑙2 = 12 − 3 = 9
𝐹 = 4.26
19
. . . Ejemplo 1
𝐹 = 4.26
• Paso 5: Toma de decisión
La hipótesis nula se rechaza
Existe evidencia fuerte de que no todas las medias
de la población son iguales
20
Ejemplo 2 . . .
• La siguiente información se refiere a dos
muestras. Verificar la hipótesis de que las
medias de tratamiento son iguales con
nivel de significancia de 0.02.
Tratamiento 1
Tratamiento 2
Tratamiento 3
8
3
3
5
2
4
10
4
5
9
3
4
21
. . . Ejemplo 2
Paso 1: Hipótesis nula e hipótesis alternativa
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Paso 2: Nivel de significancia
𝛼 = 0.02
Paso 3: Estadístico de prueba
𝑠12
𝐹= 2
𝑠2
22
. . . Ejemplo 2
• Paso 4: Regla de decisión
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
2 𝑐𝑜𝑙𝑎𝑠
0.02
𝛼=
= 0.01
2
𝑘=3
𝑔𝑙1 = 3 − 1 = 2
𝑛 = 12 𝑔𝑙2 = 12 − 3 = 9
𝐹 = 8.02
23
. . . Ejemplo 2
• 𝑃𝑎𝑠𝑜 5: 𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛
Tratamiento 1 Tratamiento 2
8
5
10
9
Tratamiento 3
3
2
4
3
3
4
5
4
• 𝑘=3
• 𝑛 = 12
• 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra
Tratamiento 1 Tratamiento 2
8
3
Tratamiento 3
4
• 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global
Tratamiento 1 Tratamiento 2
Tratamiento 3
24
5
. . . Ejemplo 2
Plan
𝑋𝑖
Tratamiento
1
8
5
10
9
3
2
4
3
3
4
5
4
Tratamiento
2
Tratamiento
3
𝑋𝑚
𝑋𝑔
8
3
5
4
∑
Variación tratamiento
𝑋𝑚 − 𝑋𝑔
(8 - 5)2
(8 - 5)2
(8 - 5)2
(8 - 5)2
(3 - 5)2
(3 - 5)2
(3 - 5)2
(3 - 5)2
(4 - 5)2
(4 - 5)2
(4 - 5)2
(4 - 5)2
=
=
=
=
=
=
=
=
=
=
=
=
2
Variación aleatoria
𝑋𝑖 − 𝑋𝑚
9.0
9.0
9.0
9.0
4.0
4.0
4.0
4.0
1.0
1.0
1.0
1.0
56.0
(8 - 8)2 =
(5 - 8)2 =
(10 - 8)2 =
(9 - 8)2 =
(3 - 3)2 =
(2 - 3)2 =
(4 - 3)2 =
(3 - 3)2 =
(3 - 4)2 =
(4 - 4)2 =
(5 - 4)2 =
(4 - 4)2 =
2
0.0
9.0
4.0
1.0
0.0
1.0
1.0
0.0
1.0
0.0
1.0
0.0
18.0
25
𝐹 = 8.02
. . . Ejemplo 2
Variación
Tratamiento
Aleatoria
∑
2
56.0
18.0
k,n
3
12
Estimación
Varianza
gl
2
9
28.00
2.00
F
14.00
La hipótesis nula se rechaza
Existe evidencia suficiente que indica que no todas
las medias de la población son iguales
26
Las temperaturas promedio de las tres principales
ciudades fueron registradas en las siguientes muestras:
Tegucigalpa
San Pedro
Sula
Ceiba
18
29
31
22
32
30
24
38
35
19
29
31
28
32
32
Con un nivel de significancia de 0.10. probar si
las temperaturas son iguales en las 3 ciudades.
27
Desarrollo práctica 1
Paso 1: Hipótesis nula e hipótesis alternativa
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Paso 2: Nivel de significancia
𝛼 = 0.10
Paso 3: Estadístico de prueba
𝑠12
𝐹= 2
𝑠2
28
Desarrollo práctica 1
• Paso 4: Regla de decisión
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
2 𝑐𝑜𝑙𝑎𝑠
𝛼 0.10
=
= 0.05
2
2
𝑘=3
𝑔𝑙1 = 3 − 1 = 2
𝑛 = 15 𝑔𝑙2 = 15 − 3 = 12
𝐹 = 3.89
29
Desarrollo práctica 1
• 𝑃𝑎𝑠𝑜 5: 𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛
Tegucigalpa
San Pedro Sula
Ceiba
18
29
31
22
32
30
24
38
35
19
29
31
28
32
32
• 𝑘 =3
• 𝑛 = 15
𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra
Tegucigalpa
22.2
San Pedro
Sula
32
Ceiba
31.8
𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global
Global
28.7
30
Desarrollo práctica 1
Muestra
Xi
Tegucigalpa
18
22
24
19
28
29
32
38
29
32
31
30
35
31
32
San Pedro Sula
Ceiba
Variación
VA
VT
22.2
32
31.8
28.7
41.8
41.8
41.8
41.8
41.8
11.1
11.1
11.1
11.1
11.1
9.8
9.8
9.8
9.8
9.8
313.7
17.64
0.04
3.24
10.24
33.64
9
0
36
9
0
0.64
3.24
10.24
0.64
0.04
133.6
31
Desarrollo práctica 1
Variación
∑
2
n
gl
Estimación
de Varianza
Tratamiento
313.7
3
2
156.9
Aleatoria
133.6
15
12
11.1
Valor crítico
F
14.09
𝐹 = 3.89
La hipótesis nula se rechaza
32
Hipótesis nula
rechazada
La hipótesis nula rechazada indica que no todas las medias
son iguales; sin embargo, se puede identificar un par de
muestras para establecer el intervalo de confianza que nos
indique que tanto es esa diferencia.
33
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los
Negocios y la Economía. México: McGrawHill
David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para 34
Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall