Download anova
Document related concepts
no text concepts found
Transcript
USAP Estadística Administrativa II 2016-1 1 𝜎 2 ANOVA Análisis de varianza 2 La prueba ANOVA A menudo se necesitan hacer comparaciones para más de dos medias y para ello se utilizan la metodología del análisis de varianza (ANOVA), que recurre a la distribución F. 3 Principio Experimentos en agricultura - Variación de tratamiento - Variación aleatoria Muestra 1 Muestra 2 Muestra 3 Muestra 4 4 Variación de tratamiento “VARIACIÓN DE TRATAMIENTO: Suma de las diferencias entre la media de cada tratamiento y la media global elevada al cuadrado.” (Lind |Marchal |Wathen, 2008, p.331). - Media aritmética global - Media aritmética de cada muestra 𝑋𝑖 𝑋= 𝑛 5 Variación de tratamiento 𝑉𝑇 = 𝑛1 𝑋𝑚1 − 𝑋𝑔 2 + 𝑛2 𝑋𝑚2 − 𝑋𝑔 2 +… • Calcular la media aritmética de cada muestra • Calcular la media aritmética de todos los datos en análisis • La diferencia entre la media muestral y la media global; se eleva al cuadrado • Se suman todas las diferencias cuadradas6 Ejemplo . . . (sin demostrar hipótesis) El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados obtenidos fueron: LOBO 55 54 59 56 BLANCO CÓRDOVA 66 47 76 51 67 46 71 48 7 . . . Ejemplo 224 𝑋𝐿 = = 56 4 280 𝑋𝐵 = = 70 4 192 𝑋𝐶 = = 48 4 696 𝑋𝑔 = = 58 12 8 . . . Ejemplo 𝑋𝑚 − 𝑋𝑔 2 𝑉𝑇 = 992 9 Variación Aleatoria “VARIACIÓN ALEATORIA: Suma de las diferencias entre cada observación y su media de tratamiento, elevada al cuadrado.” (Lind |Marchal |Wathen, 2008, p.331). - Observación ≡ Dato de una muestra - Media aritmética de cada muestra 𝑋𝑖 𝑋= 𝑛 10 Variación Aleatoria 𝑉𝐴 = 𝑋𝑖 − 𝑋𝑚1 2 + 𝑋𝑗 − 𝑋𝑚2 2 +… • Calcular la media aritmética de cada muestra • La diferencia entre el dato observado y la media de la muestra se eleva al cuadrado • Se suman todas las diferencias cuadradas 11 Ejemplo 1 . . . (sin demostrar hipótesis) El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Los resultados obtenidos fueron: LOBO 55 54 59 56 224 56 BLANCO CÓRDOVA 66 47 76 51 67 46 71 48 280 192 70 48 696 58 12 . . . Ejemplo 1 𝑋𝑖 − 𝑋𝑚 2 𝑉𝐴 = 90 13 Distribución F para ANOVA 𝑠12 𝐹= 2 𝑠2 14 Distribución F para Anova 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎𝑠 𝑉𝑇 𝑒𝑛𝑡𝑟𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙𝑒𝑠 𝐹= = 𝑘−1 𝑉𝐴 𝐸𝑠𝑡𝑖𝑚𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑛−𝑘 𝑏𝑎𝑠𝑎𝑑𝑎 𝑒𝑛 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑜 𝑒𝑟𝑟𝑜𝑟 𝑚𝑒𝑑𝑖𝑜 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜 (𝑀𝑆𝐸) • 𝑘 es el total de muestras en análisis • 𝑛 es el total de elementos en análisis 15 Tabla resumen ANOVA 2 Variación ∑ Tratamiento VT Aleatoria VA Estimación Varianza Datos gl k k-1 𝑉𝑇 𝑘 −1 n-k 𝑉𝐴 𝑛−𝑘 n F 𝑉𝑇 𝑘 −1 𝑉𝐴 𝑛−𝑘 Error medio cuadrado MSE 16 Ejemplo 1 . . . El gerente de un centro financiero regional desea comparar la productividad, medida por el número de clientes atendidos, de 3 de sus empleados. Selecciona 4 días en forma aleatoria y registra el número de clientes que atendió cada empleado. Con los datos observados, se LOBO BLANCO CÓRDOVA obtuvo una variación de 55 66 47 tratamiento de 992 y una 54 76 51 variación aleatoria de 90. Los 59 67 46 resultados se obtuvieron de las 56 71 48 siguientes muestras: ¿Existe alguna diferencia entre las medias de la 17 población con nivel de significancia de 0.10? . . . Ejemplo 1 • Paso 1: Hipótesis nula y alternativa 𝐻0 : 𝜇𝑙𝑜𝑏𝑜 = 𝜇𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇𝑐ó𝑟𝑑𝑜𝑏𝑎 𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 • Paso 2: Nivel de significancia 𝛼 = 0.10 • Paso 3: Estadístico de prueba 𝑠12 𝐹= 2 𝑠2 18 . . . Ejemplo 1 • Paso 4: Regla de decisión 𝐻0 : 𝜇𝑙𝑜𝑏𝑜 = 𝜇𝑏𝑙𝑎𝑛𝑐𝑜 = 𝜇𝑐ó𝑟𝑑𝑜𝑏𝑎 2 𝑐𝑜𝑙𝑎𝑠 0.10 𝛼= = 0.05 2 𝑘 = 3 𝑔𝑙1 = 3 − 1 = 2 𝑛 = 12 𝑔𝑙2 = 12 − 3 = 9 𝐹 = 4.26 19 . . . Ejemplo 1 𝐹 = 4.26 • Paso 5: Toma de decisión La hipótesis nula se rechaza Existe evidencia fuerte de que no todas las medias de la población son iguales 20 Ejemplo 2 . . . • La siguiente información se refiere a dos muestras. Verificar la hipótesis de que las medias de tratamiento son iguales con nivel de significancia de 0.02. Tratamiento 1 Tratamiento 2 Tratamiento 3 8 3 3 5 2 4 10 4 5 9 3 4 21 . . . Ejemplo 2 Paso 1: Hipótesis nula e hipótesis alternativa 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼 = 0.02 Paso 3: Estadístico de prueba 𝑠12 𝐹= 2 𝑠2 22 . . . Ejemplo 2 • Paso 4: Regla de decisión 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 2 𝑐𝑜𝑙𝑎𝑠 0.02 𝛼= = 0.01 2 𝑘=3 𝑔𝑙1 = 3 − 1 = 2 𝑛 = 12 𝑔𝑙2 = 12 − 3 = 9 𝐹 = 8.02 23 . . . Ejemplo 2 • 𝑃𝑎𝑠𝑜 5: 𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛 Tratamiento 1 Tratamiento 2 8 5 10 9 Tratamiento 3 3 2 4 3 3 4 5 4 • 𝑘=3 • 𝑛 = 12 • 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra Tratamiento 1 Tratamiento 2 8 3 Tratamiento 3 4 • 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global Tratamiento 1 Tratamiento 2 Tratamiento 3 24 5 . . . Ejemplo 2 Plan 𝑋𝑖 Tratamiento 1 8 5 10 9 3 2 4 3 3 4 5 4 Tratamiento 2 Tratamiento 3 𝑋𝑚 𝑋𝑔 8 3 5 4 ∑ Variación tratamiento 𝑋𝑚 − 𝑋𝑔 (8 - 5)2 (8 - 5)2 (8 - 5)2 (8 - 5)2 (3 - 5)2 (3 - 5)2 (3 - 5)2 (3 - 5)2 (4 - 5)2 (4 - 5)2 (4 - 5)2 (4 - 5)2 = = = = = = = = = = = = 2 Variación aleatoria 𝑋𝑖 − 𝑋𝑚 9.0 9.0 9.0 9.0 4.0 4.0 4.0 4.0 1.0 1.0 1.0 1.0 56.0 (8 - 8)2 = (5 - 8)2 = (10 - 8)2 = (9 - 8)2 = (3 - 3)2 = (2 - 3)2 = (4 - 3)2 = (3 - 3)2 = (3 - 4)2 = (4 - 4)2 = (5 - 4)2 = (4 - 4)2 = 2 0.0 9.0 4.0 1.0 0.0 1.0 1.0 0.0 1.0 0.0 1.0 0.0 18.0 25 𝐹 = 8.02 . . . Ejemplo 2 Variación Tratamiento Aleatoria ∑ 2 56.0 18.0 k,n 3 12 Estimación Varianza gl 2 9 28.00 2.00 F 14.00 La hipótesis nula se rechaza Existe evidencia suficiente que indica que no todas las medias de la población son iguales 26 Las temperaturas promedio de las tres principales ciudades fueron registradas en las siguientes muestras: Tegucigalpa San Pedro Sula Ceiba 18 29 31 22 32 30 24 38 35 19 29 31 28 32 32 Con un nivel de significancia de 0.10. probar si las temperaturas son iguales en las 3 ciudades. 27 Desarrollo práctica 1 Paso 1: Hipótesis nula e hipótesis alternativa 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠 Paso 2: Nivel de significancia 𝛼 = 0.10 Paso 3: Estadístico de prueba 𝑠12 𝐹= 2 𝑠2 28 Desarrollo práctica 1 • Paso 4: Regla de decisión 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 2 𝑐𝑜𝑙𝑎𝑠 𝛼 0.10 = = 0.05 2 2 𝑘=3 𝑔𝑙1 = 3 − 1 = 2 𝑛 = 15 𝑔𝑙2 = 15 − 3 = 12 𝐹 = 3.89 29 Desarrollo práctica 1 • 𝑃𝑎𝑠𝑜 5: 𝑇𝑜𝑚𝑎 𝑑𝑒 𝐷𝑒𝑐𝑖𝑠𝑖ó𝑛 Tegucigalpa San Pedro Sula Ceiba 18 29 31 22 32 30 24 38 35 19 29 31 28 32 32 • 𝑘 =3 • 𝑛 = 15 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 de cada muestra Tegucigalpa 22.2 San Pedro Sula 32 Ceiba 31.8 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚é𝑡𝑖𝑐𝑎 global Global 28.7 30 Desarrollo práctica 1 Muestra Xi Tegucigalpa 18 22 24 19 28 29 32 38 29 32 31 30 35 31 32 San Pedro Sula Ceiba Variación VA VT 22.2 32 31.8 28.7 41.8 41.8 41.8 41.8 41.8 11.1 11.1 11.1 11.1 11.1 9.8 9.8 9.8 9.8 9.8 313.7 17.64 0.04 3.24 10.24 33.64 9 0 36 9 0 0.64 3.24 10.24 0.64 0.04 133.6 31 Desarrollo práctica 1 Variación ∑ 2 n gl Estimación de Varianza Tratamiento 313.7 3 2 156.9 Aleatoria 133.6 15 12 11.1 Valor crítico F 14.09 𝐹 = 3.89 La hipótesis nula se rechaza 32 Hipótesis nula rechazada La hipótesis nula rechazada indica que no todas las medias son iguales; sin embargo, se puede identificar un par de muestras para establecer el intervalo de confianza que nos indique que tanto es esa diferencia. 33 Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística Aplicada a los Negocios y la Economía. México: McGrawHill David M. Levine, Timothy C. Krehbiel, Mark L. Berenson. 2006. Estadística para 34 Administración. (4° edición). Naucalpan de Juárez, México.: Pearson Prentice Hall