Download Diapositiva 1 - GEOCITIES.ws
Document related concepts
Transcript
Estadística Capítulo 3.2 Resumen y descripción de datos numéricos 1-2008 1 Medidas de Variación 1-2008 2 Medidas de Variación La variación es la cantidad de dispersión o “separación” que presentan los datos entre sí. Muestra A Muestra B Los edificios B están más separados que los de grupo A. La dispersión en B es mayor que en A. 1-2008 3 Medidas de variación La medidas de variación más importantes en la estadística son: • • • • • 1-2008 Rango Rango intercuartil Varianza Desviación Estándar Coeficiente de variación 4 Rango Tal como se vio en las distribuciones de frecuencia, el rango es el valor que se encuentra restando los valores mayor y menor de los datos de una muestra con sus datos ordenados. Rango Dato mayor Dato menor 1-2008 5 Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de mayor a menor 29 31 Rango 1-2008 35 39 39 40 43 44 = 53 - 29 = 24 44 53 6 Rango Intercuartil El rango intercuartil se obtiene al restar el primer cuartil del tercer cuartil. Rango Intercuartil Q3 Q1 Esta medida considera la dispersión de la mitad de los datos; por lo tanto los valores extremos no influyen en los resultados. 1-2008 7 El rango intercuartil de los rendimientos anuales que obtuvieron los fondos nacionales cuyos cargos de venta se pagan con los activos de los fondos es de US$ 3.70 1-2008 8 Varianza y Desviación Estándar El rango es una medida de dispersión total y el rango intercuartil es una medida de dispersión media; sin embargo, ninguna de ellas toma en cuenta cómo se distribuyen o se agrupan las observaciones. 1-2008 9 Varianza y Desviación Estándar La varianza y la desviación estándar toman en cuenta cómo se distribuyen los datos entre sí. Estas medidas evalúan la manera en que fluctúan los valores respecto a la media aritmética (promedio). Lo anterior la convierte en una fuerte herramienta con la suficiente confianza para preparar conclusiones y proyecciones. 1-2008 10 Varianza (Muestral) La varianza muestral es la suma de los cuadrados de las diferencias con relación a la media aritmética dividida entre el cuadrado de la muestra menos 1 n S2 1-2008 • • • • 2 ( X X ) i i 1 S2 Ξ Varianza Xi Ξ Dato u observación X Ξ Media Aritmética n Ξ Tamaño de la muestra n 1 11 Varianza (Muestral) n S2 2 ( X X ) i i 1 n 1 El proceso para calcular la varianza se resume así: 1. 2. 3. 4. 5. Se calcula la media aritmética A cada dato de la muestra se le resta el valor de media aritmética El resultado de la resta se eleva al cuadrado Se suman todos los cuadrados obtenidos Dividir el resultado entre total de muestra menos 1 1-2008 12 Para una muestra de 17 fondos de acciones generales con cargos de venta pagados por activos de los fondos, calcular la varianza. 32.2 29.5 29.9 32.4 30.5 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1 28.6 n S2 1-2008 2 ( X X ) i i 1 n 1 13 Calcular la media aritmética 507.7 X 29.86 17 1-2008 32.2 29.5 29.9 32.4 30.5 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1 28.6 507.7 14 Xi X1 X2 X3 X4 X5 X6 X7 X8 X9 1-2008 = = = = = = = = = X 32.2 29.5 29.9 32.4 30.5 30.1 32.1 35.2 10.0 29.86 29.86 29.86 29.86 29.86 29.86 29.86 29.86 29.86 Xi X 2.34 -0.36 0.04 2.54 0.64 0.24 2.24 5.34 -19.86 ( X i X )2 5.4756 0.1296 0.0016 6.4516 0.4096 0.0576 5.0176 28.5156 394.4196 15 Xi ( X i X )2 X10 = 20.6 X11 = 28.6 29.86 -1.26 1.5876 X12 = 30.5 29.86 0.64 0.4096 X13 = 38.0 29.86 8.14 66.2596 X14 = 33.0 29.86 3.14 9.8596 X15 = 29.4 29.86 -0.46 0.2116 X16 = 37.1 29.86 7.24 52.4176 X17 = 28.6 29.86 -1.26 1.5876 Total 1-2008 Xi X X 29.86 -9.26 85.7476 658.5592 16 n S 2 (X i 1 i X) 2 n 1 658.5592 2 S 17 1 2 S 41.15995 1-2008 17 Desviación Estándar La desviación estándar de la muestra es la raíz cuadrada de la varianza. n S 1-2008 2 ( X X ) i i 1 n 1 18 Para la muestra que contiene 17 fondos de acciones generales con cargos de venta pagados por activos de los fondos, calcular la varianza. 32.2 29.5 29.9 32.4 30.5 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1 28.6 n S 1-2008 2 ( X X ) i i 1 n 1 19 En el ejemplo 3.11, se hizo el cálculo de la varianza, con un resultado de 41.15995. n S 2 ( X X ) i i 1 n 1 S S2 S 41.15995 1-2008 S 6.42 20 Coeficiente de Variación A diferencia de las medidas que hemos estudiado hasta ahora, el coeficiente de variación es una indicación relativa de la variación. Siempre se expresa en porcentajes, no en términos de la unidad de medida de los datos estudiados. Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de hacer comparaciones entre muestras. 1-2008 21 Coeficiente de Variación El coeficiente de variación se calcula de la siguiente manera: S CV *100 X 1-2008 22 Calcular el coeficiente de variación para los 17 fondos de acciones generales 1-2008 32.2 29.5 29.9 32.4 30.5 30.1 32.1 35.2 10.0 20.6 28.6 30.5 38.0 33.0 29.4 37.1 28.6 23 * El valor de la media aritmética es 29.86 * El valor de la desviación estándar es 6.42 S 6.42 CV (100) 21.50% X 29.86 El coeficiente de variación es 21.50% 1-2008 24 Puntuaciones Z Un valor extremo o atípico es un valor ubicado muy lejos de la media. Las puntuaciones Z son útiles para identificar atípicos. Cuanto mayor es la puntuación Z, mayor es la distancia entre tal valor y la media. La puntuación Z es igual a la diferencia entre ese valor y la media, dividida por la desviación estándar. 1-2008 25 Puntuación Z x X Z s Una puntuación Z se considera atípica si es menor que -3.0 o mayor que +3.0 1-2008 26 Se considera que la media para arreglarse en la mañana es de 39.6 minutos y la desviación estándar de 6.77 minutos. Sí el día lunes se toma 39.0 minutos para arreglarse. Calcular la puntuación Z para este día. 1-2008 39.0 39.6 Z 6.77 Z 0.09 27 Supongamos que el gerente de operaciones de un servicio de paquetería desea adquirir una nueva flotilla de vehículos. Cuando los paquetes se guardan con eficiencia en el interior de los vehículos – durante la preparación de las entregas-, se deben considerar dos restricciones: el peso (en libras) y el volumen (en pies cúbicos) de cada paquete. 1-2008 28 Ahora supongamos que en una muestra de 200 paquetes, el peso promedio es de 26.0 libras con una desviación estándar de 3.9 libras. Por otro lado, el volumen promedio de cada paquete es 8.8 pies cúbicos con una desviación estándar de 2.2 pies cúbicos. ¿Cómo se puede comparar la variación del peso y el volumen? 1-2008 29 Coeficiente de Variación del Peso CV peso 3.9 (100%) 15% 26.0 Coeficiente de Variación del Volumen CVvolumen 2.2 (100%) 25% 8.8 El volumen de un paquete es más variable que el peso. Ya que el coeficiente de variación del volumen es 25% mientras que el peso es de 15%. 1-2008 30 Cada acción de la compañía “As” ha promediado 50 dólares en los últimos meses, con una desviación estándar de 10 dólares. Además, durante el mismo período el precio promedio de las acciones de la compañía “Bonita” fue de 12 dólares con una desviación estándar de 4 dólares. ¿Cómo puede determinar un inversionista cuáles acciones son más variables? 1-2008 31 Coeficiente de Variación de la Compañía “As” CVas 10 (100%) 20% 50 Coeficiente de Variación de Compañía “Bonita” CVbonita 4 (100%) 33.3% 12 El precio de las acciones de “Bonita” varía más que el precio de las acciones de “As”. El inversionista puede decidir comprar las acciones de “As”; su coeficiente de variación fluctúa menos. 1-2008 32 Forma Se refiere a la forma en que se distribuyen los datos. La observación de la forma puede obtenerse a través de distribución de frecuencias o del gráfico 1-2008 33 Forma La distribución de los datos puede ser simétrica o no. La no simetría también se le conoce como: • Asimétrica • Sesgada 1-2008 34 Forma La simetría se determina con la comparación de la media y la mediana • La media es igual a la mediana, la distribución es simétrica (insesgada) • La media es menor a la mediana, la distribución es sesgada a la izquierda (sesgo negativo) • Si la media es mayor que la medina, la distribución es sesgada a la derecha (sesgo positivo) 1-2008 35 Insesgada 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 • La media es igual a la mediana, la distribución es simétrica. 1-2008 36 Sesgada a la izquierda 20 15 10 5 0 1 2 3 4 5 6 7 8 9 • La media es menor a la mediana, la distribución es sesgada a la izquierda (sesgo negativo) 1-2008 37 Sesgada a la derecha 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 • Si la media es mayor que la mediana, la distribución es sesgada a la derecha (sesgo positivo) 1-2008 38