Download STAT 555 Taller Dos Narrativo S2 2.3 ppt Medidas Descriptivas
Document related concepts
Transcript
STAT 555 Taller Dos Narrativo S2 2.3 ppt Medidas Descriptivas Numéricas Diapositiva 1 Saludos: En el Taller Dos se examinarán varios métodos estadísticos que ayudan a describir los valores típicos de los datos, así como la medida en que estos se dispersan. Estos métodos presentan una forma efectiva de exponer de manera sencilla y efectiva una situación compleja a través del resumen. Diapositiva 2 El primer grupo de herramientas estadísticas que se estudiarán son las medidas de tendencia central. Estas son: la media aritmética, la mediana y la moda. Las cuales permiten calcular el punto central de valores observados. Por ejemplo, en un curso de estadística hay 30 estudiantes matriculados y en el primer examen cada estudiante obtuvo una calificación, esto significa que hay 30 valores observados. A través de las medidas de tendencia central se puede establecer cuál fue la calificación promedio en el primer examen. En otras palabras, partiendo de los 30 valores observados ahora se obtiene un sólo resultado que los resume y provee un punto de partida para establecer conclusiones y/o tomar decisiones. Diapositiva 3 La Media Aritmética es la medida de tendencia central más popular y útil. Se calcula sumado los valores observados y dividiéndolos entre la cantidad de observaciones. Se aprecia que hay dos fórmulas; la primera se utiliza para calcular la media aritmética de una muestra y la segunda se aplica a la población. Diapositiva 4 En este ejemplo se utilizó la fórmula de muestra porque se consideraron 10 entregas y no la cantidad completa de entregas de ese proveedor en particular. El resultado se puede interpretar de la siguiente manera: “en promedio el proveedor tarda 6 días en realizar las entregas.” Diapositiva 5 La segunda medida de tendencia central que se discutirá es la mediana, la cual se define como el valor que tiene la misma cantidad de observaciones por encima y por debajo de este. STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas Page 1 En este punto hay que hacer una nota aclaratoria: cuando la cantidad de observaciones es impar la mediana es el punto medio entre las mismas y para conocer su posición sólo hay que utilizar la fórmula n+1 dividido entre dos. Sin embargo, cuando la cantidad de observaciones es par, la mediana es el punto medio entre los dos valores que están a la mitad de los datos (en este ejemplo la posición de la mediana es de 5.5 que cae entre los valor 8 y 9, por tanto ahora corresponde sumar ambos valores y dividirlos entre dos para conocer el valor de la mediana que es 8.5. Diapositiva 6 En este ejemplo la data es par, primero aplicamos la fórmula n+1 dividido entre dos para conocer la posición de la mediana y es 5.5. Cae entre los valores 6 y 6, luego se suman y se divide entre 2. La mediana es 6. Diapositiva 7 La tercera medida de tendencia central que se discutirá es la moda, la cual se define como el valor con mayor frecuencia dentro de un grupo de valores observados. En ocasiones en un grupo de valores observados se pueden encontrar dos o más modas. Diapositiva 8 En este ejemplo el valor que más se repite es el 6, por lo tanto esta es la moda. Diapositiva 9 Supongo que usted se pregunta, en qué momento es pertinente usar una u otra medida de tendencia central. Dependiendo del tipo de dato se decidirá qué herramienta aplicar. Diapositiva 10 El segundo grupo de herramientas estadísticas que se estudiarán son las medidas de variación o dispersión, donde se incluyen: el rango, la varianza y la desviación estándar. Las mismas permiten calcular la cantidad de dispersión. Recordemos el ejemplo del curso de estadística con 30 estudiantes matriculados y cada estudiante obtuvo una calificación en el primer examen. A través de las medidas de variación se puede establecer cuál es la diferencia o dispersión entre las calificaciones de los estudiantes. Nuevamente, partiendo de los 30 valores observados ahora se obtiene un sólo resultado que los resume. Diapositiva 11 La primera medida de variación a discutir es el rango, este es un método rápido, simple y superficial que consiste en restar la observación con el valor mayor a la observación con el valor menor. Su principal deficiencia es que sólo consideran los valores extremos de los valores observados y omite al resto de los valores. STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas Page 2 Diapositiva 12 Recordando el ejemplo de las entregas de un proveedor, la observación mayor es 7 y la observación menor es 5, por lo tanto el rango es de dos días. Diapositiva 13 A diferencia del rango, esta es una medida común de la dispersión que incluye todos los valores observados. La fórmula a utilizar dependerá si estamos realizando el estudio a una muestra o a una población. A continuación se resolverá un ejemplo de varianza para una muestra. Diapositiva 14 Para resolver este problema el primer paso es calcular la media aritmética de los valores observados, el resultado en este caso es de seis días. El segundo paso consiste en restar cada valor observado a la media aritmética, elevarlos al cuadrado y sumar todos los resultados. El último paso es tomar la sumatoria y dividirla entre el tamaño de la muestra menos 1. El resultado final es de .67. Diapositiva 15 La última medida de variación a discutir en esta presentación es la desviación estándar. Este es el método tradicional y usado ampliamente. Ayuda a establecer cuán lejos se encuentra una observación respecto de la media aritmética. Se calcula mediante de la raíz cuadrada positiva de la varianza. Diapositiva 16 Para resolver este ejemplo es necesario recordar el resultado de la varianza en el Diapositiva 14 que tiene como resultado .67. Así que el cálculo de la desviación estándar es la raíz cuadrada de dicho resultado y es .82. Esto representa cuanto se alejan los valores observados respecto a la media. Diapositiva 17 El coeficiente de variación indica la cantidad relativa de variación de los datos, al expresar la desviación como un porcentaje de la media aritmética. Esto permite comparar con facilidad las dispersiones de dos conjuntos de datos que tienen diferentes unidades de medición o magnitudes. Por ejemplo, el coeficiente de variación le permite comparar una empresa grande con una pequeña para determinar cual empresa tiene una variación mayor a base de su tamaño. El coeficiente de variación no es aplicable cuando la media es igual a cero, porque esto implica dividir la desviación estándar entre 0. STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas Page 3 Diapositiva 18 Para calcular el coeficiente de dispersión se tomó en consideración el resultado de la desviación estándar (numerador) que es .82 y el resultado de la media aritmética (denominador) que es 6. Resultado que se obtiene es .03 ó un 3%. Diapositiva 19 La última medida que se discutirá en este taller para representar los valores observados de una manera sencilla y resumida son los cuartiles. Los cuales representan una medida de posicionamiento relativo. Así como la media divide un grupo de valores observados por la mitad (dos grupos del mismo tamaño). Los cuartiles separan los datos en cuatro grupos de igual tamaño. Es importante que los datos estén ordenados de menor a mayor al momento de crear los grupos. Diapositiva 20 El gráfico que se presenta demuestra la división de los datos en cuatro grupos y cada uno de ellos representa un 25% de los valores. Para calcular los puntos de división entre los grupos: en el primer, segundo y tercer cuartil, se demuestran las fórmulas a utilizar. A continuación se resolverá un ejemplo que le ayudará a comprender mejor este tipo de herramienta. Diapositiva 21 Una vez los valores son ordenados de forma ascendente, los cuartiles se calculan de la misma forma que la mediana. Tal vez sea necesario interpolar (calcular una posición entre) dos valores para identificar la posición de los datos que corresponde al cuartil. Diapositiva 22 El diagrama de caja ayuda a presentar de forma gráfica cinco valores importantes: los dos valores extremos y los tres cuartiles. Este diagrama permite resaltar los valores relevantes de los datos así como la distribución de los mismos. Diapositiva 23 Le felicito, ahora puede seguir con las tareas del Taller Dos. STAT555 S2 2.3 ppt_Medidas Descriptivas Numéricas Page 4