Download Estadistica Descriptiva
Document related concepts
Transcript
Razonamiento Cuantitativo Fundamentos de estadística descriptiva Sexta Unidad: Fundamentos de estadística descriptiva Capitulo 12 Pág. 669 - 709 Diagramas De dispersión, de barras, grafica circular Polígono de frecuencias e Histograma Medidas de tendencia central Media aritmética Media ponderada Mediana Moda Medidas de dispersión Rango Desviación estándar Dr. Edwin Alfonso Sosa 2 Muestra es un subconjunto de la población Población: Todos los elemento de interés. Muestra: Algunos Población elementos de la población Muestra Se hacen inferencias estadísticas de la población basados en la información de la muestra. Dr. Edwin Alfonso Sosa 3 Distribución de frecuencias y graficas Datos en bruto: Cualitativos o Cuantitativos Distribución de frecuencias tabla graficas Dr. Edwin Alfonso Sosa 4 Distribución de frecuencias Sondeo: A un grupo de estudiantes se le pregunta cuantos hermanos tienen. Numero Frecuencia Frecuencia relativa f/N X f 1 4 4/25 = 16% 2 7 7/25 = 28% 3 6 6/25 = 24% 4 3 3/25 = 12% 5 3 3/25 = 12% 6 2 2/25 = 8% Total = 100% Dr. Edwin Alfonso Sosa 5 Histograma Frecuencia 8 6 4 2 0 1 2 3 4 5 6 Num . Herm anos Serie de rectángulos cuyas longitudes representan la frecuencia y se colocan uno al lado del otro. Dr. Edwin Alfonso Sosa 6 Polígono de Frecuencias Frecuencia 8 6 4 2 0 1 2 3 4 5 6 Num . de Herm anos Se coloca un punto a la altura de cada frecuencia. Dr. Edwin Alfonso Sosa 7 Frecuencia Diagrama de barras 7 6 5 4 3 2 1 0 A B C D Una distribución de frecuencia de observaciones no numéricas puede presentarse en forma de grafica de barras. Las barras no se tocan. Dr. Edwin Alfonso Sosa 8 Grafica Circular A B C D Se emplea un circulo para representar el total de todas las categorías y lo divide en sectores o pedazos cuyo tamaño representa la magnitud relativas de cada categoría. Dr. Edwin Alfonso Sosa 9 Diagrama de Dispersión Valor y 8 6 4 2 0 0 1 2 3 4 5 Valor x Ayuda a determinar tendencias entre el valor x y valor y . Se pueden identificar “outliers”. Dr. Edwin Alfonso Sosa 10 Medidas de tendencia central Encontrar un numero que sirva como un tipo de valor representativo para el conjunto completo de números en la muestra. Un valor alrededor del cual todos los números de la muestra tienden acumularse. Dr. Edwin Alfonso Sosa 11 Media Aritmética La media es el conjunto de todos los números que se encuentra al sumar todos los valores en el conjunto y dividir el resultado entre el numero de valores. Para la siguiente lista de datos, calcule la media aritmética: 7, 8, 9, 9, 10, 10, 10, 12, 12, 13: x x n x 100 x 10 n Dr. Edwin Alfonso Sosa 10 12 Media Aritmética ponderada x valor del dato x f w f w media aritmetica ponderada f frecuencia del valor sumatoria Dr. Edwin Alfonso Sosa 13 Ej. Media aritmética ponderada x f w f Curso 12 1.71 7 Calificación Puntos Créditos Puntos x Créditos x f x•f Historia D 1 3 3 Química C 2 3 6 Arte B 3 1 3 Σx = 6 Σf = 7 Σx•f = 12 Dr. Edwin Alfonso Sosa 14 Mediana La mediana es una especie de “medio” numero. Aquel valor que divide a un grupo de números en dos partes, de manera que la mitad de los números se encuentren por debajo de la mediana y la otra mitad se halle por encima. No se afecta con los valores extremos. Dr. Edwin Alfonso Sosa 15 Pasos para encontrar la mediana 1. Distribuya los datos en orden numérico 2. Si el numero de datos es impar, la mediana es el dato que se encuentra en la misma mitad de la lista. 3. Si el numero de datos es par, la mediana es la media aritmética de los dos datos que se encuentran en la mitad de la lista. Para la siguiente lista de datos, calcule la mediana: 7, 8, 9, 9, 10, 10, 10, 12, 12, 13: Dr. Edwin Alfonso Sosa 16 Encuentre la mediana 147, 159, 132, 181, 174, 253 1. 132, 147, 159, 174, 181, 253 2. Numero Par de datos: 159 174 333 166.5 2 2 Dr. Edwin Alfonso Sosa 17 Moda La moda es el valor que ocurre con mayor frecuencia. Algunos conjuntos de números poseen dos valores que tienen lugar con mas frecuencia y son bimodales. Otros conjuntos no tienen moda en absoluto (si no se da ningún valor mas frecuentemente que los otros o si mas de dos valores presentan la mayor frecuencia). Para la siguiente lista de datos, calcule la moda: 7, 8, 9, 9, 10, 10, 10, 12, 12, 13: 10 Dr. Edwin Alfonso Sosa 18 Las medidas de tendencia central no son suficientes para caracterizar una distribución ¿En cual de las distribuciones (A y B) que se muestran la media aritmética, 7, la representa mejor? A B 15 15 10 10 5 5 0 0 Ambas distribuciones de numero tienen la misma media (y mediana también), 7, pero fuera de esto son completamente independientes. En la segunda los valores difieren bastante de 7. Dr. Edwin Alfonso Sosa 19 Medidas de dispersión Necesitamos medidas de dispersión o despliegue de los datos Dr. Edwin Alfonso Sosa 20 Rango Para cualquier conjunto de datos, el rango de un conjunto de datos se da por: Rango = (valor mayor en el conjunto) – (valor menor en el conjunto). La distribución A y B tienen un rango: Ra = 9 – 5 = 4 Rb = 13 – 1 = 12 R b > Ra Dr. Edwin Alfonso Sosa 21 Varianza y desviación estándar Varianza, s2, mide la desviación de los datos alrededor de la media aritmética. Para obtenerla: 1. 2. 3. Calculas el cuadrado de las desviaciones para cada dato. Sumas los resultados anteriores Divides entre n – 1. La desviación estándar, s, es la raíz cuadrada de la varianza. Dr. Edwin Alfonso Sosa 22 Formula de Varianza x x 2 s s 2 2 desviacion estandar n 1 x valor del dato x media aritmetica n cantidad total de datos sumatoria Dr. Edwin Alfonso Sosa 23 Formula Desviación estándar x x 2 s s desviacion estandar n 1 x valor del dato x media aritmetica n cantidad total de datos sumatoria Dr. Edwin Alfonso Sosa 24 Ejemplo: Distribución A x x x x x 5 -2 4 6 -1 1 7 0 0 8 1 1 9 N=5 2 4 2 x x 2 Dr. Edwin Alfonso Sosa 10 25 Desviación estándar de la distribución A x x 2 s n 1 10 10 1.6 5 1 4 Dr. Edwin Alfonso Sosa 26 Ejemplo: Distribución B x x x x x 1 -6 36 2 -5 25 7 0 0 12 5 25 13 N=5 6 36 2 x x 2 Dr. Edwin Alfonso Sosa 122 27 Desviación estándar de la distribución B x x 2 s n 1 122 122 5.5 5 1 4 Por lo tanto la dispersión de los datos alrededor de la media es mayor en la distribución B. Dr. Edwin Alfonso Sosa 28 Encuentre los valores estadísticos de la muestra X X = {-3, -1, 0, 2, 5, 7, 11, 12, 12} Moda = 12 Mediana = 5 Media aritmética = 5.0 Rango = 12 – (-3) = 15 Varianza = 34.0 Desviación estándar s = 5.83 Dr. Edwin Alfonso Sosa x x x x x -3 -8 64 -1 -6 36 0 -5 25 2 -3 9 5 0 0 7 2 4 11 6 36 12 7 49 12 7 49 2 29 Ejemplo Tabla1 Sumas: x y x∙y x2 y2 1 2 2 1 4 2 4 8 4 16 3 6 18 9 36 6 12 28 14 56 Dr. Edwin Alfonso Sosa x x 2 1 0 1 2 30