Download La mediana y moda.
Document related concepts
Transcript
INSTITUTO SUPERIOR DE FORMACION DOCENTE SALOME UREÑA (ISFODOSU) Estadística Descriptiva Este material ha sido preparado por Prof. Rafael David Francisco Ventura, M. A. Santo Domingo República Dominicana Introducción Son muchos los fenómenos o sucesos que no tienen respuesta alguna, es por esto, que se debe proceder a hacer estudios pertinentes que aclaren la situación que se desea analizar, este hecho se logra por medio de la experimentación constante que muestra cada uno de los resultados que se van obteniendo con ayuda de la estadística la cual permite que aquellas situaciones impredecibles se pueden volver cada vez mas explicativas. La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual puede experimentar. Su tarea fundamental es la reducción de datos que se obtiene a partir de experimentos, con el objetivo de representar la realidad y transformarla, predecir su futuro o simplemente conocerla. La estadística está presente en todas las áreas del saber. La estadística es una ciencia de aplicación práctica casi universal en todos los campos científicos: * En las ciencias naturales: se emplea con profusión en la descripción de modelos termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre otros muchos campos. * En las ciencias sociales y económicas: es un pilar básico del desarrollo de la demografía y la sociología aplicada. * En economía: suministra los valores que ayudan a descubrir interrelaciones entre múltiples parámetros macro y microeconómicos. * En las ciencias médicas: permite establecer pautas sobre la evolución de las enfermedades y los enfermos, los índices de mortalidad asociados a procesos morbosos, el grado de eficacia de un medicamento, etcétera. Definición de Estadística La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. Obtención de conclusiones. Conceptos de Estadística Población Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico. Individuo Un individuo o unidad estadística es cada uno de los elementos que componen la población. Muestra Una muestra es un conjunto representativo de la población de referencia, el número de indi viduos de una muestra es menor que el de la población. Muestreo El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población. Valor Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Definición de variable Una variable estadística es cada una de las características o cualidades que poseen los individuos de una población . Tipos de variables estadísticas Variable cualitativa Las variables cualitativas se refieren a características cualidades que no pueden ser medidas con números . Podemos distinguir dos tipos: o Variable cualitativa nominal Una variable cualitativa nominal presenta numéricas que no admiten un criterio de orden . Por ejemplo: El estado civil, divorciado y vi udo. con las siguientes modalidades: modalidades soltero, casado, no separado, Variable cualitativa ordinal o variable cuasi cuantitativa Una variable cualitativa ordinal presenta modalidades no numéricas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. Puesto conseguido en una prueba deportiva: 1º, 2º, 3º ,... Medallas de una prueba deportiva: oro, plata, bronce. Variable cuantitativa Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden reali zar o peraciones aritméticas con ella. Podemos distinguir dos tipos: Variable discreta Una variable discreta es aquella que toma valores aislados , decir no admite valores intermedios entre dos valores específicos. Por ejemplo: es El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. Variable continua Una variable continua es aquella que puede tomar valores comprendidos entre dos números . Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales. Distribución de frecuencias La distribución de frecuencias o tabla de frecuencias es una ordenación en forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia correspondiente. Tipos de frecuencias Frecuencia absoluta La frecuencia absoluta es el número determinado valor en un estudio estadístico. de veces que aparece un Se representa por f i . La suma de las frecuencias absolutas es igual al número tota l de datos, que se representa por N. Para indicar resumidamente estas mayúscula) que se lee suma o sumatoria. sumas se utiliza la letra griega Σ (sigma Frecuencia relativa La frecuencia relativa es el cociente entre determinado valor y el número total de datos. la frecuencia absoluta de un Se puede expresar en tantos por ciento y se representa por n i . La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por F i . Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos . Se puede expresar en tantos por ciento. Ejemplo Durante el mes de temperaturas máximas: julio, en una ciudad se han registrado las siguientes 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la pri mera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi Conteo fi Fi ni Ni 27 I 1 1 0.032 0.032 28 II 2 3 0.065 0.097 29 6 9 0.194 0.290 30 7 16 0.226 0.516 31 8 24 0.258 0.774 32 III 3 27 0.097 0.871 33 III 3 30 0.097 0.968 34 I 1 31 0.032 1 31 1 Este tipo de tablas de frecuencias se utiliza con variables discretas . Distribución de frecuencias agrupadas La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua. Se agrupan los valores en intervalos que amplitud denomi nados clases. A cada clase se correspondiente. tengan la misma le asigna su frecuencia Límites de la clase Cada clase está delimitada por superior de la clase . el límite inferior de la clase y el límite Amplitud de la clase La amplitud de la clase es la diferencia entre el límite superior e inferior de la clase. Marca de clase La marca de clase es el punto medio de cada intervalo y es representa a todo el intervalo para el cálculo de algunos parámetros . el valor que Construcción de una tabla de datos agrupados 3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48. 2º Se restan y se busca un número entero un p oco mayor que la diferencia y que sea di visible por el número de i ntervalos queramos establecer. Es conveniente que el número de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, i ncrementamos el número hasta 50÷5 = 10 intervalos. Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo. Clases ci fi Fi ni Ni [0, 5) 2.5 1 1 0.025 0.025 [5, 10) 7.5 1 2 0.025 0.050 [10, 15) 12.5 3 5 0.075 0.125 [15, 20) 17.5 3 8 0.075 0.200 [20, 25) 22.5 3 11 0.075 0.2775 [25, 30) 27.5 6 17 0.150 0.425 [30, 35) 32.5 7 24 0.175 0.600 [35, 40) 37.5 10 34 0.250 0.850 [40, 45) 42.5 4 38 0.100 0.950 [45, 50) 47.5 2 40 0.050 1 40 1 Diagrama de barras Un diagrama de barras se utiliza para presentar datos cuantitativos de tipo discreto . cualitativos o datos Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable , y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas . Los datos se la frecuencia. representan mediante barras de una altura proporcional a Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguí neo ha dado el siguiente resultado: Grupo sanguíneo fi A 6 B 4 AB 1 0 9 20 Polígonos de frecuencia Un polígono de frecuencias se las barras mediante segmentos . forma uniendo los extremos de También se puede real izar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos . Ejemplo Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones: Hora Temperatura 6 7º 9 12° 12 14° 15 11° 18 12° 21 10° 24 8° Diagramas de sectores Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de modo que cada sector es proporcional a l a frecuencia absoluta correspondiente. el ángulo de El diagrama circul ar se construye con la ayuda de un transportador de ángulos. Ejemplo En una clase de 30 al umnos, 12 juegan a baloncesto, 3 practican la natación, 4 juegan al fútbol y el resto no practica ningún deporte. Alumnos Ángulo Baloncesto 12 144° Natación 3 36° Fútbol 9 108° Sin deporte 6 72° Total 30 360° Los Histogramas Un histograma es de barras. una representación gráfica de una variable en forma Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de los valores representados. cada barra es proporcional a la la frecuencia de Polígono de frecuencia Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla: ci fi Fi [50, 60) 55 8 8 [60, 70) 65 10 18 [70, 80) 75 16 34 [80, 90) 85 14 48 [90, 100) 95 10 58 [100, 110) 110 5 63 [110, 120) 115 2 65 65 Histograma y polígono de frecuencias acumuladas Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono. Histogramas con intervalos de amplitud diferente Para construir un histograma con intervalo de amplitud que calcular las alturas de los rectángulos del histograma . h i es la altura del i ntervalo. f i es la frecuencia del i ntervalo. a i es la amplitud del intervalo. diferente tenemos Ejemplo En la siguiente tabl a se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. fi hi [0, 5) 15 3 [5, 7) 20 10 [7, 9) 12 6 [9, 10) 3 3 50 Definición de parámetro estadístico Un parámetro estadístico es un número que se obtiene a partir de los datos de una distribución estadística . Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfi ca. Tipos de parámetros estadísticos Hay tres tipos parámetros estadísticos : De centralización. De posición De dispersión. Medidas de centralización Nos i ndican en torno a qué valor (centro) se distribuyen los datos. Las medidas de centralización son: Media aritmética La media es el valor promedio de la distribución. Mediana La mediana es la puntación de la escala que separa la mitad superior de la distribución y la inferior , es decir divide la serie de datos en dos partes iguales . Moda La moda es el valor que más se repite en una distribución. Medidas de posición Las medidas de posición di viden un conjunto de datos en grupos con el mismo número de indi viduos. Para calcul ar l as medidas de posición es necesario que los datos estén ordenados de menor a mayor. Las medidas de posición son: Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales . Deciles Los deciles di viden la serie de datos en diez partes iguales . Percentiles Los percentiles dividen la serie de datos en cien partes iguales . Medidas de dispersión Las medidas de dispersión nos informan sobre cuanto se alejan del centro los valores de la distribuci ón. Las medidas de dispersión son: Rango o recorrido El rango es l a diferencia entre distribución estadí stica. el mayor y el menor de los datos de una Desviación media La desviación media es la media las desviaciones respecto a l a media. aritmética de los valores absolutos de Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. Desviación típica La desviación típica es la raíz cuadrada de la varianza. Definición de moda La moda es el valor que tiene mayor frecuencia absoluta . Se representa por M o . Se puede hallar la moda para variables cualitativas y cuantitativas . Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 M o = 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxi ma, la distribución es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 M o = 1, 5, 9 Cuando todas las puntuaciones de frecuencia, no hay moda. un grupo tienen la misma 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen l a el promedio de las dos puntuaciones adyacentes. frecuencia máxima, la moda es 0, 1, 3, 3, 5, 5, 7, 8 Mo = 4 Cálculo de la moda para datos agrupados 1º Todos los intervalos tienen la misma amplitud. L i es el límite i nferior de la clase modal. f i es la frecuencia absoluta de la clase modal. f i - - 1 es la frecuencia absoluta inmediatamente inferior a la clase modal. f i - + 1 es l a frecuencia absoluta inmediatamente posterior a la clase modal. a i es la amplitud de la clase. También se utiliza otra fórmula de la moda que da un valor aproximado de ésta: Ejemplo Calcular la moda de una distribución estadística que viene dada por la siguiente tabla: fi [60, 63) 5 [63, 66) 18 [66, 69) 42 [69, 72) 27 [72, 75) 8 100 2º Los intervalos tienen amplitudes distintas. En primer l ugar tenemos que hallar las alturas. La clase modal es la que tiene mayor altura. La fórmula de la moda aproximada cuando existen distintas amplitudes es: Ejemplo En la siguiente tabl a se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda . fi hi [0, 5) 15 3 [5, 7) 20 10 [7, 9) 12 6 [9, 10) 3 3 50 Definición de mediana Es el valor que ocupa el lugar están ordenados de menor a mayor . central de todos los datos cuando éstos La mediana se representa por M e . La mediana se puede hallar sólo para variables cuantitativas . Cálculo de la mediana 1 Ordenamos los datos de menor a mayor . 2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de l a mi sma. 2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5 3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales . 7, 8, 9, 10, 11, 12 Me= 9.5 Cálculo de la mediana para datos agrupados La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas . Es decir tenemos que buscar el intervalo en el que se encuentre . L i es el límite i nferior de la clase donde se encuentra la mediana. es l a semisuma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase mediana. a i es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos. Ejemplo Calcular la mediana de siguiente tabla: una distribución fi Fi [60, 63) 5 5 [63, 66) 18 23 [66, 69) 42 65 [69, 72) 27 92 [72, 75) 8 100 estadística que viene dada por la 100 100/2 = 50 Clase de la mediana: [66, 69) Definición de media aritmética La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos. es el símbolo de la media aritmética. Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio. Media aritmética para datos agrupados Si los datos vienen agrupados en la media es: una tabla de frecuencias, la expresión de Ejercicio de media aritmética En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra l a tabla. Calcula la puntuación media . xi fi xi · fi [10, 20) 15 1 15 [20, 30) 25 8 200 [30,40) 35 10 350 [40, 50) 45 9 405 [50, 60 55 8 440 [60,70) 65 4 260 [70, 80) 75 2 150 42 1 820 Propiedades de la media aritmética 1. La suma de l as desviaciones de todas las puntuaciones de una distribución respecto a la media de la misma igual a cero. La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética 7.6 es igual a 0: 8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 = = 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0 2. La suma de los cuadrados de las desviaciones de los valores de la variable con respecto a un número cualquiera se hace mínima cuando dicho número coincide con l a media aritmética. 3. Si a todos los valores de la variable se les suma un mismo número, la media aritmética queda aumentada en dicho número. 4. Si todos los valores de la variable se multiplican por un mismo número la media aritmética queda multiplicada por dicho número. Observaciones sobre la media aritmética 1. La media se puede hallar sólo para variables cuantitativas . 2. La media es independiente de las amplitudes de los intervalos. 3. La media es muy sensible a las puntuaciones extremas . Si tenemos una distribución con los siguientes pesos: 65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es igual a 74 representati va de la di stribución. kg, que es una medida de centralización poco 4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada. xi fi [60, 63) 61.5 5 [63, 66) 64.5 18 [66, 69) 67.5 42 [69, 72) 70.5 27 [72, ∞ ) 8 100 En este caso no es posible hallar la media porque no podemos calcular la marca de clase de último i ntervalo. Los cuartiles son l os tres valores de la variable un conjunto de datos ordenados en cuatro partes iguales . que dividen a Q 1 , Q 2 y Q 3 determi nan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana. Cálculo de los cuartiles 1 Ordenamos los datos de menor a mayor . 2 Buscamos el . l ugar que ocupa cada cuartil mediante la expresión Número impar de datos 2, 5, 3, 6, 7, 4, 9 Número par de datos 2, 5, 3, 4, 6, 7, 1, 9 Cálculo de los cuartiles para datos agrupados En primer l ugar buscamos la clase donde la tabla de las frecuencias acumuladas . se encuentra L i es el límite i nferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase del cuartil. a i es la amplitud de la clase. , en Ejercicio de cuartiles Calcular los cuartiles de la distribución de la tabla: fi Fi [50, 60) 8 8 [60, 70) 10 18 [70, 80) 16 34 [80, 90) 14 48 [90, 100) 10 58 [100, 110) 5 63 [110, 120) 2 65 65 Cálculo del primer cuartil Cálculo del segundo cuartil Cálculo del tercer cuartil Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D 5 coi ncide con la mediana. Cálculo de los deciles En primer l ugar buscamos la clase donde se encuentra tabla de l as frecuencias acumuladas. L i es el límite i nferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase el decil. a i es la amplitud de la clase. Ejercicio de deciles Calcular los deciles de la distribución de la tabla: , en la fi Fi [50, 60) 8 8 [60, 70) 10 18 [70, 80) 16 34 [80, 90) 14 48 [90, 100) 10 58 [100, 110) 5 63 [110, 120) 2 65 65 Cálculo del primer decil Cálculo del segundo decil Cálculo del tercer decil Cálculo del cuarto decil Cálculo del quinto decil Cálculo del sexto decil Cálculo del séptimo decil Cálculo del octavo decil Cálculo del noveno decil Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P 5 0 coincide con la mediana. Cálculo de los percentiles En primer l ugar buscamos la clase donde se encuentra tabla de l as frecuencias acumuladas. L i es el límite i nferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas. F i - 1 es la frecuencia acumulada anterior a la clase del percentil. a i es la amplitud de la clase. Ejercicio de percentiles Calcular el percentil 35 y 60 de la distribución de la tabla: , en la fi Fi [50, 60) 8 8 [60, 70) 10 18 [70, 80) 16 34 [80, 90) 14 48 [90, 100) 10 58 [100, 110) 5 63 [110, 120) 2 65 65 Percentil 35 Percentil 60 Desviación respecto a la media La desviación respecto a la media es la diferencia en valor absoluto entre cada valor de la variable estadística y la media aritmética. D i = |x - x| Desviación media La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media . La desviación media se representa por Ejemplo Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 Desviación media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias , la expresión de la desviación media es: Ejemplo Calcular la desviación media de la distribución: xi fi xi · fi |x - x| |x - x| · f i [10, 15) 12.5 3 37.5 9.286 27.858 [15, 20) 17.5 5 87.5 4.286 21.43 [20, 25) 22.5 7 157.5 0.714 4.998 [25, 30) 27.5 4 110 5.714 22.856 [30, 35) 32.5 2 65 10.174 21.428 21 457.5 98.57 La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una di stribución estadística. La varianza se representa por. Varianza para datos agrupados Para simplificar el cálculo de la varianza vamos expresiones que son equivalentes a las anteriores. Varianza para datos agrupados Ejercicios de varianza Calcular la varianza de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 o utilizar las siguientes Calcular la varianza de la distribución de la tabla: xi fi xi · fi xi2 · fi [10, 20) 15 1 15 225 [20, 30) 25 8 200 5000 [30,40) 35 10 350 12 250 [40, 50) 45 9 405 18 225 [50, 60 55 8 440 24 200 [60,70) 65 4 260 16 900 [70, 80) 75 2 150 11 250 42 1 820 88 050 Propiedades de la varianza 1 La varianza será si empre un valor positivo o cero , en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un número la varianza no varía. 3 Si todos los valores de la variable se multiplican por un número la varianza queda multiplicada por el cuadrado de dicho número. 4 Si tenemos varias distribuciones con la misma respectivas varianzas se puede calcular la varianza total. media y conocemos sus Si todas las muestras tienen el mismo tamaño: Si las muestras tienen distinto tamaño: Observaciones sobre la varianza 1 La varianza, al igual que l a media, es un índice muy sensible a las puntuaciones extremas. 2 En los casos que media tampoco será posible hallar la varianza. 3 La varianza no viene expresada en las mismas unidades que los datos, ya que las desviaciones están elevadas al cuadrado. La desviación típica es la raíz cuadrada de la varianza . Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación típica se representa por σ. Desviación típica para datos agrupados Para simplificar el cál culo vamos o utilizar las siguientes expresiones que son equivalentes a l as anteriores. Desviación típica para datos agrupados Ejercicios de desviación típica Calcular la desviación típica de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 Calcular la desviación típica de la distribución de la tabla: xi fi xi · fi xi2 · fi [10, 20) 15 1 15 225 [20, 30) 25 8 200 5000 [30,40) 35 10 350 12 250 [40, 50) 45 9 405 18 225 [50, 60) 55 8 440 24 200 [60,70) 65 4 260 16 900 [70, 80) 75 2 150 11 250 42 1 820 88 050 Propiedades de la desviación típica 1 La desviación típica será siempre un valor positivo o cero , en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un número la desviación típica no varía. 3 Si todos los valores de la variable se multiplican por un número la desviación típica queda multiplicada por dicho número. 4 Si tenemos varias distribuciones con la misma media y conocemos respectivas desviaciones típicas se puede calcular la desviación típica total . sus Si todas las muestras tienen el mismo t amaño: Si las muestras tienen distinto tamaño: Observaciones sobre la desviación típica 1 La desviación típica, al igual que la media y la varianza, es un índice muy sensible a l as puntuaci ones extremas. 2 En los casos que media tampoco será posible hallar la desviación típica. 3 Cuanta más pequeña sea la desviación típica mayor será la concentración de datos alrededor de la media. Coeficiente de variación El coeficiente de variación es la relación entre la desviación típica de una muestra y su media. El coeficiente de variación se suele expresar en porcentajes: El coeficiente de variación permite comparar las dispersiones de distribuciones disti ntas, siempre que sus medias sean positivas . dos Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre sí. La mayor dispersión corresponderá al valor del coeficiente de variación mayor. Ejercicio Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las dos presenta mayor di spersión? La primera distribución presenta mayor dispersión. Puntuaciones típicas Puntuaciones diferenciales Las puntuaciones diferenciales resultan directas la media aritmética . xi = Xi – X de restarles a las puntuaciones Puntuaciones típicas Las puntuaciones típicas son el resultado de dividirlas puntuaciones diferenciales entre la desviación típica. Este proceso se llama tipificación . Las puntuaciones típicas se representan por z. Observaciones sobre puntuaciones típicas La media aritmética de las puntuaciones típicas es0. La desviación típica de las puntuaciones típicas es1. Las puntuaciones típicas son a dimensionales , es decir, son independientes de las unidades utilizadas. Las puntuaciones típicas se utilizan para compararlas puntuaciones obtenidas en disti ntas distribuciones. Ejemplo En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las al umnas y 54.4 kg. Las desviaciones típicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg. ¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso? José es más grueso respecto de su grupo que Ana respecto al suyo. Ejercicios y problemas resueltos I Indi ca que variables son cualitativas y cuales cuantitativas: 1 Comida Favorita. 2 Profesión que te gusta. 3 Número de goles marcados por tu equipo favorito en la última temporada. 4 Número de alumnos de tu Instituto. 5 El color de los ojos de tus compañeros de clase. 6 Coeficiente i ntelectual de tus compañeros de clase. II. De las siguientes variables indica cuáles son discretas y cuales continúas . 1 Número de acciones vendidas cada día en la Bolsa. 2 Temperaturas registradas cada hora en un observatorio. 3 Período de duración de un automóvil. 4 El diámetro de l as ruedas de varios coches. 5 Número de hijos de 50 familias. 6 Censo anual de los españoles. III. Cl asifi car las sig uientes variables en cualitativas y cuantitativas discretas o continuas. 1 La nacionalidad de una persona. 2 Número de litros de agua contenidos en un depósito. 3 Número de libros en un estante de librería. 4 Suma de puntos teni dos en el lanzamiento de un par de dados. 5 La profesión de una persona. 6 El área de las disti ntas baldos as de un edificio. IV. Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir frecuencias. la tabla de distribución de frecuencias y dibuja el polígono de V. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de di stribución de frecuencias y dibuja el diagrama de barras. VI. Las cali ficaciones de 50 alumnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7 . Construir la tabla barras . de distribución de frecuencias y dibuja el diagrama de VII. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla: Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120) fi 8 10 16 14 10 5 2 1 Construir la tabla de frecuencias . 2 Representar el histograma y el polígono de frecuencias . VIII. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Físi ca. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Construir la tabla de frecuencias . 2 Dibujar el histograma y el polígono de frecuencias . IX. Sea una distribuci ón estadística que viene dada por la siguiente tabla: Calcular: xi 61 64 67 70 73 fi 5 18 42 27 8 1 La moda, mediana y media . 2 El rango, desviación media, varianza y desviación típica . X. Calcul ar la media, l a mediana y la moda de la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. XI. Hallar la varianza y la desviación típica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5. XII. Hallar la media, mediana y moda de la siguiente serie de números: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. XIII. Hallar l a desviación media, la varianza y la desviación típica de la series de números siguientes: 2, 3, 6, 8, 11. 12, 6, 7, 3, 15, 10, 18, 5. XIV. Se ha aplicado un test a los empleados de una fábrica, obteniéndose la siguiente tabla: fi [38, 44) 7 [44, 50) 8 [50, 56) 15 [56, 62) 25 [62, 68) 18 [68, 74) 9 [74, 80) 6 Dibujar el histograma y el polígono de frecuencias acumuladas . XV. Dadas las series estadísticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: La moda, l a mediana y la media. La desviación media, la varianza y la desviación típica. Los cuartiles 1º y 3º. Los deciles 2º y 7º. Los percentiles 32 y 85. XVI. Una distribución estadística viene dada por la siguiente tabla: [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 3 5 7 4 2 fi Hallar: La moda, mediana y media. El rango, desviación media y varianza. Los cuartiles 1º y 3º. Los deciles 3º y 6º. Los percentiles 30 y 70. XVII. Dada la distribución estadística: fi [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, ∞) 3 5 7 8 2 6 Calcular: La mediana y moda. Cuartil 2º y 3º. Media. Respuestas a los ejercicios y problemas I. Indica que variables son cualitativas y cuales cuantitativas : 1 Comida Favorita. Cualitativa. 2 Profesión que te gusta. Cualitativa . 3 Número de goles marcados por tu equipo favorito en la última temporada. Cuantitativa . 4 Número de alumnos de tu Instituto. Cuantitativa . 5 El color de los ojos de tus compañeros de clase. Cualitativa. 6 Coeficiente i ntelectual de tus compañeros de clase. Cuantitativa II. De l as siguientes variables indica cuáles son discretas y cuales continúas . 1 Número de acciones vendidas cada día en la Bolsa. Discreta 2 Temperaturas registradas cada hora en un observatorio. Continua 3 Período de duración de un automóvil. Continua 4 El diámetro de l as ruedas de varios coches. Continua 5 Número de hijos de 50 familias. Discreta 6 Censo anual de los españoles. Discreta III. Clasi ficar las cuantitativas discretas o continuas. siguientes variables en cualitativas y 1 La nacionalidad de una persona. Cualitativa 2 Número de litros de agua contenidos en un depósito. Cuantitativa continúa. 3 Número de libro en un estante de librería. Cuantitativa discreta . 4 Suma de puntos tenidos en el lanzamiento de un par de dados. Cuantitativa discreta. 5 La profesión de una persona. Cualitativa . 6 El área de las disti ntas baldosas de un edificio. Cuantitativa continúa. IV. Las puntuaciones obtenidas por un grupo de en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16 , 14, 13. Construir frecuencias. la tabla de distribución de frecuencias y xi Recuento fi Fi ni Ni 13 III 3 3 0.15 0.15 14 I 1 4 0.05 0.20 5 9 0.25 0.45 15 16 IIII 4 13 0.20 0.65 18 III 3 16 0.15 0.80 19 I 1 17 0.05 0.85 20 II 2 19 0.10 0.95 22 I 1 20 0.05 1 20 dibuja el polígono de Polígono de frecuencias V. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla barras . de distribución Tabla de Distribución xi Fi ni Ni 1 6 6 0.158 0.158 2 12 18 0.316 0.474 3 16 34 0.421 0.895 4 38 0.105 1 IIII 38 frecuencias y dibuja el diagrama Diagrama de barras xi 4 Recuento de 1 de VI. Las cali ficaciones de 50 al umnos en Matemáticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla barras . de distribución de frecuencias y dibuja el diagrama xi fi Fi ni Ni 0 1 1 0.02 0.02 1 1 2 0.02 0.04 2 2 4 0.04 0.08 3 3 7 0.06 0.14 4 6 13 0.12 0.26 5 11 24 0.22 0.48 6 12 36 0.24 0.72 7 7 43 0.14 0.86 8 4 47 0.08 0.94 9 2 49 0.04 0.98 10 1 50 0.02 1.00 50 1.00 de Diagrama de barras VII. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla: Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120) fi 8 10 16 14 10 5 2 1 Construir la tabla de frecuencias . 2 Representar el histograma y el polígono de frecuencias . xi fi Fi ni Ni [50, 60) 55 8 8 0.12 0.12 [60, 70) 65 10 18 0.15 0.27 [70, 80) 75 16 34 0.24 0.51 [80,90) 85 14 48 0.22 0.73 [90, 100) 95 10 58 0.15 0.88 [100, 110) 105 5 63 0.08 0.96 [110, 120) 115 2 65 0.03 0.99 65 Histograma VIII. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Física. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Construir la tabla de frecuencias . 2 Dibujar el histograma y el polígono de frecuencias . xi fi Fi ni Ni [0, 5) 2.5 1 1 0.025 0.025 [5, 10) 7.5 1 2 0.025 0.050 [10, 15) 12.5 3 5 0.075 0.125 [15, 20) 17.5 3 8 0.075 0.200 [20, 25) 22.5 3 11 0.075 0.275 [25, 30) 27.5 6 17 0.150 0.425 [30, 35) 32.5 7 24 0.175 0.600 [35, 40) 37.5 10 34 0.250 0.850 [40, 45) 47.5 4 38 0.100 0.950 [45, 50) 47.5 2 40 0.050 1.000 40 1 Histograma IX. Sea una distribución estadística que viene dada por la siguiente tabla: xi 61 64 67 70 73 fi 5 18 42 27 8 Calcular: 1 La moda, mediana y media . 2 El rango, desviación media, varianza y desviación típica . xi fi Fi x i ·f i |x − x| |x − x | · f i x i2 · fi 61 5 5 305 6.45 32.25 18 605 64 18 23 1152 3.45 62.10 73 728 67 42 65 2814 0.45 18.90 188 538 71 27 92 1890 2.55 68.85 132 300 73 8 100 584 5.55 44.40 42 632 226.50 455 803 100 Moda Mo = 67 Mediana 100/2 = 50 Me = 67 Media Desviación media Rango r = 73 − 61 = 12 6745 Varianza Desviación típica X. Calcular la media, la mediana y la moda de la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. xi fi Fi xi · fi 2 2 2 4 3 2 4 6 4 5 9 20 5 6 15 30 6 2 17 12 8 3 20 24 20 Moda Mo = 5 96 Mediana 20/2 = 10 Me = 5 Media XI. Hallar la varianza y la desviación típica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5. XII. Hallar la media, mediana y moda de la siguiente serie de números: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. 2, 2, 3, 5, 5, 5, 6, 6, 8, 9. Moda Mo = 5 Mediana 10/2 = 5 Media XIII. Hallar la desviación media, la varianza y la desviación típica de la series de números siguientes: 2, 3, 6, 8, 11. 12, 6, 7, 3, 15, 10, 18, 5. 2, 3, 6, 8, 11. Media Desviación media Varianza Desviación típica 12, 6, 7, 3, 15, 10, 18, 5. Media Desviación media Varianza Desviación típica XIV. Se ha aplicado test a los empleados de una fábrica, obteniéndose las siete tabla: fi [38, 44) 7 [44, 50) 8 [50, 56) 15 [56, 62) 25 [62, 68) 18 [68, 74) 9 [74, 80) 6 Dibujar el histograma y el polígono de frecuencias acumuladas . fi Fi [38, 44) 7 7 [44, 50) 8 15 [50, 56) 15 30 [56, 62) 25 55 [62, 68) 18 73 [68, 74) 9 82 [74, 80) 6 88 XV. Dadas las series estadísticas: 1. 3, 5, 2, 7, 6, 4, 9. 2. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: La moda, la mediana y la media. La desviación media, la varianza y la desviación típica. Los cuartiles 1º y 3º. Los deciles 2º y 7º. Los percentiles 32 y 85. 1. 3, 5, 2, 7, 6, 4, 9. Moda No existe moda porque todas las puntuaciones tienen la misma frecuencia. Mediana 2, 3, 4, 5, 6, 7, 9. Me = 5 Media Varianza Desviación típica Desviación media Rango r = 9 − 2 = 7 Cuartiles Deciles 7 · (2/10) = 1.4 D 2 = 3 7 · (7/10) = 4.9 D 7 = 6 Percentiles 7 · (32/100) = 2,2 P 3 2 = 4 7 · (85/100) = 5.9 P 8 5 = 7 2. 3, 5, 2, 7, 6, 4, 9, 1. Moda No existe moda porque todas las puntuaciones tienen la misma frecuencia. Mediana Media Varianza Desviación típica Desviación media Rango r = 9 - 1 = 8 Cuartiles Deciles 8 · (2/10) = 1.6 D 2 = 2 8 · (7/10) = 5.6 D 7 = 6 Percentiles 8 · (32/100) = 2.56 P32 = 8 · (85/100) = 6.8 P85 = XVI. 3 7 Una distribución estadística viene dada por la siguiente tabla: [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 3 5 7 4 2 fi Hallar: La moda, mediana y media. El rango, desviación media y varianza. Los cuartiles 1º y 3º. Los deciles 3º y 6º. Los percentiles 30 y 70. xi fi Fi xi · fi |x − x| · f i xi2 · fi [10, 15) 12.5 3 3 37.5 27.857 468.75 [15, 20) 17.5 5 8 87.5 21.429 1537.3 [20, 25) 22.5 7 15 157.5 5 3543.8 [25, 30) 27.5 4 19 110 22.857 3025 [30, 35) 32.5 2 21 65 21.429 2112.5 457.5 98.571 10681.25 21 Moda Mediana Media Desviación media Varianza Desviación típica Cuartiles Deciles Percentiles XVII. Dada la distribución estadística: fi [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, ∞) 3 5 7 8 2 6 Calcular: La mediana y moda. Cuartil 2º y 3º. y la Media. xi fi Fi [0, 5) 2.5 3 3 [5, 10) 7.5 5 8 [10, 15) 12.5 7 15 [15, 20) 17.5 8 23 [20, 25) 22.5 2 25 6 31 [25, ∞) 31 Moda Mediana Cuartiles Media No se puede calcular la media, porque no se puede hallar la marca de clase del último intervalo. Otra sección de ejercicios y problemas 1. A un conjunto de 5 números cuya media es 7.31 se le añaden los números 4.47 y 10.15. ¿Cuál es la media del nuevo conjunto de números? 2. Un dentista observa el número de caries en cada uno de los 100 niños de cierto colegio. La información obtenida aparece resumida en la siguiente tabla: Nº de caries fi ni 0 25 0.25 1 20 0.2 2 x z 3 15 0.15 4 y 0.05 1. Completar la tabla obteniendo los valores de x, y, z. 2. Hacer un diagrama de sectores. 3. Calcular el número medio de caries. 1. Tabla La suma de las frecuencias relativas ha de ser igual a 1: 0.25 + 0.2 + z + 0.15 + 0.05 = 1 0.65 + z = 1 z = 0.35 La frecuencia relativa de un dato es igual su frecuencia absoluta dividida entre 100, que es la suma de las frecuencias absolutas. Nº de caries fi ni fi · ni 0 25 0.25 0 1 20 0.2 20 2 35 0.35 70 3 15 0.15 45 4 5 0.05 20 155 2. Diagrama de sectores Calculamos los grados que corresponden a cara frecuencia absoluta. 25 · 3.6 = 90º 20 · 3.6 = 72º 35 · 3.6 = 126º 15 · 3.6 = 54º 5 · 3.6 = 18º 3. Media aritmética 3. Se tiene el siguiente conjunto de 26 datos: 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 Obtener su mediana y cuartiles. En primer lugar ordenamos los datos de menor a mayor: 3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20 Mediana 26/2 = 13. Como el número de datos es par la mediana es la media de las dos puntuaciones centrales: Cuartiles 26/4 = 6.5 Q 1 = 7 Q 2 = Me = 10 (26 · 3)/4 = 19.5 Q 3 = 14 4. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su consulta en el momento de andar por primera vez: Meses Niños 9 1 10 4 11 9 12 16 13 11 14 8 15 1 1. Dibujar el polígono de frecuencias . 2. Calcular la moda, la mediana, la mediay la varianza. Polígono de frecuencias xi fi Ni xi · fi x² i · f i 9 1 1 9 81 10 4 5 40 400 11 9 14 99 1089 12 16 30 192 2304 13 11 41 143 1859 14 8 49 112 1568 15 1 50 15 225 610 7526 50 Moda Mo = 12 Mediana 50/2 = 25 Me = 12 Media aritmética Varianza 5. Completar los datos que faltan en la siguiente tabla estadística: xi fi 1 4 2 4 3 7 5 5 6 ni 0.08 16 4 7 Fi 0.16 0.14 28 38 7 45 8 Calcular la media, mediana y moda de esta distribución. Tabla Primera fila: F1 = 4 Segunda fila: F2 = 4 + 4 = 8 Tercera fila: Cuarta fila: N 4 = 16 + 7 = 23 Quinta fila: Sexta fila: 28 + n 8 = 38 Séptima fila: Octava fila: n 8 = 10 N 8 = N = 50 n 8 = 50 − 45 = 5 xi fi Fi ni xi · fi 1 4 4 0.08 4 2 4 8 0.08 8 3 8 16 0.16 24 4 7 23 0.14 28 5 5 28 0.1 25 6 10 38 0.2 60 7 7 45 0.14 49 8 5 50 0.1 40 50 Media artmética Mediana 50/2 = 25 Me = 5 238 Moda Mo = 6 6. Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1. Calcular su media y su varianza. 2. Si los todos los datos anteriores los multiplicamos por 3, cúal será la nueva media y desviación típica. 1 2 xi xi2 2 4 3 9 4 16 6 36 8 64 10 100 33 229 7. El resultado de lanzar dos dados 120 veces viene dado por la tabla: Sumas 2 3 4 5 6 7 8 9 10 11 12 Veces 3 8 9 11 20 19 16 13 11 6 4 1. Calcular la media y la desviación típica. 2. Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ). xi fi xi · fi x i2 · fi 2 3 6 12 3 8 24 72 4 9 36 144 5 11 55 275 6 20 120 720 7 19 133 931 8 16 128 1024 9 13 117 1053 10 11 110 1100 11 6 66 726 12 4 48 576 120 843 6633 1 2 x − σ = 4.591 x + σ = 9.459 Los valores comprendidos en el intervalo (4.591, 9.459) son los correspondientes a las sumas de 5, 6, 7, 8 y 9. 11 + 20 + 19 + 16 + 13 = 79 8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla: Altura [170, [175, [180, [185, [190, [195, 175) 180) 185) 190) 195) 2.00) 1 3 4 8 5 2 Nº de jugadores Calcular: 1. La media. 2. La mediana. 3. La desviación típica. 4. ¿Cuántos jugadores se encuentran por encima de la media más una desviación típica? xi fi Fi xi · fi xi2 · fi [1.70, 1.75) 1.725 1 1 1.725 2.976 [1.75, 1.80) 1.775 3 4 5.325 9.453 [1.80, 1.85) 1.825 4 8 7.3 13.324 [1.85, 1.90) 1.875 8 16 15 28.128 [1.90, 1.95) 1.925 5 21 9.625 18.53 [1.95, 2.00) 1.975 2 23 3.95 7.802 42.925 80.213 23 Media Mediana Desviación típica 4 x + σ = 1.866+ 0.077 = 1.943 Este valor pertenece a un percentil que se encuentra en el penúltimo intervalo. Sólo hay 3 jugadores por encima de x + σ. 9. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla: fi 1 2 3 4 5 6 a 32 35 33 b 35 Determinar a y b sabiendo que la puntuación media es 3.6. xi fi xi · fi 1 a a 2 32 64 3 35 125 4 33 132 5 b 5b 6 35 210 135 + a + b 511 + a + 5b a = 29 b = 36 10. El histograma de la distribución correspondiente al peso de 100 alumnos de Bachillerato es el siguiente: 1. Formar la tabla de la distribución. 2. Si Andrés pesa 72 kg, ¿cuántos alumnos hay menos pesados que él? 3. Calcular la moda. 4. Hallar la mediana. 5. ¿A partir de que valores se encuentran el 25% de los alumnos más pesados? 1 xi fi Fi [60,63 ) 61.5 5 5 [63, 66) 64.5 18 23 [66, 69) 67.5 42 65 [69, 72) 70.5 27 92 [72, 75) 73.5 8 100 100 2 5 + 18 + 42 + 27 = 92 alumnos más ligeros que Andrés. Moda Mediana 5 El valor a partir del cual se encuentra el 25% de los alumnos más pesados es el cuartil tercero. 11. De esta distribución de frecuencias absolutas acumuladas , calcular: Edad Fi [0, 2) 4 [2, 4) 11 [4, 6) 24 [6, 8) 34 [8, 10) 40 1. Media aritmética y desviación típica. 2. ¿Entre qué valores se encuentran las 10 edades centrales? 3. Representar el polígono de frecuencias absolutas acumuladas . xi fi Fi xi · fi xi2 · fi [0, 2) 1 4 4 4 4 [2, 4) 3 7 11 21 63 [4, 6) 5 13 24 65 325 [6, 8) 7 10 34 70 490 [8, 10) 9 6 40 54 486 214 1368 40 Media y desviación típica 2 Los 10 alumnos representan el 25% central de la distribución. Debemos hallar P 3 7 . 5 y P 6 2 . 5 . Las 10 edades centrales están en el intervalo: [4.61, 6.2] . Polígono de frecuencias 12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media es de 1.60 m y la desviación típica es de 20 cm. Otra persona B mide 1.80 m y vive en una ciudad donde la estatura media es de 1.70 m y la desviación típica es de 15 cm. ¿Cuál de las dos será más alta respecto a sus conciudadanos? La persona A es más alta respecto a sus conciudadanos que la persona B. 13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los siguientes resultados: para el primer test la media es 6 y la desviación típica 1.5. Para el segundo test la media es 4 y la desviación típica 0.5. Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con el grupo, ¿en cuál de los dos test obtuvo mejor puntuación? En el segundo test consigue mayor puntuación. 14 La asistencia de espectadores a las 4 salas de un cine un determinado día fue de 200, 500, 300 y 1000 personas. 1. Calcular la dispersión del número de asistentes. 2. Calcular el coeficiente de variación . 3. Si el día del espectador acuden 50 personas más a cada sala, ¿qué efecto tendría sobre la dispersión? Desviación típica Coeficiente de variación 3 Si todas las salas tienen un incremento de 50 personas, la media aritmética también se ve incrementada en 50 personas. La desviación típica no varía , ya que sumamos la misma cantidad a cada dato de la serie. La dispersión relativa es menor en el segundo caso. Bibliografía Fernández, J (1999-2012). Estadística, Recuperado el 5 de junio 2012, de http://www.vitutor.com/estadistica/descriptiva/a_1.html