Download La mediana y moda.

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Desviación típica wikipedia , lookup

Mediana (estadística) wikipedia , lookup

Transcript
INSTITUTO SUPERIOR DE FORMACION DOCENTE
SALOME UREÑA
(ISFODOSU)
Estadística Descriptiva
Este material ha sido preparado por
Prof. Rafael David Francisco Ventura, M. A.
Santo Domingo República Dominicana
Introducción
Son muchos los fenómenos o sucesos que no tienen respuesta alguna, es por esto,
que se debe proceder a hacer estudios pertinentes que aclaren la situación que se desea
analizar, este hecho se logra por medio de la experimentación constante que muestra
cada uno de los resultados que se van obteniendo con ayuda de la estadística la
cual permite que aquellas situaciones impredecibles se pueden volver cada vez mas
explicativas.
La Estadística puede dar respuesta a muchas de las necesidades que la sociedad actual
puede experimentar. Su tarea fundamental es la reducción de datos que se obtiene a
partir de experimentos, con el objetivo de representar la realidad y transformarla,
predecir su futuro o simplemente conocerla.
La estadística está presente en todas las áreas del saber.
La estadística es una ciencia de aplicación práctica casi universal en todos los campos
científicos:
* En las ciencias naturales: se emplea con profusión en la descripción de modelos
termodinámicos complejos (mecánica estadística), en física cuántica, en mecánica de
fluidos o en la teoría cinética de los gases, entre otros muchos campos.
* En las ciencias sociales y económicas: es un pilar básico del desarrollo de la
demografía y la sociología aplicada.
* En economía: suministra los valores que ayudan a descubrir interrelaciones entre
múltiples parámetros macro y microeconómicos.
* En las ciencias médicas: permite establecer pautas sobre la evolución de las
enfermedades y los enfermos, los índices de mortalidad asociados a procesos
morbosos, el grado de eficacia de un medicamento, etcétera.
Definición de Estadística
La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos
por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Un estudio estadístico consta de las siguientes fases:
Recogida de datos.
Organización y representación de datos.
Análisis de datos.
Obtención de conclusiones.
Conceptos de Estadística
Población
Una población es el conjunto de todos los elementos a los que se somete a un
estudio estadístico.
Individuo
Un individuo o unidad estadística es cada uno de los elementos que componen la
población.
Muestra
Una muestra es un conjunto representativo de la población de referencia, el
número de indi viduos de una muestra es menor que el de la población.
Muestreo
El muestreo es la reunión de datos que se desea estudiar, obtenidos de una
proporción reducida y representativa de la población.
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un
estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara
y cruz.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio
estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz,
cara, cruz.
Definición de variable
Una variable estadística es cada una de las características o cualidades que
poseen los individuos de una población .
Tipos de variables estadísticas
Variable cualitativa
Las variables
cualitativas se
refieren
a
características
cualidades que no pueden ser medidas con números . Podemos distinguir dos tipos:
o
Variable cualitativa nominal
Una variable
cualitativa
nominal presenta
numéricas que no admiten un criterio de orden . Por ejemplo:
El estado civil,
divorciado y vi udo.
con
las
siguientes
modalidades:
modalidades
soltero,
casado,
no
separado,
Variable cualitativa ordinal o variable cuasi
cuantitativa
Una variable cualitativa ordinal presenta modalidades no numéricas, en las
que existe un orden. Por ejemplo:
La nota en un examen: suspenso, aprobado, notable, sobresaliente.
Puesto conseguido en una prueba deportiva: 1º, 2º, 3º ,...
Medallas de una prueba deportiva: oro, plata, bronce.
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un número, por tanto se
pueden reali zar o peraciones aritméticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable
discreta es
aquella
que
toma valores
aislados ,
decir no admite valores intermedios entre dos valores específicos. Por ejemplo:
es
El número de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre
dos números . Por ejemplo:
La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75.
En la práctica medimos la altura con dos decimales, pero también se podría dar con
tres decimales.
Distribución de frecuencias
La distribución de frecuencias o tabla de frecuencias es una ordenación en
forma de tabla de los datos estadísticos, asignando a cada dato su frecuencia
correspondiente.
Tipos de frecuencias
Frecuencia absoluta
La frecuencia
absoluta es
el número
determinado valor en un estudio estadístico.
de
veces que
aparece
un
Se representa por f i .
La suma de las frecuencias absolutas es igual al número tota l de datos, que se
representa por N.
Para indicar resumidamente estas
mayúscula) que se lee suma o sumatoria.
sumas
se
utiliza
la
letra
griega Σ (sigma
Frecuencia relativa
La frecuencia relativa es el cociente entre
determinado valor y el número total de datos.
la
frecuencia
absoluta de
un
Se puede expresar en tantos por ciento y se representa por n i .
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos
los valores inferiores o iguales al valor considerado.
Se representa por F i .
Frecuencia relativa acumulada
La frecuencia
relativa
acumulada es
el cociente
entre
la frecuencia
acumulada de un determinado valor y el número total de datos . Se puede expresar
en tantos por ciento.
Ejemplo
Durante el mes de
temperaturas máximas:
julio,
en
una
ciudad
se
han
registrado
las
siguientes
32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29,
30, 30, 31, 30, 31, 34, 33, 33, 29, 29.
En la pri mera columna de la tabla colocamos la variable ordenada de menor a
mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia
absoluta.
xi
Conteo
fi
Fi
ni
Ni
27
I
1
1
0.032
0.032
28
II
2
3
0.065
0.097
29
6
9
0.194
0.290
30
7
16
0.226
0.516
31
8
24
0.258
0.774
32
III
3
27
0.097
0.871
33
III
3
30
0.097
0.968
34
I
1
31
0.032
1
31
1
Este tipo de tablas de frecuencias se utiliza con variables discretas .
Distribución de frecuencias agrupadas
La distribución de frecuencias agrupadas o tabla con datos agrupados se
emplea si las variables toman un número grande de valores o la variable es
continua.
Se agrupan los valores en intervalos que
amplitud denomi nados clases.
A
cada clase se
correspondiente.
tengan
la
misma
le
asigna
su frecuencia
Límites de la clase
Cada clase está delimitada por
superior de la clase .
el límite
inferior
de
la
clase y
el límite
Amplitud de la clase
La amplitud de la clase es la diferencia entre el límite superior e inferior de
la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es
representa a todo el intervalo para el cálculo de algunos parámetros .
el valor que
Construcción de una tabla de datos agrupados
3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26,
20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.
2º Se restan y se busca un número entero un p oco mayor que la diferencia y que
sea di visible por el número de i ntervalos queramos establecer.
Es conveniente que el número de intervalos oscile entre 6 y 15.
En este caso, 48 - 3 = 45, i ncrementamos el número hasta 50÷5 = 10 intervalos.
Se forman los intervalos teniendo presente que el límite inferior de una clase
pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el
siguiente intervalo.
Clases
ci
fi
Fi
ni
Ni
[0, 5)
2.5
1
1
0.025
0.025
[5, 10)
7.5
1
2
0.025
0.050
[10, 15)
12.5
3
5
0.075
0.125
[15, 20)
17.5
3
8
0.075
0.200
[20, 25)
22.5
3
11
0.075
0.2775
[25, 30)
27.5
6
17
0.150
0.425
[30, 35)
32.5
7
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
42.5
4
38
0.100
0.950
[45, 50)
47.5
2
40
0.050
1
40
1
Diagrama de barras
Un diagrama de barras se utiliza para presentar datos
cuantitativos de tipo discreto .
cualitativos o datos
Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan
los valores de la variable , y sobre el eje de ordenadas las frecuencias absolutas o
relativas o acumuladas .
Los datos se
la frecuencia.
representan
mediante barras de
una
altura
proporcional a
Ejemplo
Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su
grupo sanguí neo ha dado el siguiente resultado:
Grupo
sanguíneo
fi
A
6
B
4
AB
1
0
9
20
Polígonos de frecuencia
Un polígono
de
frecuencias se
las barras mediante segmentos .
forma
uniendo
los
extremos de
También se puede real izar trazando los puntos que representan las frecuencias y
uniéndolos mediante segmentos .
Ejemplo
Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes
variaciones:
Hora
Temperatura
6
7º
9
12°
12
14°
15
11°
18
12°
21
10°
24
8°
Diagramas de sectores
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se
usa frecuentemente para las variables cualitativas.
Los datos se
representan
en
un círculo,
de
modo
que
cada sector es proporcional a l a frecuencia absoluta correspondiente.
el ángulo de
El diagrama circul ar se construye con la ayuda de un transportador de ángulos.
Ejemplo
En una clase de 30 al umnos, 12 juegan a baloncesto, 3 practican la natación, 4
juegan al fútbol y el resto no practica ningún deporte.
Alumnos
Ángulo
Baloncesto
12
144°
Natación
3
36°
Fútbol
9
108°
Sin deporte
6
72°
Total
30
360°
Los Histogramas
Un histograma es
de barras.
una representación
gráfica de
una variable en
forma
Se utilizan para variables continuas o para variables discretas, con un gran
número de datos, y que se han agrupado en clases.
En el eje abscisas se construyen unos rectángulos que tienen por base
amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
La superficie de
los valores representados.
cada barra es proporcional a
la
la
frecuencia de
Polígono de frecuencia
Para construir el polígono de frecuencia se toma la marca de clase que coincide
con el punto medio de cada rectángulo.
Ejemplo
El peso de 65 personas adultas viene dado por la siguiente tabla:
ci
fi
Fi
[50, 60)
55
8
8
[60, 70)
65
10
18
[70, 80)
75
16
34
[80, 90)
85
14
48
[90, 100)
95
10
58
[100, 110)
110
5
63
[110, 120)
115
2
65
65
Histograma y polígono de frecuencias acumuladas
Si
se
representan
las frecuencias
acumuladas de
una tabla
de
datos
agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente
polígono.
Histogramas con intervalos de amplitud diferente
Para construir un histograma con intervalo de amplitud
que calcular las alturas de los rectángulos del histograma .
h i es la altura del i ntervalo.
f i es la frecuencia del i ntervalo.
a i es la amplitud del intervalo.
diferente tenemos
Ejemplo
En la siguiente tabl a se muestra las calificaciones (suspenso, aprobado, notable y
sobresaliente) obtenidas por un grupo de 50 alumnos.
fi
hi
[0, 5)
15
3
[5, 7)
20
10
[7, 9)
12
6
[9, 10)
3
3
50
Definición de parámetro estadístico
Un parámetro estadístico es un número que se obtiene a partir de los datos de
una distribución estadística .
Los parámetros estadísticos sirven para sintetizar la información dada por una
tabla o por una gráfi ca.
Tipos de parámetros estadísticos
Hay tres tipos parámetros estadísticos :
De centralización.
De posición
De dispersión.
Medidas de centralización
Nos i ndican en torno a qué valor (centro) se distribuyen los datos.
Las medidas de centralización son:
Media aritmética
La media es el valor promedio de la distribución.
Mediana
La mediana es la puntación de la escala que separa la mitad superior de la
distribución y la inferior , es decir divide la serie de datos en dos partes iguales .
Moda
La moda es el valor que más se repite en una distribución.
Medidas de posición
Las medidas de posición di viden un conjunto de datos en grupos con el mismo
número de indi viduos.
Para calcul ar l as medidas de posición es necesario que los datos estén ordenados
de menor a mayor.
Las medidas de posición son:
Cuartiles
Los cuartiles dividen la serie de datos en cuatro partes iguales .
Deciles
Los deciles di viden la serie de datos en diez partes iguales .
Percentiles
Los percentiles dividen la serie de datos en cien partes iguales .
Medidas de dispersión
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los
valores de la distribuci ón.
Las medidas de dispersión son:
Rango o recorrido
El rango es l a diferencia entre
distribución estadí stica.
el mayor y
el menor
de
los datos de
una
Desviación media
La desviación media es la media
las desviaciones respecto a l a media.
aritmética de
los
valores
absolutos de
Varianza
La varianza es la media aritmética del cuadrado de las desviaciones respecto
a la media.
Desviación típica
La desviación típica es la raíz cuadrada de la varianza.
Definición de moda
La moda es el valor que tiene mayor frecuencia absoluta .
Se representa por M o .
Se puede hallar la moda para variables cualitativas y cuantitativas .
Hallar la moda de la distribución:
2, 3, 3, 4, 4, 4, 5, 5 M o = 4
Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa
frecuencia es la máxi ma, la distribución es bimodal o multimodal, es decir, tiene
varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 M o = 1, 5, 9
Cuando
todas
las puntuaciones de
frecuencia, no hay moda.
un
grupo
tienen
la
misma
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen l a
el promedio de las dos puntuaciones adyacentes.
frecuencia
máxima,
la moda es
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Cálculo de la moda para datos agrupados
1º Todos los intervalos tienen la misma amplitud.
L i es el límite i nferior de la clase modal.
f i es la frecuencia absoluta de la clase modal.
f i - - 1 es la frecuencia absoluta inmediatamente inferior a la clase modal.
f i - + 1 es l a frecuencia absoluta inmediatamente posterior a la clase modal.
a i es la amplitud de la clase.
También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:
Ejemplo
Calcular la moda de una distribución estadística que viene dada por la siguiente
tabla:
fi
[60, 63)
5
[63, 66)
18
[66, 69)
42
[69, 72)
27
[72, 75)
8
100
2º Los intervalos tienen amplitudes distintas.
En primer l ugar tenemos que hallar las alturas.
La clase modal es la que tiene mayor altura.
La fórmula de la moda aproximada cuando existen distintas amplitudes es:
Ejemplo
En la siguiente tabl a se muestra las calificaciones (suspenso, aprobado, notable y
sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda .
fi
hi
[0, 5)
15
3
[5, 7)
20
10
[7, 9)
12
6
[9, 10)
3
3
50
Definición de mediana
Es el valor que ocupa el lugar
están ordenados de menor a mayor .
central de
todos
los
datos cuando
éstos
La mediana se representa por M e .
La mediana se puede hallar sólo para variables cuantitativas .
Cálculo de la mediana
1 Ordenamos los datos de menor a mayor .
2 Si la serie tiene un número impar de medidas la mediana es la puntuación
central de l a mi sma.
2, 3, 4, 4, 5, 5, 5, 6, 6 Me= 5
3 Si la serie tiene un número par de puntuaciones la mediana es la media entre
las dos puntuaciones centrales .
7, 8, 9, 10, 11, 12 Me= 9.5
Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega
hasta la mitad de la suma de las frecuencias absolutas .
Es decir tenemos que buscar el intervalo en el que se encuentre
.
L i es el límite i nferior de la clase donde se encuentra la mediana.
es l a semisuma de las frecuencias absolutas.
F i - 1 es la frecuencia acumulada anterior a la clase mediana.
a i es la amplitud de la clase.
La mediana es independiente de las amplitudes de los intervalos.
Ejemplo
Calcular la mediana de
siguiente tabla:
una
distribución
fi
Fi
[60, 63)
5
5
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
8
100
estadística
que
viene
dada
por
la
100
100/2 = 50
Clase de la mediana: [66, 69)
Definición de media aritmética
La media aritmética es el valor obtenido al sumar todos los datos y dividir el
resultado entre el número total de datos.
es el símbolo de la media aritmética.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Media aritmética para datos agrupados
Si los datos vienen agrupados en
la media es:
una
tabla
de
frecuencias,
la
expresión
de
Ejercicio de media aritmética
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones
que muestra l a tabla. Calcula la puntuación media .
xi
fi
xi · fi
[10, 20)
15
1
15
[20, 30)
25
8
200
[30,40)
35
10
350
[40, 50)
45
9
405
[50, 60
55
8
440
[60,70)
65
4
260
[70, 80)
75
2
150
42
1 820
Propiedades de la media aritmética
1. La suma de l as desviaciones de todas las puntuaciones de una distribución
respecto a la media de la misma igual a cero.
La suma de las desviaciones de los números 8, 3, 5, 12, 10 de su media aritmética
7.6 es igual a 0:
8 − 7.6 + 3 − 7.6 + 5 − 7.6 + 12 − 7.6 + 10 − 7.6 =
= 0. 4 − 4.6 − 2.6 + 4. 4 + 2. 4 = 0
2. La suma de los cuadrados de las desviaciones de los valores de la variable
con respecto a un número cualquiera se hace mínima cuando dicho número coincide
con l a media aritmética.
3. Si a todos los valores de la variable se les suma un mismo número, la media
aritmética queda aumentada en dicho número.
4. Si
todos
los
valores
de
la
variable
se
multiplican por
un
mismo número la media aritmética queda multiplicada por dicho número.
Observaciones sobre la media aritmética
1. La media se puede hallar sólo para variables cuantitativas .
2. La media es independiente de las amplitudes de los intervalos.
3. La media es muy sensible a las puntuaciones extremas . Si tenemos una
distribución con los siguientes pesos:
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg.
La media es igual a 74
representati va de la di stribución.
kg,
que
es
una medida
de
centralización poco
4. La media no
se
puede
calcular
si
hay
un
intervalo
con
una amplitud
indeterminada.
xi
fi
[60, 63)
61.5
5
[63, 66)
64.5
18
[66, 69)
67.5
42
[69, 72)
70.5
27
[72, ∞ )
8
100
En este caso no es posible hallar la media porque no podemos calcular la marca
de clase de último i ntervalo.
Los cuartiles son
l os tres
valores de
la
variable
un conjunto de datos ordenados en cuatro partes iguales .
que
dividen a
Q 1 , Q 2 y Q 3 determi nan los valores correspondientes al 25%, al 50% y al 75% de
los datos.
Q 2 coincide con la mediana.
Cálculo de los cuartiles
1 Ordenamos los datos de menor a mayor .
2 Buscamos
el
.
l ugar
que
ocupa
cada cuartil
mediante
la
expresión
Número impar de datos
2, 5, 3, 6, 7, 4, 9
Número par de datos
2, 5, 3, 4, 6, 7, 1, 9
Cálculo de los cuartiles para datos agrupados
En primer l ugar buscamos la clase donde
la tabla de las frecuencias acumuladas .
se encuentra
L i es el límite i nferior de la clase donde se encuentra el cuartil.
N es la suma de las frecuencias absolutas.
F i - 1 es la frecuencia acumulada anterior a la clase del cuartil.
a i es la amplitud de la clase.
, en
Ejercicio de cuartiles
Calcular los cuartiles de la distribución de la tabla:
fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
5
63
[110, 120)
2
65
65
Cálculo del primer cuartil
Cálculo del segundo cuartil
Cálculo del tercer cuartil
Los deciles son los nueve valores que dividen la serie de datos en diez partes
iguales.
Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los
datos.
D 5 coi ncide con la mediana.
Cálculo de los deciles
En primer l ugar buscamos la clase donde se encuentra
tabla de l as frecuencias acumuladas.
L i es el límite i nferior de la clase donde se encuentra el decil.
N es la suma de las frecuencias absolutas.
F i - 1 es la frecuencia acumulada anterior a la clase el decil.
a i es la amplitud de la clase.
Ejercicio de deciles
Calcular los deciles de la distribución de la tabla:
, en la
fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
5
63
[110, 120)
2
65
65
Cálculo del primer decil
Cálculo del segundo decil
Cálculo del tercer decil
Cálculo del cuarto decil
Cálculo del quinto decil
Cálculo del sexto decil
Cálculo del séptimo decil
Cálculo del octavo decil
Cálculo del noveno decil
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes
iguales.
Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los
datos.
P 5 0 coincide con la mediana.
Cálculo de los percentiles
En primer l ugar buscamos la clase donde se encuentra
tabla de l as frecuencias acumuladas.
L i es el límite i nferior de la clase donde se encuentra el percentil.
N es la suma de las frecuencias absolutas.
F i - 1 es la frecuencia acumulada anterior a la clase del percentil.
a i es la amplitud de la clase.
Ejercicio de percentiles
Calcular el percentil 35 y 60 de la distribución de la tabla:
, en la
fi
Fi
[50, 60)
8
8
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
5
63
[110, 120)
2
65
65
Percentil 35
Percentil 60
Desviación respecto a la media
La desviación respecto a la media es la diferencia en valor absoluto entre
cada valor de la variable estadística y la media aritmética.
D i = |x - x|
Desviación media
La desviación media es la media aritmética de los valores absolutos de las
desviaciones respecto a la media .
La desviación media se representa por
Ejemplo
Calcular la desviación media de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Desviación media para datos agrupados
Si los datos vienen agrupados en una tabla de frecuencias , la expresión de
la desviación media es:
Ejemplo
Calcular la desviación media de la distribución:
xi
fi
xi · fi
|x - x|
|x - x| · f i
[10, 15)
12.5
3
37.5
9.286
27.858
[15, 20)
17.5
5
87.5
4.286
21.43
[20, 25)
22.5
7
157.5
0.714
4.998
[25, 30)
27.5
4
110
5.714
22.856
[30, 35)
32.5
2
65
10.174
21.428
21
457.5
98.57
La varianza es la media aritmética del cuadrado de las desviaciones respecto
a la media de una di stribución estadística.
La varianza se representa por.
Varianza para datos agrupados
Para simplificar el cálculo de la varianza vamos
expresiones que son equivalentes a las anteriores.
Varianza para datos agrupados
Ejercicios de varianza
Calcular la varianza de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
o
utilizar
las
siguientes
Calcular la varianza de la distribución de la tabla:
xi
fi
xi · fi
xi2 · fi
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250
42
1 820
88 050
Propiedades de la varianza
1 La varianza será si empre un valor positivo o cero , en el caso de que las
puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la varianza no
varía.
3 Si
todos
los valores de
la
variable
se
multiplican por
un número la varianza queda multiplicada por el cuadrado de dicho número.
4 Si tenemos varias distribuciones con la
misma
respectivas varianzas se puede calcular la varianza total.
media y
conocemos
sus
Si todas las muestras tienen el mismo tamaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la varianza
1 La varianza, al igual que l a media, es un índice muy sensible a las puntuaciones
extremas.
2 En los casos que media tampoco será posible hallar la varianza.
3 La varianza no viene expresada en las mismas unidades que los datos, ya que
las desviaciones están elevadas al cuadrado.
La desviación típica es la raíz cuadrada de la varianza .
Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de
desviación.
La desviación típica se representa por σ.
Desviación típica para datos agrupados
Para simplificar el cál culo vamos o utilizar las siguientes expresiones que son
equivalentes a l as anteriores.
Desviación típica para datos agrupados
Ejercicios de desviación típica
Calcular la desviación típica de la distribución:
9, 3, 8, 8, 9, 8, 9, 18
Calcular la desviación típica
de la distribución de la tabla:
xi
fi
xi · fi
xi2 · fi
[10, 20)
15
1
15
225
[20, 30)
25
8
200
5000
[30,40)
35
10
350
12 250
[40, 50)
45
9
405
18 225
[50, 60)
55
8
440
24 200
[60,70)
65
4
260
16 900
[70, 80)
75
2
150
11 250
42
1 820
88 050
Propiedades de la desviación típica
1 La desviación típica será siempre un valor positivo o cero , en el caso de que
las puntuaciones sean iguales.
2 Si a todos los valores de la variable se les suma un número la desviación
típica no varía.
3 Si todos los valores de la variable se multiplican por un número la desviación
típica queda multiplicada por dicho número.
4 Si tenemos varias distribuciones con la misma media y conocemos
respectivas desviaciones típicas se puede calcular la desviación típica total .
sus
Si todas las muestras tienen el mismo t amaño:
Si las muestras tienen distinto tamaño:
Observaciones sobre la desviación típica
1 La desviación típica, al igual que la media y la varianza, es un índice muy
sensible a l as puntuaci ones extremas.
2 En los casos que media tampoco será posible hallar la desviación típica.
3 Cuanta más pequeña sea la desviación típica mayor será la concentración de
datos alrededor de la media.
Coeficiente de variación
El coeficiente de variación es la relación entre la desviación típica de una
muestra y su media.
El coeficiente de variación se suele expresar en porcentajes:
El coeficiente
de
variación permite
comparar
las
dispersiones de
distribuciones disti ntas, siempre que sus medias sean positivas .
dos
Se calcula para cada una de las distribuciones y los valores que se obtienen se
comparan entre sí.
La mayor dispersión corresponderá al valor del coeficiente de variación mayor.
Ejercicio
Una distribución tiene x = 140 y σ = 28.28 y otra x = 150 y σ = 25. ¿Cuál de las
dos presenta mayor di spersión?
La primera distribución presenta mayor dispersión.
Puntuaciones típicas
Puntuaciones diferenciales
Las puntuaciones
diferenciales resultan
directas la media aritmética .
xi = Xi – X
de
restarles a
las puntuaciones
Puntuaciones típicas
Las puntuaciones
típicas son
el
resultado
de dividirlas puntuaciones
diferenciales entre la desviación típica. Este proceso se llama tipificación .
Las puntuaciones típicas se representan por z.
Observaciones sobre puntuaciones típicas
La media aritmética de las puntuaciones típicas es0.
La desviación típica de las puntuaciones típicas es1.
Las puntuaciones típicas son a dimensionales , es decir, son independientes de
las unidades utilizadas.
Las puntuaciones típicas se utilizan para compararlas puntuaciones obtenidas
en disti ntas distribuciones.
Ejemplo
En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2
kg y el de las al umnas y 54.4 kg. Las desviaciones típicas de los dos grupos son,
respectivamente, 3.1 kg y 5.1 kg. El peso de José es de 70 kg y el de Ana es 65 kg.
¿Cuál de ellos puede, dentro del grupo de alumnos de su sexo, considerarse más grueso?
José es más grueso respecto de su grupo que Ana respecto al suyo.
Ejercicios y problemas resueltos
I Indi ca que variables son cualitativas y cuales cuantitativas:
1 Comida Favorita.
2 Profesión que te gusta.
3 Número de goles marcados por tu equipo favorito en la última temporada.
4 Número de alumnos de tu Instituto.
5 El color de los ojos de tus compañeros de clase.
6 Coeficiente i ntelectual de tus compañeros de clase.
II. De las siguientes variables indica cuáles son discretas y cuales continúas .
1 Número de acciones vendidas cada día en la Bolsa.
2 Temperaturas registradas cada hora en un observatorio.
3 Período de duración de un automóvil.
4 El diámetro de l as ruedas de varios coches.
5 Número de hijos de 50 familias.
6 Censo anual de los españoles.
III. Cl asifi car las sig uientes variables en
cualitativas y cuantitativas discretas o continuas.
1 La nacionalidad de una persona.
2 Número de litros de agua contenidos en un depósito.
3 Número de libros en un estante de librería.
4 Suma de puntos teni dos en el lanzamiento de un par de dados.
5 La profesión de una persona.
6 El área de las disti ntas baldos as de un edificio.
IV. Las puntuaciones obtenidas por un grupo en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir
frecuencias.
la tabla
de
distribución
de
frecuencias y
dibuja
el polígono
de
V. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente
serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2,
1, 1, 1, 2, 2, 4, 1.
Construir la tabla de di stribución de frecuencias y dibuja el diagrama de barras.
VI. Las cali ficaciones de 50 alumnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3,
6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7 .
Construir la tabla
barras .
de
distribución
de
frecuencias y dibuja el diagrama
de
VII. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente
tabla:
Peso
[50, 60)
[60, 70)
[70, 80)
[80,90)
[90, 100)
[100, 110)
[110, 120)
fi
8
10
16
14
10
5
2
1 Construir la tabla de frecuencias .
2 Representar el histograma y el polígono de frecuencias .
VIII. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones,
sobre 50, en un examen de Físi ca.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26,
20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1 Construir la tabla de frecuencias .
2 Dibujar el histograma y el polígono de frecuencias .
IX. Sea una distribuci ón estadística que viene dada por la siguiente tabla:
Calcular:
xi
61
64
67
70
73
fi
5
18
42
27
8
1 La moda, mediana y media .
2 El rango, desviación media, varianza y desviación típica .
X. Calcul ar la media, l a mediana y la moda de la siguiente serie de números: 5,
3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
XI. Hallar la varianza y la desviación típica de la siguiente serie de datos:
12, 6, 7, 3, 15, 10, 18, 5.
XII. Hallar la media, mediana y moda de la siguiente serie de números:
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
XIII. Hallar l a desviación media, la varianza y la desviación típica de la
series de números siguientes:
2, 3, 6, 8, 11.
12, 6, 7, 3, 15, 10, 18, 5.
XIV. Se ha aplicado un test a los empleados de una fábrica, obteniéndose la
siguiente tabla:
fi
[38, 44)
7
[44, 50)
8
[50, 56)
15
[56, 62)
25
[62, 68)
18
[68, 74)
9
[74, 80)
6
Dibujar el histograma y el polígono de frecuencias acumuladas .
XV. Dadas las series estadísticas:
3, 5, 2, 7, 6, 4, 9.
3, 5, 2, 7, 6, 4, 9, 1.
Calcular:
La moda, l a mediana y la media.
La desviación media, la varianza y la desviación típica.
Los cuartiles 1º y 3º.
Los deciles 2º y 7º.
Los percentiles 32 y 85.
XVI. Una distribución estadística viene dada por la siguiente tabla:
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
3
5
7
4
2
fi
Hallar:
La moda, mediana y media.
El rango, desviación media y varianza.
Los cuartiles 1º y 3º.
Los deciles 3º y 6º.
Los percentiles 30 y 70.
XVII. Dada la distribución estadística:
fi
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, ∞)
3
5
7
8
2
6
Calcular:
La mediana y moda.
Cuartil 2º y 3º.
Media.
Respuestas a los ejercicios y problemas
I.
Indica que variables son cualitativas y cuales cuantitativas :
1 Comida Favorita. Cualitativa.
2 Profesión que te gusta. Cualitativa .
3 Número de goles marcados por tu equipo favorito en la última temporada.
Cuantitativa .
4 Número de alumnos de tu Instituto. Cuantitativa .
5 El color de los ojos de tus compañeros de clase. Cualitativa.
6 Coeficiente i ntelectual de tus compañeros de clase. Cuantitativa
II. De l as siguientes variables indica cuáles son discretas y cuales continúas .
1 Número de acciones vendidas cada día en la Bolsa. Discreta
2 Temperaturas registradas cada hora en un observatorio. Continua
3 Período de duración de un automóvil. Continua
4 El diámetro de l as ruedas de varios coches. Continua
5 Número de hijos de 50 familias. Discreta
6 Censo anual de los españoles. Discreta
III.
Clasi ficar
las
cuantitativas discretas o continuas.
siguientes variables en cualitativas y
1 La nacionalidad de una persona. Cualitativa
2 Número de litros de agua contenidos en un depósito. Cuantitativa continúa.
3 Número de libro en un estante de librería. Cuantitativa discreta .
4 Suma de puntos tenidos en el lanzamiento de un par de dados. Cuantitativa
discreta.
5 La profesión de una persona. Cualitativa .
6 El área de las disti ntas baldosas de un edificio. Cuantitativa continúa.
IV. Las puntuaciones obtenidas por un grupo de en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16 , 14, 13.
Construir
frecuencias.
la tabla
de
distribución
de
frecuencias y
xi
Recuento
fi
Fi
ni
Ni
13
III
3
3
0.15
0.15
14
I
1
4
0.05
0.20
5
9
0.25
0.45
15
16
IIII
4
13
0.20
0.65
18
III
3
16
0.15
0.80
19
I
1
17
0.05
0.85
20
II
2
19
0.10
0.95
22
I
1
20
0.05
1
20
dibuja
el polígono
de
Polígono de frecuencias
V. El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2,
1, 1, 1, 2, 2, 4, 1.
Construir la tabla
barras .
de
distribución
Tabla de Distribución
xi
Fi
ni
Ni
1
6
6
0.158
0.158
2
12
18
0.316
0.474
3
16
34
0.421
0.895
4
38
0.105
1
IIII
38
frecuencias y dibuja el diagrama
Diagrama de barras
xi
4
Recuento
de
1
de
VI. Las cali ficaciones de 50 al umnos en Matemáticas han sido las siguientes:
5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3,
6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7.
Construir la tabla
barras .
de
distribución
de
frecuencias y dibuja el diagrama
xi
fi
Fi
ni
Ni
0
1
1
0.02
0.02
1
1
2
0.02
0.04
2
2
4
0.04
0.08
3
3
7
0.06
0.14
4
6
13
0.12
0.26
5
11
24
0.22
0.48
6
12
36
0.24
0.72
7
7
43
0.14
0.86
8
4
47
0.08
0.94
9
2
49
0.04
0.98
10
1
50
0.02
1.00
50
1.00
de
Diagrama de barras
VII. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente
tabla:
Peso
[50, 60)
[60, 70)
[70, 80)
[80,90)
[90, 100)
[100, 110)
[110, 120)
fi
8
10
16
14
10
5
2
1 Construir la tabla de frecuencias .
2 Representar el histograma y el polígono de frecuencias .
xi
fi
Fi
ni
Ni
[50, 60)
55
8
8
0.12
0.12
[60, 70)
65
10
18
0.15
0.27
[70, 80)
75
16
34
0.24
0.51
[80,90)
85
14
48
0.22
0.73
[90, 100)
95
10
58
0.15
0.88
[100, 110)
105
5
63
0.08
0.96
[110, 120)
115
2
65
0.03
0.99
65
Histograma
VIII. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50,
en un examen de Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20,
11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.
1 Construir la tabla de frecuencias .
2 Dibujar el histograma y el polígono de frecuencias .
xi
fi
Fi
ni
Ni
[0, 5)
2.5
1
1
0.025
0.025
[5, 10)
7.5
1
2
0.025
0.050
[10, 15)
12.5
3
5
0.075
0.125
[15, 20)
17.5
3
8
0.075
0.200
[20, 25)
22.5
3
11
0.075
0.275
[25, 30)
27.5
6
17
0.150
0.425
[30, 35)
32.5
7
24
0.175
0.600
[35, 40)
37.5
10
34
0.250
0.850
[40, 45)
47.5
4
38
0.100
0.950
[45, 50)
47.5
2
40
0.050
1.000
40
1
Histograma
IX. Sea una distribución estadística que viene dada por la siguiente tabla:
xi
61
64
67
70
73
fi
5
18
42
27
8
Calcular:
1 La moda, mediana y media .
2 El rango, desviación media, varianza y desviación típica .
xi
fi
Fi
x i ·f i
|x − x|
|x − x | · f i
x i2 · fi
61
5
5
305
6.45
32.25
18 605
64
18
23
1152
3.45
62.10
73 728
67
42
65
2814
0.45
18.90
188 538
71
27
92
1890
2.55
68.85
132 300
73
8
100
584
5.55
44.40
42 632
226.50
455 803
100
Moda
Mo = 67
Mediana
100/2 = 50 Me = 67
Media
Desviación media
Rango
r = 73 − 61 = 12
6745
Varianza
Desviación típica
X. Calcular la media, la mediana y la moda de la siguiente serie de números: 5, 3, 6,
5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4.
xi
fi
Fi
xi · fi
2
2
2
4
3
2
4
6
4
5
9
20
5
6
15
30
6
2
17
12
8
3
20
24
20
Moda
Mo = 5
96
Mediana
20/2 = 10 Me = 5
Media
XI. Hallar la varianza y la desviación típica de la siguiente serie de datos:
12, 6, 7, 3, 15, 10, 18, 5.
XII. Hallar la media, mediana y moda de la siguiente serie de números:
3, 5, 2, 6, 5, 9, 5, 2, 8, 6.
2, 2, 3, 5, 5, 5, 6, 6, 8, 9.
Moda
Mo = 5
Mediana
10/2 = 5
Media
XIII. Hallar la desviación media, la varianza y la desviación típica de la series de
números siguientes:
2, 3, 6, 8, 11.
12, 6, 7, 3, 15, 10, 18, 5.
2, 3, 6, 8, 11.
Media
Desviación media
Varianza
Desviación típica
12, 6, 7, 3, 15, 10, 18, 5.
Media
Desviación media
Varianza
Desviación típica
XIV. Se ha aplicado test a los empleados de una fábrica, obteniéndose las siete tabla:
fi
[38, 44)
7
[44, 50)
8
[50, 56)
15
[56, 62)
25
[62, 68)
18
[68, 74)
9
[74, 80)
6
Dibujar el histograma y el polígono de frecuencias acumuladas .
fi
Fi
[38, 44)
7
7
[44, 50)
8
15
[50, 56)
15
30
[56, 62)
25
55
[62, 68)
18
73
[68, 74)
9
82
[74, 80)
6
88
XV. Dadas las series estadísticas:
1.
3, 5, 2, 7, 6, 4, 9.
2.
3, 5, 2, 7, 6, 4, 9, 1.
Calcular:
La moda, la mediana y la media.
La desviación media, la varianza y la desviación típica.
Los cuartiles 1º y 3º.
Los deciles 2º y 7º.
Los percentiles 32 y 85.
1.
3, 5, 2, 7, 6, 4, 9.
Moda
No existe moda porque todas las puntuaciones tienen la misma frecuencia.
Mediana
2, 3, 4, 5, 6, 7, 9.
Me = 5
Media
Varianza
Desviación típica
Desviación media
Rango
r = 9 − 2 = 7
Cuartiles
Deciles
7 · (2/10) = 1.4 D 2 = 3
7 · (7/10) = 4.9 D 7 = 6
Percentiles
7 · (32/100) = 2,2 P 3 2 = 4
7 · (85/100) = 5.9 P 8 5 = 7
2.
3, 5, 2, 7, 6, 4, 9, 1.
Moda
No existe moda porque todas las puntuaciones tienen la misma frecuencia.
Mediana
Media
Varianza
Desviación típica
Desviación media
Rango
r = 9 - 1 = 8
Cuartiles
Deciles
8 · (2/10) = 1.6 D 2 = 2
8 · (7/10) = 5.6 D 7 = 6
Percentiles
8 · (32/100) = 2.56 P32 =
8 · (85/100) = 6.8 P85 =
XVI.
3
7
Una distribución estadística viene dada por la siguiente tabla:
[10, 15)
[15, 20)
[20, 25)
[25, 30)
[30, 35)
3
5
7
4
2
fi
Hallar:
La moda, mediana y media.
El rango, desviación media y varianza.
Los cuartiles 1º y 3º.
Los deciles 3º y 6º.
Los percentiles 30 y 70.
xi
fi
Fi
xi · fi
|x − x| · f i
xi2 · fi
[10, 15)
12.5
3
3
37.5
27.857
468.75
[15, 20)
17.5
5
8
87.5
21.429
1537.3
[20, 25)
22.5
7
15
157.5
5
3543.8
[25, 30)
27.5
4
19
110
22.857
3025
[30, 35)
32.5
2
21
65
21.429
2112.5
457.5
98.571
10681.25
21
Moda
Mediana
Media
Desviación media
Varianza
Desviación típica
Cuartiles
Deciles
Percentiles
XVII. Dada la distribución estadística:
fi
[0, 5)
[5, 10)
[10, 15)
[15, 20)
[20, 25)
[25, ∞)
3
5
7
8
2
6
Calcular:
La mediana y moda.
Cuartil 2º y 3º. y la Media.
xi
fi
Fi
[0, 5)
2.5
3
3
[5, 10)
7.5
5
8
[10, 15)
12.5
7
15
[15, 20)
17.5
8
23
[20, 25)
22.5
2
25
6
31
[25, ∞)
31
Moda
Mediana
Cuartiles
Media
No se puede calcular la media, porque no se puede hallar la marca de clase del último
intervalo.
Otra sección de ejercicios y problemas
1. A un conjunto de 5 números cuya media es 7.31 se le añaden los números 4.47 y
10.15. ¿Cuál es la media del nuevo conjunto de números?
2. Un dentista observa el número de caries en cada uno de los 100 niños de cierto
colegio. La información obtenida aparece resumida en la siguiente tabla:
Nº de caries
fi
ni
0
25
0.25
1
20
0.2
2
x
z
3
15
0.15
4
y
0.05
1. Completar la tabla obteniendo los valores de x, y, z.
2. Hacer un diagrama de sectores.
3. Calcular el número medio de caries.
1. Tabla
La suma de las frecuencias relativas ha de ser igual a 1:
0.25 + 0.2 + z + 0.15 + 0.05 = 1
0.65 + z = 1 z = 0.35
La frecuencia relativa de un dato es igual su frecuencia absoluta dividida entre 100, que
es la suma de las frecuencias absolutas.
Nº de caries
fi
ni
fi · ni
0
25
0.25
0
1
20
0.2
20
2
35
0.35
70
3
15
0.15
45
4
5
0.05
20
155
2. Diagrama de sectores
Calculamos los grados que corresponden a cara frecuencia absoluta.
25 · 3.6 = 90º 20 · 3.6 = 72º 35 · 3.6 = 126º
15 · 3.6 = 54º 5 · 3.6 = 18º
3. Media aritmética
3. Se tiene el siguiente conjunto de 26 datos:
10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18
Obtener su mediana y cuartiles.
En primer lugar ordenamos los datos de menor a mayor:
3, 4, 4, 5, 6, 7, 7, 8, 8, 9, 9, 10, 10, 10, 10, 11, 12, 13, 13, 14, 16, 16, 17, 18, 18, 20
Mediana
26/2 = 13.
Como el número de datos es par la mediana es la media de las dos puntuaciones
centrales:
Cuartiles
26/4 = 6.5 Q 1 = 7
Q 2 = Me = 10
(26 · 3)/4 = 19.5 Q 3 = 14
4. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 niños de su
consulta en el momento de andar por primera vez:
Meses
Niños
9
1
10
4
11
9
12
16
13
11
14
8
15
1
1. Dibujar el polígono de frecuencias .
2. Calcular la moda, la mediana, la mediay la varianza.
Polígono de frecuencias
xi
fi
Ni
xi · fi
x² i · f i
9
1
1
9
81
10
4
5
40
400
11
9
14
99
1089
12
16
30
192
2304
13
11
41
143
1859
14
8
49
112
1568
15
1
50
15
225
610
7526
50
Moda
Mo = 12
Mediana
50/2 = 25 Me = 12
Media aritmética
Varianza
5. Completar los datos que faltan en la siguiente tabla estadística:
xi
fi
1
4
2
4
3
7
5
5
6
ni
0.08
16
4
7
Fi
0.16
0.14
28
38
7
45
8
Calcular la media, mediana y moda de esta distribución.
Tabla
Primera fila:
F1 = 4
Segunda fila:
F2 = 4 + 4 = 8
Tercera fila:
Cuarta fila:
N 4 = 16 + 7 = 23
Quinta fila:
Sexta fila:
28 + n 8 = 38
Séptima fila:
Octava fila:
n 8 = 10
N 8 = N = 50 n 8 = 50 − 45 = 5
xi
fi
Fi
ni
xi · fi
1
4
4
0.08
4
2
4
8
0.08
8
3
8
16
0.16
24
4
7
23
0.14
28
5
5
28
0.1
25
6
10
38
0.2
60
7
7
45
0.14
49
8
5
50
0.1
40
50
Media artmética
Mediana
50/2 = 25 Me = 5
238
Moda
Mo = 6
6. Considérense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide:
1. Calcular su media y su varianza.
2. Si los todos los datos anteriores los multiplicamos por 3, cúal será la nueva media y
desviación típica.
1
2
xi
xi2
2
4
3
9
4
16
6
36
8
64
10
100
33
229
7. El resultado de lanzar dos dados 120 veces viene dado por la tabla:
Sumas
2
3
4
5
6
7
8
9
10
11
12
Veces
3
8
9
11
20
19
16
13
11
6
4
1. Calcular la media y la desviación típica.
2. Hallar el porcentaje de valores comprendidos en el intervalo (x − σ, x + σ).
xi
fi
xi · fi
x i2 · fi
2
3
6
12
3
8
24
72
4
9
36
144
5
11
55
275
6
20
120
720
7
19
133
931
8
16
128
1024
9
13
117
1053
10
11
110
1100
11
6
66
726
12
4
48
576
120
843
6633
1
2
x − σ = 4.591 x + σ = 9.459
Los valores comprendidos en el intervalo (4.591, 9.459) son los correspondientes a las
sumas de 5, 6, 7, 8 y 9.
11 + 20 + 19 + 16 + 13 = 79
8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla:
Altura
[170,
[175,
[180,
[185,
[190,
[195,
175)
180)
185)
190)
195)
2.00)
1
3
4
8
5
2
Nº de
jugadores
Calcular:
1. La media.
2. La mediana.
3. La desviación típica.
4. ¿Cuántos jugadores se encuentran por encima de la media más una desviación
típica?
xi
fi
Fi
xi · fi
xi2 · fi
[1.70, 1.75)
1.725
1
1
1.725
2.976
[1.75, 1.80)
1.775
3
4
5.325
9.453
[1.80, 1.85)
1.825
4
8
7.3
13.324
[1.85, 1.90)
1.875
8
16
15
28.128
[1.90, 1.95)
1.925
5
21
9.625
18.53
[1.95, 2.00)
1.975
2
23
3.95
7.802
42.925
80.213
23
Media
Mediana
Desviación típica
4
x + σ = 1.866+ 0.077 = 1.943
Este valor pertenece a un percentil que se encuentra en el penúltimo intervalo.
Sólo hay 3 jugadores por encima de x + σ.
9. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla:
fi
1
2
3
4
5
6
a
32
35
33
b
35
Determinar a y b sabiendo que la puntuación media es 3.6.
xi
fi
xi · fi
1
a
a
2
32
64
3
35
125
4
33
132
5
b
5b
6
35
210
135 + a + b
511 + a + 5b
a = 29 b = 36
10. El histograma de la distribución correspondiente al peso de 100 alumnos de
Bachillerato es el siguiente:
1. Formar la tabla de la distribución.
2. Si Andrés pesa 72 kg, ¿cuántos alumnos hay menos pesados que él?
3. Calcular la moda.
4. Hallar la mediana.
5. ¿A partir de que valores se encuentran el 25% de los alumnos más pesados?
1
xi
fi
Fi
[60,63 )
61.5
5
5
[63, 66)
64.5
18
23
[66, 69)
67.5
42
65
[69, 72)
70.5
27
92
[72, 75)
73.5
8
100
100
2
5 + 18 + 42 + 27 = 92 alumnos más ligeros que Andrés.
Moda
Mediana
5
El valor a partir del cual se encuentra el 25% de los alumnos más pesados es el cuartil
tercero.
11. De esta distribución de frecuencias absolutas acumuladas , calcular:
Edad
Fi
[0, 2)
4
[2, 4)
11
[4, 6)
24
[6, 8)
34
[8, 10)
40
1. Media aritmética y desviación típica.
2. ¿Entre qué valores se encuentran las 10 edades centrales?
3. Representar el polígono de frecuencias absolutas acumuladas .
xi
fi
Fi
xi · fi
xi2 · fi
[0, 2)
1
4
4
4
4
[2, 4)
3
7
11
21
63
[4, 6)
5
13
24
65
325
[6, 8)
7
10
34
70
490
[8, 10)
9
6
40
54
486
214
1368
40
Media y desviación típica
2
Los 10 alumnos representan el 25% central de la distribución.
Debemos hallar P 3 7 . 5 y P 6 2 . 5 .
Las 10 edades centrales están en el intervalo: [4.61, 6.2] .
Polígono de frecuencias
12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media es de
1.60 m y la desviación típica es de 20 cm. Otra persona B mide 1.80 m y vive en una ciudad
donde la estatura media es de 1.70 m y la desviación típica es de 15 cm. ¿Cuál de las dos será
más alta respecto a sus conciudadanos?
La persona A es más alta respecto a sus conciudadanos que la persona B.
13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los
siguientes resultados: para el primer test la media es 6 y la desviación típica 1.5.
Para el segundo test la media es 4 y la desviación típica 0.5.
Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relación con el grupo,
¿en cuál de los dos test obtuvo mejor puntuación?
En el segundo test consigue mayor puntuación.
14 La asistencia de espectadores a las 4 salas de un cine un determinado día fue de
200, 500, 300 y 1000 personas.
1. Calcular la dispersión del número de asistentes.
2. Calcular el coeficiente de variación .
3. Si el día del espectador acuden 50 personas más a cada sala, ¿qué efecto tendría
sobre la dispersión?
Desviación típica
Coeficiente de variación
3
Si todas las salas tienen un incremento de 50 personas, la media aritmética también se
ve incrementada en 50 personas.
La desviación típica no varía , ya que sumamos la misma cantidad a cada dato de la
serie.
La dispersión relativa es menor en el segundo caso.
Bibliografía
Fernández, J (1999-2012). Estadística, Recuperado el 5 de junio 2012, de
http://www.vitutor.com/estadistica/descriptiva/a_1.html