Download aspectos generales de la estadística

Document related concepts
no text concepts found
Transcript
ASPECTOS GENERALES DE LA ESTADÍSTICA
POBLACIÓN Y MUESTRA
La estadística realiza el estudio de conjunt os de
elementos. Así por ejemplo, puede ser objeto
de la estadística estudiar las edades que tienen
los alumnos de cuarto de secundaria de la
ciudad de San Ramón se puede t omar una
parte de ese conjunto, por ejemplo los alumnos
de cuart o del colegio INA 18 .
de la variable (edad) ordenados en forma
creciente, en la segunda efectuamos el
recuento y en la tercera escribimos la
frecuencia (en recuento expresado en números)
Variable
(edad)
13
14
15
16
17
Observa las edades de 50 alumnos
15
14
14
15
16
16
16
15
15
17
13
15
14
15
16
15
16
15
13
14
15
14
16
14
15
16
17
14
15
13
16
15
15
14
14
13
15
14
16
15
14
16
15
14
17
15
13
15
13
16
Para observar estos datos con mayor claridad
los podemos organizar en una tabla, donde la
primera c olumna contiene los distintos valores
Recuento
|||| |
|||||||| ||
|||||||||||| |||
|||||||| |
|||
Total


Frecuencia
absoluta
6
12
18
11
3
n = 50
El conjunto de alumnos de cuarto
de
secundaria de la ciudad, se llama
población o conjuntoe stadí stico.
El subconjunto de 50 alumnos de la I.E INA
18 de la misma ciudad se llama muestra.
El conjunt o que se quiere estudiar se llama población, y una parte representativa de la población se
denomina muestra. La muestra es un subconjunto de la población.
Variables Estadísticas
Cualit ativa
Cuantitativa
Discreta
Continua
VARI ABLE ESTADÍSTICA
La variable estadística es la característica que se estudia en cada elemento de la población
VARI ABLE CUANTITATIVA
Se quiso saber el número de libros leídos por los alumnos del Tercer grado de secundaria durante las
últimas vacaciones. Cada uno de ellos respondió y se obtuvieron estos datos: 0; 1; 3; 4; 1; 0; 2; 3; 1; 5;
5; 5; 4; 4; 2; 3; 4; 2; 0; 4; 5; 0; 1; 3; 2; 2; 1; 1; 0; 1; 0; 2; 3.
Organizamos los datos en una tabla:
Variable:
Recuento
Frecuencia
N° de libros
absoluta
0
|||| |
6
1
|||| ||
7
2
|||| |
6
3
||||
5
4
||||
5
5
||||
4
Total
n = 33
Vemos que la variable estadística: números de libros leídos se expresa mediante un número: 6 alumnos
no leyeron ningún libro. 7 leyeron 1, etc.
Variable cuantitativa es aquella cuyos valores se expresan mediant e números. Una variable cuantitativa,
a su vez, puede ser continua o discreta.

VARI ABLE CONTINUA Y DISCRETA
La variable estatura es continua porque puede adoptar valores como 0,8 m; 1,5 m; 1,6 m; 2 m. En
cambio, la variable número de hijos es discreta porque sus valores posibles son aislados. Puede
adoptar como valores 1 hijo, 2 hijos, 3 hijos, 0 hijos, etc. y no admite valores intermedios como 3,3
hijos.
VARI ABLE CUALITATIVA
Si los valores de la variable no pueden s er expresados mediante números, sino mediante atributos o
cualidades, la variable es cualitativa.
El género es una variable cualitativa porque se expresa
mediante los atributos “femenino” y “masculino”. La variable “color de ojos”, que puede adoptar las
formas o atributos azul, verde, café, negro... etc., es también variable cualitativa. El estado civil es una
variable cualitativa.
EJERCI CIOS PARA LA CLAS E
1.
Los siguientes son los datos que se
obtuvieron al preguntarse a los alumnos de
Tercero de secundaria sobre el número de
años que están ya en el colegio.
9
2
5
9
4
4
5
5
2
5
3
9
10
2
2
4
3
2
5
8
3
5
4
3
7
10
10
3
5
6
5
7
8
5
10
6
2
9
10
5
a) Elabora la tabla de frecuencias e indica
a cuántos han encuestado.
b) Indica cuál es la variable.
c) Halla el porcent aje de los que tienen
más tiempo en el colegio.
d) Halla el porcent aje de los que tienen
menos tiempo.
e) ¿Cuántos alumnos tienen menos de 5
años en el colegio?
Variable Recuento Frecuencia
absoluta
%
2.
En una encuesta sobre estudios realizados
se obtuvieron las siguientes respuestas.
Estudios
Frecuencia
absoluta
Post-grado
16
Bachillerato
65
Secundarios
83
Primarios
220
Sin estudio y
63
sabe leer
Sin estudio y
13
no saben leer
total
%
Completa la tabla y resuelve:
a) ¿De cuántos fue la muestra?
b) ¿Cuál es la variable?
c) Haz tres interpret aciones
resultados.
con
los
Total
TABLAS ESTADÍSTICAS
FRECUENCIA ABS OLUTA Y RELATIVA
Frecuencia absoluta de una variable es el número de veces que se repite un dato.
Frecuencia relativa es el cociente de la frecuencia absoluta entre el total de dat os o casos observados.
Frecuencia
relativa (hi)
=
Frecuencia
absoluta (fi)
Número total
de datos
-La suma de frec uencias relativas es siempre 1.
Resumen:
n
fi
hi
%
Agregamos la frecuencia relativa porcentual (%)
en la tabla estadística:
Total de datos
Frecuencia absoluta
Frecuencia relativa
Frecuencia relativa porcentual
-La suma de los porcent ajes es siempre 100.
Para expresar este dato como porcentaje,
multiplicamos la frecuencia relativa por 100 y
decimos:
El 23% de los alumnos encuestados prefiere
helado de lúcuma.
Tabla de distribución de frecuencias
Variable
Frecuencia Frecuencia %
estadí sti ca
absoluta relativa (hi )
(preferencias)
( i )
Vainilla
3
0,18
18
Fresa
3
0,18
18
Choc olate
2
0,12
12
Lúcuma
4
0,23
23
Coco
5
0,29
29
Total
17
1,00
100
AGRUP ACI ÓN DE DATOS
OBS ERV ACION
a) Determinación del recorrido R = X max – X min
b) Determinación del número de intervalos K= 1 +3,322Log N
c) Determinación de la amplitud C = R/k
Un profesor de Educación Física midió, en centímetros, la estatura de 40 alumnos. Tras ordenarlos los
resultados fueron:
147
157
165
148
158
165
149
158
166
159
158
168
Variable estatura
(intervalo)
145 – 150
150 – 155
155 – 160
160 – 165
165 – 170
170 – 175
175 – 180
150
158
170
150
158
170
X
i
151
159
170
151
159
171
152
160
173
153
162
173
Frecuencia absoluta ( i )
Total
4
8
10
6
4
6
2
n = 40
153
162
176
154
163
179
156
163
157
164
Frecuencia relativa
(hi )
0,10
0,10
0,20
0,25
0,10
0,15
0,05
1,00
PRACTICA
1) Elabora una tabla y encuentra las
frecuencias absolutas y relativas, cada uno
de los siguientes casos:
a) Las edades en un grupo de niños son:
12; 14; 10; 13; 12; 11; 14; 10; 13.
Edades.
i
hi
%
total
b) Al lanzar un dado 30 vec es, se
obtuvieron estos res ultados: 3; 5; 3; 2;
1; 1; 2; 3; 3; 4: 2; 6; 5; 3; 1; 4; 2; 5; 6; 6;
3; 3; 3; 5; 2; 3; 6; 2; 5; 3.
VALORES
hi
%
i
total
2) La tabla muestra el número de autos
vendidos por una empresa el segundo
semestre del año 2000.
Mes Jul Ago Set Oct Nov Dic Total
I
60
86
78
94
90
112
hi
%
a) Determina en qué mes se vendieron
más carros. ¿A qué porcentaje
corresponde?
b) Halla las frecuencias relativas y sin
efectuar la operación, di cuál será la
suma total de las frecuencias relativas.
c) Determina cuánt os carros se vendieron
en Agosto y cuántos en Setiembre.
d) ¿Cuántos carros se vendieron ent re
Julio y Setiembre?
e) ¿Cuántos carros se vendieron en total?
3) Realiza esta encuesta en tu salón de clase
y elabora la tabla estadística de distribución
de frecuencias.
4) En una colecta entre 65 miembros de
parroquia, los aportes en soles fueron:
45 46 47 40 40 40 41 42 49 48
57 58 59 60 56 56 56 57 62 62
55 55 54 53 52 50 49 50 51 55
49 50 50 62 62 64 69 69 70 68
55 64 66 64 67 84 81 84 42 56
una
49
61
86
68
61
a) Elige una amplitud de clase.
b) Elabora la tabla de frecuencias.
c) ¿Cuáles fueron los aportes más
frecuent es?
d) ¿Cuál fue el aport e total de la clase
más frec uent e?
e) Resulta la misma cantidad de aporte
total si multiplicas la marca de clase
más frecuente por su frecuencia
absoluta. Explica el por qué.
VALORES
ENCUESTA
MÚSICA FAVORITA
Clase
media
i
hi
%
Balada
Rock
Tecnocumbia
Salsa
música
Balada
Rock
Tecnocumbia
salsa
i
hi
%
total
total
REPRESENTACIONES GRÁFICAS
Las representaciones gráficas permiten interpretar y analizar con mayor facilidad los datos obtenidos.
GRÁFICO DE BARRAS
Observa la tabla del margen con datos no agrupados de variable estadística cualitativa
.
Construiremos un gráfico de barras que nos permitirá una mejor lectura de las tablas de frecuencias.
45
60
89
69
60
45
60
88
69
45
Número de
personas
50
40
30
20
10
0
Radio
TV
cine
Teatro
Medios de
comunicación
Para cada uno de los valores del eje de las
abscisas, se traza un segmento perpendicular a
dicho eje.
A partir de este segmento, se construye la barra
respectiva.
Los valores del eje de las ordenadas
determinan la altura de cada barra.
Observa que sobre el eje de las ordenadas se
ubican los valores de las frecuencias absolutas
o relativas, y sobre el eje de las abscisas se
ubican los valores de la variable.
Una vez construido el gráfico de barras, podemos comparar las barras y responder preguntas como las
siguientes:
¿Cuál es el medio de comunicación que más prefieren las personas? ¿Cuál es el medio de
comunicación de menor preferencia?
HISTOGRAMA
Número de alumnos
Si tenemos una tabla de distribución de
frecuencias en la que los datos se representan
agrupados por intervalos y queremos su
representación gráfica usamos un histograma.
Observa la tabla de estaturas, éstas están
agrupadas en clas es de amplitud igual a 5. Su
representación en un histograma será de este
modo:
8
7
6
5
4
3
2
1
Fíjate que sobre el eje de las
señalado los extremos de los
intervalo está represent ado
longitud.
Sobre el eje de las ordenadas
las frecuencias.
abscisas hemos
intervalos. Cada
por la misma
hemos señalado
Debemos t ener en c uent a que cantidades
iguales deben estar representadas por
longitudes iguales. Sin embargo no es
necesario que las escalas de los dos ejes,
abscisas y ordenadas sean iguales.
Mediante un histograma es fácil detectar los
valores de la variable de mayor o menor
frecuencia, o c omparar las frecuencias de
varios valores.
150 155 160 165
170
175
Estatura
Número de
alumnos
PICTOGRAMAS
Se usan para representar variables cualitativos. Una figura o un dibujo sustituye a las barras.
Sexo
POLÍGONO DE FRECUENCIAS
Observa al margen, tenemos una tabla de
frecuencias donde se muestra el número de
personas que asisten al cine Monumental
durante una semana.
Graficamos la tabla utilizando un polígono de
frecuencias.
Los puntos de las frec uencias absolutas se
unen mediante segmentos, resultando una línea
poligonal llamada polígono de frecuencias.
Fíjate que la variable es cualitativa.
N° de Asistentes
350
300
250
200
150
100
Día de la semana
50
L
M
Mi
J
V
S
D
Un polígono de frec uencias es una línea que representa gráficamente una distribución de frecuencias.
También podemos elaborar un polígono de frecuencias correspondiente a un histograma. Tomamos
como ejemplo el histograma de la estatura de los alumnos:
ESTATURA DE LOS ALUMNOS
DE TERCER GRADO
Número de alumnos
Para elaborar el polígono hemos unido
mediante segmentos los punt os medios de las
bases superiores de cada uno de los
rectángulos, que corresponden a las marcas de
clase de cada int ervalo.
Observa que en este caso, la variable es
cuantitativa continua.
20%
Estatura
GRÁFICO DE SECTORES
Observa cómo se elabora un gráfico de
sectores, a partir de la tabla del margen, que
corresponde a una encuesta hecha a 100
alumnos sobre el medio de t ransporte que usan
para llegar al colegio.
Para representar estos datos en un gráfico se
reparten los 360 grados del círculo en partes
proporcionales con la ayuda de la regla de tres.
Bus escolar
40%
144°
54°
Automóvil
15%
72°
90°
Bicicleta
Bus urbano
Número de
alumnos
100
40
15
25%
Grados Sexagesimales
360°
40  360
x
 144
100
15  360
x
 54
100
En el c írculo, hemos trazado cuatro sectores
circulares de 144°, 54°, 90° y 72°, que
corresponden a las cuatro alternativas: bus
escolar, automóvil, bus urbano y bicicleta,
respectivamente.
b) ¿Cuántos alumnos participaron de la
prueba?
EJERCI CIOS PARA LA CLAS E
1.
Elabora un gráfico de barras
representar esta información.
Edades de
Secundaria.
15
15
15
15
14
15
13
15
14
16
17
15
14
15
15
50
15
16
15
16
15
alumnos
15
14
15
14
16
13
15
14
17
15
de
15
14
15
16
17
15
15
15
16
15
para
4ro.
de
14
13
16
16
14
14
16
15
13
15
Variable:
Puntaje
300 – 350
250 – 300
200 – 205
150 – 200
100 – 150
50 – 100
0 – 50
i
hi
%
5
2
7
4
8
2
2
a) ¿Cuál es la frecuencia más alta?
b) ¿Qué porc entaje repres entan los de
menos edad?
c) ¿Qué porcentaje representan los de 15
años?
VALORES
i
hi
%
total
3.
En los últimos Juegos Olímpicos realizados
en Atenas 2004, estos países obt uvieron el
mayor número de medallas.
N° DE MEDALLAS OBTENI DAS POR
PAÍSES – ATENAS 2004
País
Total
Oro
Plata Bronce
EE.UU.
96
41
30
25
Rusia
62
26
21
15
Alemania
60
19
17
24
China
49
16
21
12
Representa estos resultados en un gráfico
de barras.
2.
Construye un histograma usando la
información de la tabla sobre las
puntuaciones obt enidas en una prueba de
aptitud académica de un grupo de alumnos.
Además:
a) Elabora la t abla de frecuencias relativas
y porcentuales.
4.
En un c olegio se ha realizado una encuesta
sobre algunos talleres que los estudiantes
desearían tomar. Este fue el resultado:
i
18
22
Talleres
Franc és
Medios
de
comunicación
Programación
Astronomía
Electrónica
Teatro y danzas
Ingles
hi
%
25
27
48
60
12
5.
En una encuesta a alumnos de un colegio
se les preguntó sobre sus deportes
favoritos y se obtuvieron los siguientes
resultados:
Deportes
(hi )
%
( i )
Fútbol
64
Voleibol
56
Básquetbol
44
Natación
50
Atletismo
16
Ping Pong
20
a) ¿Completa la tabla de frecuencias?
b) Elabora el gráfico de sectores.
a) Elabora la tabla de frecuencias.
b) ¿Cuántos
alumnos
fueron
encuestados?
c) Construye el diagrama de barras.
d) Si el colegio ofreciera cuatro talleres,
¿cuáles deberían ser? ¿Por qué?
MEDIDAS DE TENDENCIA CENTRAL
MEDIA ARITMÉTICA (
x)
Observa cómo calculamos la media aritmética con datos agrupados.
Variable estadí stica
Estatura (cm)
145 – 150
150 – 155
155 – 160
160 – 165
165 – 170
170 – 175
175 – 180
Frecuencia absoluta
( i )
4
8
10
6
4
6
2
40
Marca de clase
x m = (a + b)/2
147.5
152.5
157.5
162.5
167.5
172.5
177.5
x m . i
590
1220
1575
975
670
1035
355
 = 6420
En este caso, debemos obtener la marca de clase (x m ) como valor representativo. Cada marca de clase
se multiplica por su frec uencia absolut a y la suma de estos productos se divide entre el total de datos:
x
x
m
n
 i

6420
 160.5
40
La estatura media de los alumnos de esta sección es 160,5 cm.
La media aritmética es una medida estadística que es igual al c ociente de la suma de los productos de
cada variable por su frecuencia absolut a entre el total de frec uencias.
MEDIANA (Me)
Observa cómo calculamos la mediana con datos agrupados.
Hallamos la mediana de las estaturas de los alumnos de la sección mostradas en la tabla anterior.
Y
Fi
40
Número de alumnos
35
30
25
20
15
10
5
X
145 150 155 160 165
170 175
Estaturas
Me
Sobre el eje X llevamos los intervalos y sobre el eje Y, las frecuencias absolutas acumuladas.
Trazamos los rectángulos cuyas alturas corresponden a las frec uencias absolutas acumuladas.
Unimos extremos superiores derechos de cada rectángulo obteniendo el polígono de frecuencias
acumuladas.
Ubicamos n/2 en la columna Y: 40/2 = 20. Trazamos una horizontal y en el punto de corte con el
polígono bajamos la perpendicular. La mediana de las es taturas de los alumnos se encuent ra en el
intervalo [155-160[.
La mediana de un conjunto ordenado de datos es el valor que deja igual cantidad de datos por encima y
por debajo de él.
MODA (Mo)
Observamos en la tabla la distribución de frecuencias vista anteriormente, que el intervalo que tiene
mayor frecuencia es [155 – 160[
Entonces, la moda se encuentra en el intervalo [155 – 160[ llamado intervalo modal.
MEDIDAS DE DISPERSIÓN
Cuando de una distribución conocemos los valores centrales ya tenemos una buena información de la
tendencia central de los dat os. Sin embargo, los promedios no proporcionan una información completa
de la distribución, como se obs erva en el siguiente ejemplo:
Observa en el cuadro del margen las estaturas de los integrantes de dos equipos de básquet.
La media aritmética de cada equipo es 165 cm, sin embargo:
-
Las estaturas de los jugadores del equipo 2 están más próximas a la media.
Las estaturas de los jugadores del equipo 1 están más distantes de la media.
Esto se expresa diciendo que las estaturas de los jugadores del equipo 1 tienen mayor dispersión que
las estaturas de los jugadores del equipo 2.
Para medir la mayor o menor dispersión de un conjunto de datos se utiliza el recorrido y las
des viaciones.
RECORRIDO, DESVI ACIONES
En las estaturas del equipo 1, el rec orrido es 180 – 150 = 30.
En las estaturas del equipo 2, el rec orrido es 168 – 162 = 6.
Se llama recorrido a la diferencia ent re el dato mayor y el dato menor.
¿Cuál es la des viación de la estatura de c ada jugador del equipo 1 y del equipo 2 respecto a la
media aritmética?
La des viación de cada estatura respecto a la media es la diferencia entre esa estatura y la
media (x i –
x ).
Equipo 1: 150 – 165 = –15; 152 – 165 = –13; 165 – 165 = 0; 178 – 165 = 13; 18 – 165 = 15
Equipo 2: 162 – 165 = –3; 163 – 165 = –2; 165 – 165 = 0; 167 – 165 = 2; 168 – 165 = 3
DESVIACIÓN MEDI A
Des viación media es el promedio de todas las des viaciones.
Para evitar que la suma salga cero se utilizan los valores absolutos.
Hallamos la des viación media (DM) de ambos equipos.
Al igual que en el recorrido,
cuanto
mayor
es
la
des viación media, mayor
es la dispersión de los
datos.
Equipo 1: DM = |–15| + |–13| + |0| + |13| + |15| = 11,2
5
Equipo 2: DM = |–3| + |–2| + |0| + |2| + |3| = 2
5
Des viación media es el cociente de la suma de los valores absolut os de las des viaciones entre
el total de frecuencias.
VARI ANZA Y DESVIACIÓN TÍPICA
Para hallar la varianza de las estaturas de cada equipo, calculamos el cociente entre la suma
de los cuadrados de las des viaciones y el número de datos:
Equipo 1: V 
788
 157,6
5
Equipo 2: V 
26
 5,2
5
Para hallar la des viación t ípica o des viación estándar, extraemos la raíz cuadrada al valor de la
varianza.
Equipo 1: D.S. =
157,6  12,55
Equipo 2:
5,2  2,28
EJERCI CIOS PROP UESTOS
1) Ordena estos datos y halla su recorrido 47; 54; 35; 71; 35; 50; 39; 79; 52; 45.
2) Al preguntar a diez conductores cuánt os galones de gasolina consume su carro en
carret era por cada 400 km, éstas fueron sus respuestas: 8; 9; 10; 8; 6; 9; 5; 7; 7; 7.
a) Encuentra el promedio o media aritmética.
b) La mediana.
c) La moda
3) Las últimas calificaciones de Enrique fueron: 14; 11; 15; 09; 17; 12; 13; 15. Usa la
calculadora y halla:
a) La media aritmética.
b) La varianza.
c) La des viación estándar.
4) Un comerciante realizó una encuesta para saber qué tallas de pant alones debe tener en su
tienda. Los resultados fueron:
Tallas
i
30
2
31
2
32
3
33
5
34
6
35
8
36
14
37
11
38
9
Encuentra:
a) La mediana.
b) La moda.
5) Los siguient es son los sueldos de los empleados de una empresa:
Un director: $ 600.
Un subdirector: $ 500.
Cuadro secretarias: $ 360 cada una.
Dos auxiliares: $ 220 cada uno.
Dieciséis empleados: $ 420 cada uno.
Un administrador: $ 480.
Hallar:
a) El recorrido y las des viaciones.
b) La media aritmética.
c) La des viación estándar.
6) La tabla representa los pesos de un grupo de niños. Halla la varianza.
35 – 40
30
Peso (Kg)
i
40 – 45
4
45 – 50
5
50 – 55
8
7) El diagrama de barras representa la cantidad de videos observados por un cierto número
de personas al mes.
Y
70
69
N° de personas
60
50
40
30
30
27
15
20
6
10
3
X
3
4
5
6
7
8
N° de videos
Elabora la tabla de frecuencias y halla:
a)
b)
c)
d)
¿Cuántas personas forman esta muestra?
¿Cuál es el promedio de videos vistos?
¿Cuál es la mediana? Y, ¿cuál es la moda?
¿Cuál es la des viación media?
i
hi
%