Download Presentación de PowerPoint

Document related concepts
no text concepts found
Transcript
ESTADÍSTICA Y PROBABILIDAD
1º BACH CCNN
CURSO 2016/2017
ESTADÍSTICA
•
Conceptos básicos:
1.
Estadística: una rama de las matemáticas
que estudia usos y análisis provenientes
de una muestra representativa de datos,
que busca explicar las correlaciones y
dependencias de un fenómeno físico o
natural, de ocurrencia en forma aleatoria
o condicional.
Población: conjunto de todos los
elementos de estudio.
2.
• ¿Qué es una variable
estadística?.
Es cada una de las propiedades o
características que podemos estudiar
de un conjunto de datos.
Pueden ser:
Ejemplo: Los alumnos que cursan 3º E.S.O.
en cierta ciudad son 6578. Los
6578 alumnos constituyen la
población objeto de estudio.
3.
Muestra: A veces no se puede trabajar
con todos los elementos y hacemos el
estudio sólo con una parte de ellos. A
este conjunto de elementos se llama
muestra.
Ejemplo: Los alumnos de 3º E.S.O.del I.E.S.
San Juan de dicha ciudad son una
muestra de la población. El
número de alumnos de la clase es
el tamaño de la muestra.
V.
Estadística
Cuantitativas
Cuantitativas
discretas
Cualitativas
Cuantitativas
continuas
Recuento de datos
EJEMPLO DE VARIABLE
CUANTITATIVA DISCRETA
EJEMPLO DE VARIABLE
CUANTITATIVA CONTINUA
La talla de calzado en una clase de 20
alumnos es:
43,42,41,39,41,37,40,43,44,40,39,39,38,
41,40,39,38,39,39,40
El peso en kg de 20 alumnos es: 66,5;
59,2; 60,1; 64,2; 70; 50; 41,6; 47,9;
42,8; 55; 52,2; 50,3; 42,2; 61,9, 52,4;
49,2; 41,6; 38,7; 36,5; 45.
Valores xi
Recuento
37
1
38
2
39
6
40
4
41
Intervalo
Marca de
clase
Recuento
[36,42)
39
4
[42,48)
45
4
[48,54)
51
5
3
[54,60)
57
2
42
1
[60,66)
63
3
43
2
[66,72)
69
2
44
1
Frecuencias
Frecuencia
Absoluta
(fi)
Frecuencia
Absoluta
Acumulada
( Fi)
Frecuencia
Relativa
Acumulada
(Hi)
Frecuencia
Relativa
(hi)
Porcentaje
(pi)
Porcentaje
acumulado
(Pi)
Tabla de frecuencias de una variable cuantitativa discreta
Valores xi
Recuento
(fi)
Fi
hi = fi/N
Hi
pi
(hi*100)
Pi
37
1
1
1/20=0,05
0,05
5%
5%
38
2
3
2/20=0,10
0,15
10%
15%
39
6
9
6/20=0,30
0,45
30%
45%
40
4
13
4/20=0,20
0,65
20%
65%
41
3
16
3/20=0,15
0,80
15%
80%
42
1
17
1/20=0,05
0,85
5%
85%
43
2
19
2/20=0,10
0,95
10%
95%
44
1
20
1/20=0,05
1
5%
100%
Suma
N=20
1
100%
Frecuencias
Frecuencia
Absoluta
(fi)
Frecuencia
Absoluta
Acumulada
(Fi)
Frecuencia
Relativa
( hi)
Frecuencia
Relativa
Acumulada
(Hi)
Tabla de frecuencias de una variable cuantitativa continua
Intervalo
Marca de
clase
Recuento
(fi)
Fi
hi
(fi/N)
Hi
Pi
(hi*100)
Pi
[36,42)
39
4
4
4/20=0,2
4/20
20
20
[42,48)
45
4
8
4/20=0,2
8/20
20
40
[48,54)
51
5
13
5/20=0,25
13/20
25
65
[54,60)
57
2
15
2/20=0,1
15/20
10
75
[60,66)
63
3
18
3/20=0,15
18/20
15
90
[66,72)
69
2
20
2/20=0,1
1
10
100
Suma
N = 20
1
100
Gráficos Estadísticos
HISTOGRAMA
6
4
2
0
Fr. Absoluta
DIAGRAMA DE
SECTORES
[36,42)
[42,48)
[48, 54)
[54,60,)
[60, 66)
[66,72)
POLÍGONO DE
FRECUENCIAS
DIAGRAMA DE
BARRAS
Medidas
Medidas
Medidas
De
centralización
Media
Aritmética (x)
Moda (Mo)
Medidas
De
Dispersión
Mediana (Me)
Media Aritmética:
Es la suma de todos los
productos de los valores de la variable ( o de las marcas
de clase para datos agrupados en intervalos) por sus
frecuencias absolutas, dividido por el número total de
datos.
Rango (R)
Varianza (σ2)
Desviación
Típica
Rango: Es la diferencia entre el mayor y el menor
de la variable. Se representa por R.
Varianza: Es la media aritmética de los cuadrados
x
f
x
f
x
f

x
f

.
.
.

x
f
i
i 
i
2
2
1
1
2
2
n
n
x

 i
f1. x1  x   ...  f n . xn  x 
2
f

f

.
.
.

f
f
N
 

1
2
n
i
Moda: Es el valor de la variable, o la marca de clase
para datos en intervalos, que tiene mayor frecuencia
absoluta.
Mediana: Es el valor tal que una vez ordenados los
datos de forma creciente, la mitad son menores o iguales
que él y la otra mitad iguales o mayores. Si el número de
datos, N, es impar, la mediana será el término central; si
es par, será la media de los valores centrales. Para datos
en intervalos, es la marca de clase del primer intervalos
cuya frecuencia absoluta acumulada es mayor que N/2.
de las desviaciones respecto de la media
N
Desviación Típica: Es la raíz cuadrada
positiva de la varianza.
Ejercicio: Los puntos que Teresa y Rosa han conseguido en
una semana de entrenamiento, jugando al baloncesto, han
sido los siguientes:
Teresa: 16 25 20 24 22 29 18
Rosa: 23 24 22 25 21 20 19
¿A quién elegirías?
PROBABILIDAD
• Experimentos
aleatorios
Un experimento es aleatorio
cuando no podemos predecir el
resultado. Los hay:
– Simples: son aquellos que no
se pueden descomponer en
varios experimentos.
– Compuesto: consisten en
varios experimentos simples
repetidos sucesivamente (Ej:
Lanzar una moneda tres veces
seguidas) o realizados al
mismo tiempo para que
formen uno solo (Ej: lanzar dos
dados a la vez)
• Experimentos
deterministas
Un experimentos es
determinista cuando
conocemos de antemano el
resultado que se va a
producir.
Espacio muestral y sucesos
• Espacio muestral
•
Es el conjunto de todos los resultados
posibles de un experimento aleatorio.
Se representa por E
Experimento
Espacio
Muestral
Sucesos
elementale
s
Cada uno de esos resultados es un suceso
elemental
Lanzar un dado
E={1,2,3,4,5,6}
1,2,3,4,5,6
Suceso
compuesto
Obtener un
número par
A={2,4,6}
Obtener un
múltiplo de
3
B={3,6}
Suceso
contrario
Obtener un
número impar
A ={1,3,5}
Obtener un
número no
múltiplo de
3
{1,2,5}
•
Un suceso es compuesto cuando está
formado por dos o más sucesos elementales
•
El suceso contrario o complementario de un
suceso A es el formado por todos los sucesos
elementales que no están en A.
•
Un suceso imposible es uno que no se
encuentra entre los posibles resultados del
espacio muestral.
•
Un suceso seguro es el que engloba todos los
resultados del espacio muestral.
Probabilidad de un suceso
• Definición: es un número
entre 0 y 1 que nos indica el
grado de confianza que hay
de que ocurra dicho suceso.
• Propiedades:
– La probabilidad de suceso
seguro es 1.
– La probabilidad de un suceso
imposible es 0.
– La probabilidad de un suceso
y su contrario suman 1
P(Ā) = 1 – P(A)
• Ley de Laplace:
– Para sucesos cuyo espacio
muestral esté formado en
sucesos equiprobables, (es
decir, con la misma
probabilidad).
Espacio muestral y sucesos
• Para calcular espacios muestrales de experimentos
compuestos se utilizan procedimientos como:
Pregunta para discutir
• Se pasó una encuesta a todas las familias con seis hijos de
cierto pueblecito de Jaén. Los padres debían anotar el orden
exacto de los nacimientos de niños (V) y niñas (M).
• ¿Cuál de las dos siguientes
secuencias MMVMVV o
VVVVMV te parece más
probable que marcará la
familia Arrieta-Barrilado?
a) La primera
b) La segunda
c) Ambas tienen la misma
probabilidad
La ley de los grandes números
•
•
Frecuencia absoluta de un
Ejemplo:
Observa la siguiente tabla, en la que se han
anotado las frecuencias del suceso “salir cara al
lanzar una moneda”.
suceso (fi) es el número de
veces que aparece dicho suceso
cuando se repite un
experimento aleatorio n veces Lanzamientos 100 150 200 300 400 500
Frecuencia relativa de un
fi
56
68
108 132 208 255
suceso (hi) es la frecuencia
hi
0’56 0’45 0’54 0’44 0’52 0’51
absoluta dividida entre el
número de veces que
Al aumentar los lanzamientos, las frecuencias
realizamos el experimento,
relativas se aproximan a un valor 0’5. Ésa es la
f
probabilidad del suceso salir cara al lanzar una
hi  i
moneda.
n
La ley de los grandes números, también llamada ley del azar, afirma que al
repetir un experimento aleatorio un número elevado de veces, la frecuencia
relativa de cada suceso elemental tiende a aproximarse a un número fijo,
llamado probabilidad de un suceso.
Pregunta para discutir
• Como son muy pocos resultados, y cada hijo/a es un
suceso independiente del anterior, las dos secuencias
tienen la misma probabilidad.
• ¿Cuál de las dos siguientes
secuencias MMVMVV o
VVVVMV te parece más
probable que marcará la
familia Arrieta-Barrilado?
a) La primera
b) La segunda
c) Ambas tienen la misma
probabilidad
Problema
• LEY DE LOS GRANDES NÚMEROS permite asignar probabilidades a los
fenómenos aleatorios, basta con repetir el experimento un número
suficientemente elevado de veces y tomar sus frecuencias relativas, que
tienden a aproximarse a un número al que denominamos probabilidad de
ese suceso.
• PERO En la práctica, no podemos repetir la experiencia tantas veces
para averiguar como se distribuye la probabilidad entre los posibles
sucesos que pueden ocurrir.
• ¿QUÉ SE HACE?
– Se hace un número limitado de veces y observamos si los resultados se
ajustan a un determinado modelo teórico de asignación de probabilidades.
– El modelo teórico será un buen instrumento para el estudio de este fenómeno
si al repetir la experiencia en las mismas condiciones obtenemos
aproximadamente los mismos resultados.
– En ese caso, tendremos una distribución de probabilidad que permitirá hacer
previsiones sobre el comportamiento de toda la población a la que se refiera
el fenómeno.
Variables aleatorias
• Discretas: si su recorrido es un número
finito de valores, que suele ser entero.
• Ejemplos: suma de los puntos
obtenidos al lanzar un dado,
número de caras obtenidas al
lanzar tres monedas.
• Continuas: cuando puede tomar, al
menos teóricamente, los infinitos
valores de un intervalo.
• Ejemplos: función que asigna a
cada recién nacido de una
maternidad su peso o talla,
Distribución probabilidad discreta
•
•
Ejemplo: Consideremos las camadas consistentes en exactamente tres perritos. Si
nos fijamos en el número de hembras que se la forman, acabamos de definir una
variable aleatoria discreta X que queda resumida en la siguiente tabla:
EXPERIMENTALMENTE: Si observamos un gran
número de camadas como esta, obtendremos la
frecuencia relativa asociada a cada uno de los
valores de esta variable. Por ejemplo, aquí
tenemos la tabla y el diagrama de barras
correspondientes a la observación de 100
camadas de tres perritos.
•
TEÓRICAMENTE: suponiendo que hay la
misma probabilidad de que un cachorro
nazca hembra o macho, podemos utilizar las
leyes de la probabilidad para construir un
modelo teórico que da lugar a una gráfica
muy parecida.
Ejemplo de
El curso que viene
estudiaremos la
distribución binomial
Distribución probabilidad continua
• Ejemplo: Se han medido las tallas de 31 alumnos de un
determinado curso de un centro escolar y se ha obtenido que se
distribuyen según el histograma de frecuencias relativas.
Intervalos
[140-150)
[150-160)
[160-170)
[170-180)
[180-190)
[190-200)
TOTAL
Frecuencia
Marca de Frecuencia
Frecuencia
Frecuencia relativa
Porcentaje % Porcentaje
clase (xi)
absoluta (fi) Absoluta (Fi) relativa (fri) acumulada (Fri) (pi)
acumulado (Pi) xi·fi
(xi-x)
(xi-x)^2
fi·(xi-x)^2
145
1
1 0,032258065
0,032258065 3,22580645
3,225806452
145
-26,13
682,7769
682,7769
155
3
4 0,096774194
0,129032258 9,67741935
12,90322581
465
-16,13
260,1769
780,5307
165
8
12 0,258064516
0,387096774 25,8064516
38,70967742
1320
-6,13
37,5769
300,6152
175
15
27 0,483870968
0,870967742 48,3870968
87,09677419
2625
3,87
14,9769
224,6535
185
3
30 0,096774194
0,967741935 9,67741935
96,77419355
555
13,87
192,3769
577,1307
195
1
31 0,032258065
1 3,22580645
100
195
23,87
569,7769
569,7769
31
1
100
10191,3653
3135,4839
Media
328,753719
Varianza
101,144642
0.6
Moda
175
D. Tipica
10,0570693
Mediana
175
0.5
Nota: En los histogramas de frecuencias
relativas el área de cada rectángulo
coincide con hi.
Base (ai): amplitud del intervalo de
clase
Altura (hi/ai): proporcional a la
frecuencia relativa
0.4
0.3
0.2
0.1
0
[140-150)[150-160)[160-170)[170-180)[180-190)[190-200)
Si tomásemos cada vez más datos, habría que hacer los intervalos cada vez más estrechos
N(0 1)
250
Count
188
125
63
0
-6.0
-3.5
-1.0
N(0 1)
1.5
4.0
Y más estrechos…
Histogram
120.0
Count
80.0
40.0
0.0
-4.0
-1.3
1.3
C1
4.0
Histogram
60.0
Count
40.0
20.0
0.0
-4.0
-1.3
1.3
C1
4.0
Histogram
35.0
Count
23.3
11.7
0.0
-4.0
-1.3
1.3
C1
4.0
Hasta ver que las barras, muy finitas, forman una campana como la del dibujo
Histogram
25.0
Count
16.7
8.3
0.0
-4.0
-1.3
1.3
C1
4.0
Idea intuitiva de distribución de
probabilidad continua
• Una distribución de probabilidad es una idealización de una
distribución de frecuencias relativas
• En esta idealización el polígono de frecuencias tiende a confundirse
con una curva continua que sería la gráfica de una función llamada
función de densidad.
Función de
densidad
Polígono de
frecuencias
Variable estadística
Variable aleatoria
IDEALIZACIÓN DE
LA POBLACIÓN
Función de densidad
(dominio de definición)
La distribución normal
• Gran cantidad de variables aleatorias continuas que se
presentan en situaciones variadas tienen una función de
densidad de forma acampanada con:
– Un eje de simetría situado en la media (µ) y
– Un achatamiento proporcional a la dispersión de los datos,
medida por la desviación típica (σ)
CAMPANA DE GAUSS
¿Qué tiene Distribución Normal?
• Caracteres morfológicos de individuos (personas, animales,
plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras,
diámetros, perímetros,...
• Caracteres fisiológicos, por ejemplo: efecto de una misma
dosis de un fármaco, o de una misma cantidad de abono.
• Caracteres sociológicos, por ejemplo: consumo de cierto
producto por un mismo grupo de individuos, puntuaciones de
examen.
• Caracteres psicológicos, por ejemplo: cociente intelectual,
grado de adaptación a un medio,...
• Errores cometidos al medir ciertas magnitudes.
• Valores estadísticos muestrales, por ejemplo : la media.
• Otras distribuciones como la binomial o la de Poisson son
aproximaciones normales, ...
• Y en general cualquier característica que se obtenga como
suma de muchos factores.
• No, ejemplo:
distribución o
clasificación según
nivel de renta.
•
 muchos
pobres, pocos ricos
frecuencia
¿Son normales todas las
distribuciones?
pobres
ricos
Un ejemplo
𝑃(𝑋 ≤ 𝑎)
𝑃(𝑎 ≤ 𝑋 ≤ 𝑏)
𝑃(𝑎 ≤ 𝑋)
http://www.vadenumeros.es/sociales/mane
jo-tabla-normal.htm
Variable aleatoria de la Distribución
Normal
Función de densidad de la Distribución
Normal
Distribución normal estándar
La N(0,1) está tabulada y todas se pueden
convertir a ella mediante un cambio de
variable que se conoce como Tipificación
Tipificación de la variable
Manejo de tablas directo
P( Z < 0,92) = 0,8212
Manejo de tablas inverso
Ejemplo: P( Z < a) = 0,9370
a = 1,53
Significa que el p = 93,7% de las
observaciones se distribuyen en (-∞,a)
• Si p > 0,5  El valor se obtiene
directamente de la tabla
• Si p ≤ 0,5  El valor de a no aparece
en la tabla. Entonces resulta que 1 –
p = P(Z ≤ a)
Ejemplo: P( Z < a) = 0,3560 en una N(0,1)
Se busca en la tabla el valor más cercano a
1 - 0,3560 = 0,6440. A este valor le corresponde en
la tabla a = 0,37, luego el valor buscado es -0,37
Ejemplo: 𝒑 −𝒌 ≤ 𝒁 ≤ 𝒌 = 𝟎, 𝟓
Habitualmente, la probabilidad p=0,5 se designa
por 𝑝 = 1 − 𝛼 y se denomina nivel de confianza.
Así mismo, el valor crítico, se designa por 𝑍𝛼
2
Si un intervalo (-k, k) encierra un área igual a p, recibe
el nombre de intervalo característico correspondiente
a la probabilidad p y k es el valor crítico.
MATEMÁTICAS 4 ESO
ESTADÍSTICA UNIDIMENSIONAL
16. Distribución de los datos respecto a la media
En distribuciones unimodales y bastante simétricas se verifica que:

s
,x

s
) se encuentra aproximadamente el 68% de los datos.
• En el intervalo (x
• En el intervalo (
se encuentra aproximadamente el 95% de los datos.
x2
s
,x2
s
)
x3

s
,x3

s
)se encuentra aproximadamente el 99% de los datos.
• En el intervalo (
68%
95%
99%
Límites sigma
Límites dos sigma
Límites tres sigma