Download Presentación de PowerPoint
Document related concepts
no text concepts found
Transcript
ESTADÍSTICA Y PROBABILIDAD 1º BACH CCNN CURSO 2016/2017 ESTADÍSTICA • Conceptos básicos: 1. Estadística: una rama de las matemáticas que estudia usos y análisis provenientes de una muestra representativa de datos, que busca explicar las correlaciones y dependencias de un fenómeno físico o natural, de ocurrencia en forma aleatoria o condicional. Población: conjunto de todos los elementos de estudio. 2. • ¿Qué es una variable estadística?. Es cada una de las propiedades o características que podemos estudiar de un conjunto de datos. Pueden ser: Ejemplo: Los alumnos que cursan 3º E.S.O. en cierta ciudad son 6578. Los 6578 alumnos constituyen la población objeto de estudio. 3. Muestra: A veces no se puede trabajar con todos los elementos y hacemos el estudio sólo con una parte de ellos. A este conjunto de elementos se llama muestra. Ejemplo: Los alumnos de 3º E.S.O.del I.E.S. San Juan de dicha ciudad son una muestra de la población. El número de alumnos de la clase es el tamaño de la muestra. V. Estadística Cuantitativas Cuantitativas discretas Cualitativas Cuantitativas continuas Recuento de datos EJEMPLO DE VARIABLE CUANTITATIVA DISCRETA EJEMPLO DE VARIABLE CUANTITATIVA CONTINUA La talla de calzado en una clase de 20 alumnos es: 43,42,41,39,41,37,40,43,44,40,39,39,38, 41,40,39,38,39,39,40 El peso en kg de 20 alumnos es: 66,5; 59,2; 60,1; 64,2; 70; 50; 41,6; 47,9; 42,8; 55; 52,2; 50,3; 42,2; 61,9, 52,4; 49,2; 41,6; 38,7; 36,5; 45. Valores xi Recuento 37 1 38 2 39 6 40 4 41 Intervalo Marca de clase Recuento [36,42) 39 4 [42,48) 45 4 [48,54) 51 5 3 [54,60) 57 2 42 1 [60,66) 63 3 43 2 [66,72) 69 2 44 1 Frecuencias Frecuencia Absoluta (fi) Frecuencia Absoluta Acumulada ( Fi) Frecuencia Relativa Acumulada (Hi) Frecuencia Relativa (hi) Porcentaje (pi) Porcentaje acumulado (Pi) Tabla de frecuencias de una variable cuantitativa discreta Valores xi Recuento (fi) Fi hi = fi/N Hi pi (hi*100) Pi 37 1 1 1/20=0,05 0,05 5% 5% 38 2 3 2/20=0,10 0,15 10% 15% 39 6 9 6/20=0,30 0,45 30% 45% 40 4 13 4/20=0,20 0,65 20% 65% 41 3 16 3/20=0,15 0,80 15% 80% 42 1 17 1/20=0,05 0,85 5% 85% 43 2 19 2/20=0,10 0,95 10% 95% 44 1 20 1/20=0,05 1 5% 100% Suma N=20 1 100% Frecuencias Frecuencia Absoluta (fi) Frecuencia Absoluta Acumulada (Fi) Frecuencia Relativa ( hi) Frecuencia Relativa Acumulada (Hi) Tabla de frecuencias de una variable cuantitativa continua Intervalo Marca de clase Recuento (fi) Fi hi (fi/N) Hi Pi (hi*100) Pi [36,42) 39 4 4 4/20=0,2 4/20 20 20 [42,48) 45 4 8 4/20=0,2 8/20 20 40 [48,54) 51 5 13 5/20=0,25 13/20 25 65 [54,60) 57 2 15 2/20=0,1 15/20 10 75 [60,66) 63 3 18 3/20=0,15 18/20 15 90 [66,72) 69 2 20 2/20=0,1 1 10 100 Suma N = 20 1 100 Gráficos Estadísticos HISTOGRAMA 6 4 2 0 Fr. Absoluta DIAGRAMA DE SECTORES [36,42) [42,48) [48, 54) [54,60,) [60, 66) [66,72) POLÍGONO DE FRECUENCIAS DIAGRAMA DE BARRAS Medidas Medidas Medidas De centralización Media Aritmética (x) Moda (Mo) Medidas De Dispersión Mediana (Me) Media Aritmética: Es la suma de todos los productos de los valores de la variable ( o de las marcas de clase para datos agrupados en intervalos) por sus frecuencias absolutas, dividido por el número total de datos. Rango (R) Varianza (σ2) Desviación Típica Rango: Es la diferencia entre el mayor y el menor de la variable. Se representa por R. Varianza: Es la media aritmética de los cuadrados x f x f x f x f . . . x f i i i 2 2 1 1 2 2 n n x i f1. x1 x ... f n . xn x 2 f f . . . f f N 1 2 n i Moda: Es el valor de la variable, o la marca de clase para datos en intervalos, que tiene mayor frecuencia absoluta. Mediana: Es el valor tal que una vez ordenados los datos de forma creciente, la mitad son menores o iguales que él y la otra mitad iguales o mayores. Si el número de datos, N, es impar, la mediana será el término central; si es par, será la media de los valores centrales. Para datos en intervalos, es la marca de clase del primer intervalos cuya frecuencia absoluta acumulada es mayor que N/2. de las desviaciones respecto de la media N Desviación Típica: Es la raíz cuadrada positiva de la varianza. Ejercicio: Los puntos que Teresa y Rosa han conseguido en una semana de entrenamiento, jugando al baloncesto, han sido los siguientes: Teresa: 16 25 20 24 22 29 18 Rosa: 23 24 22 25 21 20 19 ¿A quién elegirías? PROBABILIDAD • Experimentos aleatorios Un experimento es aleatorio cuando no podemos predecir el resultado. Los hay: – Simples: son aquellos que no se pueden descomponer en varios experimentos. – Compuesto: consisten en varios experimentos simples repetidos sucesivamente (Ej: Lanzar una moneda tres veces seguidas) o realizados al mismo tiempo para que formen uno solo (Ej: lanzar dos dados a la vez) • Experimentos deterministas Un experimentos es determinista cuando conocemos de antemano el resultado que se va a producir. Espacio muestral y sucesos • Espacio muestral • Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa por E Experimento Espacio Muestral Sucesos elementale s Cada uno de esos resultados es un suceso elemental Lanzar un dado E={1,2,3,4,5,6} 1,2,3,4,5,6 Suceso compuesto Obtener un número par A={2,4,6} Obtener un múltiplo de 3 B={3,6} Suceso contrario Obtener un número impar A ={1,3,5} Obtener un número no múltiplo de 3 {1,2,5} • Un suceso es compuesto cuando está formado por dos o más sucesos elementales • El suceso contrario o complementario de un suceso A es el formado por todos los sucesos elementales que no están en A. • Un suceso imposible es uno que no se encuentra entre los posibles resultados del espacio muestral. • Un suceso seguro es el que engloba todos los resultados del espacio muestral. Probabilidad de un suceso • Definición: es un número entre 0 y 1 que nos indica el grado de confianza que hay de que ocurra dicho suceso. • Propiedades: – La probabilidad de suceso seguro es 1. – La probabilidad de un suceso imposible es 0. – La probabilidad de un suceso y su contrario suman 1 P(Ā) = 1 – P(A) • Ley de Laplace: – Para sucesos cuyo espacio muestral esté formado en sucesos equiprobables, (es decir, con la misma probabilidad). Espacio muestral y sucesos • Para calcular espacios muestrales de experimentos compuestos se utilizan procedimientos como: Pregunta para discutir • Se pasó una encuesta a todas las familias con seis hijos de cierto pueblecito de Jaén. Los padres debían anotar el orden exacto de los nacimientos de niños (V) y niñas (M). • ¿Cuál de las dos siguientes secuencias MMVMVV o VVVVMV te parece más probable que marcará la familia Arrieta-Barrilado? a) La primera b) La segunda c) Ambas tienen la misma probabilidad La ley de los grandes números • • Frecuencia absoluta de un Ejemplo: Observa la siguiente tabla, en la que se han anotado las frecuencias del suceso “salir cara al lanzar una moneda”. suceso (fi) es el número de veces que aparece dicho suceso cuando se repite un experimento aleatorio n veces Lanzamientos 100 150 200 300 400 500 Frecuencia relativa de un fi 56 68 108 132 208 255 suceso (hi) es la frecuencia hi 0’56 0’45 0’54 0’44 0’52 0’51 absoluta dividida entre el número de veces que Al aumentar los lanzamientos, las frecuencias realizamos el experimento, relativas se aproximan a un valor 0’5. Ésa es la f probabilidad del suceso salir cara al lanzar una hi i moneda. n La ley de los grandes números, también llamada ley del azar, afirma que al repetir un experimento aleatorio un número elevado de veces, la frecuencia relativa de cada suceso elemental tiende a aproximarse a un número fijo, llamado probabilidad de un suceso. Pregunta para discutir • Como son muy pocos resultados, y cada hijo/a es un suceso independiente del anterior, las dos secuencias tienen la misma probabilidad. • ¿Cuál de las dos siguientes secuencias MMVMVV o VVVVMV te parece más probable que marcará la familia Arrieta-Barrilado? a) La primera b) La segunda c) Ambas tienen la misma probabilidad Problema • LEY DE LOS GRANDES NÚMEROS permite asignar probabilidades a los fenómenos aleatorios, basta con repetir el experimento un número suficientemente elevado de veces y tomar sus frecuencias relativas, que tienden a aproximarse a un número al que denominamos probabilidad de ese suceso. • PERO En la práctica, no podemos repetir la experiencia tantas veces para averiguar como se distribuye la probabilidad entre los posibles sucesos que pueden ocurrir. • ¿QUÉ SE HACE? – Se hace un número limitado de veces y observamos si los resultados se ajustan a un determinado modelo teórico de asignación de probabilidades. – El modelo teórico será un buen instrumento para el estudio de este fenómeno si al repetir la experiencia en las mismas condiciones obtenemos aproximadamente los mismos resultados. – En ese caso, tendremos una distribución de probabilidad que permitirá hacer previsiones sobre el comportamiento de toda la población a la que se refiera el fenómeno. Variables aleatorias • Discretas: si su recorrido es un número finito de valores, que suele ser entero. • Ejemplos: suma de los puntos obtenidos al lanzar un dado, número de caras obtenidas al lanzar tres monedas. • Continuas: cuando puede tomar, al menos teóricamente, los infinitos valores de un intervalo. • Ejemplos: función que asigna a cada recién nacido de una maternidad su peso o talla, Distribución probabilidad discreta • • Ejemplo: Consideremos las camadas consistentes en exactamente tres perritos. Si nos fijamos en el número de hembras que se la forman, acabamos de definir una variable aleatoria discreta X que queda resumida en la siguiente tabla: EXPERIMENTALMENTE: Si observamos un gran número de camadas como esta, obtendremos la frecuencia relativa asociada a cada uno de los valores de esta variable. Por ejemplo, aquí tenemos la tabla y el diagrama de barras correspondientes a la observación de 100 camadas de tres perritos. • TEÓRICAMENTE: suponiendo que hay la misma probabilidad de que un cachorro nazca hembra o macho, podemos utilizar las leyes de la probabilidad para construir un modelo teórico que da lugar a una gráfica muy parecida. Ejemplo de El curso que viene estudiaremos la distribución binomial Distribución probabilidad continua • Ejemplo: Se han medido las tallas de 31 alumnos de un determinado curso de un centro escolar y se ha obtenido que se distribuyen según el histograma de frecuencias relativas. Intervalos [140-150) [150-160) [160-170) [170-180) [180-190) [190-200) TOTAL Frecuencia Marca de Frecuencia Frecuencia Frecuencia relativa Porcentaje % Porcentaje clase (xi) absoluta (fi) Absoluta (Fi) relativa (fri) acumulada (Fri) (pi) acumulado (Pi) xi·fi (xi-x) (xi-x)^2 fi·(xi-x)^2 145 1 1 0,032258065 0,032258065 3,22580645 3,225806452 145 -26,13 682,7769 682,7769 155 3 4 0,096774194 0,129032258 9,67741935 12,90322581 465 -16,13 260,1769 780,5307 165 8 12 0,258064516 0,387096774 25,8064516 38,70967742 1320 -6,13 37,5769 300,6152 175 15 27 0,483870968 0,870967742 48,3870968 87,09677419 2625 3,87 14,9769 224,6535 185 3 30 0,096774194 0,967741935 9,67741935 96,77419355 555 13,87 192,3769 577,1307 195 1 31 0,032258065 1 3,22580645 100 195 23,87 569,7769 569,7769 31 1 100 10191,3653 3135,4839 Media 328,753719 Varianza 101,144642 0.6 Moda 175 D. Tipica 10,0570693 Mediana 175 0.5 Nota: En los histogramas de frecuencias relativas el área de cada rectángulo coincide con hi. Base (ai): amplitud del intervalo de clase Altura (hi/ai): proporcional a la frecuencia relativa 0.4 0.3 0.2 0.1 0 [140-150)[150-160)[160-170)[170-180)[180-190)[190-200) Si tomásemos cada vez más datos, habría que hacer los intervalos cada vez más estrechos N(0 1) 250 Count 188 125 63 0 -6.0 -3.5 -1.0 N(0 1) 1.5 4.0 Y más estrechos… Histogram 120.0 Count 80.0 40.0 0.0 -4.0 -1.3 1.3 C1 4.0 Histogram 60.0 Count 40.0 20.0 0.0 -4.0 -1.3 1.3 C1 4.0 Histogram 35.0 Count 23.3 11.7 0.0 -4.0 -1.3 1.3 C1 4.0 Hasta ver que las barras, muy finitas, forman una campana como la del dibujo Histogram 25.0 Count 16.7 8.3 0.0 -4.0 -1.3 1.3 C1 4.0 Idea intuitiva de distribución de probabilidad continua • Una distribución de probabilidad es una idealización de una distribución de frecuencias relativas • En esta idealización el polígono de frecuencias tiende a confundirse con una curva continua que sería la gráfica de una función llamada función de densidad. Función de densidad Polígono de frecuencias Variable estadística Variable aleatoria IDEALIZACIÓN DE LA POBLACIÓN Función de densidad (dominio de definición) La distribución normal • Gran cantidad de variables aleatorias continuas que se presentan en situaciones variadas tienen una función de densidad de forma acampanada con: – Un eje de simetría situado en la media (µ) y – Un achatamiento proporcional a la dispersión de los datos, medida por la desviación típica (σ) CAMPANA DE GAUSS ¿Qué tiene Distribución Normal? • Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,... • Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. • Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen. • Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio,... • Errores cometidos al medir ciertas magnitudes. • Valores estadísticos muestrales, por ejemplo : la media. • Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ... • Y en general cualquier característica que se obtenga como suma de muchos factores. • No, ejemplo: distribución o clasificación según nivel de renta. • muchos pobres, pocos ricos frecuencia ¿Son normales todas las distribuciones? pobres ricos Un ejemplo 𝑃(𝑋 ≤ 𝑎) 𝑃(𝑎 ≤ 𝑋 ≤ 𝑏) 𝑃(𝑎 ≤ 𝑋) http://www.vadenumeros.es/sociales/mane jo-tabla-normal.htm Variable aleatoria de la Distribución Normal Función de densidad de la Distribución Normal Distribución normal estándar La N(0,1) está tabulada y todas se pueden convertir a ella mediante un cambio de variable que se conoce como Tipificación Tipificación de la variable Manejo de tablas directo P( Z < 0,92) = 0,8212 Manejo de tablas inverso Ejemplo: P( Z < a) = 0,9370 a = 1,53 Significa que el p = 93,7% de las observaciones se distribuyen en (-∞,a) • Si p > 0,5 El valor se obtiene directamente de la tabla • Si p ≤ 0,5 El valor de a no aparece en la tabla. Entonces resulta que 1 – p = P(Z ≤ a) Ejemplo: P( Z < a) = 0,3560 en una N(0,1) Se busca en la tabla el valor más cercano a 1 - 0,3560 = 0,6440. A este valor le corresponde en la tabla a = 0,37, luego el valor buscado es -0,37 Ejemplo: 𝒑 −𝒌 ≤ 𝒁 ≤ 𝒌 = 𝟎, 𝟓 Habitualmente, la probabilidad p=0,5 se designa por 𝑝 = 1 − 𝛼 y se denomina nivel de confianza. Así mismo, el valor crítico, se designa por 𝑍𝛼 2 Si un intervalo (-k, k) encierra un área igual a p, recibe el nombre de intervalo característico correspondiente a la probabilidad p y k es el valor crítico. MATEMÁTICAS 4 ESO ESTADÍSTICA UNIDIMENSIONAL 16. Distribución de los datos respecto a la media En distribuciones unimodales y bastante simétricas se verifica que: s ,x s ) se encuentra aproximadamente el 68% de los datos. • En el intervalo (x • En el intervalo ( se encuentra aproximadamente el 95% de los datos. x2 s ,x2 s ) x3 s ,x3 s )se encuentra aproximadamente el 99% de los datos. • En el intervalo ( 68% 95% 99% Límites sigma Límites dos sigma Límites tres sigma