Download TEMA 5º - IES Salvador Serrano
Document related concepts
Transcript
TEMA 1º.- INICIACIÓN A LA ESTADÍSTICA 1º.- INTRODUCCIÓN Parece ser que la palabra estadística se utilizó por primera vez en Alemania a mediados del siglo XVII y se refería a la recolección de datos y documentos del Estado. Aunque el término estadística sea relativamente moderno, usado como recolección de datos referentes a la población y riqueza de los pueblos, parece ser anterior a la salida de los hebreos del territorio de Egipto (siglo VI a. C.). El primer censo fue realizado por el Emperador Servio Tulio (578 – 535 a.C.). Tácito, historiador latino, refiere que Cesar Augusto ordenó registrar el número de soldados, el de barcos, las riquezas y el número de habitantes de su imperio, datos estos, que están descritos en el evangelio de S. Lucas. Todo esto prueba que la estadística lleva muchos años de existencia; pero su evolución y desarrollo como ciencia empezó a mediados del siglo XVI gracias a los grandes genios de la época (Pascal, John Graunt, C. Huygens, Fermat, etc.). Hoy, la estadística es, sobre todo, un instrumento de decisión, una ciencia que usa los números para tener más conocimiento de la naturaleza y la experiencia. DEFINICIÓN 1ª.- La estadística es un conjunto de métodos que nos ayudan a tomar decisiones razonables, incluso en casos de incertidumbre. DEFINICIÓN 2ª.- La estadística también se entiende como una ciencia que trata los fenómenos de la vida, los estudia, analiza e interpreta los resultados. 1 2º.- DEFINICIONES. A) ESTADÍSTICA.- Si tomamos como definición de estadística la 2ª, en ella se distinguen tres partes claramente diferenciadas a) Descripción del fenómeno.- Es cuando se anotan o recopilan los datos o fenómenos que se quieren estudiar. Al conjunto de datos se le llama conjunto referencial, población o universo. b) Análisis de los datos.- Se trata de ver la frecuencia con la que se repiten los datos, analizar las causas que dan lugar a la reproducción de los fenómenos, ver si hay alguna explicación teórica que justifique los mismos, etc. c) Predicción de los resultados.- Analizadas las causas por las que se rigen los fenómenos y la regularidad de los mismos, se pueden hacer la predicciones oportunas. B) POBLACIÓN.- Es el conjunto de todos los elementos que cumplen una determinada característica, también se le llama conjunto referencial. Ej.- Los alumnos de 2º de Bachillerato de España, el censo de Andalucía, etc. C) MUESTRA.- Es cualquier subconjunto de la población. A la muestra se la considera una representación de la población; por ello hay que cuidar su elección. Los procesos mediante los cuales se extrae una muestra de una población son diversos, cuando cada individuo de la población tiene la misma posibilidad de pertenecer a la muestra se denomina muestreo aleatorio. Características de la muestra.- Para seleccionar una muestra adecuada han de respetarse criterios de dos tipos: De carácter cuantitativo, es decir, ¿Cuál es el tamaño adecuado de la muestra? y de carácter cualitativo, o, lo que es lo mismo ¿Cómo ha de elegirse la muestra? De los criterios cualitativos diremos que, básicamente, podemos considerar cuatro posibilidades: a) Muestra aleatoria simple.- Consiste en extraer, mediante un sorteo riguroso, una serie de individuos de una población. Todos los 2 individuos han de tener la misma posibilidad de ser elegidos. Es el método más puro, pero, sin embargo no se utiliza siempre. La razón estriba, esencialmente en el alto costo que supone en ocasiones. b) Muestra aleatoria sistemática.- Se numeran los individuos y, a, partir de uno de ellos elegido al azar se toman los siguientes mediante saltos numéricos iguales. Ej.- Si tenemos una población de N individuos y queremos tomar una muestra de “n” individuos, el salto será “h” siendo h N . Para elegir la muestra elegimos al azar un n individuo entre los “h” primeros, a1 . Los siguientes serán: a2 a1 h; a3 a2 h ; ………….. a n a n1 h . Esta forma de muestreo sólo es válida si el criterio por el que se han enumerado los individuos de la población no tiene nada que ver con la característica que se quiere estudiar a partir de la muestra. c) Muestra aleatoria estratificada.- Se eligen a los individuos según al estrato al que pertenezcan. Ej.- En un instituto hay 350 alumnos de primero de la ESO, 200 de segundo, 150 de tercero y 100de cuarto. Si queremos elegir una muestra de 80 alumnos ¿cuántos debemos de elegir de cada curso? d) Muestra no aleatoria.- Cuando se hace la elección de los individuos de forma deliberada, aunque no se les conozca. Este tipo de muestras puede dar errores graves, pues el que elige la muestra puede introducir un criterio de selección sin pretenderlo. Un error de este tipo cometió en 1936 la revista norteamericana Literary Digest ya que la fuente de la encuesta fue la lista de sus suscriptores y el listín telefónico. D) CARACTERES ESTADÍSTICOS.- Es una propiedad que permite clasificar a los individuos de la población. Estos pueden ser: cualitativos y cuantitativos. Son caracteres estadísticos cualitativos los 3 que no se pueden medir. Ej.- El color de los ojos, La carrera que pensáis estudiar, El idioma que has elegido, etc. Son caracteres estadísticos cuantitativos los que se pueden medir. Ej.La talla de un individuo, El coeficiente intelectual de un alumno, El nº de granos que tiene una espiga, etc. E) VARIABLES ESTADÍSTICAS.- Se llaman variables estadísticas a las diversas modalidades de un carácter cuantitativo. Una variable que puede tomar, teóricamente, cualquier valor comprendido entre dos valores dados se le llama variable continua. Si no puede ocurrir esto, se llama variable discreta. Ej.- La altura de un individuo (Continua) Ej.- El número de hijos de una familia (Discreta) El valor de la variable se suele notar por xi 4 TEMA 2º.- TABLAS Y GRÁFICOS ESTADÍSTICOS 1º.- FRECUENCIAS A) FRECUENCIA ABSOLUTA.- Se llama frecuencia absoluta del valor xi y la representaremos por f i , al número de veces que se repite dicho valor. B) FRECUENCIA ABSOLUTA ACUMULADA.-Se llama frecuencia absoluta acumulada del valor xi y lo representaremos por Fi , a la suma de las frecuencias absolutas de todos los valores anteriores a xi más la frecuencia absoluta de xi . Fi f1 f 2 .... f i . C) FRECUENCIA RELATIVA.- Se llama frecuencia relativa de un valor xi y la representaremos por hi , al cociente entre la frecuencia absoluta de xi y el número total de datos que intervienen en la distribución. hi fi N fi ; Siendo n f i 1 i n N f1 f 2 ....... f n f i i 1 D) FRECUENCIA RELATIVA ACUMULADA.- Es el cociente entre la frecuencia absoluta acumulada y el nº total de datos y la representaremos por H i ; Hi Fi F n i N f i 1 h1 h2 ..... hi i E) FRECUENCIAS EN %.- Todas las frecuencias anteriores pueden se expresadas en %. Ejemplo 1º.- Las notas de matemáticas en una clase de 30 alumnos han sido las siguientes: 1, 0, 1, 2, 3, 0, 1, 4, 6, 5, 5, 6, 7, 8, 8, 8, 7, 7, 9, 9, 5, 8, 7, 8, 9, 9, 8, 9, 8, 7, agrupemos estos datos y construyamos una tabla estadística 5 xi fi 0 2 1 3 2 1 3 1 4 1 5 3 6 2 7 5 8 7 9 5 Fi hi Hi fi % Fi % hi % Hi % N=30 En el caso de que la variable sea continua o bien discreta, pero con un nº de datos muy grande, resulta aconsejable agrupar los datos por intervalos que llamaremos clases. Es aconsejable elegir los extremos del intervalo nº enteros y las clases con la misma amplitud. A los puntos medios de cada clase se les llama marca de clase. Los intervalos se deben construir de forma que el extremo inferior de una clase coincida con el superior de la clase anterior. Ejemplo 2º.- La altura de 46 individuos es la siguiente: 1.64, 1.60, 1.56, 1.60, 1.63, 1.51, 1.57, 1.54, 1.53, 1.40, 1.53, 1.57, 1.44, 1.45, 1.54, 1.59, 1.52, 1.60, 1.50, 1.52, 1.55, 1.65, 1.61, 1.51, 1.55, 1.66, 1.53, 1.57, 1.56, 1.57, 1.58, 1.61, 1.70, 1.41, 1.47, 1.52, 1.44, 1.66, 1.64, 1.51, 1.58, 1.69, 1.52, 1.68, 1.68, 1.75 formemos una tabla con intervalos de clase y calcula las respectivas frecuencias 6 Intervalo Marca clase fi Fi hi Hi xi 1.40 1.45 1.45 1.50 1.50 1.55 1.55 1.60 1.60 1.65 1.65 1.70 1.70 1.75 1.425 1.475 1.525 1.575 1.625 1.675 1.725 A estas tablas se denominan TABLAS ESTADÍSTICAS 2º GRÁFICOS ESTADÍSTICOS Aun cuando las tablas estadísticas contienen toda la información, a veces es conveniente expresar esta información mediante un gráfico con el fin de hacerla más clara y evidente. Otras veces, a partir de un gráfico construimos la correspondiente tabla estadística. Los gráficos estadísticos más usuales son: Diagrama de barras. Histograma. Diagrama de sectores. Pictogramas. Cartogramas Diagramas lineales 2.1.- DIAGRAMAS DE BARRAS.- Para trazarlos se representan sobre el eje de abscisas los valores de la variable xi y sobre el eje de ordenadas las respectivas frecuencias, f i , Fi , hi , H i …. Según proceda. A continuación por los puntos 7 marcados en el eje de abscisas se levantan trazos gruesos o barras, de longitud igual a la frecuencia correspondiente 2.2.- POLÍGONO DE FRECUENCIAS.- Los polígonos de frecuencias se forman uniendo los extremos de las barras mediante una línea quebrada. 2.3.- HISTOGRAMAS.- Se utilizan para variables estadísticas continuas, o discretas con un nº de datos elevado. Para construir un histograma se representan sobre el eje de abscisas los límites de las clases. Sobre dicho eje se construyen unos rectángulos que tienen por base la amplitud de los intervalos y por altura la frecuencia de cada intervalo, siempre que todos los intervalos tengan la misma amplitud. En caso contrario las alturas de los rectángulos han de ser calculadas teniendo en cuenta que sus áreas deben de ser proporcionales a las frecuencias de cada intervalo. En este caso el polígono de frecuencias se forma uniendo el punto medio del lado superior de los rectángulos dibujados, salvo para las frecuencias acumuladas que lo que se tiene que unir son los vértices superiores derechos de cada uno de los rectángulos. 2.4.- DIAGRAMAS DE SECTORES.- Representa las distintas modalidades de un carácter mediante sectores circulares. El ángulo central de cada sector ha de ser proporcional a la frecuencia absoluta correspondiente. 2.5.- PICTOGRAMAS.- Son dibujos alusivos a la distribución y que mediante su forma, tamaño, etc. Ofrecen una descripción lo más expresiva posible de la distribución estadística. 2.6.- CARTOGRAMAS.- Son los gráficos que se realizan sobre un mapa, señalando sobre determinadas zonas con distintos colores o rayados lo que se trate de poner de manifiesto. Se suelen utiliza restos diagramas para representar la densidad demográfica de una nación, la renta percápita, los índices de lluvia, etc. 2.7.- DIAGRAMAS LINEALES.- Son utilizados para mostrar las fluctuaciones de un determinado carácter estadístico con el paso del tiempo. Ejemplo 3º.- Considera la tabla del ejercicio 1 y dibuja el diagrama de barras y polígono de frecuencia de todas las frecuencias. Ejemplo 4º.- Considera la tabla del ejercicio 2 y dibuja el histograma y polígono de frecuencias de cada una de las frecuencias. 8 RELACIÓN DE EJERCICIOS TEMA 2 1º.- En el estudio de una variable X se obtuvo la siguiente distribución de frecuencias: xi 5 7 9 10 13 14 fi 8 12 17 20 26 30 a) Construye la tabla de frecuencias b) Representa la distribución mediante un diagrama de barras 2º.- Las puntuaciones obtenidas en un test de razonamiento por 20 alumnos son las siguientes: 16, 22, 21, 20, 23, 22, 17, 15, 13, 22, 17, 18, 20, 17, 22, 16, 23, 21, 22, 18 3º.- Se ha controlado el peso de 50 recién nacidos, obteniéndose los siguientes resultados: Peso en Kg. Nº de niños 2, 5 3 3 3, 5 3, 5 4 4 4, 5 6 a) Forma la tabla de frecuencias b) Representa gráficamente la 23 distribución 12 9 4º.- Los jugadores de un equipo de baloncesto se clasifican por alturas, según la siguiente tabla Altura Nº de jugadores 1, 70 1,80 1,80 1,90 1,90 2, 00 2, 00 2,10 3 c) Forma la tabla de frecuencias 4 d) Representa gráficamente 5 la distribución 3 5º.- Según informa el Anuario El País, los cambios medios anuales para el dólar, la libra esterlina y el marchen el periodo 1980 – 1985, viene expresado por la siguiente tabla Moneda 1980 1981 1982 1983 1985 1985 Dólar 72 93 110 142 161 170 Libra 167 186 192 217 214 219 Marco 39 41 45 56 57 58 Representa esta distribución mediante tres diagramas lineales en el mismo gráfico. 9 TEMA 3º.- MEDIDAS DE CENTRALIZACIÓN Y DE DISPERSIÓN A) MEDIDAS DE CENTRALIZACIÓN 1º.- INTRODUCCIÓN Se llaman medidas de centralización a las medidas o parámetros estadísticos que tienden a situarse hacia el centro del conjunto de datos ordenados. A las medidas de centralización también se las llama medidas de tendencia central o promedios. Las medidas de centralización más importantes son: Media aritmética Moda Mediana. Cuantiles (Cuartiles, Deciles y Percentiles) También existe otras medidas de centralización menos usuales tales como: Media geométrica. Media armónica 2º.- MEDIA ARITMÉTICA. Se llama media aritmética de una variable estadística a la suma de todos los valores de dicha variable divididos por el número total de valores. Si llamamos X a la variable estadística, la media aritmética se representa por x y se calcula de la siguiente forma: Sea X una variable estadística que toma los valores x1 , x2 , x3 ,.....xn con frecuencias absolutas f1 , f 2 , f 3 ,...... f n respectivamente. La media aritmética de la variable viene dada por la expresión n x f x 2 f 2 .......x n f n x 1 1 f1 f 2 ...... f n x i 1 n f i 1 10 i fi i Si los datos son simples, se tiene que todas las frecuencias son iguales a 1 y la media aritmética quedaría: n x x i 1 i N Si la variable X es continua, o aun siendo discreta, y por tratarse de muchos datos se encuentran agrupados en clases, se toman como valores x1 , x2 , x3 ,.....xn las marcas de clase. Propiedades de la media aritmética 1ª) Si se suma una constante “k” a todos los valores xi , la media aumenta en el mismo número. Demostración 2ª) Si se multiplican todos los valores de la variable X por un mismo número “p”, la media queda multiplicada por dicho número Demostración En definitiva, la media es alterada en la misma medida que son alterados los valores de la variable X. Así si xi´ pxi k entonces x´ p x k . De esta forma cuando los valores de la X sean muy complicados podemos hacer una transformación para obtener una tabla mucho más fácil de operar. 11 Ejemplo.- Calcula la media con los datos de la siguiente tabla. A continuación haz el cambio de variable xi ´ 20 xi 34´5 y vuelve a calcular la media. xi fi 1´575 4 1´625 11 1´675 21 1´725 19 1´775 12 1´825 6 1´875 4 1´925 3 xi ´ fi xi f i xi ´ f i 12 Observaciones sobre la media: Es el parámetro que más se utiliza. Tiene en cuenta todos los datos de la distribución y es fácil de calcular Tiene el inconveniente de que cuándo la variable tiene valores extremos, excepcionalmente raros y poco significativos, estos producen una distorsión sobre la media. No siempre es posible realizar el cálculo de la media. Por ejemplo - Si los datos son cualitativos - Si los datos se encuentran agrupados en clases, estando algunas de ellas abiertas. En estos casos en los que no se puede calcular la media se utilizan otros parámetros como son la moda y la mediana. 3º.- MODA Se llama moda de una variable estadística al valor de dicha variable que presenta mayor frecuencia absoluta. La moda la representamos por M 0 . La moda no tiene por qué ser única, según el número de modas la distribución la llamaremos bimodal, trimodal, etc. El cálculo de la moda resulta muy fácil en el caso de que los datos no estén agrupados. En el caso de que estén agrupados por intervalos debemos seguir el siguiente proceso: a) Determinar la clase con mayor frecuencia absoluta(Llamada clase modal) b) Aplicar la fórmula M 0 Li D1 C . Siendo D1 D2 - Li Límite inferior de la clase modal. - D1 Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase anterior. 13 - D2 Diferencia entre la frecuencia absoluta de la clase modal y la frecuencia absoluta de la clase siguiente. - C Amplitud de los intervalos Ejemplo 1º.- Calcula la moda en la siguiente distribución xi 1 2 3 4 5 6 fi 6 7 14 10 14 9 Ejemplo 2º.- Calcula la moda en la siguiente distribución xi fi 38 – 44 7 44 – 50 8 50 – 56 15 56 – 62 25 62 – 68 18 68 – 74 9 74 - 80 6 4º MEDIANA Si se considera la serie íntegra de datos ordenados, poniendo tantas copias del dato como nos indica su frecuencia, la mediana, que anotaremos M e es el valor de la variable que está en la posición central en esa observación. La mediana es el valor que divide a la serie de datos en dos partes exactamente iguales. Veamos cómo se calcula: 4.1.- Variable estadística discreta.- Se ordenan los datos de menor a mayor, siendo la mediana el valor central si el número de datos es impar y la media aritmética de los dos valores centrales si el número de datos es par. 14 Ejemplo 1º.- Las notas de un alumno han sido 2, 4, 4, 5, 6, 7, 7. Calcula la mediana Ejemplo 2º.- Las notas de un alumno han sido 2, 4, 4, 5, 6, 7, 7, 8. Calcula la mediana. ¿Cómo calcularíamos la mediana cuando el número de datos fuese muy elevado? Calculamos N/2, siendo N el número total de datos. La mediana viene dada por el primer valor de la variable cuya frecuencia acumulada excede a la mitad del número de datos (N/2). Ejemplo.- Calcula la mediana en la siguiente tabla xi fi 1 2 2 2 3 4 4 5 5 8 6 9 7 3 8 4 9 3 En el caso de que N/2 coincida con una frecuencia acumulada entonces la mediana es la semisuma entre ese valor y el siguiente 15 Ejemplo.- Calcula la mediana en la siguiente tabla estadística xi fi 3 15 6 20 7 15 8 40 9 10 4.2.- Variable estadística continua.- En este caso procedemos de forma análogas a como acabamos de hacer y así detectamos cual es la clase mediana y a continuación aplicamos la fórmula N Fi 1 2 M e Li C fi - Li Límite inferior de la clase mediana - N Número total de datos - Fi 1 Frecuencia acumulada anterior a la clase mediana - f i Frecuencia absoluta de la clase mediana - C Amplitud del intervalo Ejemplo.- Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados, obteniéndose los siguientes resultados Puntuaciones Nº de trabajadores f i 38 – 44 7 44 – 50 8 50 – 56 15 56 – 62 25 62 – 68 18 68 – 74 9 74 - 80 6 Calcula la mediana 16 Observaciones sobre la Mediana La mediana es particularmente útil en los siguientes casos: - Cuando entre los datos existen alguno ostensiblemente extremo que, como vimos afectaba a la media - Cuando los datos están agrupados en clases y alguna de ellas es abierta. Geométricamente, y para distribuciones que se pueden representar mediante un histograma de frecuencias, la mediana es el valor de la variable, tal que la vertical levantada sobre el mismo divide al histograma en dos partes de igual área. Para calcular la mediana de esta forma, representamos el polígono de frecuencias acumuladas en % y el valor de la abscisa que le corresponda el 50% en el eje de ordenadas esa es la mediana Ejemplo.- Calcula la mediana gráficamente en el ejemplo anterior 5º.- CUANTILES Al estudiar la mediana hemos visto que, al ordenar de menor a mayor los datos de una distribución, la mediana divide a estos en dos partes iguales. Análogamente tiene interés estudiar otros parámetros que dividen a los datos de la distribución en función de otras cuantías. Los más importantes son los Cuartiles, Deciles y Percentiles 5.1.- Cuartiles.- Se llaman cuartiles a tres valores Q1 , Q2 , Q3 que dividen a la serie de datos en cuatro partes iguales. Se calcula de forma análoga a la mediana. Para el caso discreto, se hace igual que la mediana pero en N/4, N/2 y 3N/4. En el caso de continua o discreta con muchos valores tenemos 17 N Fi 1 4 Q1 Li C fi N Fi 1 Q2 Li 2 C fi 3N Fi 1 Q3 Li 4 C fi 5.2.- Deciles.- Se llaman deciles a nueve valores que dividen a la serie de datos en 10 partes iguales lo anotaremos D1 , D2 ,........D9 . Su cálculo, en una distribución discreta, se efectúa igual que la mediana y cuartiles pero en N N N N , 2, 3............... 9 . En el caso de que la distribución sea continua o 10 10 10 10 discreta con muchos valores aplicaremos la siguiente fórmula N n Fi 1 10 Dn Li C fi Siendo: - Li Límite inferior de la clase que corresponda a N n 10 - N Número total de datos - n Número de decil que vamos a calcular - Fi 1 Frecuencia acumulada anterior a la clase correspondiente - f i Frecuencia absoluta de la clase correspondiente - C Amplitud del intervalo. 5.3 Percentiles.- Se llaman percentiles a 99 valores que dividen a la serie de datos en 100 partes iguales y lo anotaremos por P1 , P2 ,.......P99 . Para calcularlos se sigue el mismo proceso de los casos anteriores 18 Ejercicio.- Enuncia una fórmula que podamos calcular cualquier percentil Como se puede observar se verifica que M e Q2 D5 P50 Ejemplo 1º.- Calcula Q1 , Q3 , D5 , D8 , P30, P70 en las calificaciones en matemáticas de 40 alumnos que vienen dadas por la siguiente tabla xi fi 1 2 2 2 3 4 4 5 5 8 6 9 7 3 8 4 9 3 Ejemplo 2º.- Se ha aplicado un test sobre satisfacción en el trabajo a 88 empleados obteniéndose la siguiente tabla. Calcula: Q3 , D4 , D5 , P40 , P90 19 Puntuaciones Nº de trabajadores f i 38 – 44 7 44 – 50 8 50 – 56 15 56 – 62 25 62 – 68 18 68 – 74 9 74 - 80 6 Observaciones sobre los cuantiles A los cuantiles se les suele llamar parámetros de posición. Aunque incluimos los cuantiles como medidas de centralización por su analogía con la mediana, se comprende, por su naturaleza, que no tienen que estar situados hacia el centro de la distribución. Pensemos por ejemplo en el P90 . Los cuantiles también se pueden calcular de forma gráfica, vasta con representar el polígono de frecuencias acumuladas en %, es decir, Fi 100 N 6º.- MEDIA GEOMÉTRICA Si tenemos una variable estadística X que toma los valores x1 , x2 , x3 ,.....xn . Llamaremos media geométrica de la variable X y la anotaremos por MG a la expresión: MG n x1 .x2 .......xn Si los valores x1 , x2 , x3 ,.....xn se presentan con frecuencia f1 , f 2 , f 3 ,...... f n respectivamente entonces MG i x1 1 .x2 2 .......xn f f f fn 20 7º.- MEDIA ARMÓNICA Es la inversa de la media aritmética del inverso de los valores. Si la variable X toma los valores x1 , x2 , x3 ,.....xn . Entonces la media armónica MA valdrá: MA 1 1 1 1 ...... x1 x 2 xn N = N 1 1 1 ........ x1 x2 xn = N n 1 x i 1 i Si los valores x1 , x2 , x3 ,.....xn se presentan con frecuencia f1 , f 2 , f 3 ,...... f n respectivamente. Entonces MA = 21 B) MEDIDAS DE DISPERSIÓN 1º.- INTRODUCCIÓN La investigación acerca de una distribución queda incompleta si sólo se estudian las medidas de centralización, siendo imprescindible conocer si los datos numéricos están agrupados o no alrededor de los valores centrales. A esto es a lo que se llama dispersión, y a los parámetros que miden estas desviaciones respecto a la media se llaman aparatos o medidas de dispersión. Los más importantes son: El rango o recorrido. La varianza. Desviación típica Otros menos frecuentes como La desviación media Rango intercuartílico. 2º.- RANGO O RECORRIDO Se llama Rango o Recorrido de una distribución a la diferencia entre el mayor y el menor valor que toma la variable estadística. Observaciones Cuanto menor es el recorrido mayor es el grado de representatividad de los valores centrales. Presenta el inconveniente que sólo depende de los valores extremos y basta que uno de ellos se separe mucho, para que el recorrido se vea sensiblemente afectado. Para paliar en alguna medida este inconveniente se utilizan en ocasiones otros dos rangos: * Rango intercuartílico: Q Q3 Q1 * Rango entre percentiles: P P90 P10 22 3º.- VARIANZA Se llama varianza de una variable a la media aritmética de los cuadrados de las desviaciones respecto a la media (Se llaman desviaciones respecto a la media a las diferencias entre cada valor de la variable y la media). Si la variable X toma los valores x1 , x2 , x3 ,.....xn . Entonces las desviaciones respecto a la media son ( x1 x), ( x2 x),........( xn x) . La Varianza se representa por S 2 y vale: n S 2 (x i 1 i x) 2 f i n f i 1 x 2 i fi 2 x . Demostrar que esta igualdad es cierta n f i i 1 i 4º.- DESVIACIÓN TÍPICA Se llama Desviación Típica de una variable X a la raíz cuadrada de la Varianza y se representa por S. S ( x x) f i 2 fi o también S = i x f f 2 i i x 2 i Observaciones sobre la varianza y la desviación típica La S es un término del que se pueden sacar conclusiones erróneas sobre la dispersión de la muestra. Por ejemplo, de dos muestras, la 1ª con x 30 y S = 4 y la segunda con x 60 y S = 6. ¿Cuál es la que aparece más dispersa?. Considerando sólo las desviaciones típicas diríamos que es la segunda. Sin 23 embargo reduciendo los datos a una misma escala, ocurre justamente lo contrario. Por ello se recurre al cociente S , llamado Cociente de variación de x Pearson. Que en los casos anteriores valdría 4/30 = 0´13 para el primer caso y 6/60 = 0´1 para el segundo por lo que los datos del primer caso están más dispersos que los del segundo. 5º DESVIACIÓN MEDIA Llamamos Desviación Media a la media aritmética de las desviaciones respecto a la media, así es que si los datos son simples entonces DesviaciónMedia Desviación Media (x i x) N ( x x) f f i y si los datos se presentan con frecuencias la i i Ejercicio 1º.- Calcula todas las medidas de centralización: Media, Moda, Mediana, Q1 , Q3 , P10 , P90 , MG y MA y de dispersión: Varianza, Desviación típica y rango con los datos de la siguiente tabla xi fi 1 2 2 2 3 4 4 5 5 8 6 9 7 3 8 4 9 3 24 Ejercicio 2º.- a)¿Qué le ocurriría a la desviación típica de una variable estadística si todos los valores de la variable los aumentamos en un mismo número “k”?.¿Y si los multiplicamos por un mismo número “p”? Demuéstralo. 25 RELACIÓN DE EJERCICIOS. TEMA 3 1º.- Un inversol ha adquirido 1000 acciones de una determinada sociedad en cinco sesiones diferentes de Bolsa. Los cambios de adquisición se registran en la tabla adjunta Cambios Nº de acciones 900 150 870 300 840 100 800 250 700 200 a) b) c) d) Halla el cambio medio Halla la mediana Halla la moda Halla la varianza y la desviación típica 2º.- Las puntuaciones obtenidas en un test de razonamiento por 20 alumnos son las siguientes: 16, 22, 21, 20, 23, 22, 17, 15, 13, 22, 17, 18, 20, 17, 22, 16, 23, 21, 22, 18 Hallar la media, los cuartiles, el rango y la varianza. 3º.- Durante el mes de julio, en una ciudad andaluza, se han registrado las siguientes temperaturas máximas: 32, 31, 28, 29, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33. a) Halla la moda, la media y los percentiles de orden 30 y 70. b) Halla el recorrido y la varianza 4º.- Se ha controlado el peso de 50 recién nacidos, obteniéndose los siguientes resultados: Peso en Kg. Nº de niños 2, 5 3 3 3, 5 3, 5 4 4 4, 5 6 Hallar los cuartiles, la desviación típica y el recorrido intercuartílico 23 12 9 5º.- Los jugadores de un equipo de baloncesto se clasifican por alturas, según la siguiente tabla 26 Altura Nº de jugadores 1, 70 1,80 1,80 1,90 1,90 2, 00 2, 00 2,10 3 Halla la media, la moda, la mediana y la desviación 4 típica. 5 3 6º.- Si los números 6, 7, 8, 9, 12 los multiplicamos por 2, se obtiene 12, 14, 16, 18, 24. ¿Qué se puede decir de las medias y las desviaciones típicas se ambas series estadísticas? ¿Y si en vez de multiplicarlos por 2 lo que hacemos es sumarles 6? 7º.- Un profesor ha realizado dos test a un grupo d 40 alumnos, obteniendo que la media y la desviación típica de los resultados del primer test son 6 y 1,5 respectivamente. La media y la desviación típica de los resultados del segundo test son 4 y 0,5. Un alumno obtuvo un 6 en el primer test y un 5 en el segundo. Comparativamente con el grupo, ¿en cual obtuvo mejor puntuación? 8º.- Las puntuaciones obtenidas por un grupo de alumnos de una guardería en un test de habilidad psicomotora han sido las siguientes: Puntuaciones Nº de Alumnos 5,10 3 [10,15) 6 [15, 20) 13 [20, 25) 7 [25,30) Halla gráfica y analíticamente la mediana, los cuartiles y los deciles de orden tres y siete 2 9º.- En un grupo de alumnos de 1º de la ESO se ha aplicado una escala de actitud sobre el cambio social, obteniéndose los siguientes resultados: 7, 12, 8, 12, 23, 9, 12, 34, 11, 13, 15. Calcula la media, la mediana y la desviación típica. 27 10º.- Se ha aplicado un test de agresividad a 40 alumnos, obteniéndose los siguientes resultados Puntuaciones Nº de alumnos [15 20) 2 [20 25) 8 [25 30) 13 [30 35) [35 40) 7 [40 45) 6 [45 50) 3 1 a) Halla la agresividad media por persona. b) ¿A partir de qué puntuación se encontrará el 25% con mayor agresividad de la clase? c) Calcula la desviación típica. 28 TEMA 4º.- DISTRIBUCIONES BIDIMENSIONALES A) CONCEPTOS GENERALES 1.-VARIABLES ESTADÍSTICAS BIDIMENSIONALES.- Hasta este momento hemos venido estudiando fenómenos en los que para cada observación se obtenía una medida y en consecuencia una única variable. A estas variables se les llaman unidimensionales. A las variables estadísticas en las que se hace la observación de un fenómeno respecto de dos modalidades se las llama Variables estadísticas bidimensionales. Ejemplos: 1º.- Ingresos y gastos de cada una de las familias de una empresa. 2º.- Extensión en Km 2 y número de habitantes de los distintos países de Europa. 3º.- Notas de Matemáticas e Historia de una determinada clase. Las variables estadísticas bidimensionales las representamos por (X, Y), donde X es una variable unidimensional que toma los valores x1 , x2 , x3 ,.....xn e Y es otra variable unidimensional que toma los valores y1 , y 2 , y3 ,...... y m por lo tanto la variable estadística bidimensional (X, Y) toma los valores ( x1 , y1 ), ( x1 , y 2 ),....( x1 , y m ), ( x2 , y1 ), ( x2 , y 2 ),.....( x2 , y m ),...............( xn , y1 ), ( xn , y 2 ),.....( xn , y m ) expresión que también se puede escribir: ( xi , y j ) con 1 i n y 1 j m . 2º.- TABLAS BIDIMENSIONALES Se pueden presentar mediante una tabla simple o una tabla de doble entrada. 29 f ij x1 y1 f 11 x1 y2 f 12 ... ... ... x1 ym f 1m x2 y1 f 21 x2 y2 f 22 ... ... ... x2 ym f 2m ... ... ... ... ... ... xn y1 f n1 xn y2 f n2 ... ... ... xn ym f nm SIMPLE yj TABLA xi Tabla de doble entrada X x1 x2 ……..….. xi …………. xn f11 f 21 ………... f i1 …………. f n1 TOTAL Y y1 n f i 1 y2 ……….. f i 2 …………. f 22 f12 n f n2 f i 1 . . . . . . . . . . yj ……….. f ij …………. f2 j f1 j . . . . . . . . . ym f1m ………. f im …………. f 2m n f i 1 m TOTAL j 1 m 1j f j 1 m 2j …….. f ij ………… j 1 30 ij . n f nm f i 1 f i2 . f nj . i1 n m f j 1 im nj m N f ij i 1 j 1 Ejemplo 1º.- Las calificaciones de 40 alumnos en Matemáticas y Lengua han sido las siguientes: (M, L) : (3,2), (3,2), (3,2), (3,2), (4,5), (4,5), (4,5), (4,5), (4,5), (4,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (5,5), (6,6), (6,6), (6,6), (6,6), (6,7), (6,7), (6,7), (6,7), (6,7), (7,6), (7,6), (7,6), (7,6), (7,7), (7,7), (8,9), (10,10), (10,10) Con estos datos, construye una tabla de doble entrada y otra simple. Consideremos como valores de la variable X las notas de Matemáticas y como variable Y las de Lengua Tabla de doble entrada X 3 4 5 6 7 Y 2 5 6 7 9 10 31 8 10 Tabla simple xi yi fi Así es que, según lo visto, se puede deducir que siempre es posible expresar una tabla de doble entrada como una tabla simple. Ejemplo 2º.- Consideremos la distribución dada por la siguiente tabla, donde X representa la edad e Y el grado de psicomotricidad de un grupo de 44 minusválidos mentales. X [ 5 – 7) [7 – 9) [9 – 11) [11 – 13) Y [25 – 30) 4 3 [30 – 35) 2 7 2 [35 – 40) 1 1 11 [40 – 45) 1 2 [45 – 50) 7 13 13 11 1 14 6 8 3 3 11 44 Expresa esta tabla de doble entrada como una tabla simple 32 8 Años X Psicomotricidad Y Nº de personas f i 33 3º.- DIAGRAMAS DE DISPERSIÓN Acabamos de ver que los valores de una variable estadística bidimensional son pares de números reales de la forma ( xi , y j ) . Si representamos estos pares en un sistema de coordenadas, se obtiene un conjunto de puntos sobre el plano. A este conjunto de puntos se llama Diagrama de Dispersión o nube de puntos. Ejemplo.- Representa los dos ejemplos anteriores en un sistema de coordenadas Ejercicio1º Y 34 X Ejercicio 2º Y X 35 B.- CÁLCULO DE PARÁMETROS ESTADÍSTICOS 4º.- MEDIAS, VARIANZAS Y COVARIANZA Consideremos una variable estadística bidimensional (X, Y) cuya distribución viene dada por la tabla simple siguiente: xi yi fi x1 y1 f1 x2 y2 f2 x3 y3 f3 . . . . . . . . . xn yn fn n f i 1 i Si consideramos las variables X e Y como variables unidimensionales, sus medias aritméticas, Varianzas y desviaciones típicas son las siguientes: n - Media aritmética de X x x i 1 n fi i f i 1 i n - Media aritmética de Y y y i 1 n i f i 1 fi i n - Varianza de X Sx 2 (x i 1 i x) 2 f i n f i 1 36 i x 2 i fi x n f i 1 i 2 n Sy 2 - Varianza de Y (y i 1 i y) 2 f i n f i 1 i y 2 i fi y n f i 1 2 i - Las desviaciones típicas de ambas variables sería la raíz cuadrada de las varianzas y las representaremos por S x y S y . Covarianza .- Se llama Covarianza de una variable bidimensional (X, Y) a la media aritmética de los productos de las desviaciones de cada una de las variables respecto a sus medias respectivas. La covarianza la vamos a representar por S xy y su valor es: n S xy ( xi x)( yi y) f i i 1 n f i 1 n x y i i f i i 1 i n i 1 fi x y . Demuestra que esta igualdad es cierta Ejercicio1º.- Calcula las medias, varianzas y covarianza en la siguiente tabla que se refiere a las notas de Matemáticas y Lengua de 40 alumnos. Notas Mat Notas Len xi yi Nº alud. fi 3 2 4 4 5 6 5 5 12 6 6 4 6 7 5 7 6 4 7 7 2 8 9 1 10 10 2 N= 40 37 Ejemplo 2º.- Consideremos la distribución dada por la siguiente tabla, donde X representa la edad e Y el grado de psicomotricidad de un grupo de 44 minusválidos mentales. Calcula las medias, varianzas y covarianza. [5 – 7) X [7 – 9) [9 – 11) [11 – 13) Y [25 – 30) 4 3 [30 – 35) 2 7 2 [35 – 40) 1 1 11 [40 – 45) 1 2 [45 – 50) 7 13 13 38 8 11 1 14 6 8 3 3 11 44 C) CORRELACIÓN 5º.- CONCEPTO GENERAL DE CORRELACIÓN Si nosotros dibujamos un diagrama de dispersión de una variable bidimensional (X, Y), este puede adoptar diversas formas: puede ajustarse en mayor o menor medida a una recta, a una curva o no ajustarse a nada. Llamaremos Correlación a la teoría que trata de estudiar la relación o dependencia que existe entre las dos variables que intervienen en la distribución bidimensional. Se dice que: a) La correlación es lineal o curvilínea según que la nube de puntos se condense entorno a una línea recta o a una curva. b) La correlación es: a. positiva o directa cuando a medida que crece una variable la otra también crece. b. negativa o inversa cuando a medida que crece una variable, decrece la otra. c. nula cuando no existe relación alguna entre ambas variables. En este caso, los puntos del diagrama están esparcidos al azar. En este caso, se dice que las variables están incorreladas. c) La correlación es de tipo funcional si existe una función tal que todos los valores de la distribución la satisfacen. Desde este momento, nos centraremos en el estudio de la correlación lineal. 6º.- COEFICIENTE DE CORRELACIÓN LINEAL Para medir de forma más objetiva la correlación lineal entre las variables, se utiliza el coeficiente de correlación lineal de Pearson que se define por la expresión 39 r S xy S x .S y . Siendo: S xy Covarianza de (X, Y) S x Desviación típica de X. S y Desviación típica de Y. Hagamos algunas observaciones al coeficiente que acabamos de definir: 1ª) El signo de r depende de la covarianza, ya que las desviaciones típicas son siempre positivas, luego r puede ser mayor que cero, menor que cero o igual a cero: Si r 0 La correlación es directa Si r 0 La correlación es inversa Si r 0 No existe correlación 2ª) El coeficiente de correlación verifica 1 r 1 , así es que el grado de dependencia entre las dos variables depende del valor que toma r: Si r 1 Todos los valores de la variable bidimensional (X, Y) se encuentran sobre una recta y se dice que existe una dependencia funcional. Si 1 r 0 La correlación es negativa y será más fuerte cuanto más se aproxime a -1 y más débil si se aproxima a cero. Existe una dependencia aleatoria Si r 0 No existe ningún tipo de relación entre las dos variables. En este caso se dicen que las variables son aleatoriamente independientes. Si 0 r 1 La correlación es positiva y será más fuerte cuanto más se aproxime a 1 y más débil si lo hace a cero. Existe una dependencia aleatoria. Si r 1 Todos los valores de la variable bidimensional (X, Y) se encuentran sobre una recta y se dice que existe una dependencia funcional. Una idea de las distintas situaciones se puede obtener a partir de los siguientes diagramas: 40 Y Y . Y . .. . .... . . . . …. . . . . . . …… …. . . .. .. … …. . . .. . . .. ..… . r 1 1 r 0 X Dependencia funcional X r=0 Dependencia aleatoria Y X Independencia Y . . .. . .... …. . . . …. . . …. . . ..… . r=1 X Dependencia funcional 0 r 1 X Dependencia aleatoria Ejemplo 1º.- La temperatura media y la latitud de las capitales de algunos países europeos es la siguiente Capitales Temperatura Latitud (º) Capitales Temperatura Latitud (º) Ámsterdam 13 54 Dublín 13 53 Atenas 24 37 Lisboa 19 39 Bonn 13 52 Londres 14 53 Bruselas 14 52 Luxemburgo 14 50 Copenhague 11 54 Madrid 4 41 19 a) Estudiar si existe algún tipo de correlación entre ellas. b) Analiza de qué tipo es Ejemplo 2º.- Las calificaciones de 40 alumnos en Matemáticas y Lengua han sido las siguientes Notas Mat Notas Len Nº alud. xi yi fi 3 2 4 4 5 6 5 5 12 6 6 4 6 7 5 7 6 4 7 7 2 8 9 1 10 10 2 N= 40 a) Estudiar si existe algún tipo de correlación entre ambas variables. b) Analizar el tipo de dependencia que hay entre ellas. 42 Ejemplo 3º.- Se han clasificado 40 familias con arreglo al número de hijos e hijas obteniéndose la siguiente tabla X 0 1 2 3 4 4 3 1 5 6 Y 0 2 1 3 2 3 9 3 6 1 6 1 4 4 2 2 5 1 1 1 a) Estudiar si existe algún tipo de correlación o dependencia entre ambas variables. b) Analizar el tipo de dependencia. 43 D) REGRESIÓN 7º.- CONCEPTO GENERAL DE REGRESIÓN Consideremos una variable estadística bidimensional (X, Y) para la que se ha comprobado la existencia de una correlación fuerte entre las variables X e Y. En este caso el análisis de la regresión permite obtener la ecuación de la función matemática que mejor se ajusta al diagrama de dispersión, es decir, aquella línea que haga que las sumas de las distancias de los puntos de la nube respecto de los correspondientes de la línea sean lo menor posible. A la hora de realizar el ajuste de una línea de regresión a una nube de puntos existe la posibilidad de aproximar ésta mediante una recta, parábola, cúbica, exponencial, etc. En lo sucesivo nos limitaremos al estudio de la regresión lineal, al igual que hicimos en la correlación. Y X 44 8.- ESTUDIO ANALÍTICO DE LA REGRESIÓN LINEAL Supongamos que una vez estudiada la correlación lineal entre las dos variables, se observa que están fuertemente correladas, pues se trata de encontrar la recta que más se ajuste a la nube de puntos. Consideremos X como variable independiente e Y como variable dependiente de X, entonces la recta de regresión de Y sobre X (que se escribe Y/X) tiene de ecuación yy S xy S x2 ( x x) A partir de esta ecuación podemos calcular con cierta aproximación los valores de “y” conociendo los de “x”, sin más que sustituir estos últimos en la ecuación. Análogamente se puede obtener la recta de regresión de X sobre Y (X/Y). En este caso la variable independiente es la Y y la dependiente X, siendo la ecuación de la recta de regresión de X sobre Y xx S xy S y2 ( y y) A partir de esta recta podemos calcular con cierta aproximación los valores de la x conocidos los de y. La fiabilidad será mayor cuanto más próximo este “r” de -1 o de 1. Si r es muy pequeño no tiene sentido hacer ningún tipo de estimación. Eejmplo1º.- Si nos referimos a la tabla del ejemplo 1º de la pregunta 6ª). Calcular la recta de regresión de X/Y y calcula la temperatura media esperada para una ciudad que se encuentra situada a 47º de latitud norte. 45 Ejemplo 2º.-Calcula la recta de regresión de Y/X en el ejemplo 2º de la pregunta 6ª). ¿Cuál será la nota esperada en Lengua sabiendo que en Matemáticas ha obtenido un 4´5? 46 RELACIÓN DE EJERCICIOS. TEMA 4º En los siguientes ejemplos de variables bidimensionales calcula: a) Las medias y varianzas de X e Y b) La covarianza de (X, Y) c) Coeficiente correlación lineal. Interprétalo. d) Tipo de dependencia que existe entre ambas variables e) Si las variables están fuertemente correladas, calcula las ecuaciones de las rectas de regresión f) Realizar las estimaciones que se indiquen en cada caso 1º) xi 2 3 4 5 6 yi 4 2 5 4 6 2º) Los gastos de publicidad de una empresa y sus correspondientes ventas, en miles de euros, son las registradas en la siguiente tabla Publicidad 1 Ventas 2 3 4 5 6 7 8 15 16 14 17 20 18 18 19 3º.- El número de bacterias por unidad de volumen, presentes en un cultivo después de un cierto número de horas, viene expresado en la siguiente tabla Nº de horas 0 1 2 3 4 5 Nº de bacterias por 12 19 23 34 56 62 unidad de volumen ¿Qué nº de bacterias cabe esperar que habrá, transcurridas 6 h 30 minutos? 4º.- Las tasa brutas de natalidad y mortalidad por cada mil habitantes, durante el año 2005, de algunos países europeos son las siguientes: 47 Países Tasa de natalidad Tasa de mortalidad Alemania 14 13 Checoslovaquia 15 12 Dinamarca 11 10 España 13 7 Francia 14 10 Grecia 14 9 Holanda 12 8 Irlanda 20 9 Italia 11 10 Noruega 12 10 Portugal 15 9 Reino Unido 13 12 5º.- La tabla siguiente registra la altura y el peso de 60 hombres adultos Talla (en m) [1,55 – 1,65) [1,65 – 1,75) [55 – 65) 3 2 [65 – 75) 6 10 4 [75 – 85) 4 11 5 [85 – 95) 1 6 8 Peso (en Kg) [1,75 – 1,85) 6º.- Las puntuaciones obtenidas por un grupo en una batería de test, mediante los que se mide la habilidad verbal y el razonamiento abstracto son las siguientes: Habil. verbal [10 – 20) [20 - 30) [30 - 40) [40 – 50) [15 - 25) 5 3 - - [25 – 35) 2 6 1 - [35 – 45) - 1 4 2 [45 – 55) - - 3 3 [55 – 65) - - 1 2 Razonamiento abstracto) 48 ¿Qué puntuación en razonamiento abstracto es previsible que obtenga un alumno que obtuvo 45 en habilidad verbal? 7º.- El departamento de personal de una empresa encargó un estudio para conocer la posible relación existente entre la edad y el absentismo de los trabajadores. Los datos obtenidos son los de la siguiente tabla Absentismo [0 – 5) [5 - 10) [10 - 15) [15 – 20) [15 - 25) - 3 7 1 [25 – 35) - 6 2 - [35 – 45) 1 3 2 - [45 – 55) 2 5 1 - [55 – 65) 3 2 - 1 (en días) Edad 49 TEMA 5º.- COMBINATORIA. BINOMIO DE NEWTON 1º- INTRODUCCIÓN La combinatoria se ocupa del estudio y propiedades de los distintos grupos que pueden formarse con los elementos de un determinado conjunto, diferenciándose entre si: - Por el número de elementos que entran en cada grupo. - Por la clase de elementos. - Por el orden de colocación. Se estudian tres clases diferentes de agrupaciones: Las Variaciones Ordinarias y las Variaciones con repetición. Las Permutaciones Ordinarias y las Permutaciones con repetición. Las Combinaciones Ordinarias y las combinaciones con repetición. 2º.- VARIACIONES ORDINARIAS Llamaremos variaciones ordinarias o sin repetición, de m elementos tomados de n en n, a los diferentes grupos que se pueden formar, con los m elementos de manera que: - En cada grupo entren n elementos diferentes. - Dos grupos son diferentes si se diferencian en el orden de colocación o en algún elemento nuevo. (m n) Ejemplo1º.- Forma todos los números de dos cifras diferentes que se pueden formar con los dígitos (1,2,3,4) 12,13,14,21,23,24,31,32,34,41,42,43. Ejemplo 2º.- Forma ahora los de tres cifras 50 123.124.132.134.142.143.213.214.232.234.241.243.312.314.321.324.341.342.412.413. 421.423.431.432 El número de variaciones ordinarias de m elementos tomados n a n lo escribiremos V nm y su valor será: Vmn m(m 1)( m 2).........(m n 1) Ejemplos: 1º.- Calcula V72 ;V64 ;V103 . 2º.- Resuelve la ecuación Vm4 12Vm2 . 3º.- ¿De cuántas formas posibles se pueden sentar 12 personas en un banco que tiene 3 plazas?. 4º.- ¿Cuántas palabras de tres letras diferentes, con significado o sin él, se pueden formar con las letras del abecedario español? 3º.- VARIACIONES CON REPETICIÓN. Variaciones con repetición de m elementos tomados n a n son los distintos grupos que se pueden formar con los m elementos, de manera que: - En cada grupo entren n elementos repetidos o no. - Dos grupos son diferentes si se diferencian en el orden de colocación o en algún elemento nuevo. El número de variaciones con repetición de m elementos tomados n a n se representa por VRmn o también VRm , n y su valor es: VRmn m n Ejemplos 51 1º.- Escribe todos los números de dos cifras que se puedan formar con los dígitos (1, 2, 3, 4 ). 11,12,13,14,21,22,23,24,31,32,33,34,41,42,43,44. 2º.- Calcula VR32 ;VR23 ;VR25 . 3º.- Resuelve la ecuación VRx2 5VRx2 2 244 4º.- Se lanzan tres dados de diferentes colores una vez. ¿Cuántos resultados distintos se pueden obtener?. 4º.- PERMUTACIONES ORDINARIAS. Permutaciones ordinarias o sin repetición de n elementos son los distintos grupos que se pueden formar con los n elementos de manera que: - En cada grupo entren los n elementos. - Un grupo se diferencie de otro en el orden de colocación. Cuando en las variaciones m = n, entonces se les llama permutaciones de n y se representa por Pn y su valor es: Pn n(n 1)( n 2)...........2.1 Ejemplos 1º.- Escribe todos los números de tres cifras que podemos formar con los dígitos (2, 4, 6 ) 246, 264, 426, 462, 624, 642. 2º.- ¿De cuántas formas podemos ordenar los 10 alumnos de una clase? 3º.- ¿De cuántas formar se pueden sentar 5 personas en una mesa circular? 52 5º.- FACTORIAL DE UN NÚMERO Sea “n” un número natural mayor que 1. Se llama factorial de “n” y lo escribiremos n!, al producto de los n primeros números naturales. n! n(n 1)( n 2)...........3.2.1. Si n 1 1! 1 n 0 0! 1 Por convenio Como podemos observar, Pn n! y Vmn m! . (m n)! Ejemplos 1º.- Calcula 4!, 6!, 5!. 2º.- Simplifica las siguientes expresiones: (n 1)! ( x 6)! ; (n 1)! ( x 4)! 6. PERMUTACIONES CON REPETICIÓN Permutaciones con repetición de n elementos donde el primero se repite a1 veces , el segundo a2 veces , ………..el k-ésimo a k veces , donde (a1 a2 .......... ak n) , son los distintos grupos que se pueden formar, de manera que: - En cada grupo entren todos los elementos. - Un grupo se diferencie de otro sólo en el orden de colocación. Estas permutaciones se representan y su valor es el siguiente Pna1 ,a2 ,...... ak n! a1!a 2 !.........a k ! 53 Ejemplos 1º.- Calcula todos los números de 5 cifras que se pueden formar con los dígitos 1 y 2, sabiendo que el 1 entra tres veces y el 2 dos veces. 2º.- ¿De cuántas formas se pueden alinear 8 signos + y 6 signos -,?. 3º.- ¿Cuántas palabras diferentes se pueden formar con las letras de la palabra CASCADA?. 7.- COMBINACIONES Combinaciones ordinarias o sin repetición de m elementos tomados n a n (n m) son los distintos grupos que se pueden formar con los m elementos, de manera que: - En cada grupo entren n elementos distintos. - Dos grupos son diferentes si se diferencian en algún elemento. El número de combinaciones de m elementos tomados n a n lo escribiremos C m , n ó C mn y su valor es: C mn Vmn Pn Ejemplos 1º.- Calcula y escribe todas las combinaciones de tres elementos que podemos formar con las letras {a, b, c, d, e}. V53 5.4.3 C 10 P3 3.2.1 3 5 abc, abd, abe, acd, ace, ade, bcd, bce, bde, cde. 2º.- ¿Cuántos triángulos distintos se pueden formar con 8 puntos en el plano si tres de ellos nunca están alineados?. 54 C83 V83 8.7.6 56 P3 3.2.1 8.- NÚMEROS COMBINATORIOS. PROPIEDADES 8.1.- Números Combinatorios.- El número C mn se llama también número combinatorio y se representa por y se lee m sobre n siendo su valor m n n!(mm! n)! m n Con estos números combinatorios Podemos observar que este triángulo podemos formar el triángulo coincide con este otro 1 4 6 4 1 ................…….... …………….. 1 0 2 0 2 1 3 0 4 0 1 1 3 1 4 1 2 2 3 2 4 2 1 1 1 2 1 3 3 4 3 1 3 3 1 4 4 ………………….. …………….…….. .............. n 0 n 1 n 2 ………………………… n n Este triángulo es conocido con el nombre de triángulo de Pascal o triángulo de Tartaglias. 8.2.- Propiedades de los números combinatorios: 1º) 2º) 1 m 0 1 m m Todas las filas son simétricas 55 m n m mn 3º) m n 1 m n m 1 n Demuestra estas propiedades. 9º.- RESUMEN DE COMBINATORIA Para saber distinguir entre variaciones, permutaciones y combinaciones ante un determinado problema, debemos hacernos las siguientes preguntas Hay repetición NO Influye el orden Entran todos los Tipo de elementos combinatoria SI SI P NO V NO C SI SI SI PR NO VR NO CR 10.- BINOMIO DE NEWTON A los números combinatorios se les da gran utilidad para calcular a b a bn 0n a n b 0 1n a n1b1 n2 a n2b 2 ................... nn a 0b n a bn 0n a n b 0 1n a n1b1 n2 a n2b 2 ................... nn a 0b n Esta expresión es conocida con el nombre de Binomio de Newton 56 n Ejemplo.- Desarrolla las siguientes expresiones a) 3 2 x = 5 b) 1 x 4 Si quisiéramos calcular un término cualquiera “k” en el desarrollo de a b Tk a n k 1 n k 1 b k 1 Si quisiéramos calcularlo en el desarrollo de a b , tendríamos que n Tk 1 a k 1 n k 1 n k 1 k 1 b Ejemplo 1º.- Calcula el término quinto en el desarrollo x 2 20 Ejemplo 2º.- Calcula el término sexto en el desarrollo de x 2 6 57 n RELACIÓN DE EJERCICIOS. TEMA 5 1º.- Un estudiante tiene que contestar 8 de las 10 preguntas de un examen. ¿De cuántas formas diferentes puede contestar? ¿Y si las tres primeras son obligatorias? ¿Y si de las cinco primeras ha de contestar a cuatro? 2º.- Para jugar al dominó, 7 fichas hacen un juego. Sabiendo que tiene 28 fichas ¿Cuántos juegos diferentes se pueden hacer? 3º.- Hallar el nº mínimo de habitantes que debe tener una ciudad para que sea inevitable que al menos dos habitantes tengan las mismas iniciales de su nombre y dos apellidos. (Suponemos que el alfabeto tiene 28letras) 4º.- El séxtuplo del número de combinaciones que se pueden formar con “m” objetos tomados de tres en tres es igual al número de variaciones que se pueden formar con m-1 objetos tomados de cuatro en cuatro. Calcula “m”, sabiendo que es mayor que 4. 5º.- La diferencia entre el número de variaciones binarias de “m” objetos y el de combinaciones binarias de los mismos “m” objetos es 136. Calcula “m”. 6º.- En las variaciones sin repetición que podemos formar con las nueve cifras significativas tomadas de tres en tres, ¿cuántas veces está la cifra 7? 7º.- ¿Cuántas palabras de 12 letras se pueden formar con la palabra AYUNTAMIENTO de tal manera que siempre comiencen y terminen por vocal? 8º.- Con una baraja de 52 cartas, ¿cuántos grupos diferentes de cinco cartas se pueden formar? 9º.- ¿Cuántas apuestas hay que rellenar en las quinielas de fútbol para tener la seguridad de acertar cinco resultados? 10.- De un grupo de 12 alumnos deben formarse tres equipos de cuatro participantes para que asistan a tres pruebas diferentes. ¿De cuántas formas diferentes podemos formarlos? 11.- ¿Cuál de las siguientes expresiones tiene mayor valor? 12º.- ¿Cuántos tetraedros determinan ocho puntos del espacio de forma que cuatro cualesquiera de ellos no sean coplanarios? 13º.- ¿Cuántas palabras de 10 letras diferentes pueden formarse con cinco vocales y cinco consonantes dadas, de manera que no haya dos vocales ni dos consonantes juntas 58 14º.- En un departamento de una empresa trabajan 4 hombres y 3 mujeres. Desean que le hagan una fotografía de forma que estén todos los hombres juntos y las mujeres también. ¿De cuántas formas deferentes pueden colocarse? 15º.- Cuántos resultados distintos se obtienen al lanzar tres dados iguales al aire? ¿Y si los dados son diferentes? 16º.- Con los dígitos pares, ¿cuántos números inferiores a 1000 se pueden formar? 17º.- Calcula el número de diagonales que tiene un polígono de 12 lados.¿Y el de n lados? 18º.- Se disponen ocho monedas en una fila. La mitad de ellas son de euro y la otra mitad de 50 céntimos. ¿De cuántas formas distintas se pueden ordenar? 19º.- Calcula los siguientes desarrollos 1 a) 2x- x 6 b) senx cos x 4 20º.- Calcula el término que se indica en los siguientes desarrollos a) El término central de 2x x 2 2 b) El término 10 de a 2 a 20 30 21º.- ¿Existe algún término en el desarrollo x 2 2 x3 que contenga x115? En caso 40 afirmativo calcúlalo. 59 TEMA 6º.- SUCESOS ALEATORIOS. PROBABILIDAD A) SUCESOS ALEATORIOS 1º.- EXPERIMENTOS ALEATORIOS Llamaremos experimento aleatorio aquel que al repetirlo en análogas condiciones jamás se puede predecir el resultado que se va a obtener. Cuando se puede predecir el resultado al experimento se le denomina determinista. Son ejemplos de experimentos aleatorios: - Extraer una carta de una baraja española. - Lanzar una moneda y ver la cara que sale - Lanzar un dado. - Abrir un libro al azar y anotar el número de página, etc. Son experimentos deterministas: - Arrojar una piedra al vacío y medir su aceleración. - Medir la longitud de una circunferencia de radio 5 m. - Abrir las compuertas de un estanque lleno de agua. Etc. 2º.- ESPACIO MUESTRAL Llamaremos espacio muestral de un experimento aleatorio al conjunto de todos los resultados posibles del experimento. A cada elemento del espacio muestral lo llamaremos punto muestral o suceso simple. Al espacio muestral de un experimento lo designaremos por la letra E y cada uno de sus elementos los designaremos con letras o números. Ejemplo.- Calcula el espacio muestral en los siguientes experimentos a) Lanzar una moneda b) Lanzar dos monedas. c) Lanzar un dado. d) Lanzar dos dados. e) Lanzar un dado y una moneda. 60 3º.- SUCESOS ALEATORIOS Se llama suceso de un experimento aleatorio a cada uno de los subconjuntos del espacio muestral E. Al conjunto de todos los sucesos de un experimento aleatorio se denomina espacio de sucesos y se designa por P(E). Ejemplo.- Determina el espacio de sucesos en los siguientes casos a) Lanzar una moneda b) Lanzar un dado de quinielas. Como se puede observar existe una relación entre el número de elementos del espacio muestral y el número de elementos del espacio de sucesos. Si el número de elementos de E es igual a n, entonces el número de elementos de P(E) = Diremos que un suceso A se verifica, se realiza o se presenta, si al efectuar una prueba del experimento aleatorio obtenemos como resultado uno de los sucesos simples que componen el suceso A. 4º.- TIPOS DE SUCESOS A) Sucesos Elementales.- Son los formados por un solo punto muestral. B) Sucesos Compuestos.- Son los formados por dos o más puntos muestrales. C) Suceso Cierto o Seguro.- Es el que siempre se verifica, este suceso está formado por todo el espacio muestral. D) Suceso Imposible.- Es el que no se verifica nunca, se designa por . 5º.- SUCESOS CONTRARIOS Dado un suceso cualquiera A del espacio de sucesos P(E), llamaremos suceso contrario del suceso A a un suceso que se verifica cuando no se verifica A, y recíprocamente. 61 Al suceso contrario de A se representa por A . El suceso A está formado por los puntos muestrales de E que no están en A. Se verifica que: E y E Ejemplo.- Se el experimento aleatorio que consiste en el lanzamiento de un dado. Calcula los sucesos contrarios de los siguientes sucesos Sucesos Sucesos contrarios A 1,2,5 B 1,3 C 4 D 1,3,5,6 E 1,2,3,4,5,6 F 6º.- OPERACIONES CON SUCESOS 6.1.- Unión de sucesos.- Dados dos sucesos A y B de un mismo experimento aleatorio, llamaremos suceso unión de A y B al suceso que se verifica cuando lo hace A o B. El suceso A unión B se representa por A B , o también A ó B. El suceso A unión B está formado por los puntos muestrales de A o de B. 6.2.- Intersección de sucesos.- Dados dos sucesos A y B de un mismo experimento aleatorio, llamaremos suceso intersección de A y B al suceso que se verifica cuando se verifican simultáneamente A y B. El suceso A intersección B se representa por A B , o también A y B. El suceso A intersección B está formado por los puntos muestrales comunes a A y a B. Ejemplo 1º.- Consideremos el experimento aleatorio de lanzar un dado. Sean los sucesos: A= salir nº par A 2,4,6 B= Salir nº primo B 1,2,3,5 62 Calcula los sucesos: Salir nº par o nº primo = Salir nº par y nº primo = Ejemplo 2º.- Sea el experimento que consiste en la extracción de una carta de una baraja española. Consideremos los siguientes sucesos: A = salir oro; B = Salir as; C = Salir rey de copas o as de espadas. Interpreta los siguientes sucesos: A B; A C; B C; A B; A C; B C . En el ejemplo anterior hemos visto que en algunas ocasiones la intersección de dos sucesos es el suceso imposible. Cuando esto ocurre, es decir, cuando es imposible que dos sucesos se verifiquen simultáneamente, decimos que dichos sucesos son incompatibles Si A B A y B son incompatibles. Si A B A y B son compatibles. 7º.- ÁLGEBRA DE BOOLE DE SUCESOS Sea E el espacio muestral de un determinado experimento y sea P(E) el espacio de sucesos asociado. La unión e intersección de sucesos definidas anteriormente, verifican las siguientes propiedades: Unión Intersección 1.- Asociativa A B C A B C A B C A B C 2.- Conmutativa A B B A A B B A 3.- Idempotente A A A A A A 4.- Simplificativa A B A A ; 5.- Distributiva A B C A B A C A B A A A B C A B A C 6.- Todo suceso A del espacio de sucesos tiene otro que llamamos contrario de A, y representamos por A , que verifica: 7.- Leyes de Morgan: A A E A B A B y 63 y A A A B A B Por verificar las seis primera propiedades, se dice que el conjunto P(E) con las operaciones de e tiene estructura de Álgebra de Boole. 8º.- EXPERIMENTOS COMPUESTOS A los experimentos formados por varios experimentos simples se les llaman experimentos compuestos. Ejemplo.- Consideremos un experimento aleatorio que consiste en el lanzamiento de un dado y una moneda. El espacio muestral asociado al experimento compuesto de este ejemplo es: E (1, c), (2, c), (3, c), (4, c), (5, c), (6, c), (1, x), (2, x), (3, x), (4, x), (5, x), (6, x) A este espacio muestral se le llama espacio compuesto o espacio producto. 64 B) PROBABILIDAD 9º.- DEFINICIÓN Laplace definió la probabilidad de la siguiente forma: La probabilidad de un suceso A es el cociente entre el número de casos favorables al suceso y el número de casos posibles. Si indicamos la probabilidad del suceso A por P(A) entonces Nº de casos favorables P( A) Nº de casos posibles A la hora de aplicar esta definición hay que tener en cuenta que los sucesos elementales tienen que ser igualmente probables (Equiprobables). Los casos posibles son todos los resultados del experimento, es decir, todos los elementos del espacio muestral. Los casos favorables son los elementos que componen el suceso A. Ejemplo 1º.- Se considera el experimento de lanzar un dado. Calcula la probabilidad de obtener: a) Nº impar b) Nº primo c) Múltiplo de tres. d) Múltiplo de cinco. Ejemplo 2º.- Se lanzan dos monedas. Halla la probabilidad de: a) Obtener dos caras b) Obtener dos cruces. c) Obtener una cara y una cruz d) Obtener al menos una cruz. 10.- DEFINICIÓN AXIOMÁTICA DE LA PROBABILIDAD. Se llama probabilidad a una función 65 P : P( E) 0,1 que verifica: a) P( A) 0; A P( E ) b) P( E ) 1 . c) Si A y B son incompatibles. Entonces P( A B) P( A) P( B) De estos axiomas se deducen las siguientes consecuencias: 1ª) P( A) 1 P( A) . Demostración: 2ª) P( ) 0 . Demostración: 11º.- PROBABILIDAD DE LA UNIÓN DE SUCESOS Distinguiremos dos casos: a) Cuando los sucesos son incompatibles P( A B) P( A) P( B) . Esto puede ser ampliable a n-sucesos incompatibles dos a dos de la forma P( A1 A2 ........ An ) P( A1 ) P( A2 ) ........... P( An ) b) Cuando los sucesos son compatibles se verifica que P( A B) P( A) P( B) P( A B) . Si son tres sucesos A,B,C entonces P( A B C ) P( A) P( B) P(C ) P( A B) P( A C ) P( B C ) P( A B C ) Ejemplo 1º.- Una bolsa contiene bolas numeradas del uno al ocho. Se realiza un experimento que consiste en extraer una bola de la bolsa y anotar su número. Consideremos los siguientes sucesos: A = <salir par>; B = <salir impar>; C = <salir múltiplo de 4>. Calcular las siguientes probabilidades: P( A B) P( A C ) P( B C ) Ejemplo 2º.- Se realiza un experimento que consiste en la extracción de una carta de una baraja española. Consideremos los sucesos A = < obtener un oro >; B = < obtener un rey >; C = < obtener el as de espadas >. Hallar la probabilidad de: A B; A C; B C 66 12.- PROBABILIDAD CONDICIONADA Se llama probabilidad condicionada del suceso B con respecto al suceso A, y la denotaremos P(B/A), al cociente siguiente: P( B / A) P( A B) si P( A) 0 . P( A) Análogamente se define la probabilidad condicionada de A respecto de B y se escribe P(A/B). P( A / B) P( B A) P( B) De estas dos igualdades se obtiene que P ( A B ) P ( B / A).P ( A) P ( A B ) P ( A / B ).P ( B ) Ejemplo 1º.- Se extraen, sucesivamente, dos cartas de una baraja española. ¿Cuál es la probabilidad de obtener dos reyes? Ejemplo 2º.- De una urna que contiene 9 bolas rojas y 5 negras se extraen sucesivamente dos bolas. Halla la probabilidad de los siguientes sucesos: a) Que las dos bolas sean negras b) Que las dos bolas sean rojas c) Que la primera sea roja y la segunda negra. d) Que una sea roja y la otra negra. Cuando ocurre que la P(B/A)=P(B). Entonces los sucesos A y B son independientes. En este caso se verifica que P( A B ) P ( A).P ( B / A) P ( A).P ( B ) P( A B ) P ( A).P ( B ) En el caso contrario los sucesos se dicen que son dependientes. 67 13.- TEOREMA DE LA PROBABILIDAD COMPUESTA Sean A1 , A2 ,........ An sucesos cualesquiera de un mismo experimento aleatorio. Entonces se verifica: a) Si A1 , A2 ,........ An son independientes. Entonces P( A1 A2 ........ An ) P( A1 ).P( A2 )......P( An ) b) Si A1 , A2 ,........ An son dependientes. Entonces P( A1 A2 ........ An ) P( A1 ).P( A2 / A1 ).P( A3 / A1 A2 ).....P( An / A1 A2 .... An1 ) 14.- TEOREMA DE LA PROBABILIDAD TOTAL Sean A1 , A2 ,........ An un conjunto de sucesos incompatibles dos a dos, es decir Ai Aj ; i j y A1 A2 ...... An E . Sea B un suceso cualquiera, entonces se verifica: n P( B) P( A1 ).P( B / A1 ) P( A2 ).P( B / A2 ) ... P( An ).P( B / An ) P( Ai ) P( B / Ai ) i 1 Ejemplo 1º.- Una empresa de productos lácteos elabora sus productos en 4 factorías A, B, C y D. Las cuotas de producción de cada factoría y el porcentaje de productos con envasado incorrecto son los siguientes. A B C D Cuotas de producción 0´4 0´3 0´2 0´1 Envasado incorrecto 0´01 0´02 0´07 0´04 Si se toma un producto de esta marca al azar. ¿Cuál es la probabilidad de que esté defectuosamente envasado?. 68 Ejemplo 2º.- Un encuestador visita una finca que tiene tres patios a una determinada hora del día. En el primer patio hay 10 pisos, de los que 4 están vacíos a esa hora. En el segundo patio hay 14 pisos, estando 5 vacíos. En el tercer patio hay 10 pisos, 5 de ellos vacíos. El encuestador elige un patio al azar y, dentro de ese patio, un piso también al azar. Si sólo aceptan ser encuestados el 70% de las personas a las que se les pide. ¿Cuál es la probabilidad de que el encuestador consiga una entrevista con sólo llamar a una puerta? 15.- FÓRMULA DE BAYES Sean A1 , A2 ,........ An un conjunto de sucesos incompatibles dos a dos y A1 A2 ...... An E . Sea B un suceso cualquiera. Entonces se verifica: P( Ai / B) P( Ai B) P( B) P( B / Ai ) y P( B Ai ) P( Ai ) De ambas igualdades tenemos que: P( Ai / B).P( B) P( B / Ai ).P( Ai ) P( Ai / B) P( B / Ai ).P( Ai ) P( B / Ai ).P( Ai ) n . P( B) P( Ai ) P( B / Ai ) i 1 P( Ai / B) P( B / Ai ).P ( Ai ) n P( A ) P( B / A ) i 1 i i 69 TEOREMA DE BAYES Si observamos el numerador es uno de los sumandos del denominador. Ejemplo.- Supongamos el ejemplo de la empresa láctea. Supongamos que hemos tomado un producto al azar y ha salido defectuoso. ¿Qué probabilidad hay que proceda de la factoría A? ¿De qué factoría es más probable que proceda? Ejercicios: 1º.- Lanzamos una moneda y si sale cara cogemos una bola de una urna que contiene 5 bolas negras y 8 blancas y si sale cruz la cogemos de otra urna que contiene 4 negras y 10 blancas. Calcular la probabilidad de que si hemos elegido una bola al azar y nos ha salido blanca, esta sea de la primea urna. 2º.- Se lanzan dos monedas al aire. Si salen dos caras se extrae una bola de una urna 1, que contiene 2 bolas blancas y 3 negras. Si sale cara y cruz, se extrae la bola de una urna 2, que contiene 4 blancas y 1 negra. Si salen dos cruces, se extrae de una urna 3, que contiene 1 blanca y 5 negras. a) ¿Cuál es la probabilidad de obtener bola blanca? b) Si hemos obtenido bola negra, ¿cuál es la probabilidad de que haya sido extraída de la urna 2? 70 3º.- En un estudio realizado sobre accidentes de automóviles se sabe que las probabilidades de tener un accidente debido a fallos mecánicos ( A1 ) es 0´1, a fallos humanos ( A2 ) 0´5, y a defectos de la carretera ( A3 ) 0´4. a) Sea B = << U conductor determinado tenga un accidente >>. Calcula la probabilidad de B sabiendo que la P( B / A1 ) 0´25; P( B / A2 ) 0´35; P( B / A3 ) 0´05 . b) Sabiendo que el conductor tuvo un accidente, halla la probabilidad de que haya sido por fallo humano. 4º.- Una empresa tiene dos factorías. En la factoría uno produce el 65% de sus productos, siendo del 0´5% la probabilidad de que sean defectuosos y del 1´5% de que sean defectuosos en la factoría dos. Se observa un artículo en el mercado y resulta defectuoso. ¿Cuál es la probabilidad de que provenga de la factoría uno? ¿Y de la dos?. 71 RELACIÓN DE EJERCICIOS. TEMA 6 1º.- ¿Cuál es la probabilidad de que al lanzar dos dados salga por suma, o bien tres, o bien cuatro, o bien cinco? 2º.- Se lanzan al aire tres monedas. Determina la probabilidad de obtener al menos dos cruces 3º.- Una urna contiene ocho bolas rojas, cinco amarillas y siete verdes. Se extrae una al azar. Determinar la probabilidad de que: a) Sea roja o verde b) No sea roja 4º.- Se lanzan simultáneamente dos dados con las caras numeradas del 1 al 6. Hallar la probabilidad de que la suma de los puntos obtenidos sea menor que siete 5º.- Se ha trucado una moneda de tal forma que la probabilidad de obtener cara es triple que la probabilidad de obtener cruz. ¿Cuál es la probabilidad de cada suceso elemental? 6º.- Un dado está trucado de modo que la probabilidad de obtener las distintas caras es directamente proporcional a los números de éstas. Se pide: a) La probabilidad de cada una de las caras b) La probabilidad de sacar un número par 7º.- Halla la probabilidad de un suceso, sabiendo que la suma de su cuadrado y la del cuadrado de la probabilidad del suceso contrario es igual a 5/9. 8º.- A un congreso de científicos asisten 100 congresistas, de ellos 80 hablan francés y 40 inglés. ¿Cuál es la probabilidad de que dos congresistas elegidos al azar no puedan entenderse sin intérprete? 9º.- Se ha comprobado que en una ciudad está, enfermos con diarrea el 60% de los niños, con sarampión el 50% y el 20% con ambas enfermedades. a) Calcular la probabilidad de que elegido un niño al azar, esté enfermo con diarrea o sarampión o ambas enfermedades. b) En un colegio con 450 niños, ¿cuántos cabe esperar que estén enfermos con diarrea o sarampión? 10º.- Se lanzan tres dados al aire. Calcular la probabilidad de que se obtenga: a) Un cuatro en cada uno b) Suma total de puntos igual a ocho. 72 11º.- Sean A, B y C tres sucesos independientes tales que p(A)=0´2, p(B)=0´8 y p(C)=0´7. Hallar la probabilidad de los sucesos siguientes: A B , A C y A B C . 12º.- Un producto está formado por tres partes: A, B y C. El proceso de fabricación es tal que la probabilidad de un defecto en A es 0´03; de un defecto en B es 0´04 y de un defecto en C es 0´08. ¿Cuál es la probabilidad de que el producto no sea defectuoso? 13º.- La probabilidad de que una bomba haga blanco en el objetivo es 1/3. Hallar la probabilidad de alcanzar el objetivo si se tiran tres bombas seguidas. 14º.- A un paciente se le aplican tres sueros independientes con probabilidades de éxito 0´9, 0´95 y 0´92. Hallar la probabilidad de que el paciente se cure. 15º.- Se tiene un dado con tres caras y tres caras rojas y otro con dos caras blancas y cuatro rojas. Se realiza el experimente consistente en lanzar ambos dados y observar los colores obtenidos. Se pide: a) Escribir el espacio muestral b) Hallar la probabilidad de los siguientes sucesos A= ”Obtener dos caras rojas” B= ”Que al menos una cara sea roja” C= “Obtener dos caras del mismo color” 16º.- Una urna contiene tres bolas rojas, dos blancas y una azul y otra urna contiene dos rojas, dos blancas y una amarilla. Se saca, al azar, una bola de cada urna y se anota el color. Se pide: a) Espacio muestral b) Escribir los sucesos: A= “Las dos bolas son rojas”; B= “Las dos bolas son del mismo color”. c) Calcular p(A); p(B); p(A y B); p(A ó B) 17º.- Se lanzan simultáneamente un dado y una moneda. Se pide: a) Espacio muestral b) Calcular p(A) y p(B) siendo A= “El número del dado es mayor que 3 y en la moneda cara” y B= “En la moneda sale cruz” 18º.- Una urna contiene tres bolas rojas y dos verdes y otra contiene dos rojas y tres verdes. Se toma al azar una bola de cada urna: a) Escribir el espacio muestral 73 b) Calcular la probabilidad de los sucesos: A= “Ambas bola sean del mismo color” B= “Ambas bolas sean de distinto color” 19º.- Se lanza una moneda y si sale cara se saca una bola de una urna que contiene 3 bolas rojas y 2 negras y si sale cruz sacamos la bola de otra urna que contiene 5 rojas y 6 negras. Calcular la probabilidad de: a) Obtener bola roja b) Obtener bola negra c) Sabiendo que la bola obtenida ha sido roja cual es la probabilidad de que sea de la primera urna. 20º.- Con los jugadores de un club de fútbol se forman dos equipos para jugar un partido de entrenamiento; entre los dos equipos se reúnen 6 defensas, 8 medios, 6 delanteros y 2 porteros. El entrenador sabe que en estos partidos, la probabilidad de que se lesione un jugador es 0.22 si es delantero, 0.11 si es medio, 0.055 si es defensa y 0 si es portero. a) Calcula la probabilidad de que se lesionen uno cualquiera de los jugadores en este partido b) Si se sabe que un jugador se ha lesionado, determinar la probabilidad de que haya sido un defensa. 21º.- Tras un estudio estadístico en una ciudad se observa que el 70% de los motoristas son varones y, de estos, el 60% llevan habitualmente el casco. El porcentaje de mujeres que conducen habitualmente con casco es del 40%. Se pide: a) Calcular la probabilidad de que un motorista elegido al azar lleve casco. b) Se elige un motorista al azar y se observa que lleva casco. ¿Cuál es la probabilidad de que sea varón? 22º.- En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene. Se sabe además que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se abstienen, son mayores de 60 años. Se pide: a) Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 años. b) Hallar la probabilidad de que un ciudadano mayor de 60 años se haya abstenido. 23º.- Los alumnos de 2º de bachillerato tienen que realizar dos pruebas, una teórica y otra práctica. La probabilidad de que un estudiante apruebe la parte teórica es de 0.6, la probabilidad de que apruebe la parte práctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5. a) ¿Son independientes los sucesos aprobar la parte teórica y la parte práctica? b) ¿Cuál es la probabilidad de que un alumno no apruebe ninguno de los dos exámenes? c) ¿Cuál es la probabilidad de que un alumno apruebe solamente uno de los dos exámenes? d) Se sabe que un alumno aprobó la teoría. ¿Cuál es la probabilidad de que apruebe también la práctica? 74 24º.- En una baraja de 40 cartas. a) Se toman dos cartas sin reemplazamiento ¿Cuál es la probabilidad de que las dos sean de distinto número? b) Y si se toman tres cartas, ¿Cuál es la probabilidad de que los tres números sean distintos? 25º.- Tenemos un dado con tres “1”, dos “2“ y un “3”. Lo tiramos dos veces consecutivas y anotamos la suma de los resultados. a) ¿Cuál es el espacio muestral? b) ¿Cuál es la probabilidad de que la suma sea 4? c) ¿Cuál es la suma más probable? 26º.- Tenemos dos dados A y B, ambos trucados. En el dado A hay tres “1” y tres “2” y en el dado B hay dos “1” y cuatro “2”. Se elige un dado al azar y se tira. a) ¿Cuál es la probabilidad de obtener un “1”? b) Sabiendo que se ha obtenido un “2”, ¿Cuál es la probabilidad de que se haya elegido el dado B? 27º.- En una caja hay x bolas blancas y 1 una bola roja. Al extraer de la caja dos bolas al azar sin reemplazamiento, la probabilidad de que sean blancas es ½. Calcula el número de bolas blancas que debe tener la caja. 28º.- El 35% de los créditos de un banco es para vivienda, el 50% para industria y el 15% para consumo diverso. Resultan fallidos el 20% de los créditos para vivienda, el 15% de los créditos para industria y el 70% de los créditos para consumo. Calcula la probabilidad de que se pague un crédito elegido al azar. 29º.- El volumen de producción en tres plantas diferentes de una fábrica es de 500 unidades en la primera, 1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades defectuosas producidas en cada planta es del 1%, 0,8% y 2% respectivamente, calcula la probabilidad de que al seleccionar una unidad al azar sea defectuosa. 30º.- El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los economistas también, mientras que de los no ingenieros y no economistas solamente el 20% ocupan un puesto directivo. ¿Cuál es la probabilidad de que un empleado directivo elegido al azar sea ingeniero? 31º.- Se toman dos barajas españolas de 40 cartas. Se extrae al azar una carta de la primera baraja y se introduce en la segunda baraja. Se mezclan las cartas de esta segunda baraja y se extrae una carta, que resulta ser el dos de oros. ¿Cuál es la probabilidad de que la primera carta extraída sea una espada? 75 TEMA 7º.- DISTRIBUCIONES DISCRETAS Y CONTINUAS. 1º.- VARIABLES ALEATORIAS Se llama variable aleatoria a toda función que asocia a cada elemento del espacio muestral E un número real. X : E R tal que a cada elemento e i de E le corresponde un número real ei X (ei ) . Este valor X (ei ) lo anotaremos por xi y le llamaremos valor X ( ei ) . de la variable. Al conjunto de valores asignados, llamaremos recorrido de la variable. Ejemplo 1º.- Supongamos el lanzamiento de dos dados. La función que asocia a cada resultado la suma de los puntos obtenidos en cada dado es una variable aleatoria que toma los valores 2,3,4,5,6,7,8,9,10,11,12. Ejemplo 2º.- Consideremos el experimento que consiste en elegir al azar 100 judías de una plantación y medir su longitud. La función que asocia a cada judía su longitud es una variable aleatoria. Las variables aleatorias pueden ser de dos tipos: Discretas y continuas. Una variable aleatoria (v.a.) es discreta cuando sólo puede tomar unos ciertos valores enteros. El primer ejemplo corresponde a una variable aleatoria discreta. Una variable aleatoria (v.a.) es continua cuando puede tomar al menos teóricamente, todos los valores posibles dentro de un cierto intervalo de la recta real. El ejemplo 2º corresponde a una v.a. continua. 76 A) VARIABLES ALEATORIAS DISCRETAS 2º.- FUNCIÓN DE PROBABILIDAD Se llama función de probabilidad de una v.a. X a la aplicación que asocia a cada valor xi de la variable su probabilidad p i . Esta función la podemos expresar en la siguiente tabla X p i P ( X xi ) x1 x2 x3 ................xn p1 p2 p3 ............... pn n p i 1 i 1 La función de probabilidad de una v.a. discreta se representa gráficamente mediante un diagrama de barras, de manera que cada ordenada representa la probabilidad del correspondiente valor de la variable n En toda función de probabilidad se ha de verificar p i 1 i 1. Ejemplo.- Supongamos que hemos lanzado un dado perfecto. La función de probabilidad será X 1 2 pi 1/6 1/6 3 4 5 6 1/6 1/6 1/6 1/6 Y su representación gráfica sería: 1 2 3 4 77 5 6 3º.- FUNCIÓN DE DISTRIBUCIÓN Sea X una v.a. discreta cuyos valores suponemos ordenados de menor a mayor. Ll amaremos función de distribución de la variable X y la escribiremos F(x) a la función F ( x) P( X x) . A la hora de utilizar esta fórmula conviene tener en cuenta lo siguiente: a) X es el símbolo que representa a la v.a. b) x es un número real cualquiera. c) P( X x) se lee: probabilidad de que la variable X tome un valor menor o igual a x. Es decir, la función de distribución asocia a cada valor de la v.a. la probabilidad acumulada hasta ese valor. Formemos la tabla de la función de distribución del ejemplo anterior X x 1 1 x 2 2 x 3 3 x 4 4 x 5 5 x 6 6 x F ( x) P( X x) 0 1/6 2/6 3/6 4/6 5/6 La gráfica de esta función sería 0 1 2 3 4 5 Veamos algunas propiedades de la función de distribución: a) Como F(x) es una probabilidad 0 F ( x) 1 . b) F(x) es una función escalonada. c) F(x) es nula para todo x menor al primer valor de la variable. d) F(x) = 1 para todo x mayor al mayor valor de la variable. e) F(x) es creciente. 78 6 1 4º.- MEDIA, VARIANZA Y DESVIACIÓN TÍPICA DE UNA v.a. DISCRETA 4.1.- MEDIA.- Se llama media, valor esperado o esperanza matemática de una v.a. X, que toma los valores x1 , x2 , x3 ,........xn con probabilidades p1 , p 2 , p3 ,...... p n , respectivamente, y se anota “ “,al valor de la siguiente expresión: n x1 p1 x 2 p 2 x3 p3 ......... x n p n xi pi i 1 n xi pi i 1 4.2.- VARIANZA.- Se llama varianza de una variable aleatoria X, que toma los valores x1 , x2 , x3 ,........xn con probabilidades p1 , p 2 , p3 ,...... p n , respectivamente, y se anota por “ 2 ” al valor de una de las siguientes expresiones: n n 2 ( xi x) 2 p i 2 xi 2 p i 2 i 1 i 1 Ejercicio.- Pasa de una a otra expresión 4.3.- DESVIACIÓN TÍPICA.- Se llama desviación típica de una variable aleatoria X, que toma los valores x1 , x2 , x3 ,........xn con probabilidades p1 , p 2 , p3 ,...... p n , respectivamente, y se anota por “ ” a la raíz cuadrada de la varianza con lo que su expresión quedaría: n (x i 1 i x) 2 pi 79 n x i 1 2 i pi 2 Ejemplo.- Un miembro del consejo de administración de una empresa ha comprobado que, si bien todos los años tienen una junta, ha habido años que tienen hasta cinco. Por la experiencia acumulada durante 15 años, sabe que el número de juntas anuales se distribuye de la siguiente forma: Nº de juntas al año Probabilidad 1 2 3 4 5 2/15 5/15 1/15 3/15 4/15 Se pide hallar: a) Función de probabilidad y su representación gráfica. b) Función de distribución y su representación gráfica. c) Media. d) Varianza y desviación típica. e) La probabilidad de que en un año, elegido al azar, se celebren más de tres juntas. 80 B) VARIABLES ALEATORIAS CONTINUAS 5º.- FUNCIÓN DE DENSIDAD Sea X una v.a. continua. Diremos que una función f : I R es una función de densidad de la v.a. X si verifica las dos siguientes condiciones: 1º) f ( x) 0; x I 2º) El área encerrada bajo la curva de la función y = f(x) es igual a 1. Ejemplo.- Comprueba que la función definida por 0 f (x) 1 / 3 0 si x0 si 0 x3 si x3 es una verdadera función de densidad. 6º.- FUNCIÓN DE DISTRIBUCIÓN Es una función F, definida por F ( x) P( X x) que verifica: 1º) 0 F ( x) 1 2º) F ( x) 0; x anterior al primer valor de la v. a. 3º) F ( x) 1; x posterior al mayor valor de la v. a. 4º) F(x) es creciente. La función de distribución es la integral de la función de densidad, siendo la función de densidad la derivada de la función de distribución. Ejemplo.- Si calculamos la función de distribución del ejemplo anterior, esta sería 81 0 F ( x) x / 3 1 si x0 si 0 x3 si x3 siendo las gráficas de ambas funciones Y Y 1 1/3 0 3 X 0 Función de densidad 1 2 3 X Función de distribución 7º.- MEDIA Y VARIANZA DE UNA v. a. CONTINUA 7.1.- MEDIA .- Sea X una v.a. continua cuyo recorrido es el intervalo a, b y sea f(x) una función de densidad. Se llama media de la variable continua X al valor de la siguiente integral b La media también recibe el nombre de esperanza matemáticas a o valor esperado. xf ( x)dx 7.2.- VARIANZA.- Sea X una v.a. continua cuyo recorrido es el intervalo a, b y sea f(x) una función de densidad. Se llama varianza de la variable continua X al valor de la siguiente integral b 2 ( x ) 2 f ( x)dx a Se llama desviación típica a la raíz cuadrada de la varianza. Ejemplo1º.- Halla la media, varianza y desviación típica de una v. a. que tiene la siguiente función de densidad 82 0 f (x) 1 / 3 0 si x0 si 0 x3 si x3 Ejemplo 2º.- La función de densidad de una v. a. continua viene dada por 2 x f ( x) 0 si si x 0,1 x 0,1 . a) Hallar F(x). b) Representar f(x) y F(x). c) Hallar media, varianza y desviación típica. En el tema siguiente vamos a estudiar dos tipos concretos de distribución, uno discreto y otro continuo. Se trata de la distribución BINOMIAL y la distribución NORMAL. 83 RELACIÓN DE EJERCICIOS. TEMA 7 1º.- Poner tres ejemplos de variables aleatorias discretas y tres de continua 2º.- Consideremos el experimento que consiste en lanzar dos dados y anotar el resultado de la suma de sus caras. Hallar: a) La función de probabilidad y su representación b) La función de distribución y su representación c) Media y desviación típica de la distribución d) Sea X la (v. a.) anterior. Calcular: p( X 5); p( X 10); F (4); F (2); F (19) 3º.- Sea el experimente que consiste en el lanzamiento de tres monedas y anotar el número de caras obtenidas. Se pide: a) La función de probabilidad y su representación b) La función de distribución y su representación c) Media y desviación típica de la distribución d) Sea X la (v. a.) anterior. Calcular: p(1 X 3) 4º.- Hallar la media y la varianza de la (v. a.) X que tiene la siguiente función de probabilidad X 2 3 7 p 0´2 0´3 0´5 5º.- Sea X una v. a. discreta cuya función de probabilidad es: X 0 1 2 3 4 5 p 0´1 0´2 0´1 0´4 0´1 0´1 a) Calcula y representa gráficamente la función de distribución b) Calcula las siguientes probabilidades: p( X 4`5); p( X 3); p(3 X 4´5) 6º.- Dada la función de distribución de una v. a. continua X, definida por si x 0 0 F ( x) sen x si 0 x / 2 1 si /2 x Calcular la función de densidad 7º.- La variable aleatoria X tiene la siguiente función de distribución 0 F ( x) x 2 0 si x0 si 0 x 1 si 1 x 84 a) Calcular la función de densidad b) Representa la función de densidad y la de distribución c) Hallar la media y la varianza 8º.- Una v. a. continua tiene la siguiente función de densidad 0 x f ( x) a 8 0 si si si x 1 1 x 5 5 x a) Calcular a para que sea una verdadera función de densidad b) Hallar la media y la desviación típica c 9º.- Dada la función f ( x) 1 x 2 0 si 0 x 1 en el resto a) Hallar el valor de c para que f(x) sea una verdadera función de densidad b) Calcula la esperanza matemática de la variable X que tiene por función de densidad f(x). 85 TEMA 8º.- DISTRIBUCIÓN BINOMIAL Y DISTRIBUCIÓN NORMAL A) DISTRIBUCIÓN BINOMIAL 1º.- VARIABLE ALEATORIA DE LA DISTRIBUCIÓN BINOMIAL Supongamos que un experimento aleatorio tienen las siguientes características: a) En cada prueba del experimento sólo son posibles dos resultados: éxito o fracaso. b) El resultado obtenido en cada prueba es independiente de los resultados anteriores. c) La probabilidad de éxito es constante. Todo experimento que tenga estas características, diremos que sigue el modelo de la distribución Binomial. A la probabilidad de éxito se le suele llamar “p” y a la de fracaso q=1-p. A la variable X, que expresa el número de éxitos obtenidos en cada prueba del experimento, la llamaremos v. a. Binomial. Esta v. a. es discreta, ya que sólo toma los valores 0, 1, 2, 3, …….,n, suponiendo que se han realizado n-pruebas. Representaremos por B(n, p) a la variable de la distribución binomial, siendo n y p los parámetros de dicha distribución: n : El número de veces que se ha realizado el experimento. p: La probabilidad de éxito. 2º.- FUNCIÓN DE PROBABILIDAD Supongamos un experimento aleatorio cuyos resultados únicamente pueden ser el suceso A = << Éxito >> y A = << Fracaso >>, con probabilidades P( A ) = q = 1- p. 86 P(A) = p y Realicemos n – pruebas del experimento y deseamos saber la probabilidad de n obtener r – éxitos en las n – pruebas. P( Obtener r éxitos) = P( X r ) p r q n r . r n P( X r ) p r q n r r Ejemplo.- Una prueba de inteligencia está compuesta por 10 preguntas, cada una de las cuales tiene 4 respuestas siendo sólo una de ellas correcta. Un alumno contesta aleatoriamente a las 10 preguntas. Se pide: a) Probabilidad de acertar exactamente 4 preguntas. b) Probabilidad de no acertar ninguna. c) Probabilidad de acertarlas todas. d) Probabilidad de acertar al menos ocho. e) Probabilidad de acertar al menos tres. 87 3º.- MEDIA Y VARIANZA DE LA DISTRIBUCIÓN BINOMIAL. n 3.1.- MEDIA.- Como la función de probabilidad es P( X r ) p r q n r . r n n n n Entonces r p r q n r r p r q n r ( sacando factor común np) r 0 r r 1 r n n 1 r 1 n r n 1 (1) np p q np( p q) np. Luego r 1 r 1 (1) Hay que demostrar que np n n 1 r n r r 1 3.2.- VARIANZA.- La varianza y la desviación típica, se demuestra que vale: 2 npq npq Ejemplo.- Se ha pasado una prueba sobre fluidez verbal a un numeroso grupo de niños y se ha detectado que el 35% tiene una fluidez verbal prácticamente nula; el resto se puede considerar aceptable. De una muestra aleatoria formada por seis niños, hallar: a) Media y varianza. b) La función de probabilidad. c) La función de distribución. 88 B) DISTRIBUCIÓN NORMAL 4º.- VARIABLE ALEATORIA DE LA DISTRIBUCIÓN NORMAL Se dice que una v. a. continua X sigue una distribución normal de media " " y desviación típica " " , y se designa por N ( , ) , si se cumplen las siguientes condiciones: a) La variable recorre toda la recta real. b) La función de densidad, que es la expresión en términos de ecuación matemática de la curva de Gauss, es 1 x 2 1 f ( x) e 2 2 . Siendo: e = base de los logaritmos neperianos = 3´1415…. La media La desviación típica 5º.- FUNCIÓN DE DENSIDAD La función de densidad de una distribución normal de media " " y desviación típica " " es: 1 x 2 1 f ( x) e 2 2 . y su representación gráfica es: N ( , ) 89 x Esta función cumple las siguientes propiedades: a) Es simétrica respecto a la media. b) El máximo lo alcanza cuando x . c) El área del recinto bajo la campana y el eje X vale 1. d) Los puntos de inflexión los alcanza en x y x 6º.- MEDIA Y VARIANZA DE LA DISTRIBUCIÓN Por la propia definición de la distribución se tiene que estas son " " y " 2 " respectivamente. 7º.- DISTRIBUCIÓN NORMAL ESTÁNDAR La representación de la función de densidad varía según los valores de la media y la desviación típica. De las infinitas distribuciones N ( , ) , tiene especial interés la N(0,1). Esta distribución se llama ley normal estándar y su función de densidad es: f ( x) 1 2 ex 2 /2 La función de distribución de la ley N(0,1) proporciona el área del recinto que va a desde hasta el valor que nos pidan. P( X a) f ( x)dx pero esta integral es muy compleja y existe una tabla para calcularla. 8º.- TIPIFICACIÓN DE LA VARIABLE Como hemos dicho anteriormente, la distribución N (0,1) se encuentra tabulada, lo cual permite un cálculo rápido de las probabilidades asociadas a esta distribución. Luego lo que debemos de hacer es transformar la variable X que sigue una distribución N ( , ) en otra variable Z que siga una distribución N (0,1). Esta transformación se conoce con el nombre de tipificación de la variable. 90 Para llevar a cabo esta transformación hay que seguir los siguientes pasos: a) Trasladar la media de la distribución al origen de coordenadas. b) Reducir la desviación típica a 1. Estos dos pasos se consiguen simultáneamente efectuando el cambio de variable z x 9º.- MANEJO DE TABLAS a ) P ( z 1´45) b) P ( z 1´45) c) P (1´25 z 2´57) d ) P (2´57 z 1´25) e) P(0´53 z 2,46) 10º.- APROXIMACIÓN DE LA BINOMIAL POR LA NORMAL Como ya sabemos la media y la desviación típica de una B(n, p) son np y npq . De Moivre demostró que bajo determinadas condiciones, la distribución B(n, p) se puede aproximar mediante la distribución normal N (np, npq ) . Es decir: X ´ N (np, npq ) X B(n, p) . z x np npq N (0,1) Para aplicar esta aproximación, basta con que se verifique que np 5 y nq 5 Cuanto mayor sea n y p más próximo a 0´5 mejor será la aproximación. 91 Gracias a esta aproximación es fácil hallar probabilidades binomiales pues la probabilidad de la distribución binomial para valores grandes de n resulta muy complicada de calcular y, en consecuencia, prácticamente inutilizable. Como la distribución binomial es discreta, tiene sentido calcular probabilidades puntuales, por ejemplo P(X = 2). En cambio, la distribución normal es de variable aleatoria continua y, por tanto, no tiene sentido calcular probabilidades puntuales, pues son todas nulas. ¿Cómo debemos proceder para calcular la probabilidad en la distribución binomial cuando es aproximada por una normal?. Lo haremos del siguiente modo: P( X 2) P(1´5 X ´ 2´5) P( X 2) P( X ´ 2´5) P( X 2) P( X ´ 1´5) P( X 2) P( X ´ 2´5) Ejemplo.- Se sabe, por una estadística sociológica, que el nivel de aceptación de un determinado partido es del 25% de la población. De un muestreo aleatorio realizado sobre 40 personas, se desea saber cuál es la probabilidad de que 15 de ellas acepten a dicho partido 92 RELACIÓN DE EJERCICIOS. TEMA 8 1º.- Sea X una v. a. que sigue una distribución B(6, 0´4). Utilizando la tabla calcula las siguientes probabilidades: a) p(X=3); p(X=6); p(X=0); p(X<3); p(X>4); p(1<X<4). 2º.- Se sabe que la tercera parte de los niños varones de 3º de la ESO dan positivo en una prueba de agresividad. Escogida al azar una muestra de 10 chicos, hallar la probabilidad de los siguientes sucesos: a) Encontrar dos con agresividad positiva b) Más de tres c) A lo sumo, cinco. d) Hallar la media y la desviación típica de esta distribución 3º.- Se ha pasado una prueba sobre fluidez verbal a un numeroso grupo de niños y se ha detectado que el 35% tiene una fluidez verbal prácticamente nula; el resto se puede considerar aceptable. De una muestra aleatoria formada por siete niños, hallar: a) La media y la varianza b) La función de probabilidad c) La función de distribución 4º.- La probabilidad de que un estudiante obtenga el título de licenciado en Química es 0´3. Hallar la probabilidad de que en un grupo de siete estudiantes matriculados en 1º. a) Ninguno de los siete finalice la carrera b) La finalicen todos c) Al menos dos acaben la carrera d) Halla la media y la desviación típica del nº de alumnos que acaban la carrera. 5º.- El 75% de la población considera que los tratamientos de psicoterapia son caros. Elegida una muestral al azar formada por seis individuos, hallar: a) La probabilidad de que los seis lo consideren caros b) La probabilidad de que ninguno los considere caros. c) La probabilidad de que al menos dos los consideren caros. 6º.- La opinión que tiene la población sobre terapia de grupo es favorable en el 45% de los casos, y desfavorable el resto. Elegidos cinco individuos al azar, hallar: a) La probabilidad de que sólo dos la consideren favorable. b) La probabilidad de que más de dos la consideren favorable c) Sobre una población de 500 individuos, ¿cuántos la considerarán desfavorable? 93 7º.- Sea Z una v. a. N (0,1). Calcular: a) p( Z 1´32) b) p( Z 2`17) c) p(1´52 Z 2´03) d) p( 1´32) e) p( Z 2´17) f) p( 2´03 Z 1´52) 8º.- Las tallas de los individuos de una población se distribuyen normalmente con media igual a 175 cm. y desviación típica 8 cm. Calcular la probabilidad de que un individuo tenga una talla: a) Mayor que 150 cm. b) Menor que 170 cm. c) Entre 170 y 180 cm. 9º.- El Ministerio de Educación ha hecho una encuesta sobre la distribución de las edades del profesoradote Secundaria, y ha observado que se distribuyen normalmente con media 38 años y desviación típica 6. De un total de 500 profesores, hallar: a) ¿Cuántos profesores hay con edades menores o iguales a 35 años? b) ¿Cuántos mayores de 55 años? 10º.- En Geografía humana se ha determinado que las condiciones socioeconómicas del 35% de la población son inaceptables. Elegida una muestra de esta población formada por nueve individuos, hallar: a) La probabilidad de que sólo tres vivan en condiciones inaceptables. b) La media y varianza de esta población 11º.- Los resultados de una estadística sociológica sobre el nivel de aceptación de un determinado partido político ha revelado que el 25% de la población es favorable a dicho partido, siendo desfavorable el resto. En una encuesta realizada a diez individuos, elegidos al azar, se desea saber: a) La probabilidad de que sólo tres sean favorables al partido b) La probabilidad de que al menos uno sea favorable c) La probabilidad de que a lo sumo dos se muestren favorables. 12º.- La duración de las pilas de una linterna se distribuyen según una N (70, 2) horas. A un establecimiento le quedan del pedido anterior 20 pilas. a) ¿Cuántas tendrán una duración superior a 70 horas? b) ¿Cuántas tendrán una duración entre 75 y 82 horas? 13º.- En una distribución N (163, 12), ¿dónde se sitúan el P10 y el P90 ? 14º.- En una distribución N (0, 1) ¿entre qué valores está el 94% de los valores centrales? 15º.- Se lanza una moneda 100 veces. Hallar la probabilidad de: 94 a) Obtener a lo sumo 40 caras. b) Obtener más de 40 caras 16º.- Supongamos que la probabilidad de nacer varón en España es de 0´512. Si durante un año en Andalucía se han producido 2000 nacimientos, ¿cuál es la probabilidad de que el número de varones está comprendido entre 1000 y 1080? 17º.- En un centro escolar se ha observado que el 55% de los alumnos superan las pruebas de selectividad. Si este porcentaje es constante, y teniendo en cuenta que se han presentado a la prueba 100 alumnos, hallar la probabilidad de que la superen exactamente más de 50. 18º.- El porcentaje de fracaso escolar en ESO, en Andalucía es del 40%. Sobre un total de 1000 alumnos. a) ¿Cuál es la probabilidad de que se produzcan exactamente 400 fracasos? b) ¿Cuál es la probabilidad de que no se superen los 400 fracasos? 19º.- En una distribución N ( , ) a) ¿Qué % de la población se encuentra en el intervalo ( , ) ? b) ¿Qué % de la población se encuentra en el intervalo ( 2 , 2 ) ? c) ¿Qué % de la población se encuentra en el intervalo ( 3 , 3 ) ? 20º.- En una distribución N ( , ) a) ¿Entre qué valores se encuentra el 90% de los valores centrales? b) ¿Entre qué valores se encuentra el 95% de los valores centrales? c) ¿Entre qué valores se encuentra el 99% de los valores centrales? 95 TEMA 9.- INFERENCIA ESTADÍSTICA 1º.- INTRODUCCIÓN.- La finalidad de la estadística es obtener conclusiones sobre una población, sin necesidad de recurrir a la observación directa del total de la población. Se recurre al muestreo entre otras cosas porque es más rápido y económico que la consulta de la población total. La inferencia estadística obtiene conclusiones de los datos ya elaborados y mide su significación, es decir, la confianza que nos merece. Desde un punto de vista matemático, la inferencia estadística es una prolongación del estudio de la distribución normal, pues la mayoría de sus resultados se basan en esta distribución. ¿EN QUÉ CONSISTE LA ESTADÍSTICA INFERENCIAL? Vamos a analizar tres situaciones, parecidas pero muy diferentes: Problema 1º.- Las estaturas de los soldados de un regimiento tienen una media 175 cm. y 5 . ¿Cuál es la probabilidad de que la estatura media de los 32 soldados de una muestra esté comprendida entre 174´4 y 175´6. P(174´4 X 175´6) . Problema 2º.- La estatura media de 32 soldados de un regimiento es x 175 cm ¿Cuál es la probabilidad de que la media , " " , de todos los soldados del regimiento esté en el intervalo (174´4, 175´6)?. P(174´4 175´6) Problema 3º.- Afirman que la media de las estaturas de los soldados de un regimiento es 175 cm. Para comprobarlo extraemos una muestra de 32 soldados y calculamos su media x 175´8 . ¿Es razonable admitir la hipótesis de que 175 ?. En el Problema 1º conocemos la población. A partir de ahí pretendemos deducir el comportamiento de las muestras. En el Problema 2º conocemos una muestra y, a partir de ella pretendemos deducir aspectos de la población. En concreto pretendemos inferir el valor de la media de la población a partir de la media de la muestra. 96 En el Problema 3º tenemos una afirmación, una hipótesis: la media de la población es 175 . Pero no tenemos garantías de que sea cierto. Para contrastarlo, extraemos una muestra y, a partir de su resultado, x 175´8 , debemos decidir si la hipótesis es o no admisible. Los parámetros de la población se pueden estimar a partir de los de la muestra bien de forma puntual o por intervalos de la siguiente forma: La media muestral "x" sirve para estimar la media poblacional " " . La desviación típica muestral “S” es un estimador de la desviación típica poblacional " " . La estimación puntual (el valor de " " es aproximadamente "x" ), sirve de poco mientras desconozcamos cuál es el grado de aproximación de "x" a " " . Por ese motivo se procede a la estimación mediante intervalos. A partir de una muestra aleatoria de tamaño “n” podemos estimar el valor de un parámetro de la población del siguiente modo: - Dado un intervalo dentro del cual confiamos que esté el parámetro. Llamado intervalo de confianza. - Hallando la probabilidad de que tal cosa ocurra. A dicha probabilidad se la llama nivel de confianza. En este curso sólo haremos estimaciones referentes a la media y a la proporción. Cuanto mayor sea el tamaño de la muestra, mayor eficacia tendremos en nuestra estimación. Esta eficacia se manifiesta de dos formas: En el tamaño del intervalo (cuanto más pequeño, más precisos estamos siendo). En el nivel de confianza (más nivel de confianza significa más seguridad en la estimación). Tamaño de la muestra, longitud del intervalo y nivel de confianza son tres variables estrechamente relacionadas que manejaremos a lo largo de esta unidad. En cada caso deberemos obtener una de ellas después de haber fijado las otras dos. 97 A) ESTIMACIÓN DE LA MEDIA 2º.- INTERVALOS CARACTERÍSTICOS Si la variable X tiene una media " " , se llama intervalo característico correspondiente a una probabilidad “p”, al intervalo ( k , k ) tal que P( k x k ) p P k k 1) Si la distribución es N(0,1), si (-k, k) es el intervalo característico correspondiente a un probabilidad “p”, es decir, P(-k < x < k) = p diremos que k es el valor crítico correspondiente a “p”. Ejemplo.- Calculemos los valores críticos correspondientes a las siguientes probabilidades: 0´9; 0´95; 0´99. P(k x k ) 0´90 k 1´645 P(k x k ) 0´95 k 1´96 P(k x k ) 0´99 k 2´575 Habitualmente se designa a la probabilidad “p” por 1 y al valor crítico correspondiente se denomina por z y se tienen las igualdades siguientes: 2 P( z z / 2 ) / 2 P( z / 2 z z / 2 ) 1 /2 /2 1 - z z 2 2 98 Ejemplo.- Calcula los valores críticos correspondientes a 0´21; 0´002 2) Si la distribución es una N ( , ) , entonces el intervalo característico correspondiente a una probabilidad p 1 es: P( k x k ) 1 . Si tipificamos esta variable haciendo el cambio z x . Entonces la convertimos en una N(0, 1). Por lo que su intervalo característico es ( z / 2 , z / 2 ) , es decir, z / 2 x z / 2 z / 2 x z / 2 Luego el intervalo característico buscado es ( z / 2 , z / 2 ) . Ejemplo.- En una N(66, 8) calcular los intervalos característicos para el 90%, 95% y 99%. 3º.- DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES TEOREMA CENTRAL DEL LÍMITE.- Dada una población de media " " y desviación típica " " , no necesariamente normal, la distribución de las medias muestrales de tamaño “n”: Tienen la misma media, " " , que la población. Su desviación típica es / n y, por consiguiente, disminuye al aumentar n. Cuando n 30 , es prácticamente normal. 99 Este teorema nos aporta las siguientes ventajas: 1) Control de las medias muestrales.- En una población de media " " y desviación típica " " , nos disponemos a extraer una muestra de tamaño “n”. Antes de hacerlo, sabemos que la distribución de las medias, x , de todas las posibles muestras es una N ( , / n ) y, por tanto, podemos averiguar la probabilidad de que la media de una muestra concreta esté en un cierto intervalo. 2) Control de la suma de todos los individuos de la muestra.- Como n x x i 1 n i n xi nx . Como x , se distribuye según una N ( , / n ) , i 1 n tenemos que x i 1 i se distribuye según una N (n , n ) . Por tanto, podemos calcular cual es la probabilidad de que la suma de los elementos de una muestra esté, a priori, en un cierto intervalo. 3) Inferir la media de la población a partir de una muestra.- Esta es la aplicación más importante de este teorema. A partir de una muestra se pueden extraer conclusiones válidas sobre la media de la población de partida (Lo veremos más adelante). Como la demostración de este teorema es muy compleja, veamos un ejemplo que lo corrobore. Ejemplo.- Sea la población formada por los valores 1, 2, y 3 equiprobables y que por tanto tiene como función de probabilidad xi 1 2 3 pi 1/3 1/3 1/3 La media de esta distribución será: 1.1/3+2.1/3+3.1/3 = 2. Y la desviación 2 típica xi . pi x 2 / 3 . 2 100 Consideremos todas las posibles muestras con reemplazamiento de tamaño 2. Serán: (1,1),(1,2),(1,3),(2,1)(2,2),(2,3), (3,1),(3,2),(3,3). Las medias serán: 1, 1´5, 2, 1´5, 2, 2´5, 2, 2´5, 3. Hemos obtenido una nueva v. a. que denominaremos por X y su función de probabilidad es: X 1 1´5 2 2´5 3 Pi 1/9 2/9 3/9 2/9 1/9 Calculemos la media y la desviación típica de esta distribución Media ( X ) = 1.1/9 + 1´5.2/9 + 2.3/9 + 2´5.2/9 + 3.1/9 = 2 Desviación típica de ( X ) = A esta desviación típica, se la llama también error típico. Si comparamos los resultados de la población con los de la muestra, vemos que se verifica el teorema, ya que: Media ( X ) = Desviación típica de ( X ) = n . Ejercicio1º.- Las bolsas de azúcar envasadas por una cierta máquina tienen =500 g y = 35 g. Las bolsas se empaquetan en cajas de 100 unidades. a) Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g. b) Hallar el intervalo característico de X para una probabilidad del 95%. c) Calcula la probabilidad de que una caja de 100 bolsas pese más de 51 Kg. Ejemplo 2º.- Los pesos en Kg de los alumnos de un instituto siguen una N(69,8). Las clases formadas por 12 alumnos. a) Hallar la probabilidad de que la media de los pesos de los alumnos de una clase sea superior a 71 Kg. b) Obtener el intervalo característico para X correspondiente a una probabilidad de 0´9. 101 c) ¿Cuál es la probabilidad de que la suma de los pesos de los alumnos de una clase sea menor que 800 Kg.? d) ¿Cuál es la probabilidad de que un alumno de la clase, elegido al azar, pese más de 93 Kg.? Ejemplo 3º.- Los parámetros de una variable son: 16´4; 4´8 . Nos disponemos a extraer una muestra de tamaño n = 400 individuos. a) Hallar el intervalo característico para las medias muestrales correspondientes a una probabilidad p = 0´99. Calcula P(16 X 17) b) Ejemplo 4º.- Los sueldos, en euros, de los empleados de una fábrica se distribuyen según una N(1200, 400). Se elige al azar una muestra de25 de ellos. ¿Cuál es la probabilidad de que la suma de sus sueldos sea superior a 35.000 €? Halla el intervalo característico para las sumas de 25 individuos, correspondientes a una probabilidad de 0´9. 4º- INTERVALO DE CONFIANZA PARA LA MEDIA Se desea estimar la media, , de una población cuya desviación típica, , es conocida. Para ello se recurre a una muestra de tamaño “n” de la cual se obtiene una media muestral x . Si la población de partida es normal, o si el tamaño de la muestra es n 30 , entonces el intervalo de confianza de con un nivel de confianza de (1 ) 100 % es: x z / 2 , x z / 2 . n n Si es desconocida se debe de estimar a partir de la muestra con el parámetro S n 1 (x i x) 2 n 1 . Sin embargo si n es grande se puede utilizar S, es decir, la desviación típica de la muestra. 102 Demostración: Tenemos que demostrar que P x z / 2 x z / 2 1 n n Puesto que la media muestral, x según el teorema central del límite sigue una distribución N ( , x z / 2 1 , ) , entonces P z / 2 n n n es decir, P z / 2 x z / 2 1 P x z / 2 x z / 2 1 n n n n P x z / 2 x z / 2 1 n n Ejercicio 1º.- Deseamos valorar el grado de conocimientos en Historia de una población de varios miles de alumnos. Sabemos que = 2´3. Nos proponemos estimar pasando una prueba a 100 alumnos. a) Calcular el intervalo característico para x correspondiente a una probabilidad de 0´95. Una vez realizada la prueba a 100 alumnos se ha obtenido una media x = 6´32. b) Hallar el intervalo de confianza de con un nivel de confianza de 95%. Ejemplo 2º.- Para estimar la media de los resultados que obtendrían al realizar un cierto test los alumnos de 4º de ESO de toda una comunidad, se les pasa dicho test a 400 de ellos elegidos al azar. Los resultados obtenidos vienen dados por la tabla xi 1 2 3 4 5 fi 24 80 132 101 63 A partir de ellos estima con un nivel de confianza del 95% el valor de la media de la población. Ejemplo 3º.- De una variable estadística conocemos la desviación típica, = 8, pero desconocemos la media, . Para estimarla, extraemos una muestra de tamaño n=60 cuya media vale x = 37. Estima mediante un intervalo de confianza del 99%. 103 5º.- RELACIÓN ENTRE NIVEL DE CONFIANZA, ERROR ADMISIBLE Y TAMAÑO DE LA MUESTRA Como acabamos de ver, el (1 ) 100 % de las muestras cumplen que / x / z / 2 n . El valor E = z / 2 n se le denomina error máximo admisible que como podemos observar depende de y de n: Si mayor es n menor es E, es decir, disminuye la amplitud del intervalo. Cuanto mayor se 1 , es decir, cuanto más seguros queramos estar de nuestra estimación mayor es E. Los niveles de confianza más comúnmente utilizados son 1 z / 2 0´90 0´10 1´645 0´95 0´05 1´96 0´99 0´01 2´575 En este cuadro se observa que cuanto mayor es 1 , mayor es z / 2 y, por tanto mayor es E. De la relación E = z / 2 n , conociendo dos de las tres variables, E, n, se puede calcular la otra. Ejemplo 1º.- De la duración de un proceso sabemos que 0´5 s. ¿Cuál es el número de medidas que hay que realizar para que, con un 99% de confianza, el error de la estimación no exceda de 0´1 s.? Ejemplo 2º.- Al medir el tiempo de reacción, un psicólogo sabe que 0´5 s. Desea estimar el tiempo medio de reacción con un error máximo de 0´1 s, para lo cual realiza 100 experiencias. ¿Con qué nivel de confianza podrá dar el intervalo ( x 0´1, x 0´1) 104 Ejemplo 3º.- Un coronel desea estimar la estatura media de todos los soldados de un regimiento con un error menor de 0´5 cm. utilizando una muestra de 30 soldados. Sabiendo que 5´3 cm. ¿Cuál será el nivel de confianza con el que se realiza la estimación. Ejemplo 4º.- Sabemos que la desviación típica de los pesos de los pollos adultos es de 300 g. Queremos estimar el peso medio de los pollos adultos de una granja con un error menor a 100 g y para ello tomamos una muestra de 50 individuos. ¿Con qué nivel de confianza podemos hacer la estimación?. 105 B) ESTIMACIÓN DE UNA PROPORCIÓN 6º.- INTRODUCCIÓN Hasta ahora hemos estimado la media de una población a partir de la media muestral con ayuda de la distribución normal. Ahora vamos a estimar la proporción de individuos de un colectivo que posee una cierta cualidad (o, lo que es equivalente, la probabilidad de que ocurra un cierto suceso). La descripción de las probabilidades de los distintos valores de una proporción se realizan con la ayuda de la distribución binomial y esta, a su vez, puede ser sustituida en ciertos casos por la normal (cuando n 30 ). 7º.- DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES.- Si en una población la proporción de individuos que poseen una cierta característica “C” es “p”, la proporción “ p r ”, de individuos con dicha característica en las muestras de tamaño “n” sigue una distribución N p, pq . n Demostración Sea x = nº de individuos de la muestra que tienen la característica “C”. x sigue una B(n, p). Si np 5 y nq 5 , entonces x sigue una N (np, npq ) . Sea p r = proporción de individuos de la muestra que tiene la característica “C”. Nº de individuos con la característica “C” x Como p r ------------------------------------------------------ = -----. Nº de individuos de la muestra n np npq = N p, Entonces la distribución de p r será N , n n pq . n c.q.d. Eejmplo1º.- Una máquina produce tornillos. Se sabe que el 5% de ellos son defectuosos. Se empaquetan en cajas de 400. a) ¿Cómo se distribuye la proporción de tornillos defectuosos en las cajas? 106 b) Encontrar un intervalo en el cual se encuentre el 90% de las proporciones de tornillos defectuosos en las cajas. c) Encontrar un intervalo en el cual se encuentre el 99% de las proporciones de tornillos defectuosos en las cajas. Ejemplo 2º.- Supongamos que el 15% de los jóvenes entre 18 y 25 años son miopes: a) ¿Cómo se distribuye la proporción de jóvenes miopes en muestras de 40 individuos? b) Hallar el intervalo característico de las proporciones muestrales correspondientes al 80%. 8º.- INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN O UNA PROBABILIDAD Se desea estimar la proporción “p” de individuos de una cierta característica que hay en una población. Para ello se recurre a una muestra de tamaño “n”, en la que se obtiene una proporción muestral p r . El intervalo de confianza de “p” con un nivel de confianza del (1 ).100% es: p r z / 2 p r (1 p r ) n p r (1 p r ) , p r z / 2 n Demostración Sabemos que p r N p, probabilidad 1 es p z / 2 P p z / 2 P p r z / 2 pq . El intervalo característico de p r para una n pq , p z / 2 n pq p r p z / 2 n pq p p r z / 2 n pq que es tanto como decir que n pq 1 n pq 1 n 107 El error máximo admisible es E z / 2 pq , tiene el grave inconveniente de n que está expresado en función de “p”. Por tanto, una vez extraída la muestra y obtenida la proporción muestral, p r , debemos estimar el valor de “p” y “q” así: p pr q 1 pr . De este modo el error máximo admisible para la estimación de “p” es: E z / 2 pr (1 pr ) n Cota de error o error máximo admisible. En el razonamiento anterior hay que añadir que pn y qn han de ser mayores o iguales a 5. Además para poder estimar “p” por “ p r ” en la construcción del error máximo admisible n 30 . Ejemplo 1º.- Tomamos una muestra de 300 personas mayores de 15 años en una ciudad, nos encontramos que 104 de ellas leían el periódico. Hallar con un nivel de confianza del 90%, un intervalo para estimar la proporción de lectores de periódicos entre los mayores de 15 años. Ejemplo 2º.- A la vista del resultado anterior, se pretende repetir la experiencia para conseguir una cota de error de 0´01 con el mismo nivel de confianza. ¿Cuántos individuos debe tener la muestra? Ejemplo 3º.- A partir de una muestra de 100 individuos se ha estimado una proporción mediante el intervalo de confianza (0´17, 0´25). ¿Cuál es el nivel de confianza con el que se ha hecho la estimación? 108 C) CONTRASTES DE HIPÓTESIS 9º.- INTRODUCCIÓN En un test de hipótesis se emite una afirmación estadística (relativa al valor de un parámetro de una población) y mediante una muestra se estudia si dicha afirmación (hipótesis) es compatible con el resultado de la experiencia (contraste). Los test de hipótesis fueron creados por Neyman y E. Pearson hacia 1940 y desarrollados posteriormente por Abraham Wald, cuyo objetivo es comprobar, mediante métodos matemáticos, hipótesis realizadas sobre el valor de algún parámetro de la población a partir de una muestra aleatoria extraída de ella. Hipótesis sobre un MUESTRA parámetro de la población Aceptamos o rechazamos la hipótesis Los pasos necesarios para tomar decisiones sobre hipótesis estadísticas sencillas (sobre la media y la proporción), son los siguientes: 1º) Enunciado.- Se enuncia la hipótesis emitida (llamada hipótesis nula), H 0 y la contraria H 1 , hipótesis alternativa. Consiste en atribuirle un valor a un parámetro de cierta población. (En este curso sólo emitiremos hipótesis sobre la media y sobre la proporción). 2º) Deducción de conclusiones.- Si la hipótesis nula fuera cierta, tal parámetro de la muestra se distribuiría de forma conocida. En consecuencia: Se elige un nivel de significación. Los más comunes son 0´10; 0´05; 0´01 . 109 Se construye la zona de aceptación. Es el intervalo donde se encuentre (1 ).100% de la población. Zona de aceptación 3º) Verificación.- Se extrae una muestra cuyo tamaño se ha decidido en el paso anterior y de ella se obtiene el correspondiente parámetro. 4º) Decisión.- Si el valor del parámetro muestral cae dentro de la zona de aceptación, se acepta la hipótesis con un nivel de significación . Si no, se rechaza. Explicitar los cuatro pasos anteriores en los siguientes ejemplos con un nivel de aceptación de 0´05 : Ejemplo 1º.- Tenemos un dado que suponemos correcto. Lo lanzamos 100 veces y obtenemos 25 cincos. ¿Podemos suponer que el dado es correcto o debemos suponer que no? Ejemplo 2º.- Hace 5 años se realizó una prueba de conocimientos a todos los soldados profesionales del ejército español. El resultado fue 102 y 11 . Este año se les ha pasado el mismo test a una muestra de 400 soldados y la media ha sido x 101 . ¿Podemos suponer que no ha habido cambio en los conocimientos de los soldados profesionales en estos 5 años y que la diferencia observada es fruto del azar? Ejemplo 3º.- Repite los dos ejercicios anteriores con un nivel de significación de 0´01 para el primer ejemplo y 0´1 para el segundo. 10.- CONTRASTES DE HIPÓTESIS PARA LA MEDIA Vamos a sistematizar los pasos que se dan para realizar contrastes de hipótesis sobre la media de la población, distinguiendo los casos en que H 0 : 0 ó H 0 : 0 ó H 0 : 0 . 110 H 0 : 0 A) Contraste bilateral.- 1º Paso.- Hipótesis H 0 : 0 ; H1 : 0 . 2º Paso.- Obtención de la zona de aceptación. Bien cuando n 30 o la población de partida es una N ( 0 , 0 ) . Entonces las medias muestrales x N 0 , 0 . n Luego la zona de aceptación para un nivel de significación es: 0 0 z / 2 n 3º y 4º paso.- Se extrae la muestra, se calcula x y se comprueba si está dentro de la zona de aceptación Valores críticos más usados /2 /2 1 0 z / 2 0 n 0 0 z / 2 B) Contraste unilateral.- 1º Paso.- Hipótesis 0 n 0 ó 0 H 0 : 0 ó 0 H1 : 0 ó 0 2º Paso.- Zona de aceptación para un nivel 111 z / 2 0´10 1´645 0´05 1´96 0´01 2´575 1 1 z z N(0,1) N(0,1) La zona de aceptación en una N ( 0 , 0 ) es: , 0 z 0 para 0 y n 0 z 0 , para 0 n 3º y 4º Paso.- Se extrae la muestra, se calcula x y se comprueba si está dentro o fuera de la zona de aceptación. Ejemplo1º.- El peso de los pollos de una granja sigue una N(2´6, 0´5). Se experimenta un nuevo tipo de alimentación con 50 crías. Cuando se hacen adultos se les pesa y se obtiene una media x 2´78 Kg. Vamos a contrastar la hipótesis de que el peso medio de la población no aumenta, con un nivel de confianza del 1%. Ejemplo 2º.- Se cree que el coeficiente intelectual medio de los estudiantes de una universidad es 113, con una 7 . Para contrastar la hipótesis se extrae una muestra de 180 estudiantes y se obtiene en ellos una media del coeficiente intelectual de 115. ¿Podemos aceptar la hipótesis con un nivel de significación del 5%? 11º.- CONTRASTE DE HIPÓTESIS PARA LA PROPORCIÓN A) Contraste bilateral.- H 0 : p p0 1º Paso.- Hipótesis H 0 : p p0 ; H 1 : p p0 112 2º Paso.- Zona de aceptación. Se sabe que si p p 0 p r N p 0 , p0 q0 n . Por tanto, la zona de aceptación para un nivel de aceptación es el intervalo característico correspondiente p 0 z / 2 p0 q0 n . 3º y 4º Paso.- Verificación y decisión. Se calcula, " pr " ,en la muestra y se comprueba si está o no en la zona de aceptación. B) Contraste unilateral.- p p0 ó p p0 Hipótesis nula H 0 : p p0 H 0 : p p0 H 1 : p p0 H 1 : p p0 1º Paso Hipótesis alternativa 2º Paso 1 1 Zona de aceptación , p 0 z p0 q0 n p 0 z p0 q0 , n Ejemplo 1º.- A unas elecciones se presentan tres partidos, A, B y C. Un comentarista político afirma que los electores se reparten del siguiente modo: A favor de A, el 40%, a favor de B el 40% o más; a favor de C el 40% o menos. Se pretende contrastar estas hipótesis mediante una muestra de 250 electores. 113 a) Hallar la zona de aceptación de cada uno de ellos, con un nivel de significación del 5%. b) Una vez extraída la muestra se obtienen 132 a favor de A, 88 a favor de B y 30 a favor de C. Tomar decisiones respecto a las tres hipótesis. Ejemplo 2º.- Respecto a un cierto dado, A opina que P(6) = 0´15, B opina que P(6) 0´15 y C que P(6) 0´15 . Contrasta las tres hipótesis con un nivel de significación de 0´10 sabiendo que se arrojó el dado 1000 veces y se obtuvo 183 veces el 6. 114 RESUMEN DEL TEMA 9.- INFERENCIA ESTADÍSTICA 1º) INTERVALOS CARACTERÍSTICOS.- Si la variable x tiene de media , se llama intervalo característico para una probabilidad “p”, al intervalo k , k tal que P( k x k ) p . Si consideramos p 1 y k Z . Entonces tenemos que: 2 Si x N(0,1) el intervalo característico será z , z 2 2 . Si x N ( , ) el intervalo característico será z . , z . 2 2 A) ESTIMACIÓN DE LA MEDIA 2º) TEOREMA CENTRAL DEL LÍMITE.- Dada una población de media y desviación típica , no necesariamente normales. Entonces la distribución de las medias muestrales, x , de tamaño n se distribuyen siempre que n 30 o la población sigua una normal, como x N , y n x i N (n , n ) . Luego se puede inferir la media de la población a partir de la media muestral, siendo el intervalo de confianza para la media con un nivel de confianza de 1 100% ; x z . es x z . . Si es desconocida, se debe estimar a partir de la muestra n n 2 2 con el parámetro s n1 x i x n 1 2 . Sin embargo si n es grande se puede sustituir por s. Se llama valor máximo admisible a E z . 2 n que depende de y de n, luego de las tres variables, conociendo dos podemos calcular la tercera. 115 B) ESTIMACIÓN DE UNA PROPORCIÓN 3º) DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES O PROBABILIDADES Si en una población la proporción de individuos que poseen una cierta característica es, p, la proporción, p r , de individuos con dicha característica en las muestras de tamaño “n” sigue una distribución N p, pq . n Si se desea estimar la proporción, p, de individuos con una cierta característica que hay en una población. Para ello se recurre a una muestra de tamaño “n” en la que se obtiene una proporción muestral, p r . El intervalo de confianza de, p, con un nivel de confianza del (1 ).100% es: pr z 2 p r (1 p r ) ; pr z n 2 p r 1 p r . El error máximo admisible o cota de error n es: E z 2 pq , que está expresada en función de p y q que son desconocidos y lo que se n hace es estimarlos con los valores de p pr ; q 1 pr . Luego E z 2 p r 1 p r . n Todo lo dicho anteriormente es cierto si np 5; nq 5 y n 30 , ya que las proporciones siguen una Binomial que es aproximable a una Normal cuando ocurre esto. C) CONTRASTES DE HIPÓTESIS Consiste en hacer una hipótesis sobre un parámetro de la población y mediante una muestra, aceptar o rechazar dicha hipótesis. Los pasos necesarios para tomar decisiones sobre hipótesis estadísticas sencillas (sobre la media y la proporción), son los siguientes: 116 1º Enunciación.- Se enuncia la hipótesis emitida (llamada hipótesis nula), H 0 , y la contraria, H 1 , (hipótesis alternativa). Consiste en atribuirle un valor al parámetro. 2º Deducción de conclusiones.- Se elige la muestra, un nivel de significación y se construye la zona de aceptación. 3º Verificación.- Se extrae una muestra cuyo tamaño ya se ha decidido en el paso anterior y de ella se obtiene el correspondiente parámetro. 4º.- Decisión.- Si el valor del parámetro muestral cae dentro de la zona de aceptación, se acepta la hipótesis con un nivel de significación . Si no, se rechaza. 4º.- CONTRASTES DE HIPÓTESIS PARA LA MEDIA a) Contrate bilateral.- H 0 : 0 . En este caso la zona de aceptación para un nivel de significación es 0 z 0 ; 0 z 0 n n 2 2 b) Contraste unilateral.- H 0 : 0 ó 0 . En este caso la zona de aceptación para un nivel de significación es: ; 0 z 0 para n 0 y 0 z 0 ; para 0 n 5º.- CONTRASTES DE HIPÓTESIS PARA LA PROPORCIÓN a) Contraste bilateral.- H 0 : p p0 . En este caso la zona de aceptación para un nivel de significación es: p 0 z 2 p0 q0 ; p0 z n 2 p0 q0 n b) Contraste unilateral. H 0 : p p0 .En este caso la zona de aceptación es: ; p 0 z H 0 : p p0 .En este caso la zona de aceptación es: p 0 z 117 p0 q0 n p0 q0 ; n RELACIÓN DE EJERCICIOS. TEMA 9 1º.- 2º.- 3º.- 4º.- 5º.- 6º.- 7º.- 8º.- 9º.- En una población, una variable aleatoria sigue una ley Normal de media desconocida y desviación típica 9. ¿De qué tamaño, como mínimo, debe ser la muestra con la cual se estime la media poblacional con un nivel de confianza del 97% y un error máximo admisible igual a 3? Se ha lanzado 400 veces un dado y se ha obtenido 80 veces el valor cinco. Estime, mediante un intervalo de confianza al 95%, el valor de la probabilidad de obtener un cinco. a) Los valores: 52, 61, 58, 49, 53, 60, 68, 50, 53 constituye una muestra aleatoria de una variable aleatoria Normal, con desviación típica 6. Obtenga un intervalo de confianza para la media de la población, con un nivel de confianza del 92%. b) Se desea estimar la media poblacional de otra variable aleatoria Normal, con varianza 49, mediante la media de una muestra aleatoria. Obtenga el tamaño mínimo de la muestra para que el error máximo de la estimación, mediante un intervalo de confianza al 97% En una muestra aleatoria de 1000 personas de una ciudad, 400 votan a un determinado partido político. Calcule un intervalo de confianza al 96% para la proporción de votantes de ese partido en la ciudad. De 500 encuestados en una población, 350 se mostraron favorables a la retrasmisión de debates televisivos en tiempos de elecciones. Calcule un intervalo de confianza, al 99´5%, para la proporción de personas favorables a estas retransmisiones. El gasto anual en videojuegos, de los jóvenes de una ciudad sigue una Normal de media desconocida y desviación típica 18 €. Elegida, al azar, una muestra de 144 jóvenes se ha obtenido un gasto medio de 120 €. a) Indique la distribución de las medias de las muestra de tamaño 144. b) Determine un intervalo de confianza, al 99%, para el gasto medio en videojuegos de los jóvenes de esa ciudad. c) ¿Qué tamaño muestral mínimo deberíamos tomar para, con la misma confianza, obtener un error menor que 1´9? De una población Normal, con media desconocida y varianza 36, se extrae una muestra aleatoria que resulta tener una media muestral de 173. a) Obtenga un intervalo de confianza del 97% para la media poblacional, si el tamaño de la muestra es de 64. b) ¿Cuál debe de ser el tamaño mínimo de la muestra, si se desea que el error cometido al estimar la media poblacional sea inferior a 1´2, para un nivel de confianza del 95%? Las calificaciones obtenidas por los estudiantes de Matemáticas siguen una ley Normal de media desconocida y desviación típica 1´19. Para una muestra de esa población se obtiene que (6´801, 6´899) es un intervalo de confianza, al 92%, para la media poblacional. a) Determina la media muestral. b) Determina el tamaño de la muestra a) Sea la población {1, 5, 7}. Escribe todas las muestras de tamaño dos, mediante muestreo aleatorio con reemplazamiento, y calcule la varianza de las medias muestrales. 118 10º.- 11º.- 12º.- 13º.- 14º.- 15º.- 16º.- c) De una población de 300 hombres y 200 mujeres se desea seleccionar, mediante muestreo aleatorio estratificado con fijación proporcional, una muestra de tamaño 30 distribuida en los dos estratos, ¿cuál será la composición de la muestra? Dada la población de elementos {3, 4, 5, 8}, se pretende seleccionar una muestra de tamaño dos, mediante muestreo aleatorio con reemplazamiento. a) Escribe todas las muestras posibles. b) Calcule la varianza de la población. c) Calcule la varianza de las medias muestrales. Lanzamos 36 dados correctos y calculamos la media de sus resultados, x . Si repetimos esta experiencia de forma reiterada: a) ¿Cual será la distribución de las medias?. b) ¿Cuál es la probabilidad de que la media de una de las tiradas sea mayor que 4? c) Halla un intervalo centrado en la media en el que se encuentre el 99% de las medias de los lanzamientos. Un ganadero de reses bravas quiere estimar el peso medio de los toros de su ganadería con un nivel de confianza del 95%. Para ello, toma una muestra de 30 toros y los pesa. Obtiene una media x 507 kg y una desviación típica s = 32 kg. a) ¿Cuál es el intervalo de confianza para la media de la población? b) ¿Cual será el intervalo si queremos que el nivel de confianza sea del 99%? El cociente intelectual de un determinado colectivo tiene una media desconocida y una desviación típica 8 . ¿De qué tamaño debe ser la muestra con la cual se estime la media con un nivel de confianza del 99% y un error admisible E = 3? Para estimar el peso medio de las chicas de 16 años de una ciudad, se toma una muestra aleatoria de 100 de ellas. Se obtienen los siguientes parámetros: x 52,5kg, s 5,3kg Se realiza la afirmación siguiente: el peso medio de las chicas de 16 años de esta ciudad está entre 51 y 54 kg. ¿Con qué nivel de confianza se hace la afirmación? En una empresa que fabrica microcircuitos se ha comprobado que el 4% de estos son defectuosos. Un cliente va a comprar un paquete de 500 microcircuitos procedentes de la fábrica. Determina: a) El número esperado de microcircuitos defectuosos en un paquete de 500. b) La distribución de la proporción de microcircuitos defectuosos en las cajas de 500 microcircuitos. c) La probabilidad de que el número de microcircuitos defectuosos (en un paquete de 500) esté entre 20 y 30. Se ha lanzado 100 veces una moneda obteniéndose 62 caras. Estima la probabilidad de “cara” mediante intervalos de confianza: a) Del 90% b) Del 95%. C) Del 99% 17º.- Basándonos en la experiencia del problema anterior, pretendemos estimar la probabilidad de “cara” con un error menor que 0,002 y un nivel de confianza del 95%. ¿Cuántas veces tendremos que lanzar la moneda? 119 18º.- 19º.- 20º.- 21º.- 22º.- Para estimar el número de peces que hay en un pantano se procede de la siguiente forma: se pescan con red una cierta cantidad de ellos, 349, se marcan y se devuelven al pantano. Al cabo de varios días se vuelve a pescar otro montón de ellos y se averiguan qué proporción. En esta segunda pesca se han obtenido 514 peces, de los cuales hay 37 marcados. a) Halla un intervalo de confianza, al 90% para la proporción de peces marcados en el pantano. b) Halla un intervalo de confianza, al 90% para el total de peces del pantano. Se ha comprobado que el tiempo de espera (en minutos) hasta ser atendido, en cierto servicio de urgencias, sigue un modelo normal de probabilidad. A partir de una muestra de 100 personas que fueron atendidas en dicho servicio, se ha calculado un tiempo medio de espera de 14,25 minutos y una desviación típica de 2,5 minutos. a) ¿Podríamos afirmar, con un nivel de significación del 5%, que el tiempo medio de espera, en ese servicio de urgencias, no es de 15 minutos? b) ¿Qué podríamos concluir si el nivel de significación hubiese sido del 0,1%? c) ¿Existe contradicción en ambas situaciones? Justifica la respuesta. La duración de las bombillas de 100 vatios que fabrica una empresa sigue una distribución normal con una desviación típica de 120 horas. Su vida media está garantizada durante un mínimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y, después de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de significación de 0,01, ¿habría que rechazar el lote por no cumplir la garantía? Reflexionemos sobre cada una de las siguientes experiencias: a) Lanzamos una moneda 10 veces y obtenemos 6 caras. b) Lanzamos una moneda 100 veces y obtenemos 60 caras. c) Lanzamos una moneda 1000 veces y obtenemos 600 caras. ¿Podemos deducir de alguna de ellas que la moneda es incorrecta tomando como nivel de significación del 0,01? En las última votaciones, el 53% de los votantes estaban a favor del alcalde. Se acaba de realizar una encuesta a 360 personas elegidas al azar y 176 de ellas estaban a favor del alcalde. ¿Se puede afirmar con un nivel de confianza del 90%, que el alcalde no pierde popularidad? 120