Download probabilidad
Document related concepts
no text concepts found
Transcript
PROBABILIDAD Asignatura Clave: FIM018 Número de Créditos: 5 Teóricos: 4 Prácticos: 1 Asesores Responsables: M. en A. Eduardo Suárez Mejía INSTRUCCIONES PARA OPERACIÓN ACADÉMICA: El sumario representa un reto. Los contenidos son los ejes temáticos. Los activos una orientación inicial para resolverlos y la síntesis concluyente como posibilidad de integración conceptual corresponderá a lo factible de un punto de vista temático amplio. La visión global de los asuntos resueltos como titular académico, te ofrecerá oportunidad de discusión que se enriquecerán en la medida que intensificas las lecturas, asistes a tu comunidad de estudio te sirves de los asesores y analizas la ciberinformación disponible posicionándote de los escenarios informativos adecuados. Los periodos de evaluación son herramientas de aprendizaje. Mantén informado al Tutor de tus avances académicos y estado de ánimo. Selecciona tus horarios de accesoria. Se recomienda al titular académico (estudiante) que al iniciar su actividad de dilucidación, lea cuidadosamente todo el texto guión de asignatura. Para una mejor facilitación. El documento lo presentamos en tres ámbitos: 1.- relación de las unidades. 2.- relación de activos. 3.- Principia Temática consistente en información inicial para que desarrolles los temas. COMPETENCIAS: Al finalizar el curso el estudiante podrá manejar la teoría de la probabilidad desde la perspectiva científico axiomática, para que a partir de aquí pueda diseñar experimentos matemáticos en el área del control estadístico de calidad. SUMARIO: En este curso se analizan los principios básicos de probabilidad, las técnicas de conteo y de combinatoria, las propiedades de las principales distribuciones de probabilidad así como la ley de los grandes números explicada en el teorema del límite central. PROBABILIDAD CONTENIDOS: UNIDAD I.- Conceptos Básicos de Probabilidad UNIDAD II.- Combinatoria Elemental UNIDAD III.- Distribuciones de Probabilidad UNIDAD IV.- Distribuciones de Probabilidad Discretas UNIDAD V.- Distribuciones Continuas UNIDAD VI.- Teorema del Límite Central ACTIVOS UNIDAD I Conceptos Básicos de Probabilidad I.1.- Conceptos Preliminares I.2.- Teoría básica de conjuntos I.3.- Algunas definiciones y propiedades I.4.- Conjunto Potencia I.5.- Conjunto Producto I.6.-Cardinalidad I.7.- Medidas de Probabilidad I.8.- Espacios Muestrales Discretos I.9.- Reglas para el Cálculo de Probabilidades I.10.- Regla de Producto I.11.- Probabilidad Condicional I.12.- Probabilidad Total y Regla de Bayes Actividad: 1. Which of the following is the sample space when 2 coins are tossed? {H, T, H, T} {H, T} {HH, HT, TH, TT} None of the above. RESULTS BOX: 2. At Kennedy Middle School, 3 out of 5 students make honor roll. What is the probability that a student does not make honor roll? 65% 40% 60% None of the above. RESULTS BOX: 3. A large basket of fruit contains 3 oranges, 2 apples and 5 bananas. If a piece of fruit is chosen at random, what is the probability of getting an orange or a banana? None of the above. RESULTS BOX: 4. A pair of dice is rolled. What is the probability of getting a sum of 2? None of the above. RESULTS BOX: 5. In a class of 30 students, there are 17 girls and 13 boys. Five are A students, and three of these students are girls. If a student is chosen at random, what is the probability of choosing a girl or an A student? None of the above. RESULTS BOX: 6. In the United States, 43% of people wear a seat belt while driving. If two people are chosen at random, what is the probability that both of them wear a seat belt? 86% 18% 57% None of the above. RESULTS BOX: 7. Three cards are chosen at random from a deck without replacement. What is the probability of getting a jack, a ten and a nine in order? None of the above. RESULTS BOX: 8. A city survey found that 47% of teenagers have a part time job. The same survey found that 78% plan to attend college. If a teenager is chosen at random, what is the probability that the teenager has a part time job and plans to attend college? 60% 63% 37% None of the above. RESULTS BOX: 9. In a school, 14% of students take drama and computer classes, and 67% take drama class. What is the probability that a student takes computer class given that the student takes drama class? 81% 21% 53% None of the above. RESULTS BOX: 10. In a shipment of 100 televisions, 6 are defective. If a person buys two televisions from that shipment, what is the probability that both are defective? None of the above. RESULTS BOX: UNIDAD II Combinatoria Elemental II.13.- Reglas Básicas II.14.- Permutaciones de un Conjunto II.15.- Combinaciones II.16.- Distribución de objetos indistinguibles II.17.- Propiedades Importantes Actividad: 1 Which of the following is a correct statement about a probability? A) It may range from 0 to 1. B) It may assume negative values. C) It may be greater than 1. D) It cannot be reported to more than 1 decimal place. E) All the above are correct. 2 An experiment is a A) Collection of events. B) Collection of outcomes. C) Always greater than 1. The act of taking a measurement or the observation of some activity. E) None of the above are correct. D) 3 Which of the following is not a type of probability? A) Subjective B) Independent C) Relative frequency D) Classical 4 Events are independent if A) By virtue of one event happening another cannot. B) The probability of their occurrence is greater than 1. C) We can count the possible outcomes. The probability of one event happening does not affect the D) probability of another event happening. E) None of the above. 5 The Special Rule of Addition is used to combine A) Independent events. B) Mutually exclusive events. C) Events that total more than one. D) Events based on subjective probabilities. E) Found by using joint probabilities. 6 We use the General Rule of Multiplication to combine A) Events that are not independent. B) Mutually exclusive events. C) Events that total more than 1.00. D) Events based on subjective probabilities. E) Found by using joint probabilities. 7 When we find the probability of an event happening by subtracting the probability of the event not happening from 1, we are using A) Subjective probability. B) The complement rule. C) The general rule of addition. D) The special rule of multiplication. E) Joint probability. 8 When we determine the number of combinations A) We are really computing a probability. B) The order of the outcomes is not important. C) The order of the outcomes is important. D) We multiply the likelihood of two independent trials. E) None of the above. 9 The difference between a permutation and a combination is: A) In a permutation, order is important and in a combination, it is not. In a permutation, order is not important and in a combination, it is B) important. C) A combination is based on the classical definition of probability. D) A permutation is based on the classical definition of probability. E) None of the above. 10 The Greater Bismarck, ND Accounting Association has 15 members, 10 of which are CPAs. The members are to be selected to study ways to increase membership. What is the probability all three selected are CPAs? A) .296 B) .264 C) .736 D) None of the above. UNIDAD III Distribuciones de Probabilidad III.18.- Preliminares III.19.- Definiciones Básicas III.20.- Parámetros en una Distribución III.21.- Función Generadora de Momentos Actividad: 1. Tres máquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa de estas máquinas son del 3%, 4% y 5%. Solucionar a través de Excel lo siguiente: a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa. b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido producida por la máquina B. c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza defectuosa? 2. Para tratar a un paciente de una afección de pulmón han de ser operados en operaciones independientes sus 5 lóbulos pulmonares. La técnica a utilizar es tal que si todo va bien, lo que ocurre con probabilidad de 7/11, el lóbulo queda definitivamente sano, pero si no es así se deberá esperar el tiempo suficiente para intentarlo posteriormente de nuevo. Se practicará la cirugía hasta que 4 de sus 5lóbulos funcionen correctamente. a) ¿Cuál es el valor esperado de intervenciones que se espera que deba padecer el paciente? b) ¿Cuál es la probabilidad de que se necesiten 10 intervenciones?. Solucionar a través de Excel. 3. La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, ¿cuál es la probabilidad de tener 3 accidentes?. Solucionar a través de Excel. 4. En un banco, el promedio de llegadas para hacer cola se rige por la ecuación de Poisson: P[n llegadas en le tiempo T] = Si existe un promedio de 6 llegadas aleatorias por hora, ¿Cuál es la probabilidad de que haya sólo 3 llegadas durante una hora? Solucionar a través de Excel. 5. El contenido de siete contenedores similares de ácido sulfúrico son 9.8, 10.2, 10.4, 9.8, 10.0, 10.2, y 9.6 litros. Encuentre un intervalo de confianza del 95% para la media de todos los contenedores si se supone una distribución aproximadamente normal. 6. La renta media de los habitantes de un país es de 4 millones de pesos/año, con una varianza de 1,5. Se supone que se distribuye según una distribución normal. Calcular en Excel: a) El porcentaje de la población con una renta inferior a 3 millones de ptas, b) La renta a partir de la cual se sitúa el 10% de la población con mayores ingresos y c) Los ingresos mínimo y máximo que engloba al 60% de la población con renta media. UNIDAD IV Distribuciones de Probabilidad Discretas IV.22.- Distribución de Probabilidad Binomial. IV.23.- Media y varianza IV.24.- Distribución de Poisson IV.25.- Distribución de probabilidad Hipergeométrica Actividad: The binomial experiment consists of n independent, identical trials, each of which results in either success or a failure and is such that the probability of success on any trial is the same. A) True B) False 2 A Poisson random variable is a continuous variable that can be used to describe the number of occurrences of an event over a specified interval of time or space. A) True B) False If p = .1 and n = 5, then the corresponding binomial distribution is _______________ A) right skewed. B) left skewed. C) symmetric. D) bimodal. 4 If p = .5 and n = 4, then the corresponding binomial distribution is ________________ A) right skewed. B) left skewed. C) symmetric. D) bimodal. 5 The requirement that the probability of success remains constant from trial to trial is a property of the binomial distribution. A) True B) False 6 If the number of surface nonconformities on a specific size of metal piece is the discrete random variable in question, then the appropriate probability distribution that can describe the probability of a specific size metal sheet containing 3 nonconformities is given most likely by binomial distribution. A) True B) False 7 Which of the following distributions can be used to solve the following problem? The average number of cars arriving at a drive-thru fast food restaurant is 3 in ten minutes. What is the probability that exactly 4 cars will arrive in a five-minute interval? A) Binomial B) Poisson C) Both of the above. D) None of the above. 8 The mean of the binomial distribution is equal to A) p. B) (n) (p). C) (1.0K) D) (n)(p)(1-p). E) (1.0K) 9 Which of the following is a valid probability value for a discrete random variable? A) .2 B) 1.01 C) -.7 D) All of the above. 0 Which one of the following is not an assumption of the binomial distribution? A) Each trial results in “success” or “failure.” B) The experiment consists of n identical trials. C) The probability of success changes from trial to trial. D) Trials are independent of each other. E) Each trial results in one of two mutually exclusive outcomes. UNIDAD V Distribuciones Continuas V.26.- La distribución Normal V.27.- ">Algunas Propiedades Importantes V.28.- Las distribuciones Gamma V.29.- La distribución de probabilidad exponencial Actividad: 1. A phone-in poll conducted by a newspaper reported that 73% of those who called in liked business tycoon Donald Trump. The unknown true percentage of American citizens that like Donald Trump is called a: A. statistic B. sample C. parameter D. population 2. A simple random sample of 50 undergraduates at Johns Hopkins University found that 60% of those sampled felt that drinking was a problem among college students. A simple random sample of 50 undergraduates at Ohio State University found that 70% felt that drinking was a problem among college students. The number of undergraduates at Johns Hopkins University is approximately 2000, while the number at Ohio State is approximately 40,000. Which of the following is the best conclusion regarding the above data? A. The sample from Johns Hopkins has much less sampling variability than that from Ohio State. B. The sample from Johns Hopkins has much more sampling variability than that from Ohio State. C. The sample from Johns Hopkins has almost the same sampling variability as that from Ohio State. D. It is impossible to make any statements about the sampling variability of the two samples since the students surveyed were different. 3. Using the above data, suppose the actual proportion of undergraduates at Johns Hopkins University who feel drinking is a problem among college students is 70%. The mean of the sampling distribution of the percentage that feel drinking is a problem in repeated simple random samples of 50 Johns Hopkins undergraduates is what? A. 50% B. 60% C. 65% D. 70% 4. The number of undergraduates at Johns Hopkins University is approximately 2000, while the number at Ohio State University is approximately 40,000. At both schools a simple random sample of about 3% of the undergraduates is taken. Which of the following is the best conclusion? A. The sample from Johns Hopkins has less sampling variability than that from Ohio State. B. The sample from Johns Hopkins has more sampling variability than that from Ohio State. C. The sample from Johns Hopkins has almost the same sampling variability as that from Ohio State. D. It is impossible to make any statements about the sampling variability of the two samples since the students surveyed were different. 5. What is a random variable? A. the particular sample obtained from simple random sampling B. a variable whose value is a numerical outcome of a random phenomenon C. any number that has an unknown and unpredictable value D. the particular variable selected by random sampling from an initial list of possible variables 6. Which of the following random variables would be considered continuous? A. the number of brothers a randomly chosen person has B. the time it takes for a randomly chosen woman to run 100 yards C. the number of cars owned by a randomly chosen adult male D. number of orders received by a mail order company in a randomly chosen week 7. The random variable X denotes the time taken for a computer link to be made between the terminal in an executive's office and the computer at a remote factory site. It is known that X has a normal distribution with mean 15 seconds and standard deviation 3 seconds. Choose the option closest to the value of P(X < 20). A. 0.548 B. 0.952 C. 0.048 D. 0.452 8. Let the random variable X represent the profit made on a randomly selected day by a certain store. Assume X is normal with a mean of $360 and standard deviation $50. The probability is approximately 0.6 that on a randomly selected day the store will make less than A. $347.40 B. $0.30 C. $361.30 D. $372.60 9. The normal distribution is a reasonably good approximation to the binomial distribution provided that A. np > 10 and n(1 - p) > 10 B. np > 10 and n(1 - p) < 10 C. np < 10 and n(1 - p) > 10 D. np < 10 and n(1 - p) < 10 (By the way, the reason why our estimates in class were so far off was that I forgot to use the adjustment moving from a descrete distribution (like the number of "heads") to the continuous Normal Distribution. For example, to estimate 6 or more "Heads", I would find the z score of 5.5 and see the area under the Normal Distribution greater than the z-score of 5.5) 10. Forty-eight percent of the students at a certain state university prefer the semester system over the quarter system. A survey is taken of 200 students (selected at random). Choose the option closest to the probability that more than half of these students prefer semesters. A. 0.3300 B. 0.5000 C. 0.2843 D. 0.7157 UNIDAD VI Teorema del Límite Central VI.30.- Desigualdades de Markov y Chebyshev VI.31.- Leyes de los Grandes Números VI.32.- El Teorema del Límite Central VI.33.- Aproximación Normal Binomial VI.34.- Estimadores VI.35.- Algunos Ejemplos Actividad: 1. Una agencia de encuestas de opinión quiere estimar con un nivel del 90% de confianza la proporción de ciudadanos que votarán por un determinado candidato dentro de ± 0.06 de la proporción real de votantes. ¿Cuál es el tamaño mínimo de la muestra requerido si otras encuestas indican que la proporción de votación por este candidato es 0.30? 2. Una muestra aleatoria de 30 empleados de una gran empresa dio como __ resultado una media X = $180 pesos por hora con una desviación estándar s = $14 pesos por hora. Estimar el intervalo de confianza para el promedio salarial de todos los empleados al 95% de confianza. 3. El ciclo medio de vida operativa de una muestra aleatoria de n = 10 focos es __ X = 4000 horas, con una desviación estándar s = 200 h. Se supone que el ciclo de vida operativa de los focos en general tiene una distribución aproximadamente normal. Estime el ciclo medio de vida operativa de la población de focos de la que fue tomada esta muestra, aplicando un intervalo de confianza de 95%. PROBABILIDAD PRINCIPIA TEMÁTICA I.1.- Dado que los lectores podrían no recordar algunos conceptos básicos se tratará de que esta sección constituya un punto de referencia que le permita refrescar los conocimientos indispensables para el desarrollo del resto del material. Esto no elimina la necesidad de que en el transcurso del estudio de estas notas debamos abordar aspectos periféricos importantes. I.2.- El estudio formal de la teoría de conjuntos no es el interés en estas notas, los resultados que se presentan son básicos y en la mayoría de los casos su demostración o justificación se dejará al lector. Si los temas le parecen conocidos pero no los recuerda bien, se recomienda al menos una lectura rápida. El estudio de la probabilidad está estrechamente ligado con el estudio particular de algunos conceptos sobre conjuntos que se discutirán en esta corta sección. En teoría de conjuntos los términos elemento, conjunto y pertenencia no se definen, se asume que de una u otra manera el lector tiene una idea al respecto. De hecho, cualquier intento por definir alguno de estos conceptos nos llevaría a definiciones circulares, es decir definiciones que reducen el concepto a un término que no es más que un sinónimo del mismo. Por ejemplo en [7] se define un conjunto como una colección de elementos distintos. Esta definición usa dos conceptos que no son claros: elemento y colección. Es usual que los conjuntos se representen por letras mayúsculas A, B, C,... y los elementos por letras minúsculas, a, b, c.... Se usa la notación xЄ A para indicar que el elemento x pertenece al conjunto A, es decir x es uno de los elementos de A. Si bien no existe un conjunto universal [7], usaremos el concepto de conjunto universal o universo restringiéndolo a dominios específicos. Por ejemplo, si hablamos de conjuntos de números enteros entonces el conjunto universo es el conjunto de los enteros. Esta simple aclaración nos facilitará la discusión de algunos de los conceptos que abordaremos posteriormente. Iniciaremos recordando el Principio de comprensión, sumamente importante en el estudio de los conjuntos. Si tenemos un conjunto universo, podemos pensar que cada uno de los elementos de este conjunto debe cumplir o satisfacer alguna condición para estar en ese conjunto y es usual que a los elementos que cumplan con esta condición que los caracteriza les digamos que son de cierto tipo. Por ejemplo si se tiran dos dados, uno azul y uno rojo y se anotan las caras que caen en cada uno de ellos, el conjunto de posibles resultados esta formado por 36 pares ordenados; ese conjunto, el universo para el experimento de tirar dos dados y registrar las caras que caen, tiene un tipo especial, digamos tipo resultado. Este principio nos permite garantizar que para todo tipo de elemento y para todo predicado siempre hay un subconjunto que cumple el predicado, este conjunto puede ser vacío. Otro principio importante es el Principio de extensión que permite establecer la igualdad entre conjuntos. I.3.- Algunas definiciones y propiedades Note que acorde con esta definición se cumple que un conjunto sin elementos, Φ es subconjunto de todo conjunto. Si Ω es un conjunto y A ⊂ Ω se define el conjunto complemento de A respecto a Ω por: ~A=Ω\A Las siguientes propiedades se enuncian sin demostración y resumen algunas de las más importantes acerca de las operaciones definidas previamente. Propiedades de la Unión • Conmutatividad • Asociatividad (A B) • Identidad A Φ = A. • Medio Excluido • Otras B=B A A. C=A =A (B C). (B C). A. A ⊆ AU B Propiedades de la Intersección • Conmutatividad A B=B • Asociatividad (A B) • Identidad A = A. • Contradicción A A = Φ. • Otras A B A. C=A A. Propiedades Conjuntas • • • Distributividad o A (B C) = (A B) (A C). o A (B C) = (A B) (A C). Leyes de De Morgan o (A B) = A B. o (A B) = A B Otras o A \ (B C) = (A \ B) (A \ C). o A \ (B C) = (A \ B) ( A \ C). I.4.- Un conjunto importante asociado con todo conjunto es el conjunto potencia o partes de. Así P( ) es un conjunto cuyos elementos son todos los subconjuntos de . I.5.- Si x y y son elementos, es posible agruparlos en una estructura que se llama par ordenado. Un par ordenado puede verse como un conjunto en cuya definición se refleja de manera clara la idea de dos elementos agrupados en un orden definido. La siguiente definición permite lograrlo. I.6.- Un concepto de vital importancia al estudiar probabilidad radica en la posibilidad de que dado un conjunto A, dentro de un universo , se pueda asignar a este conjunto alguna medida relativa al universo en el cual está inmerso. Existen teorías completas al respecto y si bien podrían ser bastante útiles en el desarrollo que haremos no profundizaremos en ninguna de ellas. Los conjuntos con los que trataremos se dividen en dos grandes grupos: discretos y continuos. En términos simples un conjunto contable (discreto) es aquel en el cual exista una manera de contar sus elementos, puede tener una cantidad finita o infinita de elementos, pero de alguna manera puede encontrarse una estrategia para contarlos. Por ejemplo los naturales son un conjunto discreto, de hecho son el conjunto que se utiliza para poder contar otros. Todo conjunto finito es contable, los enteros son un conjunto contable y los racionales también. Invitamos al lector a encontrar estrategias para contar los enteros y los racionales [8]. Para conjuntos discretos finitos la cardinalidad es una manera de asignarles una medida. A continuación listamos un conjunto de propiedades de la cardinalidad. Propiedades de Cardinalidad • Si AB • Si A • Si | A| = n • Si | A| = n, | B| = m | A| B=Φ |A | B| B| = | A| + | B| | P(A)| = 2n A×B|=mn (1.1) Cuando los conjuntos no son discretos el concepto de cardinalidad carece de sentido y se sustituye por el término de medibilidad, un concepto fuera de los objetivos de estas notas, no obstante hablaremos levemente de algunos términos necesarios en probabilidades. I.7.- Los siguientes resultados son sumamente importantes al tratar de formalizar lo que entenderemos por probabilidades. De alguna forma podríamos prescindir de algunas de estas definiciones y a pesar de ello aprender a resolver problemas que tienen que ver con la probabilidad, pero hemos decidido hacer esta sección suficientemente completa, pues muchos de los estudiantes a los cuales están dirigidas estas notas aprecian el formalismo como una excelente alternativa para luchar contra la imprecisión que puede venir del exceso de informalidad. I.8.- Espacios Muestrales Discretos Las siguientes definiciones constituyen un punto de partida importante para iniciar el estudio de la materia que nos interesa. De hecho constituyen caracterizaciones operacionales de los tipos de probabilidad discutidos, en la sección introductoria. Ejemplo 1 Se lanza un par de dados que no están cargados y se registra la suma de las caras. Determine la probabilidad del evento T : la suma de los números en ambas caras es 6. Solución En este caso, por (1.1) hay 36 posibles resultados, de los cuales (3, 3), (1, 5), (5, 1), (2, 4) y (4, 2) suman 6 así: Ejemplo 2 P[T] = En una caja hay 4 libros de inglés y 3 de ruso. Se escoge al azar un libro de la caja. ¿Cuál es la probabilidad de que el libro escogido sea de ruso? Solución Sea R el evento se escoge un libro de Ruso. Hay 3 casos en los cuales al escoger el libro resulta ser de ruso y un total de 7 escogencias por lo tanto: P[R] = Funciones de Probabilidad Las definiciones (10) y (11), caracterizan la probabilidad de un evento en términos de la frecuencia relativa. La primera permite la asignación de una medida de probabilidad a un evento mediante la experimentación. La segunda es mucho más clara y en el sentido operacional es aceptable, pero requieren que el espacio muestral sea finito. Por otro lado la afirmaciones de que "los resultados pueden ocurrir igualmente, y son mutuamente excluyentes", difícilmente pueden ser demostradas, y es usual que no se cumplan. Esa no es una limitación importante pues esta última definición puede generalizarse para que permita caracterizar cualquier probabilidad. No obstante se hace necesario establecer algunas condiciones a la colección de todos los eventos del espacio muestral. Dado un espacio muestral , se asume que la familia cumple las siguientes propiedades: • Se tiene que Φ y • Si A • Si A1, A2, A3,... son elementos de , entonces de todos los eventos . . A , también lo es Ai. Cualquier conjunto que cumpla con las propiedades anteriores se llama una álgebra. - Con estas propiedades se puede demostrar con alguna facilidad los siguientes hechos, referimos al lector interesado a [2]: • Si los eventos A1, A2, A3,... son elementos de • La unión finita de eventos de • Si A y B están es está en , también lo es A i. . también lo está A \B. Una función de probabilidad definida sobre la -álgebra de todos los eventos de un espacio muestral , debe cumplir las siguientes propiedades: • 0 P[A] para todo evento A. • P[ ] = 1. • Si A y B son eventos mutuamente excluyentes entonces P[A • B] = P[A] + P[B]. Si los eventos A1, A2, A3,... son eventos mutuamente excluyentes ( Ai Φ, i ≠j), entonces P[ An] = Aj = P[An]. El concepto de medida de probabilidad o función de probabilidad juega un rol básico al momento de estudiar las probabilidades, de hecho cuando tenemos un experimento aleatorio y queremos estudiarlo probabilísticamente lo que necesitamos es definir una de tales medidas. Buena parte de lo que haremos en secciones posteriores es definir medidas de probabilidad sobre espacios muestrales. En las siguientes páginas discutiremos los principios básicos de la probabilidad. I.9.- Cuando en un experimento aleatorio se conocen las probabilidades de los eventos simples, es decir las probabilidades de cada uno de los elementos del espacio muestral, se pueden calcular las probabilidades de eventos compuestos y de algunos eventos relacionados utilizando una serie de reglas básicas. El cálculo de probabilidades se basa principalmente en la aplicación de estas reglas básicas. El siguiente teorema, [2], define una serie de propiedades que cumple una medida de probabilidad. 1. P[Φ] = 0. 2. P[A] = 1 - P[ A]. 3. Para cualesquiera eventos A, B P[A 4. Para cualesquiera eventos A, B. Si A B] = P[A] + P[B] - P[A B]. B implica P[A] < P[B]. Demostración y discusión de algunos casos. 1. Esta propiedad se obtiene en forma inmediata pues si P[Φ] = r > 0 se tiene que P[Ω] = P[Ω Φ] = P[Ω] + P[Φ] = 1 + r > 1, lo cual contradice la propiedad 2 del axioma 2. En otras palabras P[Φ] = 0. 2. Esta propiedad también se obtiene en forma sencilla de: 1 = P[Ω] = P[A ~A] = P[A] + P[~A]. Si A es un evento sobre un espacio muestral ocurre A se denota por A. entonces el evento no 3. Esta propiedad se demuestra usando propiedades de conjuntos. Lo primero es notar que A B es una unión de eventos excluyentes: A B = (A ∩B) ( ~A ∩B) (A ∩~B), por lo tanto, P[A B] = P[(A ∩B)] + P[(~A ∩B)] + P[(A ∩~B)], Por otro lado los eventos A así: ByA (1.2) B son excluyentes y su unión es A, P[A] = P[(A ∩B)] + P[(A ∩~B)], (1.3) Similarmente: P[B] = P[(A ∩B)] + P[(~A ∩B)], (1.4) Sumando término a término (1.3) y (1.4) se obtiene: P[A] + P[B] = 2P[(A ∩B)] + P[(A ∩~B)] + P[(~A ∩B)]. (1.5) Restando (1.5) y (1.2) se obtiene el resultado. I.10.- El evento que indica la ocurrencia conjunta de los eventos A y B se denota por A B. Dos eventos se dicen independientes si la ocurrencia de uno de ellos no influye ni se ve influida por la ocurrencia del otro. Por inducción se puede demostrar que si A1, A2,..., An son eventos independientes con probabilidades P[A1], P[A2], ..., P[An] respectivamente, entonces la probabilidad de la ocurrencia del evento compuesto A1 y A2 y ... y An, es decir todos los eventos, cumple: P[A1 ∩A2∩... ∩An] = P[A1]P[A2]...P[An]. (1.6) Ejemplo 3 Suponga que una máquina fabrica un tipo específico de componente, y que la probabilidad de que un componente salga defectuoso es constante p e independiente de los resultados en los componentes tanto anteriores como posteriores. • Estime la probabilidad de que el primer componente defectuoso salga inmediatamente después de los primeros N componentes. • ¿Cuántos componentes deben producirse para tener una probabilidad del 90% de obtener al menos un componente defectuoso? Solución • Sea Di el componente i defectuoso y probabilidad pedida es: P[( • ∩ ∩... ∩ el complemento de Di. La ) ∩ DN + 1] = (1 - p)Np. La probabilidad de ningún componente defectuoso en los primeros k componentes es (1 - p)k entonces la probabilidad de al menos un componente defectuoso se 1 - (1 - p)k. El valor k buscado debe cumplir con 1 - (1 - p)k > 0.9 (1 - p)k < 0.1 k> . • Por ejemplo si la probabilidad de que un componente sea defectuoso es de 0.02 deberían producirse alrededor de 114 componentes para tener una probabilidad del 90% de que haya al menos uno defectuoso. I.11.- Cuando los eventos no son independientes y ocurren en forma sucesiva la ocurrencia de uno de ellos puede influir en la del otro. Este tipo de probabilidad se llama probabilidad condicional. Por ejemplo hay tres cajas c1, c2 y c3 tales que la caja c1 contiene 2 esferas azules y 2 rojas, la caja c2 contiene 3 esferas azules y 1 roja y la caja c3 contiene 2 esferas azules y 3 rojas. Si se va a extraer una esfera de una caja, esta esfera puede ser azul o roja; no obstante la probabilidad de que sea de uno u otro color depende de cual de las cajas se extrae esa esfera. De hecho los eventos B elegir una de las cajas y A extraer una bola azul de la caja seleccionada no son independientes. La probabilidad de que un evento A ocurra dado que un evento B ha ocurrido se llamará probabilidad condicional de A dado B. Se denotará por P[A\B]. Esta probabilidad se puede calcular recurriendo a la regla: (1.7) P[B \A] = Dos eventos A y B son independientes si se cumple: P[B \A] = P[B] y P[A \B] = P[A]. Una manera informal de darle alguna justificación a esta regla es la siguiente. Si en un espacio muestral conocemos de previo que ha ocurrido un evento, B, y queremos calcular la probabilidad de que ocurra otro evento A entonces, simplificando el cálculo de la probabilidad a la razón: total de casos que verifican el evento entre el total de casos, se tiene que como ya ha ocurrido B el espacio muestral ahora puede reducirse a B y los casos que verifican el evento ya no son los elementos de A sino los elementos de A B es decir: (1.8) . P[A \B] = Si A y B son eventos no necesariamente independientes se tiene: P[A ∩B] = P[A]P[A \B]. (1.9) Esta regla se generaliza en el siguiente sentido. Si A1, A2,..., An son eventos entonces la probabilidad de la ocurrencia del evento compuesto A1 y A2 y ... y An, es decir todos los eventos, cumple : P[A1 ∩A2∩... ∩An - 1 ∩An] = P[A1]P[A2 \A1]P[A3 \(A1 ∩A2)]...P[An \(A1 ∩A2∩... ∩An - 1)]. Ejemplo 4 Suponga que se lanzan un par de dados. Calcule la probabilidad de que ocurra cualquiera de los siguientes eventos. A : el primero de los dados cae impar, B : el segundo cae impar y C : la suma de ambas caras es impar. Solución No es difícil comprobar las siguientes probabilidades: P[A] = P[B] = P[A \B] = P[B \A] = P[C] = P[C \A] = P[C \B] = P[A ∩B ∩C] = 0 P[A]P[B]P[C] = Se tiene que los pares de eventos A, C y B, C son independientes, pero A, B y C no lo son. Ejemplo 5 Un carpintero tiene tornillos en dos cajas una azul y otra roja. Él toma al azar tonillos de cualquiera de las dos cajas, pero la caja azul está un poco más cerca por lo que toma tornillos de ella dos de cada tres veces. La caja azul contiene cuatro tornillos de 15 mm y cinco de 20 mm y la caja roja contiene seis de 15 mm y dos de 20 mm. 1. Si en las dos siguientes búsquedas de tornillo el carpintero toma un tornillo de cada caja cuál es la probabilidad de que ambos sean del mismo tipo. 2. Si el carpintero necesita dos tornillos y los toma en forma sucesiva de alguna de la cajas cuál es la probabilidad de que los dos sean del mismo tipo Solución 1. Sea A el evento: toma un tornillo de 15 mm de cada caja y B el evento: toma un tornillo de 20 mm de cada caja. El evento A no es simple de hecho, es el evento compuesto A1 A2 donde A1 es toma un tornillo de 15 mm de la caja 1 y A2 es toma un tornillo de 15 mm de la caja 2, eventos independientes. P[A] = P[A1 ∩A2] = P[A1]P[A2] = = . Similarmente. P[B] = = Como A y B son excluyentes la probabilidad pedida es: P[A B] = P[A] + P[B] = + = . 2. En este caso el evento pedido puede descomponerse como sigue. Sea M el evento toma los tornillos de la caja azul y N toma los tornillos de la caja roja. Sean P1 el primer tornillo es de 15 mm, P2 el segundo tornillo es de 15 mm, Q1 el primer tornillo es de 20 mm y Q2 el segundo tornillo es de 20 mm. La probabilidad buscada es: elegir de la caja azul y tomar 2 tornillos iguales o elegir de la caja roja y tomar 2 tornillos iguales P[{(P1∩ P2) U(Q1 ∩Q2)} ∩M} U{(P1 ∩P2) U(Q1 ∩Q2)} ∩N}] = P[M]P[{(P1 ∩P2) UQ1 ∩Q2}\ M] + P[N]P[{(P1 ∩P2) UQ1 ∩Q2} \N] = P[N]P[{(P1 ∩P2) UQ1 ∩Q2} \N] = + + + = . Ejemplo 6 El siguiente ejemplo resulta interesante porque además de ser un problema en cierta forma clásico de las probabilidades nos muestra que eventualmente nuestra intuición en probabilidades debe ser mucho más cautelosa. Nos referiremos al mismo como el problema de los cumpleaños y aparece en buena parte de los libros de probabilidad. Suponga que hay n estudiantes en un salón de clase, ninguno nacido en 29 de febrero, y que el año en el que estamos no es bisiesto. Por el principio del palomar cualquiera sabe que si n > 365, entonces al menos dos personas tienen la misma fecha de cumpleaños; en el sentido que cumplen el mismo día del mismo mes. Supongamos que 2 ≤n < 365, y demos respuesta a las preguntas siguientes: • Cuál es la probabilidad, C, de que al menos dos personas tengan la misma fecha de cumpleaños. • Cuál es el mínimo valor de n para que esta probabilidad sea mayor que 0.5. Solución Hay en total 365n posibilidades para que ocurran los cumpleaños de los n estudiantes. La probabilidad de que dos personas cumplan en la misma fecha es el complemento de que todos cumplan en días diferentes del año. Tomando 1 para el primero de enero y 365 para el 31 de diciembre se tiene que la probabilidad del evento E: ningún par de personas cumplan el mismo día es: P[E] = = 1- 1- 1- 1- La probabilidad solicitada es … ... 1- 1- . P[C]= 1- P[C] = 1 - 1- 1- 1- … 1- ... 1- . . 1- La segunda pregunta se responde resolviendo la desigualdad 1- 1- 1- 1- … 1- ≥ 0.5, 1- 1- ... 1- 0.5, por ejemplo se pueden tabular algunos valores y obtener la respuesta. n P[C] 15 0.253 25 0.568 30 0.706 40 0.891 I.12.- Si revisamos de nuevo el ejemplo del carpintero y los tornillos podemos notar como característica importante en ese experimento que está constituido de dos estados: Primero se debe elegir una caja y una vez hecho esto se debe sacar un tornillo de la misma. Hay algunas preguntas que plantearse respecto a este experimento que podrían resultar diferentes a lo que hemos explorado hasta ahora. Por ejemplo ¿Cuál es la probabilidad S de sacar un tornillo de 20 mm.? Si se sacó un tornillo de 20 mm., ¿cuál es la probabilidad de que se haya escogido de la caja azul? El esquema para abordar este par de preguntas nos permitirán iniciar el estudio de los temas probabilidad total y Teorema de Bayes, que son los últimos temas de este capítulo. Para resolver el primero de los dos problemas propuestos es importante tener en cuenta que hay dos alternativas para obtener un tornillo de 20 mm. A saber elegir en el primer estado la caja azul y sacar un tornillo de 20 mm o bien elegir en el primer estado la caja roja y sacar un tornillo de 20 mm. Si M es el evento toma el tornillo de la caja azul y N toma el tornillo de la caja roja. Y S es el tornillo es de 20 mm se tiene P[S] = P[(M ∩S) U(N ∩S)] = P[M ∩S] + P[N ∩S] = P[M]P[S\ M] + P[N]P[S\ N] + = + = Para resolver este tipo de problemas necesitamos establecer algunas definiciones y resultados importantes. Si A1, A2,..., An son eventos tales que: Aj = Φ siempre que i ≠ j. • Ai • P[Ai] > 0, i = 1, 2,..., n. Ai = • . Se dice que A1, A2,..., An forman una partición del espacio . Cuando un experimento consiste de la realización de dos etapas y es tal que la primera puede descomponerse en A1, A2,..., An eventos, entonces la ocurrencia de cualquier evento B en la segunda etapa sólo puede darse en forma conjunta con alguno de los eventos de la primera etapa. Es decir el evento B se descompone en la forma B = (B A1) (B A2) ...(B An). Si se tiene además que A1, A2,..., An forman una partición del espacio muestral en la primera etapa entonces los eventos en la descomposición anterior son independientes y obtenemos el siguiente teorema: P[B] = P[(B ∩ A1) U(B ∩A2)U...(B ∩An)] = P[B ∩A1] + P[B ∩A2] + ... + P[B ∩An] = P[A1]P[B \A1] + P[A2]P[B \A2] + ... + P[An]P[B \An] = P[Ai]P[B \Ai]. El segundo de los problemas planteados se resuelve haciendo uso de probabilidades condicionales, interesa conocer la probabilidad condicional siguiente: Si el resultado final de la elección es un tornillo de 20 mm., ¿cuál es la probabilidad de que se haya extraído de la caja azul? Utilizando la representación de eventos del primer ejemplo y utilizando la fórmula 1.7 y el teorema 3 obtenemos: P[M \ S] = = = Este tipo de deducciones propias de experimentos con dos estados y que implica el cálculo de la probabilidad de que ocurra algún conjunto de condiciones o circunstancias del primer estado dado que ocurre un evento del segundo estado se resuelven recurriendo al siguiente teorema, conocido como fórmula de Bayes: Ejemplo 7 Una caja A contiene tres bolas blancas y cuatro negras. Otra caja, B, contiene dos bolas blancas y tres negras. Se extraen bolas, una a una, en forma aleatoria y sin reemplazo. • Si las dos bolas son elegidas de A, ¿cuál es la probabilidad de que ambas sean negras? • Si se eligen dos bolas, una de cada caja, ¿cuál es la probabilidad de que no sean del mismo color? • Si se elige una caja al azar y se extraen dos bolas al azar, ¿cuál es la probabilidad de que sean del mismo color? • Si se elige una de las cajas al azar se extraen dos bolas y son de colores distintos, ¿cuál es la probabilidad de que se hayan extraído de la caja B? Solución • Si se saca la primer bola de la caja A y la segunda de la misma caja la probabilidad de que ambas sean negras es: • Una manera de hacerlo es por complemento, extraer dos bolas de distinto color es el complemento de extraerlas del mismo color. La probabilidad de extraerlas del mismo color es sacar la primera negra y la segunda negra o la primera blanca y la segunda blanca, por lo tanto la probabilidad pedida es: 1- 1- • + . El evento se descompone en elegir la caja A y extraer dos blancas o dos negras o bien elegir caja B y extraer dos blancas o dos negras. = = • + + + + + + + + + == + + = + + = La probabilidad C de extraer las dos bolas de igual color esta calculada para el caso anterior. P[B \C] = . = = Una aplicación interesante de la fórmula de Bayes tiene que ver con el análisis de confiabilidad de ciertos test realizados para detectar la presencia de enfermedades. El problema es básicamente el siguiente: Una persona puede sufrir de una enfermedad y se practica un test para saber si tiene o no la enfermedad. La exactitud del test se mide a través de dos valores probabilísticos. El primero de ellos se llama la sensibilidad, que es la probabilidad de que una persona que este enferma de positivo en el test. Р= P[TestPositivo \ EstaEnfermo]. El otro valor se llama especificidad y es la probabilidad de que una persona no enferma tenga un diagnóstico correcto. = P[TestNegativo \ NoEstaEnfermo]. Lo normal es que ambos valores sean muy cercanos a la unidad. Conociendo la incidencia de la enfermedad, sobre alguna población, se puede calcular la probabilidad de que una persona que haya dado positivo en el diagnóstico no sufra de la enfermedad. Si se sabe que en la población la probabilidad de que una persona elegida al azar este enferma es entonces usando las fórmulas de Bayes se tiene P[NoEstaEnfermo \TestPositivo] = = . Por ejemplo, [2], existe un test llamado ELISA que se utiliza para verificar sangre donada en una problación en la cual la probabilidad de que un individuo tenga los anticuerpos de SIDA es de 0.0001. Suponga que este test tiene una sensibilidad = 0.977 y una especificidad = 0.926. Por ejemplo la probabilidad de que una muestra que contenga los anticuerpos de un diagnóstico de que sí tiene los anticuerpos es: = 0.001319 Este test resulta deficiente, de hecho clasifica como positivos muchos casos que no tienen los anticuerpos. II.13.- Prácticamente todos los problemas de conteo que resolveremos se reducirán a la aplicación cuidadosa de los principios de conteo que se enuncian seguidamente. Principio 1 Regla de la Suma: Si una operación puede realizarse en n formas y otra operación, independiente de la primera, puede realizarse en m formas, hay n + m formas en las que pueden realizarse una de las dos operaciones En Terminología de teoría de conjuntos: Si ( i| 0 ≤i < j ≤n : Ai ∩Aj =Φ) Ai = | Ai|. (2.1) Principio 2 Regla del producto: Si una operación puede realizarse en n formas y otra operación, independiente de la primera, puede realizarse en m formas, hay nm formas en las que pueden realizarse las dos operaciones En Terminología de teoría de conjuntos: |A1×A2×...×An| = | Ai|. (2.2) Ejemplo 8 Para completar su plan de bachillerato un estudiante debe completar algunos cursos optativos. El Plan de estudios contempla 4 cursos de Inteligencia Artificial (IA), 3 cursos de Especificación Formal(EF) y 3 cursos de Sistemas Expertos(SE). De cuántas maneras puede el estudiante tomar los tres cursos si: 1. Debe llevar tres cursos optativos y no hay restricciones. 2. Debe llevar al menos un curso de cada área. 3. Debe llevar dos cursos de áreas distintas. Solución: 1. Al no haber restricciones el estudiante puede llevar el primer curso de 10 maneras, el segundo de 9 y el tercero de 8 maneras, así por (2.2) puede tomar sus cursos optativos en 10×9×8 maneras, si el orden en que los lleva se tiene en cuenta. Si el orden no importa este valor debe dividirse entre 6, ¿Porqué?. 2. Como debe llevar un curso de cada área, entonces puede llevar los tres cursos de 6×(4×3×3) formas. Si el orden es irrelevante son 4×3×3, Invitamos al lector a revisar esta tabla para que compruebe estos resultados. IA1, EF1, SE1 IA2, EF1, SE1 IA3, EF1, SE1 IA4, EF1, SE1 IA1, EF1, SE2 IA2, EF1, SE2 IA3, EF1, SE2 IA4, EF1, SE2 IA1, EF1, SE3 IA2, EF1, SE3 IA3, EF1, SE3 IA4, EF1, SE3 IA1, EF2, SE1 IA2, EF2, SE1 IA3, EF2, SE1 IA4, EF2, SE1 IA1, EF2, SE2 IA2, EF2, SE2 IA3, EF2, SE2 IA4, EF2, SE2 IA1, EF2, SE3 IA2, EF2, SE3 IA3, EF2, SE3 IA4, EF2, SE3 IA1, EF3, SE1 IA2, EF3, SE1 IA3, EF3, SE1 IA4, EF3, SE1 IA1, EF3, SE2 IA2, EF3, SE2 IA3, EF3, SE2 IA4, EF3, SE2 IA1, EF3, SE3 IA2, EF3, SE3 IA3, EF3, SE3 IA4, EF3, SE3 3. En este caso debe llevar una combinación IA,EF con 4×3 posibilidades o IA,SE con 4×3 o bien SE,EF con 3×3, en total 30 posibilidades, sin tomar en cuenta el orden, si fuera necesario considerar el orden, esta cantidad se duplicaría. II.14.- Permutaciones de un Conjunto Una permutación de los elementos de un conjunto es un ordenamiento lineal de sus elementos, por ejemplo si A = {a1, a2, a3} entonces las permutaciones de A son las siguientes: A1, a2, a3 A2, a1, a3 A3, a1, a2 a1, a3, a2 a2, a3, a1 a3, a2, a1 De manera similar una r -permutación de r elementos de un conjunto es un ordenamiento de r de los elementos del conjunto. Por ejemplo si A = {a1, a2, a3, a4} entonces las 2-permutaciones de A son: a1, a2 a1, a4 a2, a4 a2, a1 a4, a1 a4, a2 a1, a3 a2, a3 a3, a4 a3, a1 a3, a2 a4, a3 Para determinar el número de r -permutaciones de los elementos en un conjunto con n elementos se puede recurrir a la regla del producto. Esto pues el proceso de elegir r elementos en un orden específico puede reducirse a elegir un primer elemento entre n, luego elegir un segundo elemento entre los n - 1 que quedan, y así hasta elegir el r -ésimo elemento entre los n - r + 1 restantes. Luego por el principio del producto, (2.2), hay n(n - 1)(n - 2)...(n - r + 1) maneras de elegir r elementos en forma ordenada, de un conjunto con n elementos. Esto nos permite establecer el siguiente teorema: Este teorema merece una explicación especial en el caso de que r = 0. El número de 0-permutaciones, es decir arreglos ordenados con ningún elemento se toma como 1. Sólo hay una forma de elegir 0-permutaciones, no eligiendo ningún elemento. Este problema de las permutaciones tiene algunas variantes que se abordan a continuación. Considérese el problema de hacer una r -permutación de elementos dentro de una estructura que no necesariamente es un conjunto, por ejemplo una estructura que contenga elementos pero se admite que los elementos pueden aparecer más de una vez. Por ejemplo analizar cuántos anagramas, reordenamientos de las letras que forman una palabra, se pueden obtener de la palabra ama. Para resolver este tipo de problema lo más práctico es asumir que en realidad todos los elementos son distintos y realizar el conteo según el teorema 5, una vez hecho esto eliminar los casos que se hayan contado de más. Inicialmente ama tiene tres letras pero una es repetida. Podemos asumir que son tres letras: {a1, m, a2} y en ese casos los posibles anagramas son 6: a1ma2 a2a1m ma1a2 a1a2m a2ma1 ma2a1, No obstante, dado que a1 y a2 son en realidad la misma letra, todo anagrama está dos veces, así que el total posible debe dividirse por dos; y quedan tres anagramas. En general la solución de este tipo de problema es así. Si una estructura contiene r elementos repetidos, k1, k2,..., kr veces, respectivamente entonces para calcular el tipo de permutaciones distintas que se pueden construir primero se calcula el número de permutaciones asumiendo que todos los elementos son distintos, es decir (k1 + k2 + ... + kr)! permutaciones. Luego se procede a analizar y excluir los casos repetidos. Un elemento que aparezca kj veces ocupa kj posiciones dentro de la permutación, como se consideró que los kj elementos son diferentes entonces hay kj! posibles acomodos de esos elementos que se contaron como diferentes pero que en realidad corresponden con una única permutación; por lo tanto para eliminar los elementos contados de más producidos por este elemento el número total debe dividirse entre kj!, y así para cada uno de los elementos. Ejemplo 9 Se van a repartir 3 rosas, 5 dalias y 2 margaritas entre 10 señoras, determine el número de maneras de hacer esta distribución si cada señora debe recibir al menos una flor. Solución Como hay igual número de flores que de señoras cada una recibe una flor, y el problema se reduce a calcular el número de permutaciones posibles. El número de maneras de distribuir estas flores es = 2520. Otro tipo de problema de distribución relacionado con permutaciones tiene que ver con los posibles ordenamientos de r elementos que se pueden hacer de un conjunto de n elementos si se admite la repetición, en este caso el asunto se resuelve recurriendo a la regla del producto. El problema se reduce a elegir un elemento para la primera posición, para la segunda hasta llegar a la posición r. Como cada una de estas escogencias puede hacerse de n formas, se tiene el siguiente resultado Este mismo esquema permite resolver la distribución de k objetos distintos en n celdas, donde cada celda puede contener cualquier número de objetos. Esto pues al final de cuentas este problema se reduce a elegir una celda para poner el primer objeto, y luego elegir con posibilidad de repetición otra celda para el segundo y así hasta colocar todos los objetos. Note que los objetos, en este caso no llevan un orden particular en las celdas. Si el orden en el cual se distribuyen los objetos dentro de las celdas debe tenerse en cuenta entonces el total de maneras cambia. II.15.- A diferencia de una permutación, en la cual el orden es importante, en una r -combinación el orden de los elementos no es importante. Una r -combinación sobre un conjunto A con n elementos es un subconjunto de A con r elementos. Existe un relación directa entre permutaciones y combinaciones, de hecho cada r combinación da lugar a r! r -permutaciones. Como conocemos el número de rpermutaciones (teorema 5) entonces se tiene el siguiente teorema. Este último valor se conoce cono coeficiente binomial pues con alguna cantidad de esfuerzo es posible demostrar que: n (a + b) = n (a + b) = n-i i a b. (2.3) n-i i a b. Muchos problemas de conteo pueden resolverse recurriendo a problemas diferentes pero con la misma solución. Por ejemplo considere una estructura que solo tiene 2 elementos repetidos, uno k veces y el otro n - k veces. El número de permutaciones de los elementos en esta estructura es que es exactamente Esto en realidad no resulta complejo, pues hacer las permutaciones indicadas es equivalente al siguiente problema, dado el conjunto {1, 2,..., n} elegir subconjuntos de tamaño k que correpondan a las posiciones en donde se van a ubicar los k elementos Una última forma se discutirá en estas notas, no sin advertir que con las herramientas discutidas es posible abordar problemas diversos que no se han discutido en estas notas. II.16.- El problema de distribuir r objetos indistinguibles en n celdas, r n, con a lo sumo un objeto en cada celda es básicamente directo, ya que puede reducirse al problema de escoger r entre las n celdas, es decir . El problema de poner r objetos en n celdas donde no hay restricción en el número de objetos en cada celda es ligeramente diferente. Una manera de abordarlo que resulta sencilla es la siguiente: dados los r objetos, una manera de ubicarlos en las celdas es intercalar entre ellos n - 1 banderillas, los objetos antes de la primer banderilla, pueden ser ninguno, corresponden a la primera celda, los objetos entre la primera y segunda corresponden a los objetos en la segunda celda y así sucesivamente. En otras palabras el número de maneras de colocar r objetos indistinguibles en n celdas es: (2.4) Usando adecuadamente esta última forma se obtiene el siguiente teorema: Ejemplo 10 Si n personas se colocan aleatoriamente en n oficinas, ¿cuál es la probabilidad de que quede exactamente una oficina vacía? Solución El total de posibles ubicaciones de las n personas es nn, pero para que exactamente una oficina quede vacía el análisis debe ser cuidadoso. Se debe elegir una oficina para que quede vacía lo cual puede hacerse de n formas. Luego debe elegirse otra para que quede con dos personas; esta puede elegirse de n - 1 maneras. Una vez hecho esto se eligen dos personas para la segunda oficina y las restantes se ubican una en cada una de las n - 2 oficinas restantes. Luego la probabilidad pedida es: = = . Ejemplo 11 Si un arreglo binario de doce elementos contiene 8 unos y 4 ceros, ¿cuál es la probabilidad de que los cuatro ceros queden juntos? Solución Sólo hay 9 arreglos en los cuales los cuatro ceros quedan juntos, y el número de posibles arreglos es 12!/(4!8!), luego la probabilidad pedida es: Ejemplo 12 En un grupo de probabilidad hay inscritas n parejas (hombre, mujer) para hacer una tarea. El profesor decide separar todas las parejas y formar nuevamente n parejas, pero en forma totalmente aleatoria. ¿Cuál es la probabilidad de que se formen las mismas parejas originales? ¿Cuál es la probabilidad de que se formen sólo parejas (hombre, mujer)? Solución Para que se formen las mismas parejas originales solo se necesita calcular cuál es el número total de parejas que se pueden formar. Si se calcula este total de parejas como el número de permutaciones de las 2n personas se tiene un conteo redundante en los dos sentidos siguientes. Primero este conteo está tomando en cuenta el orden en que las n parejas quedan agrupadas y segundo este conteo está tomando en cuenta el orden en que se ubica cada pareja, por lo tanto el número de posibles parejas es La probabilidad solicitada en la primera parte es el inverso de este número. La segunda probabilidad pedida puede resolverse usando el mismo esquema anterior, y se puede razonar así. Si los hombres están fijos en las posiciones 1, 3, 5,..., las mujeres se pueden ubicar en n! formas lo cual da todas las posibles maneras de hacer parejas. Luego la probabilidad pedida es: = = . II.17.- Propiedades Importantes En esta sección se trata de rescatar algunas propiedades importantes acerca de conteo, algunas de las cosas que se expondrán resultarán reiterativas respecto a lo enunciado antes, cosa que no necesariamente es inconveniente. Este primer teorema es importante pues permite diferentes opciones para abordar el mismo tipo de problema = = = + + = Las demostraciones de estos resultados son un ejercicio interesante. Pueden verse en algunos de los textos citados como referencia [5]. III.18.- Es importante, antes de hablar sobre los tipos de distribución hacer un repaso de algunos términos que se utilizan con frecuencia en esta sección. Recordemos que llamamos espacio muestral al conjunto de todos los posibles resultados de un experimento. Un espacio muestral puede ser finito o infinito numerable, o puede ser continuo. Una variable aleatoria es una función de un espacio muestral a los reales, es decir una regla que asigna un único valor real a cada evento del espacio muestral. Si el espacio muestral es finito o discreto entonces la variable se llama variable aleatoria discreta y si es continuo se llama variable aleatoria continua. Una distribución de probabilidad es una función que permite asignar un valor de probabilidad a cada evento del espacio muestral de un experimento. Las distribuciones de probabilidad se dividen en dos casos acorde con las características de la variable aleatoria, discretas o continuas. III.19.- Definiciones Básicas La propiedad más importante de una variable aleatoria es la distribución de probabilidad. Si bien no existe una definición exacta de lo que es una distribución de probabilidad si hay consenso en las propiedades que debe cumplir. Si X es una variable aleatoria discreta con rango RX = {x1, x2, x3,...}, una distribución de probabilidad para X es una función, fX, del Rango(X) a los reales. , que cumple: fX : Rango(X) 1. fX(xi) ≥0, xi ЄRango(X), 2. fX(x) = 1. En general se aceptan ciertas convenciones de notación. Si X es una variable aleatoria y x es un número real se escribe: X = x, para referirse al evento {Є: ЄЄΩ^X(Є) = x}, similarmente se usa la notación X ≤x, para referirse al evento {Є: ЄЄΩ^X(Є) = x}, Si X es una variable aleatoria discreta se puede definir su función de distribución de probabilidad por: fX(x) = P[X = x]. (3.1) Ejemplo 13 Se tiene una caja que contiene 4 bolillas rojas y tres verdes y se empiezan a extraer bolillas, sin reemplazo, hasta obtener una bolilla roja. Sea X la variable aleatoria que indica el número de bolillas que se extraen, tenemos lo siguiente. El espacio muestral para el experimento es roja, verde - verde - verde - roja} Los valores que toma X son = {roja, verde - roja, verde - verde - Una distribución de probabilidad en este ejemplo, fundamentada en asumir que toda bolilla tiene la misma probabilidad de ser tomada, es: Una distribución de probabilidad asigna probabilidades a cada uno de los eventos simples del espacio muestral. Existe otro concepto importante que tiene que ver con el siguiente problema. Dado un espacio muestral , una variable aleatoria discreta definida sobre y un valor x, tiene sentido el calcular la probabilidad de que ocurra alguno de los valores que son menores o iguales a x. En el ejemplo anterior podrá resultar importante responder a cuál es la probabilidad de que haya que hacer dos o menos extracciones para obtener una bolilla roja. En este caso el valor solicitado es la probabilidad de que haya que hacer una o dos extracciones para obtener una bolilla roja. Aplicando el principio de la suma se obtiene que: P[X ≤ 2] = P[X = 1] + P[X = 2] = + Por ejemplo para el caso anterior se tiene que FX(x) cumple = . FX(x) = P[X ≤x] = Ejemplo 14 Se tira un dado que no está cargado, hasta que se obtenga un uno. Si denotamos por Z la ocurrencia de un uno y por W la no ocurrencia, el espacio muestral tiene la forma {Z, WZ, WWZ, WWWZ,...}. Si X es el número de lanzamientos los posibles valores para X son {1, 2, 3, 4...} y la función de probabilidad para X tiene la forma: fX(x) = Para el cálculo de de la función de densidad de masa debe calcularse el valor de: P[X ≤x] = De acuerdo a esta última función se tiene que la probabilidad de que se deban hacer 1,2 o 3 lanzamientos antes de obtener un 1 es de 0.4211 Las siguientes reglas se obtienen de manera directa de la definición 13 y de las propiedades de las probabilidades. P[a ≤ X ≤b] = F(b) - F(a), P[a ≤X < b] = F(b-) - F(a), P[a < X ≤b] = F(b) - F(a+). Como se ha dicho anteriormente una variable aleatoria es continua si cumple que al poder alcanzar cualquier par de valores a < b reales entonces puede alcanzar cualquier valor que esté en el intervalo [a, b]. En el caso de variables aleatorias continuas se tienen las siguientes definiciones: Si X es una variable aleatoria continua una distribución de probabilidad para X es una función fX que cumple las siguientes propiedades: 1. fX(x) ≥0 x. 2. Si a < b se tiene P[a ≤X ≤b] = fX(x) dx. 3. fX(x) dx=1. 4. FX(x)=P[X ≤x] = fX(t) dt. De acuerdo a esta definición se tiene que: (3.2) (3.3) P[a ≤X ≤b] = F(b) - F(a), P[X = b] = 0. Por ejemplo, si una variable aleatoria continua X tiene una distribución de probabilidad de la forma f (x; )= , se dice que la variable X sigue una distribución de tipo exponencial de parámetro . Además no es difícil demostrar que la distribución de probabilidad acumulada tiene la forma (3.4) F(x; )= , Ejemplo 15 El tiempo que tarda un persona en localizar un archivo en su escritorio sigue una distribución normal con parámetro = 2 minutos. La probabilidad de que en la próxima búsqueda dure menos de 3 minutos es F(3) = 1 - e-6 = 0.997. Mientras tanto, la probabilidad de que tarde entre 1.5 y 2.5 minutos es de F(2.5) - F(1.5) = 0.043. III.20.- Cada vez que se logre determinar una distribución existen dos mediciones asociadas con ella que son sumamente importantes: la media y la varianza. La media o esperanza, como se llama a veces, en alguna forma es una medida de localización de los datos, mientras la varianza es una medida de dispersión de los datos. En las distribuciones teóricas, este par de medidas las caracterizan en forma absoluta y en el caso de las distribuciones que no se ajusten a un patrón conocido constituyen el punto de partida para poder estudiarlas en forma adecuada. a. Si X es discreta con rango RX = {x1, x2, x3,...} se definen la media o esperanza de X por = xifX(xi), (3.5) con la condición de que | xi| fX(xi) < . b. Mientras si X es continua. = xfX(x) dx, (3.6) con la condición de que | x| fX(x) dx < La condición que se impone se conoce como convergencia absoluta [8] y se hace necesaria para evitar que el reordenamiento de las sumas pueda producir valores diferentes para la esperanza. De hecho en cada una de las definiciones que sea necesario se indicará. Note que la media, es una generalización del concepto de promedio aritmético. Por ejemplo si X es una variable aleatoria discreta tal que todos los valores en su rango tienen la misma probabilidad entonces: = En realidad la media o esperanza es un promedio ponderado y cuantifica el valor esperado para una variable aleatoria. Ejemplo 16 Sea X la variable aleatoria del ejemplo 13. En ese caso el valor de la esperanza es: = 1( ) + 2( ) + 3( ) + 4( )= , significa que en promedio deberán hacerse 2.27 intentos antes de obtener la bolilla roja. Por ejemplo para la distribución exponencial de parámetro , (3.2), usando un poco de integración por partes y regla de L'Hôpital, se tiene que: Existen ejemplos de variables aleatorias con distribuciones de probabilidad bien definidas y que no tienen media. Se invita al lector a verificar que si X es una variable aleatoria tal que fX(2k) = P[X = 2k] = 1/2k, k = 0, 1,... entonces la distribución de probabilidad está bien definida pero no existe la esperanza. Ejemplo 17 Un sistema de administración de oxígeno está formado por dos bombas idénticas. Estas bombas operan en forma independiente, y tienen una esperanza de funcionamiento continuo que es exponencial con media 20 horas. El sistema de bombeo falla solamente si ambas bombas fallan. Cuál es la probabilidad de que el sistema funcione durante 15 horas. Solución Como la media es 20 horas entonces el parámetro de la distribución es = 1/20. Acorde con (3.4) la probabilidad de que una bomba falle antes de las 15 horas es 1 - e-15/20, así que la probabilidad de que el sistema falle antes de las 15 horas es P[X ≤15] = (1 - e-15/20)2 y la probabilidad de que el sistema trabaje en forma continua por más 15 horas es de 1 - P[X ≤15] = 1 - (1 - e-15/20)2. También es posible calcular la esperanza de una función aplicada a los valores de la variable aleatoria. a. Si X es discreta (X) = (3.7) h(xi)fX(xi), con la condición de que | h(xi)| fX(xi) < . Mientras que para X continua se tiene = (3.8) h(x)fX(x) dx, con la condición de que | h(xi)| fX(xi) dx < . Para calcular la varianza de una variable aleatoria se necesita antes conocer la media de X. a. Si X es discreta: = = )2fX(xi), (xi - (3.9) b. Si es continua = = )2fX(x)dx, (xi - (3.10) Invitamos al lector a verificar en la tabla adjunta posibles distribuciones de probabilidad discretas y analizar los valores de la esperanza y de la varianza. En esta tabla puede introducir valores para la variable y las probabilidades respectivas y ver el comportamiento de la media y la varianza. La siguiente es una propiedad importante de la varianza. Según la definición de esperanza, en el caso discreto se tiene = = (xi - )2fX(xi) = (xi2 - 2xi + xi2fX(xi) - = )fX(xi) 2xi fX(xi) + ( )2fX(xi) = xi2fX(xi) – 2 = -2 xifX(xi) + + = fX(xi) -( )2. De hecho no es difícil verificar que esta propiedad también se cumple en el caso continuo. Se llamará momento de orden k a la esperanza de Xk. Es decir el momento de orden k para la variable aleatoria discreta X es E(Xk) = xikfX(xi), mientras que para una continua es E(Xk) = xkfX(x) dx. Ejemplo 18 Sea X una variable aleatoria continua con distribución de probabilidad dada por f (x) = 1. Determine el valor de k. 2. Calcule P([- 2 < X ≤ 5]). 3. Calcule VAR(X). Solución 1. Dado que 2. 3. Finalizamos esta sección enunciando un teorema que resume las propiedades fundamentales de la esperanza. 1. El valor esperado de una variable aleatoria constante es la misma constante. = c. 2. El valor esperado de una variable aleatoria multiplicada por una constante es la constante por el valor esperado de la variable. = c. 3. El valor esperado de una suma de dos variables aleatorias es la suma de los valores esperados de las variables. = + . Las pruebas de las dos primeras propiedades son bastante sencillas, y para demostrar la tercera se requiere estudiar algunos conceptos que no se han explorado hasta ahora. El lector interesado en la justificación de estos resultados puede consultar [2]. las siguientes afirmaciones. 1. La varianza de una variable aleatoria constante es cero. VAR(c) = 0. 2. La varianza de una variable aleatoria multiplicada por una constante es la constante por la varianza de la variable. VAR(cX) = c2VAR(X). 3. La varianza de una suma de dos variables aleatorias es la suma de las varianzas de las variables. VAR(X+Y) = VAR(X) + VAR(Y). Nuevamente la demostración de los apartados (1.) y (2.) es bastante directa a partir de la definición y la demostración de (3.) es un poco más delicada. El lector interesado puede verla en [2]. III.21.- Si X es una variable aleatoria se llama función generadora de momentos a la esperanza de etX y se denota por mX(t) mX(t) = E(etX). (3.11) Las siguientes líneas ayudarán a entender el porqué de este nombre. Supongamos que X es una variable aleatoria que toma valores 0, 1, 2,..., entonces mX(t) = E(etX) = etxifX(xi) = = (txi)k/k! fX(xi) tkxik/k! fX(xi) = xifX(xi) = E(Xk). Esta deducción utiliza una propiedad importante de las sumatorias que en general no es válida y es el intercambio de las sumatorias que se hace. Si el lector es paciente puede expandir cada una de las sumas y verificar que es posible el reordenamiento practicado. Como notará esta última serie tiene como parte de sus coeficientes los momentos de orden k, de hecho es bastante sencillo demostrar el siguiente lema Si X es una variable aleatoria con función generadora de momentos mX(t) se tiene que m(n)X(0) = E(Xn). (3.12) Es decir si tenemos la función generadora de momentos basta con derivarla n veces y evaluar en 0 para obtener el momento de orden n. IV.22.- Existen diversos experimentos para los cuales el espacio muestral solamente admite dos valores, pueden ser cualitativos, se cumple o no se cumple alguna condición o cuantitativos 0 o 1. No hay diferencia y para efectos de la distribución basta con que los consideremos como éxito y fallo, con valores asignados de 1 y 0, respectivamente. Cuando un experimento como éste se ejecuta una sola vez se dice que es un ensayo tipo Bernoulli, la variable aleatoria solo toma dos valores que corresponden con X(éxito) = 1 y X(fallo) = 0 y la distribución de probabilidad también es bastante simplificada con valores fX(1) = p, y fX(0) = 1 - p. Dado un experimento que consiste de una secuencia de n ensayos independientes tipo Bernoulli, donde la probabilidad, p, de éxito no cambia entre ensayo y ensayo del experimento. Si la variable aleatoria que interesa cuantificar es el número de éxitos en los n ensayos, la variable recibe el nombre de Binomial. Por ejemplo se lanza una moneda el aire en 8 ocasiones y se toma como variable aleatoria el número de veces que cae corona, o se registran los próximos 100 nacimientos en un hospital y se toma como variable aleatoria el número de mujeres que nacen. En una variable binomial se tienen por parámetros la probabilidad de éxito en cada ensayo, p, y el total de ejecuciones, n, y como variable aleatoria X, el número de éxitos digamos x. La distribución de probabilidad la denotaremos por b(x;n, p). Para la distribución de probabilidad acumulada usamos la notación B(x;n, p). La demostración de la primera de las aseveraciones hechas en el teorema resulta directa, pues puede haber desde ninguno hasta, a lo sumo, n éxitos. La segunda parte resulta de que la ocurrencia de exactamente x éxitos es la conjunción de que en x cualesquiera de los ensayos ocurra éxito y en los n - x restantes ocurra fallo, de acuerdo con la ley del producto la probabilidad es de px(1 - p)n - x. Como no importa cuales x de los ensayos resulten en éxito entonces debe de contarse todas las posibles maneras de elegir x ensayos entre los n. La tercera parte es simplemente una adaptación de la definición de la función de probabilidad acumulada. Vale la pena destacar que este tipo de cálculos es bastante laborioso, no obstante se dispone de tablas que resumen algunos de los valores más frecuentes. Mejor aún en la versión electrónica de estas notas se da una barra de herramientas que permiten realizar en forma directa los cálculos, que involucren binomiales. Ejemplo 19 Veinte palomas vuelan hacia 3 nidos. Cada una de ellas se ubicará en forma aleatoria en alguno de los nidos, además una paloma se ubica en forma independiente de lo que hicieron o harán las otras. Calcule las siguientes probabilidades. 1. Exactamente 4 palomas se ubican en el primer nido. 2. A lo sumo cuatro palomas se ubican en el primer nido. 3. Al menos cuatro palomas se ubican en el primer nido. Solución Dadas las condiciones indicadas, el arribo de cada paloma a algún nido es un ensayo de Bernoulli donde éxito es que la paloma se ubique en el nido 1 y fracaso es que no lo haga. La probabilidad de éxito es 1/3 y la variable aleatoria que indica el número de palomas que quedan ubicadas en el primer nido sigue una distribución tipo binomial: b(x;20, 1/3), y las respuestas a los problemas son 1. P[X = 4] = b(4;20, 1/3). 2. A lo sumo cuatro palomas significa ninguna, una, dos, tres o cuatro es decir: b(0;20, 1/3) + b(1;20, 1/3) + b(2;20, 1/3) + b(3;20, 1/3) + b(4;20, 1/3), por lo tanto: P[X ≤ 4] = B(4;20, 1/3). 3. Al menos cuatro puede verse como el complemento de a lo sumo tres, por tanto la la respuesta es 1 - P[X ≤3]=1-B(4;20, 1/3). Ejemplo 20 Suponga que el 20 por ciento de los componentes fabricados por una planta no pasan un control de calidad. Cuál es la probabilidad de que en una muestra de 15 componentes consecutivos a lo sumo 8 no pasen la prueba. Solución Este es un experimento de tipo binomial, que tiene 15 repeticiones del mismo experimento, con una probabilidad de éxito de 0.2. Si Y es la variable aleatoria que indica el número de componentes defectuosos, interesa calcular el valor de la expresión: P[Y ≤8] = (0.2)k(0.8)15 - k = B(8;15, 0.2), recurriendo a tablas o a la barra de herramientas se obtiene que la probabilidad del evento indicado es 0.9992. Sobre ese mismo ejemplo: • La probabilidad que exactamente 8 componentes no pasen la prueba: b(8, 15, 0.2) = B(8, 15, 0.2) - B(7, 15, 0.2) = 0.9992 - 0.9958. • la probabilidad que fallen al menos 8 es: P[Y ≥8] = 1 - P[Y ≤7] = 1 - B(7, 15.0.2) = 1 - 0.9958. Algunas veces se acepta que un experimento se porta como un binomial, aunque cumpla en forma parcial las reglas citadas en la definición. Por ejemplo en problemas de elección sin reposición la probabilidad de cada experimento está influenciada por los resultados de los anteriores. No obstante cuando el número de intentos es relativamente pequeño respecto al espacio muestral el comportamiento de la variable aleatoria puede aproximarse como si fuera binomial. Ejemplo 21 Suponga que en una ciudad viven un millón de personas de los cuales sólo 800000 son nativos de la ciudad. Si se toma una muestra de 10 ciudadanos al azar cual es la probabilidad de que a lo sumo dos de ellos no sean nativos. Solución Si bien la secuencia de 10 experimentos consecutivos de escoger un ciudadano y que no sea nativo tienen probabilidades diferentes también es cierto que estas probabilidades prácticamente son iguales, en un caso como este podemos asumir que el comportamiento de la variable aleatoria Y que indica el número de no nativos en la muestra se aproxima por una binomial. Así la probabilidad solicitada es: P[Y (0.2)k(0.8)10 - k = B(2;10, 0.2), 2] = recurriendo a tablas se obtiene que la probabilidad del evento indicado es 0.6778. IV.23.- Si una variable X es Bernoulli entonces la media se puede calcular en forma muy sencilla pues. = 0(1 - p) + 1(p) = p, mientras que la varianza es: VAR(X) = (0 - p)2(1 - p) + (1 - p)2p = p(1 - p). Si una variable es binomial de parámetros n, p entonces X puede verse como una secuencia de ensayos de Bernoulli es decir X = Y1 + ... + Yn. Para calcular su media y su varianza puede recurrirse a los teoremas (12) y (13) para obtener el siguiente teorema. Este último resultado también se puede obtener recurriendo a la definición de la media. Se invita al lector a tratar de deducir la media para una binomial a partir de la definición y del uso del teorema (11) y de (2.3). IV.24.- Una variable aleatoria X se dice que sigue una distribución de Poisson con parámetro > 0 si su rango es el conjunto 0, 1, 2,..., y la distribución de probabilidad está dada por: P[X = x] = p(x ;) = para x = 0, 1, 2,.... En general la descripción de un proceso de Poisson no es necesariamente sencilla, en [5] puede encontrarse una discusión simplificada. Ejemplo 22 Dado que p(x; )≥ 0 y recurriendo a la expresión: ex = (4.1) se obtiene que con lo cual p(x; ) cumple con las propiedades para ser una distribución. La herramienta adjunta permite realizar los cálculos relacionados con la distribución Poisson. Ejemplo 23 Las consultas arriban a un servidor siguiendo una distribución de Poisson con 12 consultas por minuto. 1. ¿Cuál es la probabilidad de que el intervalo de tiempo entre las dos próximas consultas sea menor o igual a 7.5 segundos? 2. ¿Cuál es la probabilidad de que el intervalo de tiempo entre las dos próximas consultas sea mayor a 10 segundos? Solución 1. Si en 60 seg. arriban 12 consultas entonces en 7.5 segundos arriban 1.5 consultas, por lo tanto el número de llamadas, X, que llegan en 7.5 segundos sigue una distribución de Poisson p(x;1.5). La probabilidad de que después del arribo de una consulta pasen menos de 7.5 segundos antes del arribo de la siguiente debe verse como la probabilidad de que en 7.5 segundos llegue al menos una consulta. P([X > 0]) = 1 - P([X = 0]) = 1 - p(0, 1.5) = 1 - = 1 - e-1.5. 2. Por argumentos similares al caso anterior se tiene que la probabilidad solicitada es: p(0, 2). Para una distribución de Poisson se tiene que la esperanza es Para calcular la varianza de una distribución de Poisson es mejor utilizar la función generadora de momentos. La función generadora de momentos para una Poisson de parámetro recurriendo a la expresión 3.11. se calcula Derivando dos veces y evaluando en cero, lema (2), se obtiene que E[X2] = que unido al lema (1) permite obtener que la varianza de una Poisson de parámetro es . - IV.25.- Los tipos de aplicaciones en los cuales la distribución es hipergeométrica son muy similares a aquellos donde se aplica la binomial. Una manera de entender la diferencia entre ambas es analizando el esquema con que se lleva a cabo el muestreo. Mientras que en la distribución binomial el muestreo se realiza con reemplazo de cada artículo, después de observarse, en la hipergeométrica el muestreo se lleva a cabo sin reemplazo. Por ejemplo de un naipe se desea extraer una muestra de 5 cartas y calcular la probabilidad de obtener 3 cartas rojas. En este caso se deben muestrear 5 objetos, para cada objeto se considera como éxito el hecho que la carta sea roja y como fracaso que sea negra, hay 26 éxitos en la población, toda muestra de 5 cartas tiene la misma probabilidad de ser elegida. El conjunto de valores posibles x para la variable aleatoria en un experimento hipergeométrico está restringido por dos condiciones importantes, la primera de ellas es que en la muestra puede haber a lo sumo min{n, M} éxitos mientras que al menos hay max{0, n - (N - M)} éxitos. La distribución de probabilidad h(x;n, M, N) depende de: • el tamaño de la muestra n, • el tamaño del conjunto sobre el cual se toman los objetos N, • y el número de éxitos, M, en el conjunto sobre el que se hace el muestreo. El cálculo de la distribución de probabilidad para un valor x de los posibles de la variable aleatoria se puede hacer de manera simple pues la probabilidad P[X = x] puede reducirse a un problema de conteo. Se eligen x de los M éxitos y se eligen n - x de los N - M que no son éxitos, y se divide entre el total de posibles maneras de escoger los x elementos de los N. Esto conduce a la expresión: . h(x;n, M, N) = (4.2) Los cálculos que se necesitan para la distribución hipergeométrica se pueden hacer recurriendo a la herramienta adjunta. Ejemplo 24 Un equipo de trabajo de 5 personas se va a seleccionar de entre cinco hombres y tres mujeres. Si la variable aleatoria es el número de hombres en el equipo, ¿cuál es la distribución de probabilidad asociada? Solución Los posibles valores de esta variable aleatoria son 2, 3, 4 y 5 y las probabilidades son: h(x;5, 5, 8) = , El lector puede verificar que la media para esta distribución es 176/56. Ejemplo 25 De una población de 500 animales se capturan 200, se marcan y se sueltan para que vuelvan a mezclarse con el resto de la población. La probabilidad de que en una muestra de 20 animales capturados o recapturados haya 4 o menos marcados se puede calcular por Mientras tanto la probabilidad de que aparezcan 3 o más animales marcados en una captura o recaptura de 20 es: 1V.26.- En general las distribuciones de probabilidad son herramientas muy necesarias en el estudio de problemas probabilísticos y estadísticos. Entre las distribuciones de probabilidad continuas, la distribución normal, es la más utilizada y la más importante. Muchas mediciones dentro de poblaciones siguen distribuciones normales y en casos donde poblaciones no distribuyen normalmente, es común que ciertos promedios y ciertos valores acumulados se distribuyan en forma normal, esta última observación se conoce como el teorema del límite central. En términos muy simples, una población sigue una distribución normal respecto a alguna medición cuando el grueso de los valores de la población se distribuyen cerca de la media y existe cierta simetría en la forma en que se distribuyen los datos alrededor de la media. En términos matemáticos la definición es la siguiente: Se puede demostrar que la media de esta distribución es . y la desviación es En las siguientes aplicaciones usted puede explorar la forma de las gráficas de distribuciones normales. Se puede variar la media y la desviación estándar para analizar distintos casos. Además la distribución de probabilidad acumulada es decir, P[X ≤ x] se calcula por la integral: FX(x) = P[X ≤x] = dt e Para efectos operacionales, las distribuciones normales son difíciles pues los cálculos que deben hacerse son complejos. Entre las normales, la distribución más importante es la que se llama normal estándar, una normal cuya media es 0 y cuya desviación estándar es 1. De hecho en estas mismas notas veremos que toda probabilidad que implique la distribución normal puede reducirse a una en que se utilice la normal estándar. Y en este caso el cálculo de la distribución de probabilidad acumulada es, Φ(x) = P[X ≤ x] = e dt. La última expresión es una variante de una función que se conoce como la función error erf(x), [1], y solo hay formas numéricas de aproximar sus valores [3,2]. Los valores de la función (x) se pueden obtener en tablas que aparecen en libros de probabilidades o bien utilizando la herramienta provista en estas notas. V.27.- Como la función de distribución de probabilidad es simétrica, y además el área total acumulada, sobre toda la recta real es 1, entonces para cualquier x real se obtiene la siguiente propiedad: (5.1) Φ(x) + Φ(- x) = 1, Para finalizar este corto recorrido por la distribución normal invitamos al lector a seguir cuidadosamente las siguientes líneas. Si X sigue una distribución normal con parámetros y entonces si aplicamos el cambio de variable = a la integral en P[X ≤ x] = dt, e obtenemos P[X ≤ x] = e dt = Φ ( ). Ejemplo 26 Las notas finales de un curso se distribuyen en forma normal con una media de 75 y una desviación estándar de 10. Si la nota de aprobación es de 70 que porcentaje de los estudiantes aprobarán el curso. Solución: Primero se debe notar que la afirmación de que las notas siguen una distribución normal debe entenderse en el sentido aproximado. El porcentaje solicitado puede obtenerse al encontrar el valor P[X ≥ 70]. Dadas las propiedades de las distribuciones de probabilidad se tiene que P[X ≥ 70] = 1 - P[X ≤70] = 1 - Φ ( ) = 1 - 0.6915 = 0.3085. Ejemplo 27 La distribución de peso de ciertos bultos de papel para reciclaje es normal con media de 50 kilos y desviación estándar de 10 kilos. La persona que transporta los paquetes cobra 100 colones por bulto pero desea imponer un peso máximo después del cual cobrar un recargo. Cuál debería ser ese peso para que los bultos tengan una probabilidad inferior al 10% de pagar tal recargo. Solución Hay dos aspectos importantes que se deben notar; el primero de ellos es que si X es la variable aleatoria para el peso de cada paquete lo que se debe encontrar es un valor r tal que: P[X ≥ r] > 0.1, lo que se reduce a encontrar un r que cumpla con: P[X ≤ r] ≤ 0.9, El problema es inverso en el sentido de que no se busca una probabilidad, sino un valor que permita obtener cierta probabilidad. El segundo aspecto que debe tenerse en cuenta es que para poder utilizar las barras de cálculo de que se dispone en estas notas o las tablas, la distribución de normalizarse en el sentido de 18. La siguiente herramienta permite resolver el problema indicado, a saber si se tiene una probabilidad p encontrar el valor r tal que P[X ≤r] = p. Uniendo ese par de observaciones se debe resolver: P[ ≤ ] ≤ 0.9. Utilizando en barra de asistencia la herramienta normal inversa se obtiene la ecuación: = 1.286, de donde r = 62.86. V.28.- Muchas veces, aún cuando una variable aleatoria no siga una distribución normal es posible que su comportamiento pueda ser modelado con distribuciones que siguen comportamientos similares a una normal pero de manera sesgada. Antes de poder estudiar este tipo de distribuciones se hace necesario definir una función sumamente importante en el estudio de diversos problemas en matemática. Por Ejemplo: Otra propiedad importante se obtiene de aplicar a dx y u = e-x, para obtener: ( +1) las partes dv=x Con un poco de paciencia y regla de L'Hopital se puede demostrar que el primer límite en la última expresión es 0 mientras que la segunda integral es ( ). Con esto la función gamma cumple con la propiedad allí si n es entero (n) = (n - 1)!. ( + 1) = ( ) ( ) y de También, usando algunos argumentos de cálculo en varias variables se puede calcular que ( )= . Aparte de un reducido número de argumentos el cálculo de valores de la función gamma debe hacerse utilizando métodos numéricos [3,1]. Para hacer estos cálculos se provee una herramienta, que ha sido programada acorde con [9]. El parámetro puede verse como un parámetro de forma pues su modificación altera la forma de la distribución mientras que funciona como un parámetro de escala. Invitamos al lector que revise la versión electrónica de estas notas a utilizar el graficador para distribuciones gamma y verificar algunas de las formas variando los parámetros. Si en una distribución gamma estándar. = 1 se dice que es una distribución gamma Para una variable aleatoria continua, X, con distribución de probabilidad gamma de parámetros y , aplicando un cambio de variable u = y / se tiene que la función de distribución de probabilidad para X cumple: dy P([X ≤x]) = du = = F(x / (5.2) ; ) Esta última función se conoce como la función gamma incompleta. • E[X] = • Var[X] = Ejemplo 28 Suponga que el tiempo de reacción para iniciar el frenado ante una emergencia, en la población de cierta edad sigue una distribución Gamma con media de .5 segundo y varianza de .1 segundo cuadrado. Solución Dado que la esperanza es .5 y la varianza .1 se obtiene que = 5/2 y = 1/5 En ese caso, si quisiéramos calcular la probabilidad de que la respuesta de frenado en una situación de emergencia sea inferior a .72 segundos usando la expresión (5.2) se tiene que P[X ≤ 7.2] = F(.72/.2, 2.5) = F(3.6, 2.5) Ejemplo 29 Suponga que el tiempo utilizado por una persona preparando un tipo particular de informe sigue una distribución gamma con media de 20 minutos y varianza 80 minutos cuadrados. Aplicando el teorema (19) se obtiene que =5y =4 Para determinar la probabilidad de que una persona elegida al azar tarde menos de 24 minutos preparando el informe debe resolverse P[X ≤ 24] = F(24/4, 5) = F(6, 5) = 0.715 V.29.- La distribución de probabilidad exponencial En realidad la distribución exponencial es un caso especial de la distribución gamma. Ya se ha abordado antes algunos aspectos relativos a la distribución exponencial. • E[X] = • Var[X] = La primera afirmación en este teorema ya ha sido demostrada en la sección 3.3 y la segunda parte se deja como ejercicio para el lector. VI.30.- Si X es una variable aleatoria discreta con rango RX entonces es sencillo deducir la siguiente secuencia de desigualdades: E(X) = xP[X = x] xP[X = x] + xP[X = x] = ≥ xP[X = x] ≥ xP[X = x] = tP[X ≥ t] Este análisis, que se puede hacer en forma equivalente para distribuciones continuas da lugar al siguiente teorema conocido como la desigualdad de Markov [2]. P[X ≥ t] ≤ (6.1) Esta desigualdad permite hacer aproximaciones vagas acerca del comportamiento de variables aleatorias tomando en cuenta únicamente la esperanza. Veamos el siguiente ejemplo. Ejemplo 30 En una caja hay 10 bolillas rojas y 6 negras. Se extraen con remplazo 8 bolillas y se registra el número de bolillas rojas extraídas. X sigue una distribución binomial b(x;8, 10/16) y usando la herramienta para binomiales, es simple verificar por ejemplo que P[X ≥6] = 1 - P[X ≤ 5] = 0.3697. Utilizando la desigualdad de Markov se obtiene que P[X ≥ 6] ≤ 5/6 = 0, 8333. Comparando estos dos valores nos damos cuenta que la cota que se obtiene por la desigualdad de Markov no necesariamente es buena. Es importante notar que si en la desigualdad (6.1) utilizamos t = n P[X ≥ n obtenemos ]≤ Es decir la probabilidad de que los valores de una variable aleatoria estén a más de n veces la media es menor a 1/n. Si además de la media o esperanza se conoce la varianza entonces existe la posibilidad de hacer acotaciones con un poco más de precisión. Supongamos que X es una variable aleatoria con esperanza y varianza Si consideramos la 2 variable aleatoria (X ) , aplicando la desigualdad de Markov a esta variable, cuya esperanza es precisamente (3.9), se obtiene P[(X - )2 ≥ t2] ≤ Dado que [(X )2 ≥ t2es equivalente a | X conocido como la desigualdad de Chebyshev. | ≥ t se obtiene el teorema (6.2) P[| X - )| t] La desigualdad de Chebyshev permite acotar la probabilidad de que los valores de la distribución queden alrededor de la media. Estas aproximaciones no necesariamente son buenas, no obstante mejorar los resultados que se pueden obtener con esta desigualdad implicaría restringir mucho las hipótesis iniciales, como se verá en un ejemplo posterior. Ejemplo 31 Una persona puede digitar un texto en un tiempo que sigue una distribución con media 50 minutos y desviación 10 minutos. Para estimar una cota para la probabilidad de que esta persona tarde entre 30 y 50 minutos se puede recurrir a la desigualdad de Chebyshev y se obtiene P[30 ≤ T ≤ 70] = 1 - P[| X - 50| ≥ 20] ≥ 1 - = Aún cuando este tipo de estimaciones pueden resultar innecesarias cuando se dispone de la distribución de probabilidad el ejemplo siguiente sirve para comparar los resultados que se obtienen usando la de la desigualdad (6.2). Ejemplo 32 El tiempo que tarda un computador en resolver un problema sigue una distribución exponencial con media 2 minutos. Para estimar la probabilidad que el tiempo de solución de un problema al azar esté entre 0 y 6 minutos si utilizamos la desigualdad de Chebyshev obtenemos P[0 ≤ T ≤ 6] = 1 - P[| X - 2| ≥ 4] ≥ 1 - = .75 Es decir con la desigualdad de Chebyshev obtenemos que la probabilidad de que el tiempo esté entre 0 y 6 minutos es superior a 0.75. Si usamos la distribución en forma directa obtenemos que: dx = 1 - e-3 = 0.95 P[0 ≤ T ≤ 6] = Lo que nos indica que las cotas que se obtienen de la desigualdad de Chebyshev pueden no ser muy buenas, no obstante como veremos no es tan fácil mejorar las cotas que se obtienen con esta desigualdad sin imponer restricciones adicionales. El siguiente ejemplo, [2], es ilustrativo en ese sentido. Ejemplo 33 Sea X una variable aleatoria discreta cuya distribución de probabilidad se da en la siguiente tabla: x1 = - 2 x2 = 0 x3 = 2 P[X = x1] = 1/8 P[X = x2] = 3/4 P[X = x3] = 1/8 Es muy sencillo verificar que E[X] = 0 y que VAR[X] = 1 Si aplicamos la desigualdad de Chebyshev obtenemos que P[| X - | ≥ 2] ≤ que en este coincide con el valor pues P[| X - | ≥ 2] = P[X = 2] + P[X = - 2] = + = Este ejemplo indica que aún cuando las cotas obtenidas de la desigualdad (6.2) no siempre son buenas a veces son exactas. VI.31.- Para poner en contexto las implicaciones de este teorema es importante revisar las siguientes observaciones. Dado un experimento con espacio muestral , para un evento se ha indicado que si se hacen n repeticiones del experimento y se nota que en esas n repeticiones del experimento ocurren (n) veces el evento , intuitivamente se define la probabilidad del evento por P[ ]= . Sin embargo, como ya hemos apuntado antes esta definición deja abiertas una serie de preguntas. Por ejemplo si aceptamos definir la probabilidad como el valor límite de estos cocientes entonces la definición se complica. Primero que todo, qué garantiza que ese límite existe, segundo esta definición no es operacional en el sentido de que no es posible repetir infinitamente tal experimento. Estudiaremos la ley de los grandes números que nos ayudará a precisar un poco mejor el sentido de P[ (6.3) ]= Simplificando un poco el problema, cada una de las repeticiones del experimento que se realicen en el contexto citado puede verse como un ensayo de Bernoulli donde el éxito coincide con la ocurrencia de . Así el número de éxitos X en los n ensayos del experimento es una variable aleatoria binomial en la cual la probabilidad de éxito es un valor desconocido p. Para esta variable sabemos que la media es np y la varianza es np(1 - p) (teorema 15). Si consideramos la variable aleatoria Y = X / n es muy sencillo demostrar que la esperanza de Y es np/n = p y que la varianza es (np(1 - p))/n2 = p(1 - p)/n. Aplicando la desigualdad de Chebyshev a Y con t = P -p P -p obtenemos: (6.4) . Es decir el límite (6.3) existe o dicho en palabras algo más simples dada cualquier precisión se puede encontrar un valor n de manera que el cociente éxitos entre el total de ensayos esté tan cerca del valor p desconocido como queramos. En cierta forma esta última desigualdad da legitimidad al proceso estadístico que se ha citado en la definición (10), pues garantiza que el proceso descrito en esta definición en realidad converge al valor de la probabilidad del evento. Por supuesto que no resuelve en forma simple el problema operacional de saber cuál debe ser el número de repeticiones del experimento necesarias para obtener aproximaciones precisas de la probabilidad buscada. Se puede utilizar la desigualdad de Chebyshev para obtener aproximaciones del valor de n pero el teorema del límite central, que abordaremos en la sección siguiente será de mayor utilidad en ese sentido. Las conclusiones que se han obtenido hasta ahora se resumen en el siguiente teorema conocido como una forma débil de la ley de los grandes números [2]. (6.5) P - P[ ] = 0. Paralela a la la forma débil de la ley de los grandes números existe una generalización que se llama la Ley de los grandes Números cuya justificación está fuera de los objetivos de este curso [6] y se enuncia en el siguiente teorema: (6.6) P - ] = 0. Dicho en otras palabras la probabilidad de que el promedio Sn/n difiera de la esperanza menos que un cualquiera, tiende a uno. VI.32.- El último teorema de la sección previa es generalizado por otro teorema cuya importancia en aplicaciones de la probabilidad y estadística es mucho mayor. El teorema del límite central se enuncia seguidamente: P Donde x≤ ≤y (6.7) = Φ (y) - Φ (x). (z) es la distribución normal estándar. La importancia de este teorema es enorme, en especial porque no tiene ninguna condición especial sobre el tipo de distribución al que se aplica. Puede ser continua o discreta, no importa como sean, en promedio la suma de estas variables se distribuyen como una normal con media n y varianza n . Este teorema también es válido para la variable aleatoria = Sn/n para la que, si n se hace grande, distribuye como una normal de media y varianza /n. Para explorar mejor el valor de este teorema se presenta la siguiente aplicación que permite partir de una distribución de datos cualquiera y analizar la distribución de probabilidad de los posibles promedios de muestras sobre la distribución original. VI.33.- El teorema del límite central tiene una implicación adicional que también resulta sorprendente. Si Sn sigue una distribución binomial de parámetros n y p entonces si x y y son enteros no negativos tales que x < y, según el teorema del límite central se tiene que si n es suficientemente grande se cumple. P [x ≤ Sn ≤ y ] → Φ P x Sn -Φ (6.8) - y . Este resultado se conoce como la aproximación normal de la binomial y dado que es aproximación continua de una distribución discreta deben tenerse algunos cuidados adicionales. La mejor manera de utilizar este resultado puede obtenerse en la expresión: k p (1 - p) k n-k n-k p (1 - p) =Φ = Φ (6.9) - El valor 1/2 que se agrega a cada lado se llama un factor de corrección de continuidad. La razón para agregar tal factor de corrección es que si uno usa una distribución normal, que es continua, para aproximar una binomial que es discreta, en cada extremo del intervalo la distribución discreta incluye la mitad de una barra que la distribución continua omite, por eso debe agregarse. Las siguientes gráficas pueden ayudarle a comprender la necesidad de este factor de corrección. Ejemplo 34 Se sabe que en una ciudad el 35% de los habitantes tienen sobrepeso. Se eligen 500 personas, cuál es la probabilidad de que haya entre 200 y 300 con sobrepeso. La solución de este problema se obtiene por la expresión k (0.35) (0.65) 500 - k (0.35)k(0.65)500 - k - . Usando la herramienta para cálculo de binomiales se obtiene que la parte izquierda es 0.008864 mientras que la parte derecha, usando la herramienta correspondiente es 0.0108. Existen varios criterios para asegurar la precisión de este tipo de aproximaciones. Los ejemplos abundan, por ejemplo en [5] se afirma que si np ≥ 5 y n(1 - p) ≥ 5 la aproximación es adecuada, en [2] se presenta un resumen de diferentes condiciones para asegurar precisión, al final de cuentas lo que si es válido es que valores de p muy cercanos a 0 o 1 hacen que las aproximaciones normales de binomiales no sean buenas. En la Herramienta que se da a continuación el lector puede colocar valores de n y p y verificar por si mismo la calidad de la aproximación normal de la binomial. Ejemplo 35 Dos empresas de venta de servicios telefónicos optan por el mismo mercado, hay n clientes que seleccionan al azar alguna de las dos empresas. Si una de las empresas tiene capacidad de atender a lo sumo r < n clientes entonces la probabilidad de que esta empresa reciba solicitudes de más de r clientes está dada por k (.5) (.5) n–k (.5)k(.5)n - k ≈ 1- Φ 1- =1-Φ =1Por ejemplo si hay 1000 clientes y una de las empresas desea que el total de solicitudes sin atender no exceda el 10% entonces usando las herramientas disponibles se obtiene que Φ ≥ 0.9 de donde se obtiene que r = 520, líneas bastarán para satisfacer al menos el 90% de las demandas de servicio. Si ese porcentaje se elevara y se quisiera que el porcentaje de solicitudes sin atender no exceda el 1% entonces se debe resolver Φ ≥ 0.99 usando las herramientas disponibles y despejando se obtiene que r = 537 líneas son suficientes. Esta aproximación no solo es buena, es excelente como puede verificarse usando las herramientas para binomiales que se han programado. Para estas herramientas se ha obtenido una precisión sorprendente, si hiciéramos el mismo análisis pero con una probabilidad de 0.7 de que cada cliente elija a esta empresa; usando la aproximación normal se obtendría que se necesitan 734 líneas si se usa la binomial en forma directa se ve que 733 bastan. Se invita al lector a ver el comportamiento para otros valores de p. Como nota aparte es interesante hacer notar que el desempeño de estas herramientas programadas mejoran los resultados que se obtienen en tablas como las de [6] además permiten una serie de exploraciones que de otra manera serían muy complicadas. VI.34.- Estimadores Un estimador de un parámetro de una variable aleatoria X es una variable aleatoria, que puede depender de una muestra aleatoria X1, X1,..., Xn. Los dos estimadores más usuales son el promedio usual llamado también media y la varianza muestral denotado por S2. muestral y denotado por Estos estimadores son a su vez variables aleatorias, = = 2 S = 2 S = Xi (6.10) Xi (Xi - (Xi - ) 2 (6.11) 2 ) La desviación estándar muestral S es la raíz de la varianza. Como sus nombres lo indican, se tiene que es un estimador para la esperanza, S2 lo es para la varianza Var[X] y S para la desviación estándar . El siguiente teorema, que en algunos textos [5] se llama teorema del límite central, es sumamente útil pues permite resolver diversos ejercicios de manera bastante simple. 1. E [ ]= 2. E[S2] = 3. Var[ ]= 4. Si n es suficientemente grande, entonces la variable Z= (6.12) Z= 5. sigue una distribución que se aproxima a una normal estándar. Este teorema puede ampliarse de forma directa a la distribución T = n = X1 + X2 + ... + Xn la cual también sigue una distribución normal con media n y desviación estándar . Nuevamente, entre mayor sea el valor de n mejor será la aproximación. Hemos desarrollado una aplicación que nos permite simular el comportamiento de los promedios de las varianzas cuando se parte de una distribución con k valores cualesquiera y se estudia valores de n suficientemente grandes. El estudiante puede variar la distribución de probabilidad inicial así como los datos iniciales y la herramienta le muestra cual es la distribución de probabilidad de la variable promedio. El estudiante mediante exploración podrá validar los resultados que se han discutido previamente, en especial puede ver como a valores mayores de n la distribución de las medias se acerca más a una normal. En papel la aplicación es bastante simple, toma una distribución de probabilidad y un valor n que es el tamaño del muestreo. Calcula todas las combinaciones de X1, X2,..., Xn, hace los promedios, les calcula las probabilidades a cada uno y construye la distribución de probabilidad de los mismos, la cual se presenta en forma de tabla y en forma gráfica. VI.35.- Ejemplos En una gran empresa el 60% de las personas tiene problemas de tensión. Cuál es la probabilidad de que en una muestra de 1000, 615 o más presenten este problema. Solución Este problema es de tipo binomial, puede resolverse calculando en forma directa 1 - B(614;1000,.6) lo que conduce al valor 0.158528, También podemos recurrir a la aproximación normal de binomial y la probabilidad solicitada es: P [ X ≥ 615] Φ P[X 615] = -Φ - = 1 - Φ(.93597) = 0.174 Ejemplo 37 Las consultas a un sistema tienen una duración cuya media es de 4 segundos y su desviación estándar es de 1.5 segundos. Si llegan 50 consultas en forma independiente, cuál es la probabilidad de que las 50 tengan una duración promedio entre 3.5 y 3.8 segundos. Solución Si aplicamos los resultados descritos hasta ahora el promedio de la muestra de las 50 consultas sigue una distribución que es aproximadamente normal con media = 4 y desviación estándar = 1.5/ = 0.2121. Luego: P[3.5 ≤ X ≤ 3.8] = Φ P[3.5 X 3.8] = -Φ - = 0.1645. = 0.1645. Ejemplo 38 Una sonda espacial cuenta con un juego de 10 computadores para controlar su estado. En todo momento se encuentra trabajando un único computador y estos trabajan en forma serial de manera que en el instante en que uno falle empieza a funcionar el siguiente, y así sucesivamente hasta utilizar los 10 computadores. La sonda está por pasar detrás de un planeta, por lo que se espera no tener comunicación con ella durante 4000 horas. Si cada computador opera correctamente 440 horas en promedio con una desviación estándar de 30 horas, entonces el tiempo acumulado de funcionamiento, Y de todas los computadores sigue una distribución que se puede aproximar por una normal con media 1440 y desviación estándar 30 . P[Y > 4000] = 1 - Φ = 1 – Φ (- 4.21) ≈ 1. Si el promedio de funcionamiento de cada computador fuera de 410 horas y la desviación estándar de 30 entonces la probabilidad pedida sería: P[Y > 4000] = 1 - Φ = 1 - Φ (- 1.05409) = 1 - 0.14592 = 0.85408. Ejemplo 39 El rendimiento de cierto cilindro de gas está normalmente distribuido con una media de 6 horas y una desviación estándar de 0.5 horas. Este gas se vende en paquetes de 5 cilindros y en cada paquete se utilizan los cinco cilindros en forma secuencial, es decir se empieza uno solamente si se ha terminado el anterior. Se desea determinar el tiempo máximo de duración de cada paquete de manera que éste sea excedido sólo por el 3% de los paquetes. Solución Como el tiempo de duración de cada cilindro es normal la distribución del tiempo TP = T1 + ... + T5 de cada paquete también es normal con media 30 y desviación estándar 0.5 , lo que se solicita es un valor c tal que. P[TP < c] = 0.97 = P[Z < ] = 0.97 De la herramienta correspondiente se obtiene = 1.8807 es decir c = 31.977, es decir solo un 3% de los paquetes tienen una duración de más de 31.977 horas. Ejemplo 40 La duración de una batidora de un cierto fabricante es de 5 años, con una desviación estándar de un año. Si asumimos que las duraciones de estos mezcladores siguen aproximadamente una distribución normal, la aplicación de los teoremas estudiados nos permite hacer las siguientes deducciones. Si se toma una muestra aleatoria de 9 de estas batidoras entonces como la duración de un mezclador es de 5 años con una desviación de 1 año, la duración promedio sigue una distribución normal con la media de 5 años con una desviación de = = 0.3333. Si se quiere la probabilidad de que en promedio este grupo dure entre 4.4 y 5.2 años se tiene P[4.4 ≤ ≤5.2] = P[- 1.8 ≤ Z ≤.60] = 0.9918 - 0.0359 = 0.9559 O por ejemplo el valor de a la derecha del cual caería el 15% de las medias calculadas de las muestras aleatorias de tamaño 9 se obtiene del cálculo. P[ ≥ ] = 0, 15 o bien P[ ≤ ] = P[Z ≤ ] = 0, 85 de la tabla y despejando se obtiene = 5, 35, es decir si se compraran 9 batidoras un 15% de éstas funcionaría por un período superior a 5.35 años. Ejemplo 41 Un médico atiende un paciente en un tiempo que es una variable aleatoria con media = 8 minutos y desviación estándar 3 minutos. Si debe atender un total de 40 pacientes la probabilidad de que atienda todos los pacientes en menos de 5 horas, asumiendo que los pacientes ingresan, en forma continua es P[T = T1 + ... + T40 ≤ 300] = P[Z < ] = 0, 1469 La probabilidad de que el tiempo promedio de atención sea superior a 7.5 minutos se obtiene de P[ > 7.5] = 1 - P[Z ≤ ] = 0.8531 INTEGRACION CONCEPTUAL (El titular académico, conocerá las respuestas) Conocerá la administración de recursos humanos, donde se aplica a organizaciones de cualquier clase y tamaño. En general los asuntos estudiados por la administración de recursos humanos abarcan una gran cantidad de campos de conocimiento, se habla de la aplicación e interpretación de pruebas psicológicas y entrevistas, tecnología del aprendizaje individual, cambio organizacional salud, salarios, higiene en el trabajo, selección del personal, reclutamiento de personas y desarrollo organizacional. REVISADO POR LA COORDINACIÓN GENERAL EDUCATIVA EL DIA 25 DE OCTUBRE DE 2007. -------------------------------------------------------------------------------------------------------------REPORTES CRÍTICOS O SUGERENTES A; Dr. Ernesto Guerra García, Coordinador General Educativo. (Correo electrónico eguerra@uaim.edu.mx) Geranios 1362 pte. Colonia Jardines de Fátima, Los Mochis, Sinaloa, México. C.P. 81223. Tel. 01 668 81 7 08 88. --------------------------------------------------------------------------------------------------------------