Download Distribuciones continuas de probaiblidad

Document related concepts
no text concepts found
Transcript
1
UNIDAD 2
DISTRIBUCIONES CONTINUAS DE PROBABILIDAD
Una variable aleatoria es continua cuando puede tomar cualquier valor dentro de un
intervalo de números reales. Por lo tanto, no es posible conocer su valor exacto.
Si la variable aleatoria es discreta, pero el rango es muy amplio, resulta más conveniente
utilizar un modelo basado en variables aleatorias continuas.
Si la variable es continua, resulta imposible describir su distribución de la manera que se
explicó anteriormente; en este caso, es necesario desarrollar una función en donde aparezca
X, de tal forma que la probabilidad de que X tome un valor en el intervalo demarcado por
su rango sea igual al área bajo f(x) entre esos límites; lo anterior implica una integración.
Dicha función es denominada función de densidad de probabilidad de X y cumple lo
siguiente:

a)
 f ( x) dx 1

b) P( x1  X  x2 ) 
x2
 f ( x)dx
x1
c) f(x) ≥ 0
d) P(X = x) = 0 
P( x1  X  x2 )  P( x1  X  x2 )
Esta última propiedad podría describirse así: La probabilidad que un modelo de variable
continua asigna a la observación de un valor exacto (es decir, medido con infinita
precisión) es cero.
La función de densidad podría mirarse como un modelo de la curva límite que
obtendríamos en el histograma de una población disminuyendo indefinidamente las
anchuras de cada clase.
f(x) es más general que un histograma. Trata de reflejar no el comportamiento de una
muestra concreta, sino la estructura de los valores de la variable a largo plazo; además, es
más operativa.
2
EJEMPLO 2.1.
El error en la temperatura de reacción, en grados centígrados, para un experimento de
laboratorio controlado es una variable aleatoria continua X que tiene la siguiente función de
densidad de probabilidad:
 x 2 / 3,  1  x  2
f ( x)  
 0, en otro caso
a) Verifique la propiedad a.
b) Encuentre la probabilidad de que X tome un valor entre 0 y 1.
Solución:
2
a)
x
2
/ 3 dx  x 3 / 9
2
1
1
1
1
b) P(0 < x < 1) =
x
2
/ 3 dx  1/ 9
0
Según la definición de función acumulada dada anteriormente, la función de distribución
acumulada de una variable aleatoria continua X es:
x
F ( x)  P( X  x) 
 f ( x)dx

Por lo tanto, la función de densidad de probabilidad de una variable aleatoria continua
puede calcularse a partir de la función de distribución acumulada mediante derivación. Es
decir,
dF ( x)
f ( x) 
dx
EJEMPLO 2.2.
El tiempo necesario, en milisegundos, para completar una reacción química está
aproximado por la siguiente función de distribución acumulada:
 0, x  0
F ( x)  
 0.01x
,x0
1  e
3
Calcule la función de densidad de probabilidad de X. ¿Qué proporción de las reacciones
están completas en 200 milisegundos?
Solución:
0, x  0

f ( x)  
 0.01x
,x0
0.01e
Al derivar:
P(x < 200) = F(200) = 1 – e-2 = 0.8647
MODELOS DE DISTRIBUCIONES CONTINUAS
1. Distribución uniforme continua:
Se caracteriza porque la probabilidad es constante en un intervalo cerrado y, por lo tanto, su
función de densidad es plana.
Su función de densidad está dada por: f ( x) 
b
Su media es:
x
 b  adx 
a
1
, a xb
ba
ab
2
ab
1
(b  a) 2

y su varianza es:   x 
dx 
 *
2  ba
12
a
b
2
EJEMPLO 2.3.
X es una variable aleatoria que representa la corriente, medida en miliamperes, en un
alambre delgado de cobre. El rango de X es [0,20 mA] y su función de densidad de
probabilidad es f(x) = 0.05.
a) ¿Cuál es la probabilidad de que una medición de corriente esté entre 5 y 10 mA?
b) ¿Cuáles son su media y desviación estándar?
Solución:
4
10
a ) P (5  X  10) 
 f ( x)dx  5(0.05)  0.25
5
b) E ( x ) 
0  20
 10 mA
2
Desv. est .( x) 
20 2
 5.77 mA
12
2. Distribución normal:
Es la distribución de probabilidades más empleada para modelar experimentos aleatorios
porque describe ajustadamente muchos fenómenos naturales, industriales e investigativos;
además, los errores en mediciones científicas se aproximan bien mediante la distribución
normal.
La ecuación que describe una variable aleatoria normal X, con media µ y desviación
estándar σ es:
f ( x) 
1
2 

e
( x )2
2 2
,   x  
La distribución normal presenta las siguientes características:
1. Su gráfica tiene forma de campana.
2. El punto más alto de la curva normal es la media, que también es la mediana y la moda
de la distribución.
3. El área total bajo la curva es 1.
4. La curva es simétrica alrededor de la media; por lo tanto, el área a la izquierda de la
media es 0.5 e igual a su derecha.
5. El eje x es una asíntota horizontal, es decir, los extremos de la curva se prolongan al
infinito en ambas direcciones.
6. La desviación estándar determina el ancho de la curva. A mayores valores de σ se
obtienen curvas más anchas y bajas (mayor dispersión de los datos).
La probabilidad de que la variable aleatoria X tome un valor entre a y b es:
P ( a  X  b) 
1
b
e
2 
a
Que gráficamente sería:

( x )2
2 2
dx
5
Esta integral no es de fácil solución, pero dicho problema puede obviarse mediante la
estandarización de la variable, que consiste en transformar todas las observaciones de
cualquier variable aleatoria normal X a un nuevo conjunto de observaciones de una variable
aleatoria normal Z con media 0 y varianza 1; todas las distribuciones normales pueden
convertirse a “distribuciones normales estándar” restando la media de cada observación y
dividiendo por la desviación estándar.
Z
x

Aproximadamente el 68% de las veces, una variable aleatoria normal asume un valor entre
más o menos una desviación estándar respecto a su media, aproximadamente 95% en el
intervalo µ± 2σ y más del 99% en µ ± 3σ
6
EJEMPLO 2.4.
Cierta máquina fabrica resistores eléctricos que tienen una resistencia promedio de 25
ohmios y una desviación estándar de 3.2 ohmios. La resistencia tiene una distribución
normal.
a) ¿Qué porcentaje de los resistores tendrán una resistencia inferior a 16 ohmios?
b) ¿Qué porcentaje de resistores tendrán una resistencia superior a 35 ohmios?
c) ¿Qué porcentaje de resistores tendrán una resistencia entre 20 y 32 ohmios?
d) ¿Por encima de qué valor está el 10% de los resistores con mayor resistencia?
Solución:
16  25 

a) P( X  16)  P Z 
  P( Z  2.81)  0.0025
3.2 

Lo que implica que el 0.25% de los resistores tienen una resistencia inferior a 16 ohmios.
35  25 

b) P( X  35)  P Z 
  P( Z  3.13)  1  P( Z  3.13)  1  0.9991  0.0009
3.2 

Por lo tanto, el 0.09% de los resistores tienen una resistencia superior a 35 ohmios.
32  25 
 20  25
c)P(20  X  32)  P
Z
  P(1.56  Z  2.19)
3.2 
 3.2
 P( Z  2.19)  P( Z  1.56)  0.9857  0.0594  0.9263
Por lo tanto, el 92.6% de los resistores tiene una resistencia entre 20 y 32 ohmios.
d ) P( Z  z )  1  0.1  0.9  De la tabla : z  1.28
z
x

 x    z  25  1.28(3.2)  29.10 ohmios
EJEMPLO 2.5.
El diámetro del eje de una unidad de almacenamiento óptico tiene distribución normal con
media 0.2508 pulgadas y desviación estándar 0.0006 pulgadas. Las especificaciones del
diámetro del eje son 0.2500 ± 0.0013 pulgadas. ¿Qué proporción de los ejes cumple con el
requisito?
Solución:
7
0.2513  0.2508 
 0.2487  0.2508
P(0.2487  X  0.2513)  P
Z

0.0006
0.006


 P(3.5  Z  0.83)
 P( Z  0.83)  P( Z  3.5)
 0.7967  0.0000  0.7967
Lo que implica que el 79.7% de los ejes cumple con el requisito.
EJEMPLO 2.6.
Durante los últimos años ha crecido el volumen de acciones negociadas en la Bolsa.
Durante las dos primeras semanas de abril, el volumen diario promedio fue de 586000
acciones. La distribución de probabilidad del volumen es aproximadamente normal con
desviación estándar de 115000 acciones.
a) ¿Cuál es la probabilidad de que el volumen negociado en un día sea menor a 395000
acciones?
b) ¿Cuál es la probabilidad de que se negocien más de 800000 acciones en un día?
c) ¿Cuál es la probabilidad de que en un día se negocien entre 500000 y 600000 acciones?
d) Si la Bolsa quiere emitir un boletín de prensa sobre el 5% de los días más activos, ¿qué
volumen activará la publicación?
Solución:
Sea: X = miles de acciones negociadas.
395  586 

a) P( X  395)  P Z 
  P( Z  1.66)  0.0485
115 

800  586 

b) P( X  800)  P Z 
  P( Z  1.86)  1  P( Z  1.86)  1  0.9686  0.0314
115 

600  586 
 500  586
P(500  x  600)  P
Z
  P(0.75  Z  0.12)
c)
115 
 115
 0.5478  0.2266  0.3212
d ) P( Z  z )  0.05  P( Z  z )  0.95  De la tabla : z  1.645
8
z
x

 x    z  586  1.645(115)  775
Eso implica que la publicación se sacará los días que se negocien más de 775000
acciones
EJERCICIOS PROPUESTOS
1. La duración de un disco magnético empaquetado expuesto a gases corrosivos tiene una
distribución aproximadamente normal con una vida media de 600 horas y desviación
estándar de 180 horas.
a) Calcule la probabilidad de que uno de esos discos dure al menos 500 horas.
b) Calcule la probabilidad de que uno de esos discos dure por lo menos 300 horas, pero
no más de 1000.
c) Si el fabricante está dispuesto a reemplazar el 2% de los discos que primero fallan,
¿de qué duración debe ser la garantía que ofrece?
2. La vida eficaz de un dispositivo utilizado por una máquina industrial es una variable
aleatoria con media 15000 horas y desviación estándar de 600 horas; su distribución es
muy próxima a una distribución normal. El fabricante del dispositivo introduce una
mejora en el proceso de producción que aumenta el tiempo de vida útil promedio a
15550 horas y disminuye la desviación estándar a 450 horas (considere que la
distribución sigue siendo normal).
El nuevo proceso se considerará satisfactorio si la probabilidad de que la vida del
dispositivo sea mayor que 14000 horas supera por lo menos en 10% a la misma
probabilidad con el proceso “antiguo”.
El costo del proceso mejorado es mucho más alto. ¿Usted recomendaría la inversión?
3. Un fabricante está interesado en el voltaje de salida de una fuente de alimentación
utilizada en un computador portátil. Experimentos anteriores han demostrado que el
voltaje de salida tiene una distribución normal con media 5.1V y desviación estándar
0.25V.
a) ¿Cuál es la probabilidad de que el voltaje sea superior a 5.5V?
b) ¿Cuál es la probabilidad de que el voltaje esté entre 4.5 y 5.4V?
c) ¿Cuál es el voltaje excedido por el 95% de las fuentes?
4. El diámetro del punto producido por una impresora tiene una distribución normal con
media de 0.002 pulgadas y desviación estándar de 0.0004 pulgadas.
a) ¿Cuál es la probabilidad de que el diámetro del punto sea mayor de 0.0026
pulgadas?
b) ¿Cuál es la probabilidad de que el diámetro del punto esté entre 0.0014 y 0.0026
pulgadas?
c) ¿Por encima de que valor estará el 39% de los diámetros?
9
d) ¿Qué valor debe tener la desviación estándar del diámetro para que la probabilidad
del inciso b) sea 0.995?
5. Las mediciones de corriente de una tira de alambre tienen una distribución normal con
una media de 5.25 mA y una desviación estándar de 0.42 mA.
a) ¿Cuál es la probabilidad de que el resultado de una medición sea mayor de 6 mA?
b) ¿Cuál es la probabilidad de que una medición de corriente esté entre 5 y 5.8 mA?
c) ¿Cuál es la probabilidad de que una medición sea menor de 5mA o mayor de 6 mA?
d) ¿Por encima de que valor estará el 88% de las mediciones?
e) ¿Cuál debe ser el valor de la varianza de las mediciones para que la probabilidad de
que la corriente esté entre 5 y 5.5 mA sea 0.95?
6.
El tiempo entre llegadas de mensajes electrónicos a un computador tiene una
distribución exponencial con media de 1.25 horas.
a) ¿Cuál es la probabilidad de que el computador reciba un mensaje en un período de
10 minutos?
b) Si son las 5 de la tarde y no ha recibido mensajes desde las 10 de la mañana, ¿Cuál
es la probabilidad de recibir un mensaje antes de las 10 de la noche?
7.
La duración de un láser semiconductor a potencia tiene una distribución normal con
media de 10000 horas y una varianza de 422500 hrs2.
a) ¿Cuál es la probabilidad de que el láser dure entre 10000 y 12000 horas?
b) ¿Cuál es la probabilidad de que el láser falle antes de 8500 horas?
c) ¿Cuál es la duración excedida por el 95% de los láseres?
8. El tiempo que transcurre entre las llamadas a cierta empresa tiene una distribución
exponencial con un tiempo promedio entre llamadas de 15 minutos.
a) ¿Cuál es la probabilidad de que no haya llamadas en un lapso de 30 minutos?
b) ¿Cuál es la probabilidad de recibir la primera llamada entre 5 y 10 minutos después
de haber abierto la empresa?
c) Calcule la dimensión de un intervalo de tiempo, de modo tal que la probabilidad de
recibir al menos una llamada en ese lapso sea 0.75
9. En la detección de una señal digital, el ruido de fondo tiene una distribución normal con
media de 0 volts y desviación estándar de 0.45 volts. Si el sistema supone que se ha
transmitido un uno digital cuando el voltaje es mayor que 0.9 volts.
a) ¿Cuál es la probabilidad de detectar un uno digital?
b) Determine las cotas simétricas alrededor de 0 que incluyen el 99% de todas las
lecturas de ruido.
10. Un artículo electrónico para oficina contiene 200 componentes electrónicos. La
probabilidad de que cada componente trabaje sin falla alguna durante el tiempo de vida
útil del producto es 0.999. Aproxime la probabilidad de que 5 o más de los 200
componentes fallen durante el tiempo de vida útil del producto.
11. El tiempo de reacción de un conductor a un estímulo visual tiene una distribución
normal con media 0.4 segundos y desviación estándar 0.05 segundos.
10
a) ¿Cuál es la probabilidad de que el conductor tarde más de medio segundo para
reaccionar?
b) ¿Cuál es la probabilidad de que el tiempo de reacción esté entre 0.4 y 0.5 segundos?
c) ¿Cuál es el tiempo de reacción que se espera exceder el 75% de las veces?
12. Un proceso de fabricación de chips produce un 2% que son defectuosos. Suponga que
los chips son independientes y que un lote contiene 1000 de ellos.
a) Encuentre la probabilidad de que el lote contenga más de 25 chips defectuosos.
b) Encuentre la probabilidad de que el lote contenga entre 20 y 30 chips defectuosos.
13. La duración de un láser semiconductor a potencia constante tiene una distribución
normal con una media de 7000 horas y desviación estándar de 600 horas.
a) ¿Cuál es la probabilidad de que el láser falle antes de 5600 horas?
b) ¿Cuál es la duración en horas que excede el 90% de todos los láseres?
c) Si se hace uso de tres láseres en un producto y se supone que fallan de manera
independiente, ¿cuál es la probabilidad de que los tres sigan funcionando después de
7000 horas?
14. El diámetro del eje de una unidad de almacenamiento óptico tiene una distribución
normal con media 0.2508 pulgadas y desviación estándar 0.0005 pulgadas. Las
especificaciones del diámetro del eje son 0.25  0.0015 pulgadas.
a) ¿Qué proporción de ejes cumplen con este requisito?
b) Si la especificación menor no puede variar, ¿cuál debería ser la especificación
superior para que el 95% cumplan el requisito?
15. 3256 personas presentaron los exámenes de ingreso a una universidad, los cuales se
calificaban con un puntaje máximo de 100. Las calificaciones se aproximan a una
distribución normal, con una media de 67.8 y una desviación estándar de 10.1.
a) El 12% de los postulantes con más alta calificación en el examen son aceptados en
la universidad. ¿Un estudiante que obtiene un puntaje de 73 en el examen es
aceptado o no?
b) ¿Qué porcentaje de postulantes obtuvieron una calificación entre 60 y 80?
16. En una prueba de tarjetas de circuitos, la probabilidad de que un diodo en particular
falle es 0.01. Una tarjeta contiene 200 diodos.
a) ¿Cuál es la probabilidad de que por lo menos 4 diodos fallen en una tarjeta seleccionada
al azar?
b) Si se despachan cinco tarjetas a un cliente en particular, ¿cuál es la probabilidad de
que por lo menos 4 de ellas funcionen bien? (una tarjeta funciona si todos los diodos
funcionan bien)
17. Se sabe que el voltaje de ruptura de un diodo de cierto tipo seleccionado al azar está
normalmente distribuido con valor medio de 40 V y desviación estándar de 1.5 V.
a) ¿Cuál es la probabilidad de que el voltaje de un solo diodo esté entre 39 y 42?
b)¿Cuál es el valor tal que sólo 15% de todos los diodos tengan voltajes que lo rebasen?
11
18. Un ingeniero de sistemas está investigando la utilidad de un lenguaje de diseño para
mejorar las tareas de programación. Pidió a 200 programadores que codificaran una
función estándar con ese lenguaje, anotando el tiempo, en minutos, que requiere para
hacer esa tarea. Los datos obtenidos revelan una media de 23 minutos y una desviación
estándar de 1.4 minutos; con el lenguaje de diseño que se utiliza actualmente, se
necesitan 24 minutos. Asuma distribución normal.
a) ¿Cuál es la probabilidad de mejorar el tiempo que se utiliza actualmente?
b) ¿Qué valor es excedido por el 20% de los tiempos requeridos con el nuevo
lenguaje?
19. En un canal de comunicación digital, el número de bits que se reciben de manera
errónea puede modelarse como una variable aleatoria binomial; la probabilidad de
recibir un bit de manera errónea es 1*10-5. Si se transmiten 16 millones de bits,
a) ¿cuál es la probabilidad de que se presenten más de 150 errores?
b) ¿cuál es la probabilidad de que se presenten más de 100 errores, pero menos de
250?
20. Se sabe que la vida útil de un equipo electrónico tiene una distribución
aproximadamente normal, con una desviación estándar de 8.4 días y una media de 62
días.
a) El fabricante reemplaza los equipos que fallen dentro del tiempo de garantía. Si está
dispuesto a reemplazar únicamente el 2% de los equipos, ¿de qué duración debe ser
la garantía que ofrezca?
b) ¿Cuál debe ser la desviación estándar del tiempo de vida útil para que el fabricante
pueda garantizar que sólo reemplazará los que duren menos de mes y medio? (tenga
en cuenta que se reemplaza el 2% de los equipos y que la media se considera
invariable en ese caso)
21. Se utilizan medidores para rechazar todos los componentes cuyas dimensiones no se
encuentren dentro de la especificación 60  d. Se sabe que esta dimensión está
normalmente distribuida con una media de 60 y una varianza de 33.64.
a) Determine las especificaciones (simétricas a la media), de tal manera que éstas
cubran el 90% de las mediciones.
b) ¿Cuál debería ser la desviación estándar para que la probabilidad de que la duración
de un componente esté entre 50 y 70 días sea 0.92?
22. El tiempo entre la llegada de los clientes a un cajero automático es una variable
aleatoria exponencial con una media de cinco minutos.
a) ¿Cuál es la probabilidad de que lleguen al cajero más de tres clientes en un lapso de
10 minutos?
b) ¿Cuál es la probabilidad de que el tiempo transcurrido hasta que llega el quinto
cliente sea menor que 15 minutos?
23. Se utilizan medidores para rechazar todos los componentes cuyas dimensiones no se
encuentren dentro de la especificación 1.50  d. Se sabe que esta dimensión es
normalmente distribuida con una media de 1.50 y una desviación estándar de 0.2.
a) Determine el valor d para que la especificación cubra el 95% de las mediciones.
12
b) Cuál es la probabilidad de que la dimensión de un componente sea mayor de 1.75?
24. El número de computadores que se venden por hora en un gran almacén sigue una
distribución de Poisson con un promedio de 30 computadores vendidos por hora.
a) ¿Cuál es la probabilidad de que exactamente 50 computadores sean vendidos entre
las 10 y las 11 de la mañana?
b) ¿Cuál es la probabilidad de que el tiempo que transcurre entre dos ventas
consecutivas esté entre 1 y 3 minutos?
25. La longitud de un estuche moldeado por inyección para una cinta magnética tiene una
distribución normal con una media de 90.2 milímetros y desviación estándar de 0.1
mm.
¿Cuál es la probabilidad de que la longitud de una pieza sea menor que 89.7 mm o
mayor que 90.3?
26. Una prueba de admisión a una universidad tiene 200 preguntas, cada una con 4 posibles
respuestas, de las que sólo una es correcta. Para pasar a entrevista se debe responder
correctamente por lo menos el 75% de las preguntas.
a) Un aspirante está seguro de 107 respuestas, pero tiene que responder las demás al
azar. ¿Cuál es la probabilidad de que sea llamado a entrevista?
b) Un aspirante sólo tiene que adivinar 10 para ajustar el número de respuestas correctas
que necesita, ¿cuál es la probabilidad de que sea llamado a entrevista?
27. El tiempo requerido por unos técnicos en sistemas para completar cierto trabajo tiene
una media de 88 minutos y una desviación estándar de 20 minutos. Para chequear el
progreso de los trabajadores en un día particular, el supervisor registró los tiempos que
los técnicos de la empresa necesitaron para completar el trabajo. Dicho proceso se ajusta
aproximadamente a una distribución normal.
a) ¿Cuál es la probabilidad de que un técnico se demore más de dos horas para hacer
ese trabajo?
b) El supervisor les pasará un memo a los que se demoren más de dos horas y media.
Según la distribución normal, ¿a cuántos se espera que les pase memo por esa causa?
c) ¿Por debajo de qué tiempo se demora el 20% de los técnicos de la empresa para
completar el trabajo?
RESPUESTAS
1. a) 0.7123
b) 0.9393
c) 231 h
2. Ant: P(X>14000) = 0.9525
Act: P(X>14000) = 0.9997
3. a) 0.0548
b) 0.8767
c) 4.69 V
4. a) 0.067
b) 0.866
c) 0.002112 pulg
d) 0.000214 pulg
13
5. a) 0.0367
b) 0.6306
c) 0.689
d) 4.76 mA
e) 0.01627 mA2
6. a) 0.1167
b) 0.7854
7. a) 0.4990
b) 0.0104
c) 8930.75 h
b) 66.6%
16. a) 0.1423
b) 0.978
17. a) 0.6568
b) 41.6 V
18. a) 0.7611
b) 24.2 min
19. a) 0.7967
b) ≈ 1
8. a) 0.5413
b) 0.226
c) 21 min
20. a) 44 días
b) 8.29 días
9. a) 0.0228
b) [-1.16,1.16]
21. a) [50.46, 69.54]
b) 49.9
10. ≈ 0
22. a) 0.323
b) 0.185
11. a) 0.0228
b) 0.4772
c) 0.367 seg
23. a) 0.392
b) 0.1056
12. a) 0.1539
b) 0.5349
24. a) 0.0022
b) 0.3834
13. a) 0.0099
b) 6232 h
c) 0.125
25. 0.8413
14. a) 0.9192
b) 0.2516 pulg
15. a) No
26. a) ≈ 0
b) 0.6291
27. a) 0.0548
b) 0.1%
c)71.2min