Download Probabilidad y Estadística
Document related concepts
no text concepts found
Transcript
Facultad Ingeniería y Tecnología Informática Licenciatura en Sistemas de Información Ingeniería Informática Probabilidad y Estadística Profesora: Lic. Haydeé Castelletti Lunes a viernes de 9 a 21 h. Torre Universitaria, Zabala 1837, primer nivel inferior. C1426DQG - CABA Teléfono: 4788-5400, internos 5002 y 2122. Email: fasciculos@ub.edu.ar www.ub.edu.ar Facultad de Tecnología Informática Guía de Trabajos Prácticos PROBABILIDAD Y ESTADÍSTICA Año 2014 Facultad de Tecnología en Informática Ingeniería en Informática/Lic. en Sistemas Universidad de Belgrano Lic. Haydeé Castelletti Magíster en docencia Universitaria 1 Facultad de Tecnología Informática Guía de Trabajos Prácticos ASIGNATURA: PLAN DE ESTUDIOS: AÑO ACADEMICO: CARRERA/S : PROFESOR a CARGO: Universitaria CUATRIMESTRE: Semana 1 2 3 4 5 6 7 8 9 Probabilidad y Estadística 2010 2014 Ingeniería en Informática/Licenciatura en Sstemas Lic Haydeé Castelletti-.Magister en docencia Primer Cuatrimestre Descripción de Actividad Evaluación diágnóstica de conocimientor previos Modelos determinísticos y estadísticos P r o b a b i l i d a d ProbabilidadTrabajo Práctico1 Probabilidad.Trabajo Práctico1 Probabilidad Trabajo Práctico 1 Esp unid disc y cont.Variables aleatorias Discretas y cont Parámetros.Función de var aleatoria E j e r c i t a c i ó n Variable aleatoriaUnid y Bid.Func v.a. Variable aleatoria discreta.Realizar la Práctica 3 Variable aleatoria discreta Variable aleatoria discreta.Trabajo práctico 3 Variable aleatoria discreta Variable aleatoria discreta.Trabajo Práctico 3 Distribuciones especiales de variable aleatoria discreta Distribuciones especiales de variable aleatoria discreta Distribuciones especiales de variables aleatorias discretas Distribuciones especiales de variables aleatorias discretas.Trabajo Práctico 3 Variables aleatorias continuas Variables aleatorias continuas Distribuciones especiales de variables aleatorias continuas Distribuciones especiales de variables aleatorias continuas.Trabajo Práctico 4 Ejercitación de variables aleatorias continuas. . Trabajo Práctico 4 Evaluación de Trabajos realizados por los alumnos Re v is ió n p a ra e l p a rc ia l E x a m e n P a r c i a l D e v o l u c i ó n d e l p a r c i a l . Teorema central del límite Teorema central del límite.Trabajo Práctico 5 2 Tipo T T TP1 P3 P1 T T P1 T P1 T P1 T P1 T P1 T P3 T P1 T P1 P1 E E E E T P1 Unidad/es 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 1-2-3 1-2-3 4 4 4 4 Hs.Cát. 1 1 1 2 1 2 2 2 2 2 2 1 1 2 2 1 1 2 22 1 1 2 3 1 2 4 2 2 1 Facultad de Tecnología Informática Guía de Trabajos Prácticos 10 11 12 13 14 15 16 I n t e r v a l o s d e c o n f i a n z a Intervalos de confianza.Trabajo Práctico 5 Intervalos de confianza.Trabajo Práctico 5 Intervalos de confianza.Trabajo Práctico 5 T e s t d e h i p ó t e s i s T e st d e h ip ó t e s is, T ra b a jo P rá ct i co 6 T e st d e h ip ó t e s is. T ra b a jo P rá ct i co 6 Test de hipotesisTrabajo Práctico 6 T e st d e h ip ó t e s is. T ra b a jo P rá ct i co 6 Regresión.Parámetros.Inferencias Regresión.Realizar la Práctica 7 Ejercicios en el LaboratorioPR 7 Correlación.Realizar la Práctica 7 Ejercicios en el Laboratorio Evaluación de carpetas de Trabajos prácticos Introducción an Análisis de la varianza A n á l i s i s d e f a c t o r e s . E j e r c i t a c i ó n P r á c t i c o 7 Ejercicios en laboratoriode Computaciónde los T Prácticos 6 Ejercitación en computadora de An de la var.Práctica 7 Evaluación de ejercicios realizados en el laboratorio deComputación 3 T P1 P1 P1 T P1 P1 P1 P1 T P1 L P1 L E T T P1 P3 P4 E 4 4 5 5 5 5 5 6 6 6 6 6 6 6 4-5-6 7 7 7 6 7 6-7 2 1 4 2 2 2 2 4 2 2 2 2 2 2 2 2 2 2 2 2 2 Facultad de Tecnología Informática Guía de Trabajos Prácticos ANEXO A A1 - Carga Horaria - Modalidad de Enseñanza Modalidad Teóricas Act. Prácticas Evaluaciones Total Horas cátedra 29 53 14 96 Horas reloj 21,75 39,75 10,5 72 A2 – Carga Horaria de Actividades Prácticas Tipo Actividad P1.- Formación experimental P2.- Resolución de problemas abiertos de ingeniería P3.- Proyecto y diseño de sistemas informáticos P4.- Instrucción supervisada de formación práctica P5-Otros Total Horas cátedra 10 16 16 42 Tipo Actividad 1.- Formación Experimental 2.- Resolución de problemas abiertos a la Ingeniería 3.-Proyecto y diseño de Sistemas Informáticos 4.-Instrucción supervisada de información práctica 5-Otros Total A3 – Problemas abiertos de Ingeniería 4 Horas reloj 8 12 12 32 Horas cátedra 0 4 0 2 46 53 Horas reloj 0 3 0 1,5 34,5 Facultad de Tecnología Informática Guía de Trabajos Prácticos Tipo Actividad Problemas abiertos de Ingeniería 5 Horas cátedra 0 Facultad de Tecnología Informática Guía de Trabajos Prácticos ASIGNATURA: PROBABILIDAD Y ESTADÍSTICA PLAN DE ESTUDIOS: 2010 ANO ACADEMICO: 2014 AÑO 3º CARRERA: 502-Ingeniería Informática Lic en Sistemas de Información PROFESOR a CARGO: Lic Haydeé Castelletti ,Magister en Docencia Universitaria CUATRIMESTRE: Primer cuatrimestre. 1. OBJETIVOS: 1. OBJETIVOS • • • • • • • • • • • Introducir al alumno en la comprensión de la necesidad y oportunidad de los modelos estadísticos no sólo en la ciencia sino también en la tecnología y en las distintas ramas del saber. Adopte la terminología técnica y adquiera habilidad en el uso de este vocabulario. Comprender las posibilidades, ventajas y limitaciones de estos modelos, su entendimiento como simple modelo de una realidad, como una matemática o ciencia formal y no como la realidad misma. Dar la base de conocimientos para asignaturas que necesitan de la misma como modelos y Simulación y para un posterior desarrollo personal en el área. Que el alumno utilice los conceptos aprendidos para el ordenamiento y posterior tratamiento de los datos obtenidos en trabajos de investigación. Que el alumno sepa como generar una secuencia de valores aleatorios que respondan a un comportamiento probabilístico dado. Que prediga comportamientos de un conjunto por estimación a partir del estudio de un subconjunto. Que el alumno ajuste modelos matemáticos teóricos a situaciones prácticas que presentan cierta semejanza con la idealidad. Que el alumno sepa simular por el computador los distintos casos. Distinguir entre distintos modelos de distribución de variables aleatorias clásicas. Estudiar el comportamiento de dichas distribuciones en el límite. 6 Facultad de Tecnología Informática Guía de Trabajos Prácticos • • • • conocer el concepto de estimador y sus propiedades, como así también métodos para definir los estimadores. Saber construir intervalos de confianza para los parámetros poblacionales. Saber diseñar experimentos válidos. Obtener conclusiones confiables a partir de los datos obtenidos. Que sepa interpretar la relación entre variables y realizar inferencias estadísticas a partir de dichas relaciones. Que el alumno: • • • • • • • • • • • • • • Comprenda la importancia de la estadística y de la probabilidad como disciplinas científicas y de aplicación a las herramientas informáticas. Adopte la terminología técnica y adquiera habilidad en el uso de este vocabulario. Utilice los conceptos aprendidos para el ordenamiento y posterior tratamiento de los datos obtenidos en trabajos de investigación. Conocer y manejar con facilidad los conceptos básicos de la Teoría de Probabilidad. Manejar el concepto de distribución de una variable aleatoria en forma general, y los parámetros que caracterizan dicha distribución. Saber como generar una secuencia de valores aleatorios que respondan a un comportamiento probabilístico dado. Prediga comportamientos de un conjunto por estimación a partir del estudio de un subconjunto. Ajuste modelos matemáticos teóricos a situaciones prácticas que presentan cierta semejanza con la idealidad. Saber simular por el computador los distintos casos. Distinguir entre distintos modelos de distribución de variables aleatorias clásicas. Estudiar el comportamiento de dichas distribuciones en el límite. conocer el concepto de estimador y sus propiedades, como así también métodos para definir los estimadores. Saber construir intervalos de confianza para los parámetros poblacionales. Saber diseñar experimentos válidos. Obtener conclusiones confiables a partir de los datos obtenidos. 2. Contenidos: Primer Bloque: Análisis Descriptivo Unidad Nº 1: ¿Qué es la Estadística? El papel de la Estadística en la ingeniería y en la ciencia. Las computadoras y la estadística. Las unidades experimentales. El dato como resultado de 7 Facultad de Tecnología Informática Guía de Trabajos Prácticos un experimento. Datos cualitativos y cuantitativos. Distintas escalas y reglas de medición. Datos agrupados y no agrupados. Frecuencia absoluta simple y acumulada. Frecuencia relativa simple y acumulada. Distribución de frecuencias. Intervalos de clase. Marca de clase. Medidas que resumen información. Medidas de posición. La media aritmética simple y ponderada. La mediana. La moda. Medidas de dispersión. El rango. La varianza. El desvío estándar. La distancia intercuartil. Datos anómalos. Cantidades absolutas y relativas. Indicadores. Los fractiles: deciles, cuartiles y centiles. Cuadros y gráficos de tendencias. Gráficos de curvas. Gráficos de barra. Esquemas circulares. Boxplots. Histogramas. Polígonos de Frecuencia. Ojivas. Segundo Bloque: Análisis Probabilístico Unidad Nº 2: Nociones de probabilidad. Experimento aleatorio. Aleatoriedad. Espacio Muestral. Espacios de equiprobabilidad. Sucesos excluyentes y no excluyentes, independientes y dependientes. Postulado de Laplace. Reglas de probabilidad. Probabilidad simple. Probabilidad conjunta, marginal y condicional. Tabla de decisión. Diagrama de Venn. Teorema de Bayes. Unidad Nº 3: La variable aleatoria. Variables discretas y continuas, sus respectivas funciones y parámetros. Modelos de distribuciones discretas. Ley de Bernoulli, de Pascal, Binomial, Hipergeométrica y de Poisson. Media y varianza de las variables especiales. Modelos de distribuciones continuas. Ley uniforme, exponencial y normal, gamma y Weibull. Problemas y aplicaciones. Tercer Bloque: Análisis Inferencial Unidad Nº 4: Definición de muestra aleatoria. Parámetros. Estadísticos o estadígrafos. Estimador de un parámetro. Error cuadrático medio (ECM). Sesgo (B) de un estimador. Estimador insesgado. Demostrar que ECM( θˆ ) = V( θˆ ) + B². La media muestral como estimador de la media de la variable. Cálculo de su media y varianza. La varianza muestral como estimador de la varianza de la variable. Cálculo de su media. La estimación de las diferencias de medias en el caso de independencia. Cálculo de la media y la varianza de los respectivos estimadores. 8 Facultad de Tecnología Informática Guía de Trabajos Prácticos Teorema central del límite. Versión referida a la suma de variables aleatorias independientes e igualmente distribuidas. (Sin demostración). La distribución de la media muestral. (Caso normal y cuando se aplica teorema central del límite). Deducción del intervalo de confianza para la media. (Caso σ conocido). Error absoluto de estimación: tamaño de muestra. La t de Student. Intervalo de confianza para la media. (Caso σ desconocido). La χ2. Deducción del intervalo de confianza para la varianza. Intervalo de confianza para la diferencia de medias. (Casos varianzas conocidas y desconocidas pero iguales). Unidad Nº 5: Hipótesis nula y alternativa. Errores tipo I y II. En todas las pruebas de hipótesis indicar el estadístico de prueba, su distribución y la correspondiente zona de rechazo. Concepto de diferencia significativa. Prueba de hipótesis para la media (σ conocido). Deducir la fórmula para el tamaño de muestra. Cálculo de la probabilidad de cometer error tipo II Prueba de hipótesis para la media (σ desconocido). Prueba de hipótesis para la varianza. Prueba de hipótesis para la diferencia de medias (σ1, σ2 conocidos). Prueba de hipótesis para la diferencia de medias (σ1 = σ2 desconocidos). Unidad Nº 6: Descripción del modelo de regresión lineal simple. Criterio de los mínimos cuadrados. Estimadores de los parámetros de la regresión (Remitirse a la bibliografía en caso de que no se llegue a hacer la deducción en clase). Sumas de cuadrados total, explicada y residual. Cuadrado medio residual. Estimación de σ2. Coeficiente de determinación. Interpretación de su valor. Estimación puntual y por intervalo de la media de Y correspondiente a un valor particular de X (sin demostración). Predicción del valor de Y correspondiente a un valor particular de X. Intervalo de predicción (sin demostración). Prueba de hipótesis sobre la pendiente de la recta de regresión poblacional. Descripción del modelo de correlación. Estimación puntual del coeficiente de correlación. Probar -1 ≤ r ≤ 1. Prueba de hipótesis acerca del coeficiente de correlación. Unidad 7: 9 Facultad de Tecnología Informática Guía de Trabajos Prácticos Introducción al análisis de la varianza. Diseños completamente aleatorizados. Diseños con bloques aleatorizados. Análisis de la varianza con un factor de clasificación. Supuestos teóricos. Fórmulas para el cálculo. Experimentos de dos factores. Experimentos multifactoriales. Aplicaciones. ……………………………………………………………. 3. BIBLIOGRAFIA 3.1 BASICA Devore Jai L., Probabilidad y Estadística para ingeniería y ciencias. Editorial Thomson Navidi William, Estadística para ingenieros y científicos,Editorial Mc Graw Hill *Walpole;Myers; Probabilidad y Estadística para ingeniería y ciencias. Editorial Pearson . Montgomery y Runger, Probabilidad y Estadística aplicadas a la Ingeniería. Editorial Mc Graw Gill. Richard Johnson,Probabilidad y Estadística para Ingenieros. Editorial Prentice Hall.Quinta Edición. Walpole y Myers; Probabilidad y Estadística;McGraw Hill 3.2 Adicional Berenson, Mark-Levine, David."Estadística para administración y economía". Ed. McGraw-Hill De Groot, Morris. "Probabilidad y Estadística". Ed. Addison-Wesley Iberoamericana. Freund, John-Walpole, Ronald. "Estadística Matemática". Ed. Prentice-Hall Hispanoamericana 10 Facultad de Tecnología Informática Guía de Trabajos Prácticos Levin, Richard: "Estadística para administradores". Ed. Prentice-Hall Hispanoamericana Roberto García, Inferencia Estadística y Diseño de experimentos. EUDEBA Apuntes de Cátedra que figuran en la página virtual. Sitios de Internet: PROBABILIDAD/www.alipso.com/monografías probabilidad/=228k-En cachéPáginas similares. (PDF)APUNTES DE PROBABILIDAD Y ESTADÍSTICA/IND.TEM./www.csampablo.com.ar/apuntes-archivos. *Se encuentra disponible en Biblioteca 3.3 Software necesario para desarrollar las clases. Excel 4. METODOLOGIA DE LA ENSEÑANZA El curso se desarrollará a través de actividades de enseñanza y aprendizaje que contemplan exposiciones teóricas, ejecución de trabajos prácticos individuales fuera del horario de clase y en equipo en aula, actividades especiales. Realizarán una guía de Trabajos Prácticos donde los alumnos serán los protagonistas y centro de la escena. Realizarán las conclusiones correspondientes utilizando el computador y simulando las variables aleatorias diversas. Realizarán Análisis de Casos en determinadas Actividades dadas por el docente. Entre los recursos a utilizar se contemplará biblioteca digital y consultas por Internet. Los ejercicios de aplicación serán resueltos, algunos en horario de clase con asistencia docente y otros a cargo del alumno fuera del horario habitual. Los ejercicios de aplicación formarán parte de la carpeta de trabajos prácticos que será de ejecución obligatoria e individual. Harán uso de la cátedra virtual, tanto para las actividades solicitadas como para poder investigar acerca de la teoría correspondiente. 5. CRITERIOS DE EVALUACION Un examen parcial, de acuerdo con las normas establecidas por la Universidad, con sus respectivos recuperatorios, en caso de ser necesario. Se agregarán trabajos realizados en computadora y trabajos prácticos realizados por los alumnos que serán evaluados en forma continua. 11 Facultad de Tecnología Informática Guía de Trabajos Prácticos Se tomarán sucesivos parcialitos pudiendo así obtener una evaluación permanente. Las sucesivas simulaciones realizadas con el computador serán presentadas en una carpeta donde será evaluada, con sus respectivas conclusiones. Se realizarán trabajos especiales que serán evaluados. Por lo tanto, en la evaluación se tendrá en cuenta: *El resultado del parcial *El rendimiento en el aula *La asistencia del alumno. *Las evaluaciones permanentes de los Trabajos prácticos. *El cumplimiento y la calidad de los trabajos prácticos realizados. *Entrega de los Trabajos prácticos obligatorios, en una carpeta con el CD correspondiente. Para poder rendir el Examen final, los alumnos deberán tener aprobados: *El Parcial Y *Los Trabajos prácticos, que consisten en: *Evaluaciones de Trabajos Prácticos. Se tomarán 3 evaluaciones ó más. La última evaluación comprende los temas desde el parcial al final de la cursada. Sólo se puede recuperar una evaluación. De todos modos se verá la asistencia del alumno a la asignatura y su actuación en clase. *Trabajos prácticos obligatorios de la guía. (Se pueden realizar en grupos de a dos, se presentará en un CD , e impreso en una carpeta al final de la cursada) Para conocimiento de los profesores se adjunta la resolución N.º 117/09 de la presidencia de la Universidad de Belgrano donde se establece el régimen de trabajos prácticos 12 Facultad de Tecnología Informática Guía de Trabajos Prácticos ASIGNATURA: PLAN DE ESTUDIOS: ANO ACADEMICO: CARRERA/S: AÑO: CUATRIMESTRE: PROBABILIDAD Y ESTADÍSTICA 2010 2014 Ingeniería en Sistemas/Licenciatura en Sistemas de Información 3er Año 1er cuatrimestre. Probabilidad y Estadística Trabajo práctico 1. Análisis Probabilístico Probabilidad OBJETIVO: El alumno deberá: • • • Conocer y manejar con facilidad los conceptos básicos de la Teoría de Probabilidad. Ser capaz de obtener conclusiones a partir de los resultados de su práctica. Saber sacar conclusiones de la aplicación del teorema de Bayes PRÁCTICA 1 PROBABILIDAD a) b) c) d) e) f) Ejercicio 1: Describa el espacio muestral para cada uno de los siguientes experimentos aleatorios: Se arroja una moneda equilibrada 4 veces. Se ensambla una puerta de un automóvil con un gran número de puntos de soldadura y se cuenta el número de soldaduras defectuosas. Se fabrica un tubo de rayos catódicos y se somete a una prueba de duración hasta que ocurre una falla. Se registra el tiempo de buen funcionamiento. Se eligen tres items de un lote fabricado por cierta máquina y se determina si son o no defectuosos. En una planta química el volumen diario producido de cierto producto varía entre un valor mínimo a y un máximo b. Se elige un día al azar y se observa la cantidad producida. Una paleta de 10 piezas fundidas contiene una pieza defectuosa y nueve en buen estado. Se seleccionan cuatro al azar (sin reemplazo) y se inspeccionan. 13 Facultad de Tecnología Informática Guía de Trabajos Prácticos g) Se prueban diodos de un lote uno a la vez y se marcan ya sea como defectuosos o como no defectuosos. Esto continúa hasta encontrar dos artículos defectuosos o cuando se han probado cuatro artículos. h) Una caja contiene 10 bombitas de las cuales hay 3 con filamentos rotos. Estas se prueban una por una hasta que se encuentra una defectuosa Ejercicio 2: Para cada uno de los experimentos del ejercicio 1 describa dos sucesos aleatorios y expréselos como subconjuntos del espacio muestral.Y describa los sucesos: a) a lo sumo 1 defectuoso b) b)al menos 1 defectuoso Ejercicio 3: Un fabricante tiene cinco terminales de computadora aparentemente idénticas, listas para ser enviadas a su destino, de las cuales dos son defectuosas. Si el fabricante recibe un pedido de tres terminales, defina el espacio muestral para este experimento. Ejercicio 4: Dados los sucesos A, B y C, exprese en términos de operaciones entre ellos a los sucesos siguientes y represéntelos con diagramas de Venn: i) Ocurre por lo menos uno de ellos. ii) Ocurre exactamente uno. iii) No ocurre C. iv) No ocurren ni B ni C. v) Ocurren a lo sumo dos de los sucesos. vi) Ocurren exactamente dos. Ejercicio 5: Una instalación consiste de dos calderas y un motor. Sean los sucesos, A: El motor funciona, B1: La caldera 1 funciona, B2: La caldera 2 funciona, C: La instalación funciona. Si la instalación funciona cuando lo hacen el motor y por lo menos una caldera, expresar los sucesos C y C’ en función de A, B1 y B2. Ejercicio 6: En la oficina A hay 3 varones y 2 mujeres, en la oficina B, 4 varones y 3 mujeres. Se quiere formar un equipo de 2 personas, una de cada oficina. ¿Cuántas posibilidades hay si: a)se quiere que el equipo conste de un hombre y de una mujer b)en el equipo debe haber por lo menos un hombre c)en el equipo debe haber por lo menos una mujer Ejercicio 7: De cuántas formas distintas puede fotografiarse una familia de 5 personas: a) Puestas en hilera b) si la madre y el padre se sientan juntos c) el padre se sienta en el extremo derecho d) el padre en el extremo derecho y la madre no se sienta junto a él Ejercicio 8: En una rifa de 100 números Juan adquirió 40. Determine la probabilidad de que saque sólo uno de los 3 premios. 14 Facultad de Tecnología Informática Guía de Trabajos Prácticos Rta:0,4378 Ejercicio 9: Una prueba muy común para controlar la calidad de productos alimenticios se obtiene presentando una muestra a cada uno de 3 catadores C1, C2 y C3. Dados los siguientes sucesos: A: Los 3 catadores encuentran satisfactorio el producto B: Al menos dos catadores encuentran satisfactorio el producto C: C2 encuentra satisfactorio el producto a) Represente los sucesos mediante diagramas de Venn. b) Si el producto se saca a la venta cuando C2 y otro catador lo encuentran satisfactorio exprese dicho suceso en función de A, B y C y represéntelo. Ejercicio 10: Sean A, B y C tres sucesos cuyas probabilidades son: P(A) = 0,7 P(B) = 0,4 P (C)=.0,4 P(A∩B) = 0,3 P(A∩C) = 0,25 P(B∩C) = 0,15 P(A∩B∩C) = 0,1 Calcule:a) P(A∩B∩C’);b) P(A’∩B∩C’);c) f)P[(B∪C)’] y g) P[A’∩(B∪C)]. P[(A∪B∪C)’];d) P(A∪B); e) Ejercicio 11: El doctor Carrizo y una médica de ojos verdes conforman un grupo de 8 médicos disponibles para guardias. Determine la probabilidad de que el doctor Carrizo salga elegido para integrar una guardia si: a) La guardia es de 2 médicos que se eligen entre los 8. b) La guardia es de 3 médicos elegidos entre los 8 y una de ellas es la médica rubia de ojos verdes. Rta:a) 0,25;b)0,107 Ejercicio 12: En una fábrica de tanques plásticos para bolígrafo se observa que el 89% de la producción resulta apto para su uso, el 7% presenta defectos en su bolilla y, el 6% presenta defectos en la unión del plástico y metal. a) ¿Cuál es la probabilidad de que un tanque tomado al azar presente ambos defectos? b) ¿ Cuál es la probabilidad de que un tanque tomado al azar presente un sólo defecto? Rta:a)0,02;b)0,09 Ejercicio 13-Un lote de 100 circuitos integrados contiene 20 defectuosos. Se eligen dos al azar, sin reemplazo, del lote. a)¿Cuál es la probabilidad de que el primero en ser seleccionado sea defectuoso? b)¿Cuál es la probabilidad de que el segundo sea defectuoso dado que el primero es defectuoso? c)¿Cómo cambia la respuesta del inciso b) si los circuitos se toman con reemplazo antes de la siguiente elección? Rta:0,2;b)0,188..;c)0,2 15 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 14: Un recién graduado solicita empleo en la compañía X y en la compañía Z. Se estima que la probabilidad del rechazo de por lo menos una de las solicitudes es 0.8. ¿Cuál es la probabilidad de ser empleado por lo menos por una de las compañías, si las probabilidades de ser contratado por cada una de las compañías son 0.36 y 0.42 respectivamente? Rta:0,58 Ejercicio 15: Un mecánico toma un perno y un buje para conformar un juego de perno y buje con que completará un acople de piezas. Si tomó el buje de una caja con un 8% de defectuosos y el perno de otra con el 5% de defectuosos, ¿cuál es la probabilidad de obtener un juego apto de perno y buje? Rta:0,874 Ejercicio 16:De los tres elementos de una calculadora que funcionan independientemente, dos fallaron y el otro funcionó correctamente. Halle la probabilidad de que fallen el primero y el segundo elemento si las probabilidades de falla son respectivamente: 0.2, 0.4 y 0.3 Rta:0,2978 Ejercicio 17: Dos alarmas conectadas a circuitos independientes actúan en una subusina de transformación ante un aumento sustancial de la temperatura, activando rociadores de líquido. Cada uno de los dos sistemas tiene una probabilidad de fallar de 0.09 y 0.12. ¿Cuál es la probabilidad de que en un caso de emergencia actúe por lo menos una alarma? Rta:0,9892 Ejercicio 18: En una ciudad se publican los periódicos A,B y C. Una encuesta reciente de lectores indica lo siguiente: 20% lee A, 16% lee B, 14% lee C, 8% lee A y B, 5% lee A y C, 2% lee A,B y C y 4% lee B y C. Para un adulto escogido al azar, halle la probabilidad de que: a) no lea ninguno de los periódicos b) lea exactamente uno de los periódicos c) lea al menos A y B, si se sabe que lee al menos uno del periódicos Rta:a)0,65;b) Ejercicio 19: El esquema representa un sub-circuito entre M y N. A, B, C son interruptores que cierran desde un comando, en forma independiente con probabilidades 0.9, 0.9 y 0.8 respectivamente. Si se acciona el comando de cierre, ¿cuál es la probabilidad de que pase corriente de M a N?. A C M B 16 N Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 20: En una calle de una mano, hay 2 semáforos a 400 metros de distancia que la corriente de vehículos salva en, aproximadamente, 30 segundos. En estas condiciones, quienes la transitan, permanentemente han notado que encuentran ambas luces en verde el 40% de las veces; que las encuentran en rojo el 13,5% de las veces; que el 24% de las ocasiones cruzan la 1ra en verde y se detienen ante la 2da en rojo y, en el resto de las oportunidades, se da la inversa. ¿Existe alguna coordinación entre los semáforos o actúan independientemente?. Justifique su respuesta. Ejercicio 21: Se diseña un dispositivo de frenado para evitar que un automóvil patine. El sistema completo puede descomponerse en 3 subsistemas en serie que operan en forma independiente: un sistema electrónico, un sistema hidráulico y un accionador mecánico. En un frenado particular, las confiabilidades de estas unidades son 0.995, 0.993 y 0.994 respectivamente. ¿Cuál es la confiabilidad del sistema? Rta: 0,9821 Ejercicio 22: Los registros indican que para las partes que salen de un taller de reparación de componentes hidráulicas en una instalación de reparación de aviones, el 2% tendrá un defecto en el eje; el 1% tendrá un defecto en el buje y el 97.5% no tendrá defectos: Para un artículo seleccionado al azar calcule la probabilidad de que: a) El artículo tenga por lo menos un defecto. b) El artículo tenga los dos defectos sabiendo que tiene por lo menos uno. c) El artículo tenga defecto en el buje sabiendo que tiene defecto en el eje. Rta:a)0,025;b)0,2;c)0,25 Ejercicio 23: El Banco Agosto utiliza un modelo computarizado para evaluar las solicitudes de préstamos. Esta evaluación sirve como información al momento de decidir el otorgamiento de los mismos. Históricamente, el 2% de todos los préstamos que se otorgan presentan problemas por incumplimiento de pago . Si el 70% de todas las solicitudes tienen buenas evaluaciones en el modelo computarizado y se les otorga el préstamo, determinar: a) la probabilidad de que una solicitud que recibe una buena evaluación y a la que se le otorga el préstamo no presente problemas para el pago del mismo. b) la probabilidad de que un préstamo tenga una buena evaluación y pague a tiempo. Ejercicio 24: Un conjunto electrónico consta de dos subsistemas A y B. A partir de una serie de pruebas previas, se determinó que la probabilidad de que A falle es de 0.2, la de que sólo falle B es de 0.15 y la de que fallen ambos es de 0.15. Obtenga la probabilidad de que: a) A falle sabiendo que B ha fallado b) Sólo falle A Rta:0,5;b)0,05 Ejercicio 25: Se conduce una investigación detallada de accidentes aéreos. La probabilidad de que un accidente por falla estructural se identifique es 0.9 y la 17 Facultad de Tecnología Informática Guía de Trabajos Prácticos probabilidad de que un accidente que no se debe a una falla estructural se identifique en forma incorrecta como un accidente producido por ese tipo de falla es 0.2. Si el 25% de los accidentes aéreos se deben a fallas estructurales, determine la probabilidad de que un accidente aéreo, identificado como falla estructural, se haya producido realmente por una falla de ese tipo. Rta: 0,6 Ejercicio 26: Dos máquinas automáticas, producen piezas idénticas que son colocadas en un transportador común. El rendimiento de la primera máquina es el doble del correspondiente a la segunda. La primera produce un promedio del 60% de las piezas sin defectos y la segunda un 84%. Una pieza que se toma del transportador resulta sin defectos. Encuentre la probabilidad de que esta pieza haya sido producida por la primera máquina. Rta:0,588 Ejercicio 27: Dos divisiones de producción de una fábrica se denominan M y N. La probabilidad de que M tenga un margen de utilidad de por lo menos un 10% durante este año es 0.3, de que N tenga igual margen de utilidad es de 0.2 y de que ambas alcancen dicho margen es 0.05. a) ¿Cuál es la probabilidad de que N tenga un margen de utilidad del 10%, dado que M ha alcanzado dicho margen? b) Determine si el logro de la meta de utilidad de las dos divisiones es independiente. Rta.a)0,1666..b)No son independientes Ejercicio 28: Una cadena de negocios de video vende 3 marcas diferentes de DVD. De las ventas de DVD el 50% son de la marca 1, el 30% son de la marca 2 y, el 20% son de la marca 3. Cada fabricante ofrece un año de garantía en partes y mano de obra. Se sabe que el 25% de las DVD de la marca 1 requieren trabajo de reparación en garantía, en tanto que los porcentajes correspondientes a las marcas 2 y 3 son 20% y 10% respectivamente. a) ¿Cuál es la probabilidad de que un comprador seleccionado al azar, haya comprado una DVD de la marca 1 que necesita reparación, mientras está en garantía? b) Si un cliente regresa al negocio con una DVD que necesita trabajo dentro del período de garantía, ¿cuál es la probabilidad de que sea una DVD de la marca 1?, ¿y que sea una DVD de la marca 2?, ¿y que sea una DVD de la marca 3? Rta:a)0,125,b)0,609;.. Ejercicio 29: El número de camiones, ómnibus y automóviles que pasan por una determinada ruta donde se encuentra una estación de servicio están en la relación 3:2:5. El 8% de los camiones, el 3% de los ómnibus y el 6% de los automóviles entran en la estación de servicio a cargar nafta. a) ¿Cuál es la probabilidad de que el próximo vehículo que venga por la ruta entre a cargar nafta en la estación de servicio? b) Si el último vehículo que entró cargó nafta, ¿qué probabilidad hay de que haya sido un ómnibus?. 18 Facultad de Tecnología Informática Guía de Trabajos Prácticos Rta:0,06,b)0,1 Ejercicio 30: Para aprobar un examen, un alumno debe resolver un problema de 10 minutos. Se cuenta con 4 sobres cerrados, cada uno con un problema, de los cuales debe seleccionar uno. Se sabe por otras experiencias que la probabilidad de resolver el problema más difícil es de 0.1. Las otras probabilidades son 0.3, 0.5 y 0.8. Si el alumno aprueba el examen. ¿ Cuál es la probabilidad de que haya seleccionado el problema más difícil? Rta:0,0588 Ejercicio 31: Las tres máquinas más antiguas producen un 6% de la producción de tornillos y tienen un 4% de defectuosos; otras 5 máquinas producen un 8% cada una, con un 3% de defectuosos. Por último, las 2 máquinas más modernas producen, cada una, un 21% de la producción de tornillos, con un 2% de defectuosos. a) ¿Cuál es la probabilidad de que un tornillo cualquiera, tomado al azar, resulte defectuoso? b) ¿Con qué probabilidad lo pudo haber fabricado, cualquiera de las máquinas modernas, si resultó defectuoso? Rta:0,0276;b)0,3043 Ejercicio 32: Entre la central telefónica A y B hay una cantidad de canales tal que una llamada tiene una probabilidad del 5% de encontrar congestión. En caso de encontrar congestión, la llamada es derivada a una ruta alterna en la cual la probabilidad de congestión es p. Si la llamada encuentra congestión en la ruta alterna se pierde. Calcule p para que la probabilidad de pérdida de una llamada sea 0.01. Rta:0,2 Nota.: Como evaluación serán obligatorios a presentar en las condiciones descriptas anteriormente de ésta práctica los ejercicios: 14, 17, 24, 31. TRABAJO PRÁCTICO 2. VARIABLE ALEATORIA OBJETIVO: El alumno deberá manejar el concepto de distribución de una variable aleatoria en forma general, y los parámetros que caracterizan dicha distribución. • Saber como generar una secuencia de valores aleatorias que correspondan a un comportamiento probabilístico dado. 19 Facultad de Tecnología Informática Guía de Trabajos Prácticos • • • • Saber hacer modelos mediante simulaciones con el computador, contrastando la validez de las conclusiones con los problemas reales tratados. Distinguir los distintos tipos de variables aleatorias. Distinguir variables aleatorias unidimensionales y bidimensionales. Saber calcular e interpretar el resultado de sus parámetros. PRÁCTICA 2 VARIABLES ALEATORIAS Ejercicio 1: Señale las variables aleatorias discretas: a) X: altura del Riachuelo b) Y: número de embragues defectuosos en una partida de 120 embragues c) Z: estimación de la probabilidad de defectuoso para un embrague tomado al azar d) P: puntaje que obtendrá el ganador de un certamen de ajedrez clasificado entre 10 competidores e) Q: peso de un ladrillo común f) R: grupo sanguíneo del mejor alumno del curso g) T: cantidad de cheques rechazados por una agencia bancaria en una fecha dada Rta:Y,R,T Ejercicio 2: Se van a colocar cuatro microcircuitos integrados en una computadora. Se escogen en forma aleatoria dos de los cuatro para revisarlos antes de armar la computadora. Sea X el número de circuitos integrados defectuosos que se encuentran entre los dos que se revisan. Determine la función de probabilidad de X si: a) Dos de los cuatro microcircuitos integrados son defectuosos b) Uno de los microcircuitos integrados es defectuoso Rta.a) X 0 1 2 P(x) 1/6 2/3 1/6 b) X 0 1 P(x) 0,5 0,5 Ejercicio 3: Se extraen dos bolillas de una urna que contiene bolillas así numeradas: 1, 1, 2, 2, 5. Sea X = suma de los valores obtenidos a) Halle el dominio e imagen de X b) Halle y grafique la función de probabilidad de X c) Halle y grafique la función de distribución de X d) Calcule E(X) y V(X) Rta: Dom(X) = {{1,1}, {1,2}, {1,5}, {2,2}, {2,5}} Im(X) = {2,3,4,6,7} 20 Facultad de Tecnología Informática Guía de Trabajos Prácticos x P(X) c) F(X) = 2 1/10 0 1/10 1/2 3/5 4/5 1 3 2/5 si si si si si si 4 1/10 6 1/5 7 1/5 x<2 2 ≤ x <3 3 ≤ x <4 4 ≤ x <6 6 ≤ x <7 x≥7 d) E(X) = 4.4 V(X) = 3.24 Ejercicio 4: Un capataz de una fábrica tiene tres hombres y tres mujeres trabajando para él. Desea elegir dos trabajadores para una labor especial y decide seleccionarlos al azar para no introducir algún sesgo en su selección. Sea Y el número de mujeres en su selección. a) Encuentre la función de probabilidad para Y b) Halle E(Y) y V(Y) Rta:a) Y P(Y) 0 1/5 1 3/5 2 1/5 b) E(Y) = 1; V(Y) = 2/5; D(Y)=0,632 Ejercicio 5: El gerente de producción en una fábrica ha construido la siguiente función de probabilidad para la demanda diaria ( nº de veces utilizada) de una herramienta en particular. y 0 1 2 f(y) 0.1 0.5 0.4 Le cuesta a la fábrica $10 cada vez que se utiliza la herramienta. Encuentre la media y la varianza del costo diario para el uso de la herramienta. Rta. E(X) = 13; V(X) = 41;D(X)=6,4 Ejercicio 6: El departamento de ingeniería industrial de una compañía está realizando un estudio sobre la labor de sus técnicos. Califica a sus técnicos en tres categorías: A, B y C, según el tiempo que demoran en realizar una tarea. Si las probabilidades de pertenecer a cada una de las categorías son respectivamente 0.1, 0.3 y 0.6 respectivamente y se supone que las calificaciones de los técnicos son independientes entre sí, halle la media de X: número de técnicos de la categoría A entre dos elegidos al azar. Rta: E(X) = 0.2 Ejercicio7:Una máquina puede tener un cierto número de fallas por día, no superior a 3. 21 Facultad de Tecnología Informática Guía de Trabajos Prácticos La tabla da la función de probabilidad de la variable aleatoria X : número de fallas diarias X f(X) 0 1 2 0.2 3 a) Complete la tabla sabiendo que P( X ≤ 1) = 0.5 y E(X) = 1.3 b) Halle la función de distribución de X Rta: a) X P(X) 0 0.4 b) 0 si 0.4 si F(X) = 0.5 si 0.8 si 1 si 1 0.1 2 0.3 3 0.2 x<0 0 ≤ x <1 1 ≤ x <2 2 ≤ x <3 x≥3 Ejercicio 8: Suponga que la demanda diaria de un artículo es una variable aleatoria X cuyo recorrido es R(x) = { 1,2,3,4 } y su función de probabilidad f(x) = c 2x/ x! a) Halle el valor de la constante c b) Calcule la demanda esperada c) Calcule la desviación estándar de la demanda Rta: a) c =1/6 b) 2. 1 c) 0.9938 Ejercicio 9: La función de distribución de una variable aleatoria X es: F(X) = 0 X<3 1/3 3≤X<4 1/2 4 ≤ X < 5 2/3 5 ≤ X < 6 1 X≥6 a) Calcule P ( 3 < X ≤ 5) b) Halle la función de probabilidad de X Rta: a)1/3 b) X P(x) 3 1/3 4 1/6 5 1/6 6 1/3 Ejercicio 10: Sea X una variable aleatoria cuya función de probabilidad es f(x) = 0.5 - 0.05 x2 y su recorrido R(x) = {-3,-1,1,3 } a) Calcule P( X< 0 ) 22 Facultad de Tecnología Informática Guía de Trabajos Prácticos b) Verifique que P ( X < 0 ) = P ( X > 0 ) c) Halle y grafique la función de distribución de X Rta:a)0.5 c) F(X) = 0 si x< -3 0.05 si -3 ≤ x< -1 0.5 si -1 ≤ x< 1 0.95 si 1 ≤ x <3 1 si x ≥ 3 Ejercicio 11:Una variable aleatoria discreta tiene como función de probabilidad = 0,.7.(0.3)x x = 0,1,2,3,............... p(x) a) Verifique que p(x) es una función de probabilidad. b) Halle: i) P(x >3) ii) P(4 ≤ x ≤6) iii) P(x >3 / x >1) Ejercicio 12:El tiempo de vida, en miles de horas, de una lámpara es una variable aleatoria con densidad: − 6 x 2 + 18 x − 12 f ( x) = 0 si 1 ≤ x ≤ 2 para otro x Halle la probabilidad de que una de tales lámparas, que está colocada en tenga que cambiarse durante las primeras 1.200 horas de operación. Rta:0,104 un equipo, Ejercicio 13: La demanda diaria de combustible, en miles de litros, en una estación de servicio es una variable aleatoria con función de densidad: 5 6 x 5 5 f ( x ) = − x + 4 2 0 si 0 ≤ x ≤ 1,2 si 1,2 < x ≤ 2 para otro x Al comenzar cada día se completan los tanques hasta alcanzar los 2.000 litros. Cada litro vendido produce una utilidad de 20 centavos mientras que, cada litro no vendido produce una pérdida de 1,5 centavos (debido a costos de almacenamiento). Halle la utilidad diaria esperada. 23 Facultad de Tecnología Informática Guía de Trabajos Prácticos Rta:Ayuda:U=0,2x-(2000-x)0,015; E(X)=1,066..;E(U)=199,33 Ejercicio 14: Supóngase que el tiempo, en horas, necesario para reparar una pieza de un equipo en un proceso de manufactura, es una variable aleatoria con media 5 y varianza 20. Si la pérdida de dinero, en pesos, es igual al cuadrado del número de horas necesario para llevar a cabo la reparación, determine el valor esperado de las pérdidas por reparación. Rta: 45 Ejercicio 15: La cantidad de reactivo, medido en cientos de mililitros, en un proceso químico, es una variable aleatoria X con la siguiente función de densidad: 1-x/2 si x ε (0,2) f(x) = 0 en otro caso a) Grafique la función f b) Halle la función de probabilidad acumulada c) Halle la cantidad de reactivo para el cual la probabilidad de superar dicha cantidad es 0.75 d) ¿Cuál es la probabilidad de que en tres observaciones independientes de un procesos químico exactamente una de ellas tenga una cantidad de reactivo superior a 130 mililitros? Rta:b) F(X) = 0 x – x2/4 si 1 si si x <0 0≤x≤2 x>2 c) 26.8 ml. d) 0.283 Ejercicio 16: Un fabricante de aparatos de televisión a color ofrece un año de garantía de restitución gratuita si el tubo de imagen falla. El fabricante estima el tiempo de falla T,(medido en años) como una variable aleatoria con la siguiente función de densidad de probabilidad f(t) = 1 e-t/4 4 0 t>0 en otro caso a) ¿Qué porcentaje de aparatos tendrá que reparar? b) Si la utilidad por la venta de un televisor es de $200 y la sustitución del tubo de imagen cuesta $ 50, encuentre la utilidad esperada por aparato vendido. Rta:a) 22.12%;b)188.94 24 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 17: La demanda de anticongelante, medida en cientos de litros, en una temporada tiene la siguiente función de densidad: f(x) = 1/3(4x + 1) si 0 < x < 1 ; 0 en otro caso a) Calcule P( 1/3 < x < 5/3 / x < 1/2) b) Halle E(3x –5) , E(x2 + 1) c) Halle el valor de k tal que P( x < k) = 0.04 Rta:a)4/9,b)19/6; 13/9;c)0.1 Ejercicio 18: El costo de reparación de un equipo depende del tiempo que lleva repararlo y de una serie de gastos. Cada vez que un equipo debe ser reparado hay un gasto fijo de $100 y un gasto variable de $10t. Si el tiempo de reparación tiene una función de densidad f(t) = 1/4 - t/32 si 0 ≤ t < 8 ; 0 en otro caso Halle el valor medio y la varianza del costo de reparación. Rta: E(c) = 126.67; V(c) = 355.56 Ejercicio 19:La función de distribución de una variable aleatoria w, que mide el porcentaje de cierto aditivo en gasolina es F(w) 0 w 2 w2 + 1 3 1 = w<0 0 ≤ w < 0.5 0.5 ≤ w < 1 w ≥1 a) Grafique F(w) b) Halle P( 1/3 < w < 2/3) usando la función de distribución c) Halle la función de densidad Rta: b)8/27 c) 1 f(w) = 4w 3 0 si si 0 ≤ w < 0.5 0.5 ≤ w ≤ 1 en otro caso Ejercicio 20: Una variable aleatoria continua tiene la siguiente función de densidad: x 0≤x≤1 2-x 1<x<2 0 en otro caso Se definen los siguientes sucesos: f(x) = 25 Facultad de Tecnología Informática Guía de Trabajos Prácticos A = { 0.5 < x < 1.5 } B={x>1} ¿ Son A y B independientes? Rta:Sí Ejercicio 21:La fracción de tiempo X, que un robot industrial está en operación durante una semana de 40 horas es una variable aleatoria cuya función de densidad de probabilidad es: 2X 0 <X < 1 f(X) = 0 en cualquier otro punto a) Calcule E(X) y V(X) b) Para el robot que se estudia, la ganancia semanal está dada por Y = 200X – 60, halle E(Y) y V(Y) Rta. a)2/3,1/18,b)20/3;2222,22 Ejercicio 22:El tiempo por semana que una empresa de contadores usa la unidad central de proceso (CPU) tiene como función de densidad de probabilidad ( medida en horas): 3/64(4-x)x2 0<x<4 f(X) = 0 en cualquier otro punto a) Calcule el valor esperado y la varianza del tiempo por semana que se usa la CPU b) El tiempo que se usa la CPU cuesta a la empresa $200 la hora. Calcule el valor esperado del costo semanal por usar la CPU. Rta: a)E(x)=2,4;V(x)=0,64;b)E(c)=480;V(c )=25600 Ejercicio 23: Una determinada operación, en un proceso de montaje, tiene un costo fijo de $ 12 y otro, que varía en función del tiempo empleado, a razón de $ 0.20 por segundo. Si el tiempo empleado es una variable aleatoria con media 98 segundos y varianza 68 segundos2 , determine la media y la varianza del costo total de la operación. Rta.E(X)=98;V(X)=68; C=12+0,2 x; E(C)=139,6;V(C)=2,72 Ejercicio 24: La probabilidad de que una inmobiliaria venda una propiedad con una ganancia de $3000 es 3/20, la probabilidad de que venda y gane $1500 es 7/20, la de que salga a mano es 7/20 y la de que pierda $1500 es 3/20. ¿Cuál es su ganancia esperada? Ejercicio 25:Función de variable aleatoria. Un proceso para refinar azúcar rinde hasta 1 tonelada de azúcar puro al día, pero la cantidad real producida ,Y, es una v.a. debido a descomposturas de máquinas y otros problemas. Suponga que Y tiene función densidad dada por. 26 Facultad de Tecnología Informática Guía de Trabajos Prácticos 2y, 0 ≤ y ≤ 1 0, e.o.c f(y)= A la compañía se le paga a razón de $ 300 por tonelada de azúcar refinada, pero también tiene un costo fijo general de $ 100 por día. Por tanto, la utilidad diaria, en cientos de dólares, es U=3Y-1. a)Encuentre la función densidad de probabilidad de U b)Encuentre E(U) y V(U). . Ejercicio 26: Sea Y una v.a. con función densidad de probabilidad dada por: 2(1-y) 0 ≤ y ≤1 f(y)= 0 e.o.c a) Encuentre la función densidad de U=1-2Y b)Encuentre E(U) y V(U). Ejercicio 27: Considere que x es una v.a.c con distribución de probabilidad: f(x) = x/12 si 1<x<5 0 en otro caso a)Obtenga la función dist. acumulada de x b)Calcule E(x) y V(x) c) Si Y= 3X+2, encuentre E(y) y V(y). Variables aleatorias bidimensionales Ejercicio 28: Se selecciona al azar dos repuestos para una pluma de una caja que contiene 3 repuestos azules, 2 rojos y 3 verdes. Si X es el número de repuestos azules seleccionados e Y el de rojos, encuentre. a)la función de probabilidad conjunta f(x,y) y, b)P(X,Y ∈ A { región: ( x, y ) Rta: f(x,y) 0 1 2 Tot Col x + y ≤ 1 }. ] , donde A es la 0 1 2 3/28 3/14 1/28 5/14 9/28 3/14 3/28 15/28 1/28 b)Rta:9/14. 27 Tot por Renglón 15/28 3/7 1/28 1 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 29: Dada la siguiente distribución de probabilidad conjunta es: P(x,y) Y 0 0,25 0,15 X 1 2 a) Calcular la Px / y ( x) b)Calcular Px ( x) y 2 0,05 0,1 4 0,3 0,15 Py ( y ) Ejercicio 30:Una compañía de dulces distribuye cajas de chocolates con una mezcla de cremas y nueces cubiertas, tanto en chocolate oscuro como claro. Para el caso de una caja seleccionada aleatoriamente, sean X y Y, respectivamente, las proporciones de chocolates oscuros y claros que son cremas y suponga que la función de densidad conjunta es : 2 (2 x + 3 y ) 5 f ( x, y ) = 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 0 en cualquier otro caso. a)Verifique que es función densidad. b)Encuentre la P[( X , Y ) ∈ A],donde A es la región {( x, y ) / 0 < x < 1 / 2;1 / 4 < y < 1 / 2 Rta: a)Sí;b)13/160 } Nota: Como evaluación serán obligatorios a presentar en las condiciones descriptas anteriormente de ésta práctica los ejercicios: 3-10-14-18-23-25 TRABAJO PRÁCTICO 3. VARIABLE ALEATORIA OBJETIVO: El alumno deberá distinguir entre los distintos tipos de distribuciones especiales de variables aleatorias, así como los parámetros que caracterizan dicha distribución. • Saber como generar una secuencia de valores aleatorias que correspondan a un comportamiento probabilístico dado. 28 Facultad de Tecnología Informática Guía de Trabajos Prácticos • • Saber hacer modelos mediante simulaciones con el computador, contrastando la validez de las conclusiones con los problemas reales tratados. Distinguir entre distintos modelos de distribución de variables aleatorias clásicas. DISTRIBUCIONES ESPECIALES 3.1-VARIABLES ALEATORIAS DISCRETAS Ejercicio 1: Un examen de elección múltiple consta de 10 preguntas cada una de las cuales posee 5 posibles respuestas, siendo sólo una la correcta. Suponga que un estudiante rinde el examen contestando cada pregunta en forma independiente y al azar. Si Z es el número de respuestas correctas a)Halle la distribución de Z, la media y la varianza. Interprete dichos resultados. b) Halle la probabilidad de que el alumno responda correctamente 7 preguntas. c)Si para aprobar es necesario tener más de 5 respuestas correctas. Halle la probabilidad de que un estudiante apruebe. Rta: a) Z P(z) 0 1 2 3 4 5 6 7 8 >8 0.1074 0.2684 0.3020 0.2013 0.0881 0.0264 0.0055 0.0008 0.0001 0.000 E(z)=2; V(Z)=1.6 b)0.0008 c)0.0064 Ejercicio 2: La probabilidad de que un tirador inexperto impacte en el blanco es 0.35. Si dispara 10 veces, cuál es la probabilidad de acertar por lo menos dos tiros? Rta:0,914 Ejercicio 3: Se dispone de un gran lote de artículos de los cuales se sospecha que el 10% es defectuoso. Se eligen 4 artículos al azar. Sea la v.a. X= Número de artículos defectuosos encontrados. a) Halle la distribución de X, su media y su varianza. b) Un comprador potencial del artículo regresa las piezas defectuosas para su reparación y el costo de reparación es: C=2 X2 + 3X +10 Calcule el costo de reparación esperado. Rta:12,24 Ejercicio 4: La probabilidad de que un paciente se recupere de una rara enfermedad en la sangre es 0.4. Si se sabe que 10 personas han contraído esa enfermedad, ¿cuál es la probabilidad de que: a) por lo menos 7 sobrevivan? 29 Facultad de Tecnología Informática Guía de Trabajos Prácticos b) sobrevivan de 3 a 5? c) sobrevivan exactamente 5? d)¿cuántos, en promedio, sobrevivirán? e)¿cuál es la varianza de la v.a. en cuestión? Rta.a)0,0548;0,6665;c)0,2007,d)4;e)2,4 Ejercicio 5: De acuerdo con la teoría genética, cada hijo de un par de padres en particular tiene: P(ojos azules)=0.5; P(ojos marrones)=0.2 y P(ojos verdes)=0.3. Si los padres tienen 5 hijos, halle la probabilidad de que por lo menos tres tengan ojos verdes. Rta:0,1631 Ejercicio 6: Las probabilidades de que un delegado que asiste a una convención llegue por avión, autobús, automóvil o tren son respectivamente 0.4, 0.2, 0.3 y 0.1. ¿Cuál es la probabilidad de que entre 9 delegados seleccionados al azar al menos 3 hayan llegado por avión? Rta:0,7682 Ejercicio 7: Se embarcan motores eléctricos pequeños en lotes de 50. Antes de aceptar el cargamento, un inspector elige 5 motores y los prueba uno por uno. Si ninguno de ellos es defectuoso, acepta el lote. Si encuentra que uno o más son defectuosos, se inspecciona el cargamento completo. Supongamos que en realidad hay tres motores defectuosos en el lote. ¿Cuál es la probabilidad de que se requiera una inspección al 100%? Rta:0,276 Ejercicio 8: Cincuenta representantes de cierto estado asisten a una convención política nacional, de los cuales 30 apoyan al candidato A y 20 al candidato B. Si se seleccionan aleatoriamente 5 representantes; ¿Cuál es la probabilidad de que entre estos cinco, por lo menos dos apoyen al candidato A? Rta:0,924 Ejercicio 9: Un motor de automóvil de 8 cilindros tiene dos bujías falladas. Si se quitan las cuatro bujías de un lado del motor, ¿Cuál es la probabilidad de que entre ellas se encuentren las dos que tienen fallas? Rta:0,21428 Ejercicio 10: Se sabe que el número de microorganismos por gramo de una cierta muestra de suelo diluida en agua destilada, sigue una distribución de Poisson de parámetro λ =0.8. Si una preparación con un gramo de esta dilución se vuelve turbia, este gramo contiene al menos un microorganismo. Halle la probabilidad de que una preparación que se ha vuelto turbia tenga: a) Calcule la probabilidad de que la preparación se vuelva turbia. b)un sólo microorganismo c)menos de tres microorganismos. d)más de dos microorganismos. 30 Facultad de Tecnología Informática Guía de Trabajos Prácticos Rta:a) 0,55;b)0,6536;c)0,915 Ejercicio 11: Se sabe que una fuente de líquidos contiene bacterias, con un promedio de 3 bacterias por mm3. El número de bacterias por unidad de volumen puede tomarse como una v.a. Poisson. Diez tubos de 0.5mm3 se llenan con líquido. Calcule la probabilidad de que: a) todos los tubos queden contaminados, es decir, contengan al menos una bacteria b) exactamente 7 tubos queden contaminados Rta:a)0,08,b)0,2276 Ejercicio 12: Un fabricante de cables para electricidad asegura que su producto presenta, en promedio, una falla de aislación cada cincuenta metros. Se desea comprar una partida de rollos de 200 metros si en una muestra de 10 rollos seleccionados al azar más de la mitad tienen a lo sumo dos fallas. ¿Cuál es la probabilidad de comprar la partida? Rta:Puede dejar expresada la respuesta Ejercicio 13:Suponga que 220 errores de tipeo se distribuyen aleatoriamente a lo largo de 200 páginas de un libro. Halle la probabilidad de que una página dada: a)tenga un error b)tenga dos o más errores. Rta:a)0,366;b)0,301 Nota: Como evaluación serán obligatorios a presentar en las condiciones descriptas anteriormente de ésta práctica los ejercicios: 1, 3 de variables aleatorias discretas. 1, 6, 12 de distribuciones especiales de variables aleatorias discretas. EJERCICIOS DE SIMULACIÓN DE VARIABLES ALEATORIAS CON EL COMPUTADOR 1-Simular el resultado obtenido al arrojar un dado regular. Repetir 500 simulaciones la experiencia y organizar la información en una distribución de frecuencias. 2- Simular el resultado X: suma de las caras obtenidas al arrojar dos dados regulares. Construir la distribución de frecuencias relativas. Estimar la probabilidad de que la suma dé 7 u 11. 3- La probabilidad de que un alumno lea el diario antes de asistir a clase es p= 0,25. Se toman dos alumnos al azar y se les pregunta si esa mañana leyeron el diario antes de asistir a clase. Simular la distribución de X: cantidad de alumnos que leen el diario antes de asistir a clase. Estimar la probabilidad de que al menos un alumno lea el diario. 31 Facultad de Tecnología Informática Guía de Trabajos Prácticos 4-La probabilidad de que una persona hable francés en un determinado grupo de estudiantes es 0,2. Simular la distribución de X: cantidad de personas que hablan francés en una muestra de n=6 personas que se eligen al azar. a)Realizar el histograma correspondiente. b)Estime la probabilidad de que al menos dos hablen francés. Uno de estos ejercicios debe figurar en la carpeta de Trabajos Prácticos. 3.2-VARIABLES ALEATORIAS CONTINUAS OBJETIVO: El alumno deberá manejar el concepto de distribución de una variable aleatoria en forma general, y los parámetros que caracterizan dicha distribución. • Saber como generar una secuencia de valores aleatorias que correspondan a un comportamiento probabilística dado. • Distinguir entre los distintos tipos de variables: continuas y discretas • Saber hacer modelos mediante simulaciones con el computador, contrastando la validez de las conclusiones con los problemas reales tratados. • Distinguir entre distintos modelos de distribución de variables aleatorias clásicas. 3.2-VARIABLES ALEATORIAS CONTINUAS Ejercicio 1:Sea Z una v.a. N(0,1), Halle: (a) P[Z < 1] (b) P[Z > 1] (c) P[Z < -1.5] (d) P[-1.5 < Z < 0.5] (e) P[-1.37 < Z < 2.01] (f) P[-0.73 < Z < 0] (g) P[-1.79 < Z < -0.54] (h) P[ |Z| < 0.5] Rta.a)0,8413;b)0,1587;c)0,0668;d)0,6247,e)0,8925;f)0,2653,g)0,4222,h90,383 32 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 2: Sea X una v.a. N(10,2), Halle: (a) P[8 < X < 12] (b) P[9 < X ] (c) P[X < 13] Rta:a)0,6826;b)0,6915,c)0,9332 Ejercicio 3: Sea Z una v.a. N(0,1) Halle a tal que: (a) P[Z < a] = 0.5 (b) P[Z < a] = 0.8749 (c) P[Z > a] = 0.117 (d) P[Z > a] = 0.617 Rta:a)a=0;b)a=1,15;c)a=1,19;d)a=-0,3 Ejercicio 4: Halle un número k tal que para una variable X∼ N(u,σ) se verifique que: P [u – kσ < X < u + kσ] = (a) 0.95 (b) 0.90 (c) 0.99 Rta:a)1,96;b)1,645,c)2,58 Ejercicio 5: Para armar un circuito se necesita entre otros componentes, resistencias de 119 más menos 1.2 ohms. En plaza se fabrican resistencias de valor nominal que sigue una distribución N (120,2). Calcule la probabilidad de que un comprador encuentre sólo una resistencia apta para armar el circuito, si compra 10. Rta:0,03828 Ejercicio 6: Cierta máquina manufacturera requiere de un producto específico a granel. La cantidad del producto utilizada en un día se puede representar por una distribución exponencial con parámetro 4 (mediciones en toneladas) a)Halle la probabilidad de que la fábrica vaya a utilizar más de 4 toneladas en un día determinado b)¿qué cantidad del producto a granel deberá ser almacenada para que la probabilidad de agotar la existencia sea solamente de 0.05? Rta:a)0,367;b)11,98 Ejercicio 7: Supongamos que las notas de un examen se distribuyen según una N(76,15) y al tomarlo se comprueba que un 15% obtiene sobresaliente y un 10%, insuficiente. Halle la nota mínima para aprobar y la mínima para obtener sobresaliente. Rta:S=91,6;A=56,8 33 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 8:Para un tipo de cañón dado y un alcance fijo, la distancia que recorrerá un proyectil lanzado por dicho cañón es una v.a. N (1.5 km, 0.1 km). Cual es la probabilidad de que un proyectil recorra: (a) Más de 1.72 km (b) Menos de 1.35 km (c) Entre 1.45 km y 1.62 km inclusive. (d) Si se disparan 2 proyectiles al azar. Halle la probabilidad de que ambos alcancen más de 1.6 Km Rta:a)0,0139;b)0,0668;c)0,5764;d)0,0251 Ejercicio 9: Dada 2e −2 x x > 0 f ( x) = x≤0 0 Calcule: (a) la media (b) la varianza (c)P(X > 1) (d) P(2 < X <3) (e) Halle F(x) Rta:a)1/2;b)1/4;c)0,1353,d)0,0158;e)1- e −2 x Ejercicio 10: Una refinadora de azúcar tiene tres plantas, y todas reciben azúcar morena a granel. La cantidad de azúcar que puede procesar la planta en un día se puede representar mediante una v.a. con distribución exponencial con un promedio de 4 (mediciones en toneladas) para cada una de las tres plantas. Si las plantas trabajan en forma independiente, Calcule la probabilidad de que sean exactamente dos de las tres plantas las que procesen más de 4 toneladas en un día determinado. Rta:0,26 Ejercicio 11: Los tiempos de servicio en una ventanilla de cajero de banco siguen una distribución exponencial con promedio de 3.2 minutos. Un cliente llega a la ventanilla a las 4:00 p.m. (a) Encuentre la probabilidad de que todavía esté allí a las 4:02 p.m. (b) Calcule la probabilidad de que todavía esté allí a las 4:04, dado que todavía estaba allí a las 4:02. Obtenga conclusiones. Rta:a)0,53526;b) 0,53526 34 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 12:Sea 1/5 si 0 ≤ x ≤ 5 0 e.o.c. f(x)= a)¿ Es una función de densidad? b)¿Cuál es su valor medio? c)¿Cuál es su desvío estándar? d)Calcule: (a) P(X > 3) (b) P(2 < X < 4) Rtaa)Sí;b)E(X)=2,5;c)D(X)=1,44;d) a)0,4;b)0,4 Ejercicio 13: Una sustancia radioactiva emite un promedio de 1800 partículas por hora. Calcule la probabilidad de que: (a) En un período de 2 segundos se emitan por lo menos 2 partículas. (b) En un período de t segundos no se emita ninguna partícula. Rta:a=0,2642;b) e − t / 2 Ejercicio 14: Si un paracaidista cae en un sitio aleatorio de la línea entre los marcadores A y B, encuentre la probabilidad de que la distancia con respecto a A sea más de tres veces la distancia con respecto a B. Rta.1/4 Ejercicio 15: Un fabricante de radios desea adquirir 100 resistencias de cierta marca. Supone que algunas serán defectuosas, pero sólo admitirá el lote si posee menos de cuatro defectuosas. Para verificar la calidad del lote, elige tres resistencias y las pruebas. Sea X = número de resistencias defectuosas. Si se sabe que el lote de 100 resistencias tiene 4 defectuosas. Si decide rechazar el lote si entre las 3 resistencias elegidas hay más de una defectuosa; ¿cuál es la probabilidad de rechazar el lote? Rta:0,0036 Ejercicio 16: El tiempo de un viaje (ida y vuelta) de los camiones que transportan el cemento hacia una obra en construcción de una carretera, está distribuido uniformemente en un intervalo de 50 a 70 minutos. ¿Cuál es la probabilidad de que la duración del viaje sea mayor a 65 minutos si se sabe que la duración del viaje es mayor a 55 minutos? Rta:1/3 Ejercicio 17: El tiempo de paro Y (en horas) de una máquina industrial determinada tiene aproximadamente una distribución exponencial con media igual a 2. La pérdida, 35 Facultad de Tecnología Informática Guía de Trabajos Prácticos en dólares, de la operación como resultado de ese tiempo de paro está dada por: L = 30Y + 2Y2. Halle el valor esperado de L Rta:76 Ejercicio 18: Las ausencias por enfermedad de los empleados de una empresa en un mes tienen una distribución aproximadamente N(200horas, 20 horas). (a) Calcule la probabilidad de que el próximo mes el ausentismo total por enfermedad sea menor que 150 horas. (b) Para planear el programa del mes próximo ¿Cuánto tiempo debe suponer darse al ausentismo por enfermedad, si aquella cantidad sólo se debe superar con una probabilidad de tan sólo 10%? Rta:0,0062,b)225,8 Ejercicio 19: El costo de un producto terminado se considera una variable aleatoria con distribución normal, con media igual a $1000 y dispersión igual a $ 100. a) Si se extrae al azar un producto terminado ¿cuál es la probabilidad de que su costo sea inferior a $ 1200 ¿ b) Si se toma una muestra de 10 productos terminados, calcular la probabilidad de que: i) menos de 8 de ellos tengan un costo inferior a $ 1200. ii) por lo menos 7 tengan un costo inferior a $1200. i) Hallar la cantidad esperada de productos terminados con un costo inferior a $ 1200. a)0,97725;b)i)0,0008,ii)1;iii)9,7725 Ejercicio 20:En una ciudad , el consumo diario de energía eléctrica, en millones de Kwh es una v.a. X que tiene una distribución gamma con media 6 y varianza 12. ¿Cuál es la probabilidad de que en un determinado día el consumo de energía eléctrica no exceda de 12 millones de Kwh? Rta:0,938 Ejercicio 21. El tiempo de reabastecimiento para cierto tipo de producto sigue una distribución gamma con media 40 y varianza 400. Obtenga la probabilidad de que una orden se reciba:. a)en los 20 primeros días b)los primeros 60 días después de haber sido realizada. Rta:a)0,143,b)0,849 Ejercicio 22:El tiempo de fallas en horas de una flecha está modelada según una v.a. Weibull, con β = 1 / 2 y δ = 500 horas. a)Calcule el tiempo promedio entre fallas..b)Calcule la P(X>600)? 36 Facultad de Tecnología Informática Guía de Trabajos Prácticos Rta:a)E(x)=10000hs;b)1-Fx(6000) ´ ó bien= e más de 6000hs. −( 6000 5000 )1 / 2 =0,31=> El 30,1 tienden a durar Ejercicio 23 : Suponga que la duración de un disco magnético empaquetado expuesto a gases corrosiva tiene una distribución Weibull con β = 0,5 y una vida media de 600 horas. a)Calcule la probabilidad de que un disco empaquetado dure al menos 500 horas. b) Calcule la probabilidad de que un disco empaquetado falle antes de 400 horas. Nota.: Como evaluación serán obligatorios a presentar en las condiciones descriptas anteriormente de ésta práctica los ejercicios: 1, 5, 8, 18 y 20 de distribuciones especiales de variables aleatorias continuas. TRABAJO PRÁCTICO 4 ESTIMACIÓN PUNTUAL Y POR INTERVALOS OBJETIVO: El alumno deberá saber construir los distintos intervalos de confianza, utilizando los conceptos del Teorema Central del límite. • Saber generar variables aleatorias con el computador para llegar al concepto de Teorema central del límite. • Saber como generar intervalos de confianza utilizando la simulación mediante la simulación. • Saber interpretar los diversos intervalos de confianza. TEOREMA CENTRAL DEL LÍMITE ESTIMACIÓN PUNTUAL Y POR INTERVALO Revisión de Estadística Descriptiva Ejercicio 01. En un negocio de computadoras se llevó el registro durante una hora, de la cantidad de pentdrive que compró cada cliente atendido. 1 2 3 1 4 2 5 1 1 4 2 5 37 1 2 4 1 1 3 2 1 Facultad de Tecnología Informática Guía de Trabajos Prácticos a) Indique cuál es la variable en estudio. b) Construya una distribución de frecuencias no agrupadas de la cantidad –de artículos comprados. c) Construya una distribución de frecuencias relativas no agrupadas de los mismos datos d) Construya una distribución de frecuencias relativas acumuladas de los mismos datos. e) Trace un histograma de frecuencias relativas de estos datos. f) ¿Qué cantidad de artículos compró en promedio cada cliente? Rta: X = 2,3; s = 1,4179 Ejercicio 02. Las edades de 50 estudiantes que se presentaron a un concurso de selección para un determinado trabajo fueron: 21 19 21 20 18 19 20 19 20 21 22 21 21 19 19 19 22 21 21 18 18 21 19 21 22 20 20 19 22 21 23 22 20 19 24 19 20 19 19 20 19 21 19 21 24 20 20 19 19 17 a. Construya una distribución de frecuencias no agrupadas de estas edades. b. Construya una distribución de frecuencias relativas no agrupadas de los mismos datos c. Construya una distribución de frecuencias relativas acumuladas de los mismos datos. d. Trace un histograma de frecuencias relativas de estos datos. Ejercicio 03. Los siguientes datos muestran la cantidad de días empleados en trabajos de refacción y pintura de 20 clientes de una constructora: 18 15 17 20 22 23 33 12 27 15 18 13 22 21 14 19 28 14 18 16 a) Indique cuál es la variable en estudio. b) Construya una distribución de frecuencias agrupadas en intervalos de 5 días de estos datos. c) Indique el ancho de clase, y los límites de clase. d) Trace un histograma de frecuencias de estos datos. e)Calcule las medidas de tendencia central y variabilidad y elabore un informe con los resultados obtenidos. Rta:e) X = 29,16 , me = 20 ; mo = 19 ;s=1,48;CV=7,38 Ejercicio 04. En una calle de la ciudad se midieron con radar las velocidades de 55 automóviles: 38 Facultad de Tecnología Informática Guía de Trabajos Prácticos 27 25 29 26 21 23 23 28 33 23 22 22 27 25 24 38 52 25 27 18 43 31 29 25 48 24 30 28 34 23 35 41 24 32 16 26 45 37 36 38 28 29 28 22 26 18 27 29 32 21 20 43 18 33 23 a. Clasifique estos datos en una distribución de frecuencias agrupada utilizando las clases 15-20, 20-25, ..., 50-55. b. Encuentre el ancho de clase. c. Obtenga (1) la marca de clase, (2) el límite inferior de clase, y (3) la frontera superior de clase, para la marca del intervalo 20-25. d. Construya un histograma de las frecuencias de estos datos. Ejercicio 05: En un experimento que medía el porcentaje de encogimiento al secar, once especimenes de prueba de arcilla plástica produjeron los siguientes resultados: 19.3 15.8 20.7 18.4 14.9 17.3 21.3 16.1 18.6 20.5 16.9 Halle la media, la mediana y la desviación estándar de esta muestra de porcentajes. Rta: X = 18,16 ; me = 17,3 ;No existe moda; s= 2,1472;CV=11,82 ESTIMACIÓN PUNTUAL, TEOREMA INTERVALOS DE CONFIANZA CENTRAL DEL LÍMITE, Ejercicio 1: Se diseña un ascensor cuyo límite de carga es 2000 libras. Se indica que su capacidad máxima es de 10 personas. Si el peso de las personas se distribuye según una N(185 libras,22 libras), ¿cuál es la probabilidad de que un grupo de 10 personas exceda el límite de carga del ascensor? Rta:0,0158 Ejercicio 2: Las manzanas que se producen en un huerto tienen un peso que se distribuye normalmente con una media de 200gr, y una varianza de 1600 gr2 Si las manzanas se envasan de a 30 en un cajón de peso constante 700 gr. ¿Cuál es la probabilidad de que el cajón completo pese más de 7 kilos? Rta:0,0853 Ejercicio3: Se admite que la duración en horas de las pilas para transistores, es una variable con distribución normal, con media = 100 horas y dispersión 20 horas. a) ¿Qué proporción de la producción se espera con duración comprendida entre 100 y 125 horas? b) Si se seleccionan muestras aleatorias de tamaño n=16. ¿Cuál es la proporción de 39 Facultad de Tecnología Informática Guía de Trabajos Prácticos medias muestrales con valor entre 98 y 110 horas? Analice sus resultados, comente y justifique teóricamente. Rta:a)0,3944;b)0,6326 Ejercicio 4: El tiempo en minutos, requerido para reparar una máquina de empaque de alimentos, tiene una distribución N(120, 24). Si se toma una muestra de 16 máquinas y se reparan, ¿Cuál es la probabilidad de que el tiempo medio de reparación sea mayor a 130 minutos? Rta:0,0485 Ejercicio 5: Una población de fuentes de energía para una computadora personal tiene un voltaje de salida que se distribuye normalmente con una media de 5 v. y una desviación estándar de 0.1 v. Se selecciona una muestra aleatoria de 36 fuentes de energía. a) ¿Cuál es la probabilidad de que el voltaje medio sea inferior a 4.95 v? b) ¿Cuál es el voltaje medio que no es superado con probabilidad 0.95? Rta:a)0,0013;b)5,0275 Ejercicio 6: El porcentaje de carbohidratos contenido en una pieza de pan blanco es en promedio 76 con un desvío estándar de 0.8. Se toma una muestra aleatoria de 64 piezas. Halle la probabilidad de que el porcentaje medio se encuentre en el intervalo (75.8; 76.2) Rta:0,9544 Ejercicio 7: Un fabricante de dispositivos semiconductores toma una muestra de 100 chips, y los prueba y clasifica como defectuosos o no defectuosos. Si se sabe que habitualmente hay un 2% de defectuosos, ¿Cuál es la probabilidad de que en la muestra, el porcentaje sea inferior al 1%? Rta:0,2389 Ejercicio 8: Se desea estimar la media µ de una población. Se toma una muestra de tamaño 5. Sean los siguientes estimadores: X1 + X 2 + X 3 + X 4 + X 5 5 X1 + X 5 µˆ 3 = 2 µˆ1 = X1 + 2 X 2 + 3X 3 + 4 X 4 + 5 X 5 15 X1 + 2 X 2 + 3X 3 + 2 X 4 + X 5 µˆ 4 = 9 µˆ 2 = Halle esperanza y varianza de todos los estimadores y decida a favor de uno de ellos justificando la respuesta. Rta: E ( µˆ1 ) = E ( µˆ 2 ) = E ( µˆ 3 ) = E ( µˆ 4 ) = µ ; V( µ̂1 ) = σ2/5; V( µ̂ 2 ) = 11σ2/45; V( µ̂3 ) = σ2/2; V( µ̂ 4 ) = 19σ2/81 40 Facultad de Tecnología Informática Guía de Trabajos Prácticos µ̂1 es el mejor Ejercicio 9: Se tiene una muestra de tamaño 2n de una población, de E(x) = µ y V(x) = σ2. Sean los estimadores de µ: µˆ1 = X 1 + X 2 + ... + X i + ... + X 2 n 2n µˆ 2 = X 2 + X 4 + ... + X 2i + ... + X 2 n n ¿Cuál es el mejor estimador de µ? Justifique su elección. Rta. µ̂1 es el mejor Ejercicio 10: Se desea estimar el porcentaje de votantes a favor de un determinado candidato. Se toman dos muestras independientes de tamaños 100 y 150 respectivamente. ¿Cuál de estos dos estimadores elegiría para estimar dicho porcentaje? 1 1 X X Pˆ1 = ( X1 + X 2 ) Pˆ2 = 1 + 2 250 2 100 150 ( siendo X1 el número de votantes a favor en la 1ª muestra y X2 el número de votantes a favor en la 2ª muestra). Rta: p1 es el mejor Ejercicio 11:Un fabricante produce focos que tienen un promedio de vida con distribución aproximadamente normal y una desviación estándar de 40 horas. Si una muestra de 30 focos tiene una vida promedio de 780 horas, a) Encuentre un intervalo de confianza del 96% para la media poblacional de todos los focos que produce esta empresa. b) ¿Qué tan grande se requiere que sea una muestra si se desea tener una confianza del 96% de que la media muestral esté dentro de las 10 horas del promedio real? c) Indique los límites correspondientes al 90% de confianza. Compare el resultado con el del punto(a). d) Complete: A medida que aumenta el nivel de confianza, el intervalo es más.......................... y por lo tanto, ..............................la precisión de estimación. Dado un nivel de confianza, a medida que.........................el tamaño de la muestra, se reduce el error de la estimación y por lo tanto es más............................. Rta: a) (765, 795);b) n ≅ 8 ;c)(768,792) Ejercicio 12: Una máquina de refrescos está ajustada de tal manera que la cantidad de líquido despachada se distribuye aproximadamente en forma normal con una desviación estándar igual que 0.15 decilitros. 41 Facultad de Tecnología Informática Guía de Trabajos Prácticos a) Encuentre un intervalo de confianza del 95% para la media de todos los refrescos que sirve esta máquina si una muestra aleatoria de 36 refrescos tiene un contenido promedio de 2.25 decilitros. b) ¿Qué tan grande se requiere que sea la muestra si se desea tener una confianza del 95% de que la media muestral estará dentro de 0.02 decilitros del promedio real? Rta:a)(2,2;2,3);b) n ≈ 217 Ejercicio 13: Las alturas de una muestra aleatoria de 50 estudiantes mostraron una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. a)Determine un intervalo de confianza de 98% para la altura promedio de todos los estudiantes. b)¿Qué se puede afirmar con un 98% de confianza acerca del posible tamaño del error si se estima que la altura promedio de todos los estudiantes es 174.5 centímetros? Rta a)(172,23;176,77),b) ε = 227,3 Ejercicio 14: Una muestra aleatoria de 100 propietarios de automóvil indica que, en la ciudad de Córdoba, un automóvil recorre un promedio de 23500 kilómetros por año con un desviación estándar de 3900 kilómetros. a) Determine un intervalo de confianza del 99% para la cantidad promedio de kilómetros que un automóvil recorre anualmente en Córdoba. b) ¿Qué se puede afirmar con una confianza del 99% respecto al posible tamaño del error si se estima que la cantidad promedio de kilómetros recorridos por los propietarios de vehículos en Córdoba es de 23500 kilómetros al año? Rta:a) (22496;24504) b) 1004 km Ejercicio 15:Un experto en eficiencia desea determinar el tiempo promedio que toma el hacer tres perforaciones en una cierta pieza metálica. ¿Qué tan grande se requiere que sea la muestra si se necesita una confianza del 95% de que su media muestral estará dentro de 15 segundos del promedio real? Asuma que, por estudios previos se sabe que σ = 40 segundos. Rta: n = 28 Ejercicio 16:Una máquina produce piezas metálicas de forma cilíndrica. Se toma una muestra de piezas cuyos diámetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01 y 1.03 centímetros. Encuentre un intervalo de confianza del 99% para el diámetro promedio de piezas de esta máquina, si supone una distribución aproximadamente normal. Rta :(0,97816;1,031849 42 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 17: Una muestra aleatoria de 8 cigarros de una marca determinada tiene un contenido promedio de nicotina de 2.6 miligramos y una desviación estándar de 0.9 miligramos. Determine un intervalo del 99% de confianza para el contenido promedio real de nicotina de esta marca de cigarros en particular, asumiendo que la distribución de los contenidos de nicotina es aproximadamente normal. Rta:(1,486;3,713) Ejercicio 18: Se registraron las siguientes mediciones del tiempo de secado, en horas, de una marca de pintura látex: 3.4 5.2 2.5 3.0 4.8 4.8 2.9 3.6 2.8 3.3 5.6 3.7 2.8 4.4 4.0 Suponiendo que las mediciones representan una muestra aleatoria de una población normal, Encuentre un intervalo de confianza del 99% para los tiempos promedio de secado. Rta: (3,0399;4,5325) Ejercicio 19:Se realiza un estudio para estimar el porcentaje de ciudadanos de un pueblo que están a favor de que su agua se trate con flúor. ¿Qué tan grande debe ser una muestra si se desea tener una confianza al menos de 95% de que la estimación estará dentro del 1% del porcentaje real? Ejercicio 20: Se realiza un estudio para estimar la proporción de residentes en una ciudad y en sus suburbios que están a favor de la construcción de una planta de energía nuclear. ¿Qué tan grande debe ser una muestra, si se requiere una confianza de al menos 95%, de que la estimación estará dentro del 0.04 de la proporción real de residentes que están a favor de la construcción de la planta? Ejercicio 21: Se selecciona una muestra aleatoria de 500 fumadores de cigarro y se encuentra que 86 de ellos prefieren la marca X. a) Encuentre el intervalo de confianza de 90% para la fracción de la población de fumadores que prefieren la marca X. b) ¿Qué se puede afirmar con una confianza de 90% acerca de la posible magnitud del error si se estima que la fracción de fumadores que prefieren la marca X es 0.172? Rta:0,172;b)(0,142;0,1998);c) ε = 0,02784 Ejercicio 22: En una muestra aleatoria de 1000 casas en una determinada ciudad, se encuentra que 228 de ellas tiene calefacción de petróleo. Encuentre el intervalo de confianza de 99% para la proporción de hogares en esta ciudad que tiene este tipo de calefacción. Rta: (0,1938;0,2622) 43 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 23: La Asociación Americana de Agencias de Publicidad tiene un registro de datos sobre minutos de anuncios por cada media hora de programas principales de TV. En la tabla siguiente vemos una lista de datos representativos de una muestra de programas preferentes en cadenas principales a las 8:30 P.M. 6.0 7.2 6.0 6.2 6.6 5.7 6.5 6.0 5.8 6.4 7.2 7.0 7.0 7.3 6.3 6.5 7.6 6.2 6.2 6.8 a) Determine un estimador puntual para el promedio de anuncios por cada media hora de programa. b) Suponiendo normalidad, determine un intervalo de confianza de 95% para la cantidad promedio de minutos de anuncios en los principales espectáculos televisivos a las 8:30 P.M. Rta: a) X =6.525 b)(6.27;6.78) Ejercicio 24: En la 47a Encuesta Anual de Pagos que se presenta en Business Week, se ven los datos de salario anual y bonos para los directores ejecutivos (Business Week, 21 de abril de 1997). En una muestra preliminar se vio que la desviación estándar es de $675 dólares, estando los datos en miles de dólares. ¿Cuántos directores ejecutivos deben estar en la muestra, si deseamos estimar el salario o bono anual de la media de población, con un margen de error de $100,000 dólares y una confiabilidad del 95%? (Nota: El margen de error sería ε = 100, porque los datos están en miles de dólares.) Ejercicio 25:Una encuesta de USA Today y CNN Gallup, entre 369 padres que trabajan, determinó que 200 de ellos dijeron pasar muy poco tiempo con sus niños, debido a compromisos en el trabajo (USA Today, 10 de abril de 1995) a) ¿Cuál es el estimador puntual de la proporción poblacional de padres que trabajan que creen pasar muy poco tiempo con sus hijos debido a sus compromisos en el trabajo? b) ¿Cuál es el margen de error, con 95% de confianza? c) Encuentre un intervalo de confianza de 95% para la proporción poblacional de padres que trabajan y creen pasar muy poco tiempo con sus hijos Rta:a)p=0,542,e=0,05083;c)(0,4911;0,59289 Ejercicio 26: Un senador ha conseguido los servicios de un equipo de encuestadores para determinar el porcentaje de la población que está a favor suyo. Este equipo efectuará una encuesta de opinión a $1.5 la entrevista. ¿Cuánto le costará al senador la encuesta, si insiste en que el error sea menor del 5% el 95% de las veces? Rtas: $5775 44 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 27: En una encuesta de opinión, un candidato obtiene 228 votos de 400 encuestados. a) ¿Cuál es el intervalo de confianza del 98% para estimar la verdadera proporción de votantes a favor del candidato? b) ¿A cuántos votantes hay que encuestar para tener una confianza de por lo menos 92% de que el error en la estimación de la proporción de votantes a favor del candidato con la proporción muestral, sea inferior a 0,08? Rta :a)0,512;0,628);b) n ≈ 118 Ejercicio 28: Una muestra de tamaño n1 = 25 que se toma de una población normal con una desviación estándar σ1 = 5 tiene una media x 1 = 80. Una segunda muestra aleatoria de tamaño n2 = 36, que se toma de una población normal diferente con una desviación estándar σ2 = 3, tiene una media x 2 = 75. Halle un intervalo de confianza del 95% para µ1 - µ2. Rta:( 2,8087;7,1913) Ejercicio 29: Las duraciones de superficies de rodadura de dos marcas competidoras de medida FR78-15 de llantas radiales son variables aleatorias normales con medias µ1 y µ2 y desviaciones estándares σ1 = 2200 y σ2 = 1900. Sendas muestras proporcionaron la información siguiente: n1= 40, X1 = 36500, n2 = 40, X 2 = 33400. Halle el intervalo de confianza del 95% para µ1 - µ2. Ejercicio 30: Dos máquinas A y B llenan cajas de cereal. El peso en gramos del contenido de cada caja es una variable aleatoria normal con varianza igual a 48,5 g2 si la caja es llenada por la máquina A ó por la máquina B. Con el propósito de verificar la diferencia entre el promedio de los pesos en el proceso de llenado por ambas máquinas se seleccionaron al azar 5 cajas llenadas por A y 6 cajas llenadas por B, obteniendo los siguientes pesos: Máquina A: 506 508 499 503 504 Máquina B: 497 512 514 505 493 496 Halle el intervalo de confianza del 96% para la diferencia entre los pesos medios de los contenidos de las cajas. Ejercicio 31: Un técnico desea controlar la producción de piezas que provienen de dos máquinas diferentes. A tal fin toma una muestra de ambas máquinas, midiendo los diámetros de las piezas (en cm), y obtiene los siguientes resultados: Maquina 1: 1.45 1.37 1.21 1.54 1.48 1.29 1.34 Máquina 2: 1.54 1.41 1.56 1.37 1.20 1.31 1.27 1.35 ¿Cuál es el intervalo de confianza del 95% para la diferencia de los diámetros medios? Suponga que los diámetros se distribuyen normalmente con varianzas iguales. Rta (-0,129,0,144) 45 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 32: Las siguientes muestras aleatorias son mediciones de la capacidad de producción de calor (en millones de calorías por tonelada) de especímenes de carbón de dos minas: Mina 1: 8.260 8.130 8.350 8.070 8.340 Mina 2: 7.950 7.890 7.900 8.140 7.920 7.840 ¿Cuál es el intervalo de confianza del 98% para estimar la diferencia entre las capacidades medias de producción de calor de especímenes de carbón de las dos minas? a)Suponga que las varianzas son iguales. b)Suponga que las varianzas son distintas Ejercicio 33: En una planta eléctrica manufacturera uno de los productos es un fusible eléctrico, cuya característica más importante es el tiempo que transcurre antes que se queme, cuando se lo sujeta a una carga especificada. Se llevó a cabo un programa de pruebas y se obtuvieron los siguientes datos: Día 1: 42 45 68 72 90 Día 2: 69 84 109 113 118 153 Calcule un intervalo de confianza del 90% para la diferencia entre los tiempos promedio de duración de los fusibles producidos en los dos distintos días. a) Suponga que esos tiempos de duración son variables aleatorias normales independientes con igual varianza.B)Idem si las varianzas son distintas. Obtenga conclusiones. Rta :(15,92;72,47) Ejercicio 34: En una muestra de 400 piezas que son producidas por una máquina, se encontraron 12 defectuosas, mientras que en una muestra de 500 piezas producidas por otra máquina se encontraron 20 defectuosas. Halle el intervalo de confianza del 97% para estimar la diferencia de proporciones de piezas defectuosas provenientes de ambas máquinas. Obtenga conclusiones. Rta (-0,017;0,037) Ejercicio 35: Dos marcas de refrigeradores A y B tienen una garantía de un año. En una muestra aleatoria de 50 refrigeradores de la marca A, 12 se descompusieron antes de terminar el período de garantía. Una muestra de 60 refrigeradores de la marca B arrojaron igual cantidad de desperfectos antes de finalizar el período de garantía. Estime la diferencia real entre las proporciones de fallas durante el período de garantía con un nivel de confianza de 0,98. Nota. Obligatorios de Intervalos de confianza. 5,14,21,23,27,31 SIMULACIÓN DE LA VARIABLE ALEATORIA PROMEDIO 46 Facultad de Tecnología Informática Guía de Trabajos Prácticos Simular la suma de 12 variables aleatorias uniformes (0,1) y verificar el teorema central del límite construir el histograma correspondiente, utilizando el paquete de estadística descriptiva de Excel interpretando los resultados Este trabajo debe ser presentado en carpeta ó bien en forma digital. TRABAJO PRÁCTICO 5 TESTS DE HIPÓTESIS OBJETIVO: El alumno deberá saber construir las distintas hipótesis. • Saber construir la zona de rechazo. • Distinguir entre el error de tipo I y de tipo II • Interpretar las conclusiones después de realizar un test de Hipótesis.. PRÁCTICA 5 TESTS DE HIPÓTESIS Ejercicio 1: Para cada una de las siguientes aseveraciones, diga si es una legítima hipótesis estadística y porqué: a) H : µ > 100 b) H : x = 45 c) H : p ≤ 0.2 d) H : µ = 4 e) H : X ≥ 5 Rta:a),c),d)Sí. B) y e) no Ejercicio 2: Supongamos que en las especificaciones de procedimientos de una planta de energía nuclear se establece que la resistencia media de soldadura debe superar 100 lb/plg 2 .Suponga que usted es el director del equipo de inspección del ente regulador estatal que debe determinar si la planta cumple con las especificaciones. Usted plantea seleccionar una muestra al azar de soldaduras y realizar pruebas en cada soldadura de la muestra. 47 Facultad de Tecnología Informática Guía de Trabajos Prácticos a) ¿Cuáles son las hipótesis a testear? b) Explique que significan en este contexto el error de tipo I y el de tipo II y discuta cuales son las consecuencias de cometer cada tipo de error. Ejercicio 3: Se toman muestras de agua de la que se utiliza para enfriamiento a medida que se descarga de la planta eléctrica de un río. Se ha determinado que mientras la temperatura media del agua descargada sea menor a 150º F, no habrá efectos negativos en el ecosistema del río. Para investigar si la planta cumple con los reglamentos que prohíben una temperatura media de descarga de por lo menos 150º F, el ente regulador tomará muestras de agua en 50 horas seleccionadas al azar y registrará su temperatura. a) ¿Cuáles son las hipótesis nula y alternativa que debe plantear el ente regulador? b) En el contexto de esta situación, describa los errores de tipo I y II y las consecuencias de cometerlos. Rta:Se rechaza H 0 Ejercicio 4: Una mezcla de ceniza pulverizada de combustible y cemento debe tener una resistencia a la compresión de más de 1300 KN/m 2 . La mezcla no se utilizará a menos que una evidencia experimental indique de manera concluyente que se ha satisfecho la especificación de resistencia. Supongamos que la resistencia a la compresión para especímenes de esta mezcla está distribuida normalmente con σ = 60 . Denotemos por µ el verdadero promedio de resistencia a la compresión. a) ¿Cuáles son las hipótesis nula y alternativa adecuadas? b) Denotemos por X el promedio de resistencia muestral compresiva para 20 especímenes seleccionados al azar. Si se plantea un test cuya región de rechazo es X > 1331.26 , ¿Cuál es la máxima probabilidad de cometer error de tipo I para esta región de rechazo? c) ¿Cuál debería ser la región de rechazo para que el test tenga nivel 0.05? Ejercicio 5: La calibración de una balanza debe verificarse al pesar 25 veces un espécimen de prueba de 10 kg. Supongamos que los resultados de diferentes pesadas son independientes entre sí y que el peso de cada intento está normalmente distribuido con σ = 0.2 kg . Si µ es el verdadero peso promedio de lectura de la balanza, a) ¿Cuáles son las hipótesis a testear? b) ¿Cuáles son los valores de X que lo llevarían a rechazar Ho a un nivel de 0.05? c) ¿Cómo se modificaría su región de rechazo si su muestra fuera de tamaño 10? d) Mediante el uso de la parte c), ¿ qué concluye de los siguientes datos muestrales? 9.981, 10.006, 9.857, 10.107, 9.888, 9.793, 9.728, 10.439, 10.214, 10.190 ¿cuál es el valor p de su conclusión? Rta:d) No hay evidencias suficientes de que el peso difiere de 10Kg a nivel del 0,05.Valor de P=0,749 Ejercicio 6: Se ha propuesto un nuevo diseño para el sistema de frenos de un automóvil. Se sabe que para el sistema actual, el verdadero promedio de distancia de 48 Facultad de Tecnología Informática Guía de Trabajos Prácticos frenado, a 40 millas por hora, bajo condiciones especificadas, es de 120 pies. Se propone que el nuevo diseño se ponga en práctica, sólo si los datos muestrales indican fuertemente una reducción en el verdadero promedio de distancia de frenado para el nuevo diseño. a) Defina el parámetro de interés e indique las hipótesis pertinentes. b) Suponga que la distancia de frenado para el nuevo sistema está normalmente distribuida con una desviación estándar σ = 10 y desea plantear un test de nivel 0.01 basado en una muestra de tamaño 16, ¿cuál es la región de rechazo? c) En una muestra de tamaño 16 se obtuvo un promedio muestral de 118 pies, ¿ encuentra suficiente evidencia de una reducción en la distancia promedio de frenado a un nivel del 1%? Ejercicio 7: Se desea comprobar el promedio de lectura de velocímetros de una marca en particular, cuando la velocidad es de 55 millas por hora. El promedio muestral y desviación estándar muestral resultantes de 40 velocímetros elegidos al azar fueron 53.8 y 1.3 respectivamente. Sea µ el verdadero promedio de lectura cuando la velocidad es 55 millas por hora. ¿Sugiere fuertemente la evidencia muestral que el promedio de lectura de los velocímetros difiere de la velocidad real cuando esta es de 55 millas por hora? Utilice un test de nivel 0.01. Ejercicio 8: Se determinó la cantidad de desgaste de un eje, después de un recorrido fijo de millas para 8 motores de combustión interna que tienen cobre y plomo como material antifricción, resultando un promedio muestral de 3.72 y una desviación estándar muestral de 1.25. a) Si se supone que la distribución de desgaste del eje es normal, plantee un test de nivel 0.05 para probar H 0 : µ = 3.5, versus H 1 : µ > 3.5 b) ¿Cuál es su conclusión en este caso? Rta: No hay evidencias suficientes para rechazar la H 0 Ejercicio 9: La ingestión recomendada de dieta diaria de zinc entre hombres mayores de 50 años es de 15 mg/día. Para una muestra de 115 hombres entre 65 y 74 años de edad se obtuvo un promedio muestral de 11.3 mg/día y una desviación estándar muestral de 6.43. ¿ Indica esta información, a un nivel del 5% que el promedio diario de ingestión de zinc, en la población de todos los hombres entre 65 y 74 años , cae debajo de los recomendado? Ejercicio 10: Se seleccionó una muestra de 12 detectores de radón de cierto tipo y cada uno se expuso a 100 pCi/L. Las lecturas resultantes fueron las siguientes: 105.6, 90.9, 91.2, 96.9, 96.5, 91.3, 100.1, 105.0, 99.6, 107.7, 103.3, 92.4 ¿Sugiere esta información que la lectura media de población bajo estas condiciones difiere de 100? Establezca y pruebe las hipótesis pertinentes con α = 0.05 . Suponga que los datos siguen una distribución normal. 49 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 11: Los registros de la Dirección Nacional de Vehículos de Motor indican que de todos los vehículos que se sometieron a prueba de verificación durante el año anterior, 70% pasaron al primer intento. Una prueba aleatoria de 200 automóviles probados en una localidad en particular durante el año actual indica que 156 pasaron en la prueba inicial. ¿Sugiere esto que la verdadera proporción de esta localidad, durante el año actual, difiere de la proporción anterior a nivel nacional? Pruebe las hipótesis pertinentes usando α = 0.05 . ¿Cuál es el valor p de su conclusión? Rta: Sí, hay evidencias de que la proporción de esta localidad difiere de la del año anterior. El p valor es 0.0136 Ejercicio 12: Una compañía telefónica está tratando de determinar si algunas líneas en una gran comunidad deben instalarse subterráneas. Debido a que se hará un pequeño cargo adicional en las cuentas telefónicas para pagar los costos extra de instalación, la compañía ha determinado hacer un estudio entre los clientes y continuar si el estudio indica fuertemente que más del 60% de todos los clientes están a favor de la instalación subterránea. Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del cargo adicional , ¿qué debe hacer la compañía? Pruebe las hipótesis pertinentes usando α = 0.05 . Rta: A un nivel del 5% la compañía debe instalar las líneas subterráneas. Ejercicio 13: En la venta de un determinado producto industrial en polvo es muy importante la homogeneidad del proceso medida por la varianza de la concentración de materia activa. Se está estudiando la incorporación de un nuevo tipo de mezclador que mejoraría la homogeneidad. El departamento de estadística de la fábrica informa que sería económicamente conveniente el cambio si la nueva varianza es inferior a 0.22 %2, ya que se obtendría un aumento en el volumen de ventas y en el precio del producto. Se realizaron 17 determinaciones de la concentración de materia activa incorporando el nuevo tipo de mezclador que arrojaron una varianza de 0.10 %2. ¿Es aconsejable el cambio a partir del resultado de una prueba de nivel de significación 0.05? Suponga que la concentración de materia activa sigue una distribución normal Ejercicio 14: Dos tornos automáticos producen ejes cuyos diámetros son variables aleatorias normales con desvíos estándares de 2.8 y 2.3 mm respectivamente. Se quiere, con un nivel de significación 0.05, ensayar la hipótesis de que las producciones de ambos tornos tienen igual valor medio. Muestras de 20 y 25 piezas producidas respectivamente por cada torno arrojaron las siguientes medias de sus diámetros: 17.32 mm y 16.41 mm. ¿Habrá que rechazar la hipótesis? Ejercicio 15: Se estudia la tasa de combustión de dos propelentes sólidos utilizados en los sistemas de escape de emergencia de aeroplanos. Se sabe que las tasas de combustión de los dos propelentes son variables aleatorias normales con la misma desviación estándar; esto es σ1 = σ2 = 3 cm/s. Se prueban dos muestras aleatorias de n1 = 20 y n2 = 20 especímenes. Las medias muestrales de la tasa de combustión son x 1 = 19 cm/s y x 2 = 24 cm/s. ¿Son estas medias significativamente diferentes al nivel del 1%? Rta: Hay evidencias suficientes para concluir que las medias difieren 50 Facultad de Tecnología Informática Guía de Trabajos Prácticos Ejercicio 16: Existen dos tipos de plástico apropiados para su uso por un fabricante de componentes electrónicos. La tensión de ruptura de cada uno de estos dos tipos de plástico se puede considerar como una variable aleatoria normal. Se sabe que σ1 = σ2 = 1 psi. De muestras aleatorias de tamaños n1 = 10 y n2 = 12, se tiene que x 1 = 165.5 y x 2 = 155.0. La compañía no adoptará el plástico 1 a menos que la tensión de ruptura media de este exceda a la del plástico 2 al menos por 10 psi. Sobre la base de la información contenida en las muestras, ¿deberá la compañía utilizar el plástico 1?. Utilice α = 0.05 para llegar a una decisión. Rta: No hay evidencias suficientes para rechazar H 0 Ejercicio 17: Un experimento para comparar la resistencia de cohesión a la tensión de morteros modificados con morteros no modificados resultó en x1 = 18.12 (para el mortero modificado) y x2 = 16.87 (para el mortero no modificado) en muestras de tamaño n1 = 15 y n2 = 12 respectivamente. Se supone que las resistencias siguen una distribución normal con σ 1 = 1.6 y σ 2 = 1.4 . Pruebe a nivel 0.01 la hipótesis de que la resistencia media de los morteros modificados es superior a la de los no modificados. Rta: Se acepta H 0 Ejercicio 18: Una empresa alimenticia dispone de dos equipos para el llenado de paquetes de cereal. El gerente y su supervisor quisieran saber si hay alguna diferencia entre las cantidades promedio por caja de cereal llenada por el equipo A y el equipo B. La información sobre sendas muestras se resume en la forma siguiente. Media Desvío Tamaño de muestra Equipo A 366.35 g 16.71 g 13 Equipo B 369.74 g 14.20 g 15 ¿Qué conclusión podrá obtenerse haciendo una prueba al nivel de significación 0.01? Suponga que las cantidades llenadas por ambas máquinas siguen una distribución normal con igual varianza Rta. Se acepta H 0 Ejercicio 19: Dos técnicos de control de calidad miden el acabado de la superficie de una pieza metálica, obteniendo los resultados siguientes: Técnico 1: 1.45 1.37 1.21 1.54 1.48 1.29 1.34 Técnico 2: 1.54 1.41 1.56 1.37 1.20 1.31 1.27 1.35 Determine si existe diferencia significativa entre las medias obtenidas con α= 0.05. 51 Facultad de Tecnología Informática Guía de Trabajos Prácticos Suponga que las mediciones de los dos técnicos siguen distribuciones normales con igual varianza. Rta No hay evidencias para rechazar la hipótesis nula. Ejercicio 20: El jefe de servicios de una empresa química está evaluando la posibilidad de modernizar los sistemas de seguridad de las calderas. Le ofrecen un sistema importado con una tecnología de punta pero, como adquirirlo significa una gran inversión, decide someterlo a un período de prueba en una de las calderas y comparar los tiempos de respuesta logrados con los del sistema en uso en las mismas condiciones de prueba. Sólo justifica el cambio si el tiempo de respuesta se reduce en más de 0.1 segundos y le asigna 0.10 a la probabilidad de comprarlo en caso de que esto no suceda. Los resultados de la experiencia fueron los siguientes: Sistema viejo 2.99 2.84 3.01 2.70 2.86 3.20 3.17 2.65 Sistema nuevo 2.50 2.88 2.94 2.71 2.79 2.60 2.44 2.65 ¿Qué decisión debería tomar el jefe de servicios? Suponga que los tiempos de respuesta de ambos sistemas se distribuyen normalmente con igual varianza. Rta Se rechaza la hipótesis nula . El nuevo sistema reduce en un tiempo de 0,1 seg Ejercicio 21: Un fabricante desea comparar la tensión promedio de su hilo con la de su más cercano competidor. Las tensiones de 100 hilos para cada marca se observaron bajo condiciones controladas. Las medias y desviaciones estándar de cada marca fueron las siguientes: Media Desvío Fabricante 110.8 10.2 Competidor 108.2 12.4 ¿existe alguna razón para pensar que hay una diferencia entre las tensiones promedio de ruptura de los dos hilos? Use un nivel de significación de 0.02 Rta: Se acepta la hipótesis nula. Ejercicio 22: Se cree que el promedio verbal para el número de respuestas correctas para un determinado tipo de prueba para las mujeres es mayor que el de los hombres por más de 10 puntos. Las muestras aleatorias para ambos sexos arrojaron los siguientes resultados: Mujeres Hombres Media 480 460 Desvío 60 52 Tamaño 125 100 ¿Apoyan los datos la creencia a un nivel de 0.05? Nota.Obligatorios:8,10,15,18. 52 Facultad de Tecnología Informática Guía de Trabajos Prácticos TRABAJO PRÁCTICO 6 REGRESIÓN Y CORRELACIÓN OBJETIVO: El alumno deberá reconocer el significado de la regresión.. • Saber construir la recta de regresión lineal • Explicar el significado de la correlación. • Interpretar el resultado del error en la regresión. • Distinguir entre el error de tipo I y de tipo II • Interpretar las conclusiones después de realizar un test de Hipótesis.. PRÁCTICA 6 REGRESIÓN Y CORRELACIÓN Ejercicio 1: Se desea determinar la relación existente entre la cantidad real de un componente químico en un líquido para revelar fotografías y la cantidad estimada por un método de análisis químico. Se presume que existe una relación lineal. Se realizan a tal efecto 8 análisis de la cantidad de sustancia química, obteniendo los siguientes resultados: Valor real: 1 1 2 2 3 3 4 4 Valor estimado: 1.0 1.4 2.2 2.1 3.3 3.2 4.1 4.4 Halle la recta de regresión muestral y dibújela sobre el diagrama de dispersión Rta: y = 1.025 x + 0.15; r=0,9932; r 2 =0,984 Ejercicio 2: Un ingeniero está investigando el efecto de la temperatura de operación de proceso en el rendimiento de un producto. El estudio da como resultado los siguientes datos Temperatura (º C) Rendimiento (%) 100 45 110 51 120 54 130 61 140 66 150 70 a) Halle los coeficientes de la recta de regresión muestral 53 160 74 170 78 180 190 85 89 Facultad de Tecnología Informática Guía de Trabajos Prácticos b) Estime el rendimiento promedio cuando la temperatura es de 140º Rta: a) y = 0.483 x - 2.739 b)E(Y140) = 64.88; r= 0,998; r 2 =0,996 Ejercicio 3: Se hizo un estudio sobre la relación existente entre el cilindraje de un motor de automóvil y el consumo de nafta por milla. Se obtuvieron los siguientes datos Cilindraje 350 350 250 351 225 440 231 262 (Pulg cúbicas) Millas por galón 18.90 17.00 20.00 18.25 20.07 11.20 22.12 21.47 a) Ajuste un modelo de regresión que relacione las millas recorridas con el cilindraje del motor. b) ¿Qué porcentaje de la variabilidad total en las millas recorridas explica el modelo? Rta:a) y = -0.04 x + 30.9867;b)80.77% Ejercicio 4: La resistencia del papel utilizado en la manufactura de cajas de cartón (Y) se relaciona con el porcentaje de la concentración de madera dura en la pulpa original(X). En condiciones controladas, una planta piloto manufactura 8 muestras, cada una de diferentes lotes de pulpa y se mide la resistencia a la tensión. Los datos son los siguientes: X Y 1. 0 101.4 1.5 117.1 2.0 2.2 2.4 131.9 146.8 133.9 123.0 2.5 145.2 2.8 134.3 3.0 a) Ajuste un modelo de regresión a los datos b) Estime la resistencia del papel para una concentración de 2.3 Rta: a) y = 17.4636 x + 91.2165;b) E(y2.3) = 131.38 Ejercicio 5: Una firma de servicios de electricidad debe prever constantemente la demanda de electricidad semanal para administrar adecuadamente los inventarios de petróleo utilizados. Se supone que la demanda de electricidad puede variar directamente con la temperatura. Se analizaron 12 semanas del año pasado obteniendo los siguientes resultados: Predicción de temperatura media Consumo de petróleo hecha por el servicio meteorológico (Grados F.) (miles de litros) 81 83 86 93 83 92 89 99 93 101 105 79 78 102 111 76 54 Facultad de Tecnología Informática Guía de Trabajos Prácticos 112 105 98 96 100 113 110 122 a)Halle la ecuación de regresión muestral b)Estime el consumo promedio de petróleo, para una semana en la que la predicción del servicio meteorológico para la temperatura media fue de 90º 55 e) Realice un pequeño informe con los datos y resultados obtenidos. Ejercicio 06: Los promedios finales para 10 estudiantes elegidos al azar que asisten a un curso de estadística para ingenieros y a otro de investigación operativa se muestran a continuación. Estadística 86 Operativa 80 75 81 69 75 75 81 90 92 94 95 83 80 86 81 71 76 65 72 a) b) c) Estime el coeficiente de correlación lineal. Pruebe la hipótesis H0: ρ = 0 al nivel del 5%. Haga una predicción sobre el promedio en Investigación Operativa de un estudiante que obtuvo un promedio de 85 en Estadística. d) Haga una predicción sobre el promedio en Estadística de un estudiante que obtuvo un promedio 80 en Investigación Operativa. Rta: y = 30,94 + 0,632 x ; b) Se rechaza H o .c)84,66; Ejercicio 07: Un ingeniero investiga la distribución de latas de cerveza y las operaciones del servicio de ruta para máquinas expendedoras. Se supone que el tiempo requerido para cargar una máquina expendedora se relaciona con el número de latas entregadas del producto. Se selecciona una muestra aleatoria de 9 entregas y se dispone de los datos de tiempo de entrega en minutos Y y el número de latas entregadas X. X 2 Y 9.95 8 24.4 11 10 31.75 35.00 8 25.02 4 16.86 2 14.38 a) Estime el coeficiente de correlación muestral. b) Pruebe la hipótesis H0: ρ = 0 al nivel del 5%. c) ¿Qué porcentaje de la variabilidad total del explicado por la regresión sobre el número de latas?. Rta:a)r=0,9598;b) Se rechaza H o ;c) r 2 = 0,9213 .;92,13% 2 9.60 9 24.35 tiempo de entrega es Ejercicio 08: Se quiere conocer el grado de relación lineal existente entre el porcentaje de carbono en las fundiciones y su dureza. Los ensayos y medidas efectuadas han dado los siguientes resultados Carbono 4.01 Dureza 176 3.65 219 3.68 213 4.33 141 3.76 209 3.81 206 3.79 206 3.61 229 3.40 237 4.12 183 a) Halle el coeficiente de correlación muestral. b) Estudie la significación de dicho coeficiente al nivel del 1%. Rta.a)r =-0,9739; b) Existe un 94,8% de variabilidad Nota :Obligatorios. Elegir tres de estos ejercicios y hacerlos en Excel con sus conclusiones y gráficos. 56 TRABAJO PRÁCTICO 7 ANÁLISIS DE LA VARIANZA OBJETIVO: -Saber interpretar el efecto de experimentos de una ó más variables con un factor. -Saber diseñar dichos experimentos. PRÁCTICA 7 ANÁLISIS DE LA VARIANZA 1-Los valores codificados para una medida de elasticidad de un plástico preparado por dos procesos diferentes se proporcionan en la tabla. Las muestras independientes, ambas de tamaño 6, se tomaron de la producción de cada uno de los procesos. ¿Los datos presentan suficiente evidencia para indicar una diferencia en elasticidad media en los dos procesos? A 6,1 7,1 7,8 6,9 7,6 8,2 B 9,1 8,2 8,6 6,9 7,5 7,9 Use el ANOVA para probar las hipótesis apropiadas. Pruebe en el nivel α = 0,05 de significaciancia. 2- Cuatro grupos de estudiantes se someten a diferentes técnicas de enseñanza y se examina al final de un período especificado. Como consecuencia de las deserciones de los grupos experimentales (por enfermedad, transferencia, etc), el número de estudiantes varío de un grupo a otro. ¿Los datos que se muestran en la tabla presentan suficiente evidencia para indicar diferencia de éxito medio para las cuatro técnicas de enseñanza? 1 65 87 73 79 81 69 2 75 69 83 81 72 79 3 59 78 67 62 83 76 4 94 89 80 88 Otros ejercicios de Regresión y Correlación para hacer en Excel: 57 Ejercicio 1: Se piensa que el porcentaje de impurezas en gas oxígeno producido en un proceso de destilación se relaciona con el porcentaje de hidrocarburo en el condensado principal del procesador. Se dispone de los siguientes datos: Pureza (%) Hidrocarburo(%) 86.91 89.85 90.28 86.34 92.58 87.33 86.29 91.86 1.02 1.11 1.43 1.11 1.01 0.95 1.11 0.87 a)Ajuste un modelo de regresión lineal simple a los datos b)Estime el coeficiente de correlación Ejercicio 2: Los promedios finales para 10 estudiantes elegidos al azar que forman un curso de estadística para ingenieros, y otro de investigación operativa se muestran a continuación Estadística 86 Operativa 80 75 81 69 75 75 81 90 92 94 95 83 80 86 81 71 76 65 72 a) Estime el coeficiente de correlación lineal b) Haga una predicción sobre el promedio en Investigación Operativa de un estudiante que obtuvo un promedio de 85 en Estadística. c) Haga una predicción sobre el promedio en Estadística de un estudiante que obtuvo un promedio 80 en Investigación Operativa. Ejercicio 3: Un ingeniero investiga la distribución de latas de cerveza y las operaciones del servicio de ruta para máquinas expendedoras. Se supone que el tiempo requerido para cargar una máquina expendedora se relaciona con el número de latas entregadas del producto. Se selecciona una muestra aleatoria de 9 entregas y se dispone de los datos de tiempo de entrega en minutos (Y) y el número de latas entregadas (X) X Y 2 9.95 8 24.4 11 31.75 10 35.00 8 4 2 2 25.02 16.86 14.38 9.60 9 24.35 a) Estime el coeficiente de correlación muestral b)¿Qué porcentaje de la variabilidad total del tiempo de entrega es explicado por la regresión sobre el número de latas ? Ejercicio 4: Diez aspirantes a un empleo realizaron una prueba de aptitudes y fueron contratados. Después de un año, su desempeño y rendimiento en el trabajo, fueron calificados Prueba 7 6 5 4 5 8 7 8 9 6 Calif. 8 7 6 6 7 10 9 9 10 8 a) Halle la recta de regresión muestral. ¿Cómo interpreta los coeficientes de dicha recta? 58 b) ¿Cuál es el grado de asociación lineal que hay entre estos dos conjuntos de puntajes? c)¿Qué calificación cabe esperar en promedio de un aspirante que obtiene 6 puntos en la prueba? Ejercicio 5: Los promedios finales para 10 estudiantes elegidos al azar que asisten a un curso de estadística para ingenieros y a otro de investigación operativa se muestran a continuación. Estadística 86 Operativa 80 a) b) c) d) 75 81 69 75 75 81 90 92 94 95 83 80 86 81 71 76 65 72 Estime el coeficiente de correlación lineal. Pruebe la hipótesis H0: ρ = 0 al nivel del 5%. Haga una predicción sobre el promedio en Investigación Operativa de un estudiante que obtuvo un promedio de 85 en Estadística. Haga una predicción sobre el promedio en Estadística de un estudiante que obtuvo un promedio 80 en Investigación Operativa. Ejercicio 6: Un ingeniero investiga la distribución de latas de cerveza y las operaciones del servicio de ruta para máquinas expendedoras. Se supone que el tiempo requerido para cargar una máquina expendedora se relaciona con el número de latas entregadas del producto. Se selecciona una muestra aleatoria de 9 entregas y se dispone de los datos de tiempo de entrega en minutos Y y el número de latas entregadas X. X Y 2 9,95 8 24,4 11 31,75 10 35 8 25,02 4 16,88 a) Estime el coeficiente de correlación muestral. b) Pruebe la hipótesis H0: ρ = 0 al nivel del 5%. c) ¿Qué porcentaje de la variabilidad total del explicado por la regresión sobre el número de latas?. 2 14,86 2 9 14,38 24,35 tiempo de entrega es Ejercicio 7: Se quiere conocer el grado de relación lineal existente entre el porcentaje de carbono en las fundiciones y su dureza. Los ensayos y medidas efectuadas han dado los siguientes resultados Carbono 4.01 Dureza 176 3.65 219 3.68 213 4.33 141 3.76 209 3.81 206 3.79 206 3.61 229 a) Halle el coeficiente de correlación muestral. b) Estudie la significación de dicho coeficiente al nivel del 1%. 59 3.40 237 4.12 183 TRABAJO PRÁCTICO 7 CASO A RESOLVER 1DEPARTAMENTO DE TRANSPORTE DE LOS ESTADOS UNIDOS Como parte de un estudio sobre la seguridad en el transporte, el Departamento de Transporte en ese país reunió datos sobre la cantidad de accidentes fatales por cada 1000 licencias de conducir y el porcentaje de conductores con licencia menores de 21 años, en una muestra de 42 ciudades. A continuación vemos esos datos recopilados durante un período de un año. Estos datos están disponibles en Internet en el archivo titulado Safety. Porcentaje menor Accidentes fatales Porcentaje menor Accidentes fatales de 21 años por 1000 licencias de 21 años por 1000 licencias 13 2.962 17 4.100 12 0.708 8 2.190 8 0.885 16 3.623 12 1.652 15 2.623 11 2.091 9 0.835 17 2.627 8 0.820 18 3.830 14 2.890 8 0.368 8 1.267 13 1.142 15 3.224 8 0.645 10 1.014 9 1.028 10 0.493 16 2.801 14 1.443 12 1.405 18 3.614 9 1.433 10 1.926 10 0.039 14 1.643 9 0.338 16 2.943 11 1.849 12 1.913 12 2.246 15 2.814 14 2.855 13 2.634 14 2.352 9 0.926 11 1.294 17 3.256 Informe gerencial 1. Elabore resúmenes numéricos y gráficos para estos datos. 2. Aplique el análisis de regresión para investigar la relación entre la cantidad de accidentes fatales y el porcentaje de conductores menores de 21 años. Comente sus resultados. 3 ¿Qué conclusión y/o recomendaciones puede sacar de su análisis? Este trabajo debe ser presentado en carpeta ó bien en forma digital. 60 Facultad Ingeniería y Tecnología Informática Licenciatura en Sistemas de Información Ingeniería Informática Probabilidad y Estadística Profesora: Lic. Haydeé Castelletti Lunes a viernes de 9 a 21 h. Torre Universitaria, Zabala 1837, primer nivel inferior. C1426DQG - CABA Teléfono: 4788-5400, internos 5002 y 2122. Email: fasciculos@ub.edu.ar www.ub.edu.ar