Download tomo 1 de estadística ii de cir - la importancia de las matematicas
Document related concepts
no text concepts found
Transcript
TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR TOMO 1 COMPULIBRO ESTADISTICA II DE CIR ESCRITO POR CARLOS IVAN RESTREPO EL LIBRO EN SU TOTALIDAD ESTA EN CD. DONDE ENCONTRARAS EJERCICIO DE PROFUNDIZACION SI DESEAS EL CD LLAMAR AL 3006096633 O ESCRIBIR AL CORREO CAIVAR@HOTMAIL.COM 1 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR AGRADESCO PRIMERO A DIOS A MI ESPOSA HIJOS Y NIETOS QUE ME BRINDAN EL ESPACIO DE DEDICARLE HORAS A LO QUE MAS ME GUSTA QUE ES TRANSMITIR POR ESCRITO LO APRENDIDIO A TRAVES DE MIS AÑOS DE ENSEÑANZA DE LA ESTADISTICA 2 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR CONTENIDO LA IMPORTANCIA DE LA ESTADISTICA 6 CAPITULO 1 7 RESUMEN 7 FUNDAMENTOS DEL AREA DE MODELOS PROBABILISTICOS 7 COMPETENCIAS Y HABILIDADES SOCIALES 9 1) COMPETENCIAS ESPECÍFICAS 9 2) COMPETENCIAS TRANSVERSALES 9 HISTORIA DE LA ESTADÍSTICA Y LA PROBABILIDAD 9 TOMA DE DESICIONES 10 TEORIA DE PROBABILIDADES 10 TIPOS DE PROBABILIDAES 12 APLICACIONES 12 ELEMENTOS DE ESTADISTICA DESCRIPTIVA 13 DEFINICIÓN DE ESTADÍSTICA 13 POBLACION 13 INDIVIDUO 13 MUESTRA 13 MUESTREO 14 VALOR 14 DATO 14 DEFINICIÓN DE VARIABLE 14 VARIABLE CUALITATIVA 14 VARIABLE CUALITATIVA NOMINAL 14 VARIABLE CUALITATIVA ORDINAL 14 VARIABLE CUANTITATIVA 15 a) VARIABLE DISCRETA 15 b) VARIABLE CONTINÚA 15 PRUEBA DE STURGES 15 FACTORIAL DE UN NÚMERO NATURAL 17 VARIACIONES 17 VARIACIONES CON REPETICIÓN 18 PERMUTACIONES 18 PERMUTACIONES CON REPITICION 19 COMBINACIONES 20 COMBINACIONES CON REPETICIÓN 21 ELEMENTOS DE PROBABILIDAD 22 ZONA DE EJEMPLOS 23 EJERCICIOS DE REPASO DEL CAPITULO 1 32 3 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR CAPITULO II 42 DISTRIBUCIONES 43 I) LA DISTRIBUCIÓN BINOMIAL: B(n, p) 43 ELEMENTOS DE ESTADISTICA PARA RESOLVER PRO 48 II) DISTRIBUCIÓN DE POISSON 49 III)DISTRIBUCION MULTINOMIAL 54 IV) DISTRIBUCION HIPERGEOMETRICA 55 V) DISTRIBUCION NORMAL 59 PROPIEDADES DE LA DISTRIBUCIÓN NORMAL 60 VI) DISTRIBUCION GEOMETRICA 64 VII) DISTRIBUCION EXPONENCIAL 67 FUNCIÓN DE DENSIDAD O LEY DE PROBABILIDAD 70 FUNCIÓN DE DISTRIBUCIÓN 71 DISTRIBUCIÓN UNIFORME 76 DISTRIBUCION UNIFORME DISCRETA 77 DISTRIBUCIÓN T STUDENT 78 OTRAS DISTRIBUCIONES 80 1) DISTRIBUCIÓN DE CAUCHY 80 2) DISTRIBUCIÓN ERLANG 80 3) DISTRIBUCIÓN DE LAPLACE 81 4). DISTRIBUCIÓN DE PARETO 82 5.).DISTRIBUCIÓN LOGÍSTICA 82 6) DISTRIBUCIÓN DE GUMBEL 83 7) DISTRIBUCIÓN DE RAYLEIGH 83 8) DISTRIBUCIÓN DE WEIBULL 84 9) DISTRIBUCIÓN BETA 84 EJERCICIOS DE REPASO CAPITULO II 85 CAPITULO III 99 ERROR MUESTRAL 99 ESTIMACION 100 ESTIMACIÓN DE UNA PROPORCIÓN 102 LONGITUD DEL INTERVALO DE CONFIANZA 107 MUESTREO 107 LA ENCUESTA 108 TIPOS DE ENCUESTAS 108 TIPOS DE PREGUNTA 109 REGLAS PARA LA ELABORACION DE UN CUESTIONARIO 110 LA ENTREVISTA 110 TIPOS DE MUESTREO 111 I. MUESTREO PROBABILÍSTICO 111 2. MUESTREO ALEATORIO SIMPLE 111 3. MUESTREO ALEATORIO SIN REPOSICIÓN 112 4. MUESTREO ALEATORIO CON REPOSICIÓN 113 5. MUESTREO ALEATORIO SISTEMÁTICO 114 6. MUESTREO ALEATORIO ESTRATIFICADO 115 7. MUESTREO POR CONGLOMERADO 115 II MUESTREO NO PRIOBABILISTICO 115 1.- MUESTREO POR CUOTAS 116 4 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 2.- MUESTREO INTENCIONAL O DE CONVENIENCIA 117 3.- BOLA DE NIEVE: 117 TAMAÑO DE MUESTRA 117 CÁLCULO DEL TAMAÑO DE LA MUESTRA DE BASE 120 DISTRIBUCIONES MUESTRALES 122 TEOREMA DEL LÍMITE CENTRAL 125 DISTRIBUCIÓN MUESTRAL DE MEDIAS 126 VALOR ESPERADO 129 DISTRIBUCIÓN MUESTRAL DE LA MEDIA CON σ2 DESCONOCIDA 131 DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN 131 DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS 133 DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE PROPORCIONES 136 DISTRIBUCIÓN MUESTRAL DE NÚMERO DE DEFECTOS 144 EJERCICIO DE REPASO CAPITULO III 148 LINKGRAFIA 161 5 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR LA IMPORTANCIA DE LA ESTADISTICA Se mostrara a través del libro la importancia de la estadística a través de grandes frases sobre ella como se presenta a continuación. Una única muerte es una tragedia, un millón de muertes es una estadística. Josef Stalin En estadística, lo que desaparece detrás de los números es la muerte. Günter Grass Democracia: es una superstición muy difundida, un abuso de la estadística. Jorge Luis Borges La esencia de la vida es la improbabilidad estadística a escala colosal. Richard Dawkins La falacia del cuadro estadístico estriba en que es unilateral, en la medida en que representa sólo el aspecto promedio de la realidad y excluye el cuadro total. La concepción estadística del mundo es una mera abstracción, y es incluso falaz, en particular cuando atañe a la psicología del hombre. Carl Jung Conseguimos obtener así la fórmula estadística para conocer aproximadamente la posición de un eléctron en un instante determinado. Pero, personalmente, no creo que dios juegue a los dados. Albert Einstein 6 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR CAPITULO I ESTE CAPITULO TIENE COMO OBJETIVO ELEMENTOS QUE DEBEMOS APLICAR EN EL CURSO ASPECTOS GENERALES DE QUE TRATA EL CURSO RESUMEN Se describe una propuesta didáctica de enseñanza contextualizada partiendo de que el estudiante debe conocer elementos de estadística inferencial como el concepto de probabilidades, propiedades y teorema total y de bayes y con uso del programa g STAT STUDENT de las distribuciones muéstrales, aplicación de pruebas de hipótesis y a las técnicas de regresión en el aula de estadística para ingenieros de segundo año universitario extendido a cualquier otra carrera. Apropiándonos de la teoría de las funciones semióticas, desarrollada en la Universidad de LA UNIDAD CENTRAL DEL VALLE, caracterizamos los elementos de significado de las propiedades importantes de las distribuciones muéstrales y evaluamos, mediante campos de problemas algebraicos y de simulación, los errores o dificultades que los alumnos ponen de manifestó en las aplicaciones de simulación de procesos en las ciencias de la ingeniería. Como consecuencia, al considerar los elementos de significado adquiridos en las respuestas de los estudiantes, proponemos la simulación para muestras pequeñas y grandes de forma intuitiva, como primer acercamiento del alumno hacia la construcción del significado de las distribuciones muéstrales, usando el lenguaje gráficos con apoyo del computador, para posteriormente analizar con los estudiantes su forma algebraica según la naturaleza de las variables aleatorias contando para esto con una página base para desarrollar sus dudas llamada de vitutor. Palabras clave: Enseñanza y aprendizaje de la estadística, distribuciones muéstrales, regresiones significado y comprensión, simulación. ALERTA : SIEMPRE QUE ENCUENTRES ESTA IMAGEN TE PIDES QUE TERMNES EL EJEMPLO DADO FUNDAMENTOS DEL AREA DE MODELOS PROBABILISTICOS Se describe el marco teórico empleado, que ha situado los elementos de significado institucional y personal de LA DISTRIBUCIÓN MUESTRAL, PRUEBAS DE HIPOTESIS , DE ANALISIS DE MUESTREO DE REGRESIONES LINEALES Y NO 7 a) b) c) d) e) f) 8 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR LINEALES Y LAS IMPLICACIONES DE LOS NUMEROS INDICES y a continuación alguna investigaciones previas relacionadas con sus propiedades y la simulación en ingeniería. Significado y comprensión de la distribución y als aplicaciones de la regresiones lineales y no lineales, el análisis de las covarianzas de los números índices e asumen como una actividad humana implicada en la solución de cierta clase de situaciones problemáticas de la cual emergen y evolucionan progresivamente los objetos matemáticos. Se pretende elaborar un modelo de los procesos de comprensión de las matemáticas que tenga en cuenta los factores institucionales y socioculturales implicados en los mismos. El autor considera diferentes entidades primarias como constituyentes del significado de un objeto matemático (por ejemplo), que son las que se analizan en este trabajo: a) Problemas y situaciones que inducen actividades matemáticas y definen el campo de problemas asociado al objeto. b) Procedimientos, algoritmos, operaciones. Cuando un sujeto se enfrenta a un problema y trata de resolverlo, realiza distintos tipos de prácticas, que llegan a convertirse con el tiempo en objeto de enseñanza. c) Representaciones materiales utilizadas en la actividad de resolución de problemas (términos, expresiones, símbolos, tablas, gráficos). d) Abstracciones (conceptos, proposiciones). Las definiciones y propiedades características del objeto y sus relaciones con otros conceptos. e) Demostraciones que empleamos para probar sus propiedades y que llegan a formar parte de su significado. Objetivos generales. El alumno debe: Conocer y aplicar correctamente los procedimientos de análisis de datos que mas habitualmente son utilizados en el proceso de obtención de información cientí fica en el ámbito de la ingeniería. Identificar la cuestión planteada y formularla en términos de hipótesis científicas. Gestionar bases de datos informatizadas: Organizar, introducir y procesar los datos correctamente. Seleccionar las técnicas más adecuadas para responder a las cuestiones planteadas considerando las características de los datos, con que se opera. Realizar los cálculos mediante ordenador. Interpretar los resultados y extraer las conclusiones TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR COMPETENCIAS Y HABILIDADES SOCIALES. 1) COMPETENCIAS ESPECÍFICAS. a) Competencia número 1: Conocer los principios del método científico y las características de los diferentes métodos utilizados en en el área de las ingenierías y sus técnicas de análisis. b) Competencia número 2: Ser capaz de aplicar el conocimiento metodológico para resolver los problemas planteados en la práctica profesional. c) Competencia número 3: Ser capaz de analizar datos psicológicos mediante programas estadísticos y otras tecnologías de la información. d) Competencia número 4: Ser capaz de interpretar, valorar críticamente y comunicar los resultados de la evidencia empírica. 2) COMPETENCIAS TRANSVERSALES. a) Desarrollar habilidades de expresión oral y escrita encaminadas a realizar y presentar en público informes científicos. b) Trabajar en grupo (a desarrollar en las prácticas con ordenador). c) Búsqueda de fuentes bibliográficas y documentación. HISTORIA DE LA ESTADÍSTICA Y LA PROBABILIDAD Se dice en el mundo de la arqueología que la presencia del hueso astrágalo de oveja o ciervo en las excavaciones arqueológicas más antiguas, parece confirmar que los juegos de azar tienen una antigüedad de más de 40.000 años, y la utilización del astrágalo en culturas más recientes, ha sido ampliamente documentada. Pero no solo esa es una señal de la antigüedad de los juegos de azar, pues aquellos que han tenido la ocasión de visitar las pirámides de Egipto han podido detallar pinturas que muestran juegos de azar que datan del año 3.500 a. C. y Herodoto se refiere a la popularidad y difusión en su época de los juegos de azar, especialmente la tirada de astrágalos y dados. Los dados más antiguos se remontan a unos 3000 años antes de Cristo y se utilizaron en el juego como en ceremonias religiosas. Todo lo anterior conlleva a pensar que las civilizaciones antiguas, explicaban el azar mediante la voluntad divina como se puede apreciar en la civilización griega o romana que utilizaban la configuración resultante de tirar cuatro dados para predecir el futuro y revelar la voluntad favorable o desfavorable de los dioses. Pero no únicamente los griegos o los romanaos realizaban prácticas de juego de azar también se encontraron prácticas similares en culturas tan distintas como la tibetana, la india o la judía.. A medida que transcurre el tiempo y el cambios de periodos de la civilización, en unos de esos periodos llamado renacimiento aparece un nuevo enfoque global de considerar al mundo, desde la perspectiva de un 9 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR abandono progresivo de explicaciones teológicas los cuales conduce a una reconsideración de los experimentos aleatorios; y los matemáticos italianos del siglo XVI, comienzan a interpretar los resultados de experimentos aleatorios simples. Cardano, establece la equiprobabilidad de aparición de las caras de un dado a largo plazo yes asi como a finales del siglo XVI, existía un intuitivo pero preciso análisis empírico de los resultados aleatorios que conllevo a el desarrollo del análisis matemático de los juegos de azar se produce lentamente durante los siglos XVI y XVII, y algunos autores consideran como origen del cálculo de probabilidades la resolución del problema de los puntos en la correspondencia entre Pascal y Fermat en 165 lo que hace consolidar el cálculo de probabilidades como disciplina independiente en el período que transcurre desde la segunda mitad del siglo XVII hasta comienzos del siglo XVIII donde la teoría de la probabilidad fue aplicada con buenos resultados a las mesas de juego y con el tiempo a otros problemas socioeconómicos. Pero es precisamente en el siglo XVIII que el cálculo de probabilidades se extiende a problemas físicos y actuariales (seguros marítimos) siendo este el principal impulsor de la astronomía y física donde surgen problemas ligados a la contrastación empírica de la teoría de Newton donde sus investigaciones toman gran importancia en el desarrollo de la Estadística. Ya en el siglo XX nace la industria de los seguros, la cual requería de un conocimiento exacto del riesgo de perder pues de lo contrario no se podían calcular las pólizas lo que llevo muchos años después a que se incluyera en muchos centros de enseñanza, ele estudios de las probabilidades como un instrumento que les permitiría entender los fenómenos sociales que permitiera comparar con exactitud los datos observados con la teoría requería un tratamiento riguroso del mismo, que va a dar lugar a la teoría de errores. Debido a esto aparecen matemáticos como D. Bernoulli, Abraham de Moivre, el reverendo Thomas Bayes y Joseph Lagrange inventaron fórmulas y técnicas de probabilidad y en una de esas formula Bernouilli proporciona la primera solución al problema de estimar una cantidad desconocida a partir de un conjunto de mediciones de su valor que, por el error experimental, presentan variabilidad. Fue pionero en la aplicación del cálculo infinitesimal al cálculo de probabilidades. Pero no únicamente los matemáticos mencionados anteriormente trabajaron en el área de las probabilidades existieron otros como Pierre Simon, Marqués de Laplace quien indujo la primera definición explícita de probabilidad y desarrolló la ley normal como modelo para describir la variabilidad de los errores de medida; también formuló y estimó el primer modelo explicativo estadístico y donde Gauss hace su aporte con respecto a la estimación de modelos estadísticos. Continuando con esta lista encontramos, geólogo y astrónomo Bravais, que es el primero en considerar la relación entre errores de medida dependientes entre sí; a Benjamín Pierce que establece el primer criterio para rechazar observaciones heterogéneas con el resto , y en el siglo xix 10 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR aparece , el más famoso astrónomo americano llamado S. Newcomb que el que l introduce los primeros métodos de estimación cuando hay errores fuertes en algunos datos (Estimación Robusta). TOMA DE DECISIONES Hoy por hoy la teoría matemática de la probabilidad constituye el fundamento de las aplicaciones estadísticas tanto en la investigación científica, económica, social, ingenieril como aspecto fundamental de la toma de decisiones la cual e hace que vivamos en un mundo inestable donde somos incapaces de pronosticar el futuro con absoluta certeza a pesar de los avances tecnológicos y donde la necesidad de sortear la incertidumbre nos lleva a estudiar y aplicar la teoría de la probabilidad. El concepto de la probabilidad pasa por la cabeza de cualquier ciudadano y con algún conocimiento sobre los posibles resultados de una decisión. que nos permita reconocer nuestras suposiciones, de tal manera que podamos comunicar a otros nuestro razonamiento y tomar una decisión más inteligente de la que lograríamos recurriendo a un método que no sea científico. Pero en un mundo globalizado donde los perfiles de los hombres son tan diferente ya que encontramos el hombre de negocios, el jugador de póquer o el estratega militar, etc. que deben tomar decisiones en condiciones de incertidumbre con respecto al futuro y para ello debe relacionar una probabilidad numérica con cada evento posible que pueda influir en el resultado de sus decisiones, y que el tener éxito que tenga en la toma de decisiones, estará enlazada a la capacidad de tratar sistemáticamente con la incertidumbre misma mediante cuidadosas evaluaciones y aplicaciones de métodos estadísticos concernientes a las actividades de los negocios. LA TEORÍA DE LA PROBABILIDAD Cuando se hable de probabilidad lo primero que debemos pensar es que la probabilidad está relacionada con un evento numérico comprendido entre 0 y 1, el cual representa el riesgo o la posibilidad de que ocurra ese evento. Una probabilidad de (P = 0) significa que el evento es imposible ; si P = 0.50, es tan probable que el evento ocurra como que no ocurra; si P = 1, es seguro que suceda. Un aspecto importante es que el valor de P no puede ser negativo ni mayor que uno y además se puede considerar que la probabilidad es la frecuencia relativa de "éxitos" o aciertos (es decir, la ocurrencia de un evento determinado) en un proceso aleatorio en que se ha repetido un gran número de pruebas o ensayos. La frecuencia relativa es el número de "éxitos" dividido entre el número de pruebas efectuadas. 11 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR FUENTES DE PROBABILIDADES Es posible estimar probabilidades mediante cualquiera de las tres siguientes maneras alternativas: 1. Frecuencia relativa de eventos pasados. Las probabilidades pueden estimarse a partir de las frecuencias relativas que se observen en un experimento controlado, o mediante muestreo de un universo grande y finito. La probabilidad a priori (previa) se deduce de la experiencia obtenida de la observación prolongada. Donde las probabilidades de eventos complicados pueden determinarse a partir de las probabilidades de eventos más sencillos, por medio de un método de simulación, utilizando un modelo experimental diseñado para representar las condiciones reales del mismo. 2. Distribuciones teóricas. Las probabilidades pueden determinarse sin recurrir a las frecuencias relativas. Estas probabilidades pueden determinarse a partir de la distribución binomial, sin recurrir a experimentos o muestras basadas en la experiencia pasada. La validez de dichas distribuciones teóricas depende de cuán fielmente las hipótesis representen la realidad. 3. Apreciación subjetiva. Si ninguno de los métodos anteriormente mencionados pueden utilizarse, el responsable de la toma de decisiones debe estimar las probabilidades en base a su juicio o criterio y experiencia. Una probabilidad subjetiva es una evaluación que una persona que toma decisiones hace acerca de la vero – similitud relativa de que ocurra un evento incierto, o sea, representa las "apuestas" que se hacen sobre la concurrencia de ese evento. Tales apreciaciones son sumamente personales y, por lo tanto, dos individuos pueden asignar diferentes probabilidades subjetivas al mismo evento. TIPOS DE PROBABILIDADES 1. Probabilidad simple. Probabilidad de que el dato escogido tenga una característica. 2. Probabilidad conjunta. Probabilidad de escoger un dato con dos (o más) características específicas. 3. Probabilidad marginal (al margen de la tabla). No es más que la probabilidad simple, vista con otro enfoque; o sea, mientras que la probabilidad simple es un concepto singular, la probabilidad marginal es esencialmente una suma de probabilidades conjuntas. 4. Probabilidad condicional. La característica específica del dato es la condición (condiciona la probabilidad). APLICACIONES En estos tiempos modernos hace que la complejidad de los negocios en los últimos años, ha incrementado el uso de la estadística para tomar decisiones en cualquier nivel de la administración. 12 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Las aplicaciones de métodos estadísticos en las diferentes áreas son numerosas; por ejemplo: gráficas y tablas estadísticas son usadas frecuentemente por gerentes de ventas para representar hechos numéricos de ventas; métodos de muestreo son empleados por investigadores de mercado, al hacer encuestas sobre las preferencias del consumidor sobre ciertas marcas de artículos competitivos; métodos de control de calidad, aplicados en producción, etc.1 RECORDEMOS ELEMENTOS DE ESTADISTICA DESCRIPTIVA DEFINICIÓN DE ESTADÍSTICA La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadístico consta de las siguientes fases: Recogida de datos. Organización y representación de datos. Análisis de datos. Obtención de conclusiones. Conceptos de Estadística POBLACIÓN Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico. INDIVIDUO Un individuo o unidad estadística es cada uno de los elementos que componen la población. MUESTRA Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población. 11 aprendeenlinea.udea.edu.co/lms/moodle/mod/.../view.php?...true... 13 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR MUESTREO El muestreo es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población. VALOR Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y sello. DATO Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. DEFINICIÓN DE VARIABLE Una variable estadística es cada una de las características cualidades que poseen los individuos de una población. o Tipos de variable estadísticas VARIABLE CUALITATIVA Las variables cualitativas se refieren a características o cualidades que no pueden ser medidas con números. Podemos distinguir dos tipos: VARIABLE CUALITATIVA NOMINAL Una variable cualitativa nominal presenta modalidades numéricas que no admiten un criterio de orden. Por ejemplo: no El estado civil, con las siguientes modalidades: soltero, casado, separado, divorciado y viudo. VARIABLE CUALITATIVA CUASICUANTITATIVA ORDINAL O VARIABLE Una variable cualitativa ordinal presenta modalidades no númericas, en las que existe un orden. Por ejemplo: La nota en un examen: suspenso, aprobado, notable, sobresaliente. 14 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Puesto conseguido en una prueba deportiva: 1º, 2º, 3º,... Medallas de una prueba deportiva: oro, plata, bronce. VARIABLE CUANTITATIVA Una variable cuantitativa es la que se expresa mediante un número, por tanto se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos: a) VARIABLE DISCRETA Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores específicos. Por ejemplo: El número de hermanos de 5 amigos: 2, 1, 0, 1, 3. b) VARIABLE CONTINÚA Una variable continua es aquella que puede tomar valores comprendidos entre dos números. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la práctica medimos la altura con dos decimales, pero también se podría dar con tres decimales. PRUEBA DE STURGES Se para disminuir un numero amplio de intervalos al azar y ser más precisos a la hora de construir intervalos Permite disminuir la aleatoridad de los intervalos a través: ¡) k= 1+3,3LogN ¡¡) RANGO INICIAL= DM-dm ¡¡¡) C¡= (amplitud de intervalo) ¡v) Cn= es la aproximación al dato entero que sigue si es discreta, ej. C¡= 2,4= 3 v) RANGO NUEVO= Rn= (Cn)(k) v¡) DIFERENCIA DE RANGOS= Rn-Ri 15 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR v¡¡) AJUSTE= DR-1 si es discreto v¡¡¡) SESGO: -par, ajuste ÷ 2 -impar, ajuste se limita, ejm: 7= 3ó4 y 4ó3 EJEMPLO 1.1 Distribuir en intervalos los siguientes datos: 4 10 21 9 18 8 11 22 9 19 12 12 23 11 20 16 13 24 11 20 20 14 15 11 20 24 15 15 11 21 5 16 15 13 20 6 17 15 15 15 7 18 5 16 15 8 19 7 17 15 9 20 9 17 14 ¡) K= 7 ¡¡) Ri= 24-4= 20 iii) Ci= iv) Cn= 3 v) Rn= (3)(7)= 21 vi) Dr= 21- 20= 1 vii) AJ= 1-1= 0 Intervalos 4-6 7-9 10-12 13-15 16-18 19-21 22-24 ∑ Ni 4 8 8 13 8 10 4 55 X´ 5 8 11 14 |7 20 23 98 ∑(x´ni) 20 64 88 182 136 200 92 782 Nota si es decimales el Cn será el decima que sigue y si es el dato es discreto se continua con en le Cn con el entero que sigue 16 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR FACTORIAL DE UN NÚMERO NATURAL Es el producto de los “n” factores consecutivos desde “n” hasta 1. El factorial de un número se denota por n!. VARIACIONES Se llama variaciones ordinarias de m elementos tomados de n en n (m ≥ n) a los distintos grupos formados por n elementos de forma que: No entran todos los elementos. Sí importa el orden. No se repiten los elementos. También podemos calcular las variaciones mediantefactoriales: Las variaciones se denotan por EJEMPLO 1.2 Calcular las variaciones de 6 elementos tomados de tres en tres. EJEMPLO 1.3 Cuántos números de tres cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5 ? m=5 n=3 m≥n No entran todos los elementos. De 5 dígitos entran sólo 3. 17 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Sí importa el orden. Son números distintos el 123, 231, 321. No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes. VARIACIONES CON REPETICIÓN Se llama variaciones con repetición de m elementos tomados de n en n a los distintos grupos formados por n elementos de manera que: No entran todos los elementos si m > n. Sí pueden entrar todos los elementos si m ≤ n Sí importa el orden. Sí se repiten los elementos. EJEMPLO 1.4 ¿Cuántos números de tres cifras se puede formar con los dígitos: 1, 2, 3, 4, 5 ? m=5 n=3 No entran todos los elementos. De 5 dígitos entran sólo 3. Sí importa el orden. Son números distintos el 123, 231, 321. Sí se repiten los elementos. PERMUTACIONES Sí entran todos los elementos. Sí importa el orden. No se repiten los elementos. 18 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLO 1.5 ¿Cuántos números de 5 cifras diferentes se puede formar con los dígitos: 1, 2, 3, 4, 5? m=5 n=5 Sí entran todos los elementos. Sí importa el orden. No se repiten los elementos. El enunciado nos pide que las cifras sean diferentes. PERMUTACIONES CIRCULARES Se utilizan cuando los elementos se han de ordenar "en círculo", (por ejemplo, los comensales en una mesa), de modo que el primer elemento que "se sitúe" en la muestra determina el principio y el final de muestra. EJEMPLO 1.6 Calcular las permutaciones circulares de 7 elementos. PC7= (7 − 1)! = 6! = 6 · 5 · 4 · 3 · 2 · 1 = 720 PERMUTACIONES CON REPETICIÓN Permutaciones con repetición de m elementos donde elprimer elemento se repite a veces , el segundo b veces , el tercero c veces, ...(m = a + b + c + ... = n) son los distintos grupos que pueden formarse con esos m elementos de forma que : Sí entran todos los elementos. Sí importa el orden. Sí se repiten los elementos. 19 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLO 1.7 Con las cifras 2, 2, 2, 3, 3, 3, 3, 4, 4; ¿cuántos números de nueve cifras se pueden formar? m=9 a=3 b=4 c=2 a+b+c=9 Sí entran todos los elementos. Sí importa el orden. Sí se repiten los elementos. COMBINACIONES Se llama combinaciones de m elementos tomados de n en n (m ≥ n) a todas las agrupaciones posibles que pueden hacerse con los m elementos de forma que: No entran todos los elementos. No importa el orden. No se repiten los elementos. También podemos calcular las combinaciones mediante factoriales: EJMEPLO 1.8 En una clase de 35 alumnos se quiere elegir un comité formado por tres alumnos. ¿Cuántos comités diferentes se pueden formar? No entran todos los elementos. No importa el orden: Juan, Ana. No se repiten los elementos. 20 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR COMBINACIONES CON REPETICIÓN Las combinaciones con repetición de m elementos tomados de n en n (m ≥ n), son los distintos grupos formados por n elementos de manera que: No entran todos los elementos. No importa el orden. Sí se repiten los elementos. Números combinatorios El número por se llama también número combinatorio. Se representa y se lee "m sobre n". Propiedades de los números combinatorios 1. 2. 3. EJEMPLO 1.9 En una bodega hay cinco tipos diferentes de botellas. ¿De cuántas formas se pueden elegir cuatro botellas? No entran todos los elementos. Sólo elije 4.. 21 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR No importa el orden. Da igual que elija 2 botellas de anís y 2 de ron, que 2 de ron y 2 de anís. Sí se repiten los elementos. Puede elegir más de una botella del mismo tipo. ELEMENTOS DE PROBABILIDAD Probabilidad de la unión de sucesos incompatibles A p(A B= B) = p(A) + p(B) Probabilidad de la unión de sucesos compatibles A p(A B≠ B) = p(A) + p(B) − p(A B) Probabilidad condicionada Probabilidad de la intersección de sucesos independientes p(A B) = p(A) · p(B) Probabilidad de la intersección de sucesos dependientes p(A B) = p(A) · p(B/A) Probabilidad de la diferencia de sucesos Teorema de la probabilidad total p(B) = p(A1) · p(B/A1) + p(A2) · p(B/A2 ) + ... + p(An) · p(B/An ) 22 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR TEOREMA DE BAYES 0 ≤ p(A) ≤ 1 p(E) = 1 ZONA DE EJEMPLOS ALGUNOS EJEMPLOS TOMADOS DE http://www.vitutor.net/1/52.html EJEMPLO 1.10 Se tira 2 dados, ¿Cuál es la probabilidad de que salga: 5, 7, 9, 10? LEY DE (1,1) (1,2) (1,3) (1,4) (1,5) (1,6) (2,1)……………………………(2,6) (3,1)…………………………....(3,6) S= (4,1)……………………………(4,6) (5,1)……………………………(5,6) (6,1)……………………………(6,6) Para 5: (1,4)(4,1)(2,3)(3,2) P(5)= 4/36= 0,1111= 11,11% Para 7:(1,6)(6,1)(2,5)(5,2)(3,4)(4,3) P(7)= 6/36= 0,1667= 16,67% Para 9: (4,5)(5,4)(3,6)(6,3) P(9)= 4/36= 0,1111= 11,11% 23 LAPLACE TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Para 10: (5,5) (6,4)(4,6) P(10)= 3/36= 0,0833= 8,33% EJEMPLO 1.11 Dada la función ½ para x>0 F(x)= ¾ para x x<2 1 para x>=2 Hallar a) P(x>=0) SI P(X<0) =½ b) Hallar el complemento de P(x<0) c) P(x>=0) SOLUCION a) AXIOMA: P(x>=0)+P(x<0)= 1 P(x>=0)= 1-P(x<0) = 1- ½= ½ ESTIMADO ESTUDIANTE REALIZAR B Y C EJEMPLO 1.12 Dados los puntos (-20,0) y (30,1) hallar a) b) c) d) La pendiente La ecuación de la recta que pasa por esos puntos La grafica Dada la grafica escriba análisis a través de intervalos SOLUCION a) 24 m 1 0 1 30 (20) 50 b) TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Y-Y1= m(X-X1) CUAL ES EL VALOR DE b c)La grafica d) Dada la función de la grafica: f(x)= 0 si 1 si x<=-20 x>10 EJEMPLO 1.13 Hallar la probabilidad de que al levantar unas fichas de dominó el maestro Alfonso Acuña obtenga un número de puntos mayores que 9 o que sea múltiplo de 4. 25 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLO 1.14 NEWTON lanza dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: 1)La probabilidad de que salga el 7. 2) La probabilidad de que el número obtenido sea par. 3) La probabilidad de que el número obtenido sea múltiplo de tres. EJEMPLO 1.15 De una urna que contiene 4 bolas verde, 5 blancas y 6 negras, se extrae una bola ¿cuál es la probabilidad de que la bola sea verde o blanca? ¿Cuál es la probabilidad de que no sea blanca? EJEMPLO 1.16 26 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Juan y Victoria son dos hermanos que salen de caza. El primero mata un promedio de 2 piezas cada 5 disparos y el segundo una pieza cada 2 disparos. Si los dos disparan al mismo tiempo a una misma pieza, ¿cuál es la probabilidad de que la maten? A= JUAN MATA 2 DE 5 B= VICTORIA UNA DE DOS EJEMPLO 1.17 A una pareja de esposos cuarentones le realizaron un diagnostico de supervivencia y se encontró que la probabilidad de que un hombre viva 20 años es ¼ y la de que su señora viva 20 años es 1/3. Se pide calcular la probabilidad: 1)De que ambos vivan 20 años. 2)De que el hombre viva 20 años y su señora no. 3De que ambos mueran antes de los 20 años. EJEMPLO 1.18 En la Uceva los estudiantes de las carreas ofrecidas por esta institución educativa pueden optar por cursar como lengua extranjera inglés o Italiano. En un determinado curso, el 90% de los alumnos estudia inglés y el resto italiano. El 30% de los que estudian inglés son chicos y de los que estudian italiano son chicos el 40%. El elegido un alumno al azar, ¿cuál es la probabilidad de que sea chica? 27 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR p(chica) = 0.9 · 0.7 + 0.1 · 0.6 = 0.69 EJEMPLO 1.19 El sociólogo Rubén Darío González de una baraja española de 48 cartas extrae simultáneamente dos de ellas. Calcular la probabilidad de que: 1 Las dos sean copas. 2Al menos una sea copas. 3Una sea copa y la otra espada. EJEMPLO 1.20 En un taller de autos se sabe que por término medio acuden: por la mañana tres automóviles con problemas eléctricos, ocho con problemas mecánicos y tres con problemas de chapa, y por la tarde dos con problemas eléctricos, tres con problemas mecánicos y uno con problemas de chapa. 1 Hacer una tabla ordenando los datos anteriores. 28 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 2Calcular el porcentaje de los que acuden por la tarde. 3Calcular el porcentaje de los que acuden por problemas mecánicos. 4Calcular la probabilidad de que un automóvil con problemas eléctricos acuda por la mañana. EJEMPLO 1.21 Un estudiante dormilón cuenta, para un examen con la ayuda de un despertador, el cual consigue despertarlo en un 80% de los casos. Si oye el despertador, la probabilidad de que realiza el examen es 0.9 y, en caso contrario, de 0.5. 1 Si va a realizar el examen, ¿cuál es la probabilidad de que haya oído el despertador? 29 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 2Si no realiza el examen, ¿cuál es la probabilidad de que no haya oído el despertador? EJEMPLO 1.22 En la biblioteca de la Uceva existe una sección de entretenimiento en las estanterías donde hay 60 novelas y 20 libros de poesía. Una persona A elige un libro al azar de la estantería y se lo lleva. A continuación otra persona B elige otro libro al azar. 1 ¿Cuál es la probabilidad de que el libro seleccionado por B sea una novela? 2Si se sabe que B eligió una novela, ¿cuál es la probabilidad de que el libro seleccionado por A sea de poesía? 30 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLOS 1.23 USANDO INTERNET En estas direcciones explicados en internet encontraras mas ejemplos en videos 1)http://www.youtube.com/watch?v=J-B-Enaphw4 2)http://www.youtube.com/watch?v=J-B-Enaphw4 3)http://www.youtube.com/watch?v=WY80AY6XU0Q&feature=related 4)http://www.youtube.com/watch?v=qCKZKDWRXAA&feature=relate d 5)http://www.youtube.com/watch?v=LGZbeW-vCW8&feature=related 6)http://www.youtube.com/watch?v=v2autI4LAyA&feature=related 7)http://www.youtube.com/watch?v=4O2waWg5cTg 8)http://www.youtube.com/watch?v=v2autI4LAyA&feature=related 9)http://www.youtube.com/watch?v=4hbNgJc-qR0&feature=related 10)http://www.youtube.com/watch?v=cGT_YHZ7M7s&feature=related 11)http://www.youtube.com/watch?v=VM8uBmr3EkQ&feature=related 12)http://www.youtube.com/watch?v=VM8uBmr3EkQ&feature=related 13)http://www.youtube.com/watch?v=-5EG28z2E08 14)http://www.youtube.com/watch?v=fFbY6dPOacM&feature=relmfu 15)http://www.youtube.com/watch?v=wJn-JqqKcu8&feature=relmfu 31 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJERCICIOS DE REPASO DEL CAPITULO 1 NOTA SI TIENES DUDAS NO DUDES IR A VITUTOR PERO NO OLVIDES RESCRIBIR LA RESPUESTA CON ENUNCIADO NOTA LOS EJERCICIOS DE 1 AL 9 TIENE UN OBJETIVO DE RECORDAR ESTADISTICA DESCRIPTIVA 1) Indica que variables son cualitativas y cuales cuantitativas: a. Comida Favorita. b. Profesión que te gusta. C, Número de goles marcados por tu equipo favorito en la última temporada. d. Número de alumnos de tu Instituto. e. El color de los ojos de tus compañeros de clase. f. Coeficiente intelectual de tus compañeros de clase. 2. De las siguientes variables indica cuales continuas. cuáles son discretas y a. Número de acciones vendidas cada día en la Bolsa. b. Temperaturas registradas cada hora en un observatorio. c. Período de duración de un automóvil. d. El diámetro de las ruedas de varios coches. e. Número de hijos de 50 familias. f. Censo anual de los españoles. 3. Clasificar las siguientes variables en cuantitativas o cualitativas, en discretas o continuas según el enunciado a. La nacionalidad de una persona. b Número de litros de agua contenidos en un depósito. c Número de libros en un estante de librería. d Suma de puntos tenidos en el lanzamiento de un par de dados. e La profesión de una persona. 32 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR f El área de las distintas baldosas de un edificio. 4. Las calificaciones de 50 alumnos en Estadística siguientes: han sido las 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla de distribución de frecuencias para dato no agrupados y agrupados aplicando le a los agrupados sturges y dibuja el diagrama de barras. 5. Los 40 estudiantes de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Estadística. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. a. Construir la tabla de frecuencias aplicando sturges b. Dibujar el histograma y el polígono de frecuencias. 9. Sea una distribución estadística que viene dada por la siguiente tabla: xi 61 64 67 70 73 fi 5 18 42 27 8 Calcular: 1 La moda, mediana y media. 2 El rango, desviación media, varianza y desviación típica. 6.Calcular la media, la mediana y la moda de la siguiente serie de números: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. Si agrupan 7. Hallar la varianza y la desviación típica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5. 8. Hallar la media, mediana y moda de la siguiente serie de números: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. 16. Una distribución estadística viene dada por la siguiente tabla: 33 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR [10, 15) fi 3 [15, 20) [20, 25) [25, 30) [30, 35) 5 7 4 2 Hallar: La moda, mediana y media. El rango, desviación media y varianza. Los cuartiles 1º y 3º. Los deciles 3º y 6º. Los percentiles 30 y 70. 9. Dada la distribución estadística: [0, 5) fi 3 [5, 10) [10, 15) [15, 20) [20, 25) [25, ∞) 5 7 8 2 6 Calcular: La mediana y moda. Cuartil 2º y 3º. Media. 10) ¿Cuántos números de tres cifras diferentes se puede formar con los dígitos: 0, 1, 2, 3, 4, 5 ?R/100 11) En un concurso literario de la UCEVA se han presentado 10 candidatos con sus novelas. El cuadro de honor lo forman el ganador, el finalista y un accésit. ¿Cuántos cuadros de honor se pueden formar?R/ 720 12) ¿Cuántos números de tres cifras se puede formar con los dígitos: 0, 1, 2, 3, 4, 5? R/ 180 13) ¿De cuántas formas distintas pueden sentarse ocho personas en una fila de butacas? 40320 34 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 14) ¿De cuántas formas distintas pueden sentarse ocho personas alrededor de una mesa redonda?R/ 5040 15) En el palo central de un barco velero se pueden izar tres banderas rojas, dos azules y cuatro verdes. ¿Cuántas señales distintas pueden indicarse con la colocación de las nueve banderas? 1260 16) En una clase de 30 alumnos se quiere elegir un comité formado por tres alumnos. ¿Cuántos comités diferentes se pueden formar?R/ 4060 17) En una bodega hay 5 botellas de vio diferente. ¿De cuántas formas se pueden elegir 4 botellas? R/70 18) ¿De cuántas formas diferentes se pueden cubrir los puestos de presidente, vocal y tesorero de un club de fútbol sabiendo que hay 12 posibles candidatos? R/ 1320 19) Con las letras de la palabra libra, ¿cuántas ordenaciones distintas se pueden hacer que empiecen por vocal? R/48 20) ¿De cuántas formas pueden mezclarse los siete colores del arco iris tomándolos de dos en dos? R/ 21 21) ¿Cuántos números de cinco cifras distintas se pueden formar con las cifras impares? R/ 120 22) ¿De cuántos partidos consta una liguilla formada por 6 equipos?30 23) A una reunión de directivos de la UCEVA asisten 10 personas y se intercambian saludos entre todos. ¿Cuántos saludos se han intercambiado? R/45 24) Con las cifras 1, 2 y 3, ¿cuántos números de cinco cifras pueden formarse? R/ 243 25) ¿De cuántas formas pueden colocarse los 11 jugadores de un equipo de fútbol teniendo en cuenta que en las reglas del futbol el portero no puede ocupar otra posición distinta dl arco o portería? R/ 3628800 26) En la sala de ejecutivos existe la mesa de reuniones que está formada por ocho personas, ¿de cuántas formas distintas se pueden sentar, si el presidente y el secretario siempre van juntos/10080 27) Una comisión de negocios compuesto por cinco hombres y siete mujeres, forma un comité de 2 hombres y 3 mujeres. De cuántas formas puede formarse, si: 35 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 1. Puede pertenecer a él cualquier hombre o mujer/ 350 2. Una mujer determinada debe pertenecer al comité/ 150 3. Dos hombres determinados no pueden estar en el comité. R/ 105 28) Cuatro libros distintos de estadística, seis diferentes de física y dos diferentes de química se colocan en un estante. De cuántas formas distintas es posible ordenarlos si: 1. Los libros de cada asignatura deben estar todos juntos. R/ 207360 2. Solamente los libros de matemáticas deben estar juntos. R/ 8709120 29) Un colombiano tiene cinco monedas de distintos valores. ¿Cuántas sumas diferentes de dinero puede formar con las cinco monedas?31 30) Se ordenan en una fila 5 bolas Verdes, 2 bolas Rojas y 3 bolas azules. Si las bolas de igual color no se distinguen entre sí, ¿de cuántas formas posibles pueden ordenarse? R/2520 31) Resolver las ecuaciones combinatorias: 1 . 2. R/ X=6 R/ X=7 3. R/ X=7 4. R/ X=17 32) Resolver las siguientes ecuaciones 1) R/ X=12 2) R/ X=5 3) R/ X=5 4) R/ X=5 36 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 5) R/ X= 19 6) R/ X= 10 33) Se lanzan dos monedas al aire hallar la probabilidad de que salgan dos caras/1/4 34). Calcular la probabilidad de que al lanzar un dado al aire, salga Un número par. R/1/2 35) Se lanza un dado ccalcular la probabilidad de obtener un 2 ó un 5. R/ 1/3 36) Se lanza un dado calcular la probabilidad de obtener un múltiplo de 2 ó un 6. R1/2 37) Calcular la probabilidad de obtener un 6 al tirar un dado sabiendo que ha salido par. R/1/3 38) Se sortea un viaje a Panaca entre los 120 mejores clientes de una agencia de automóviles. De ellos, 65 son mujeres, 80 están casados y 45 son mujeres casadas. Se pide: a) ¿Cuál será la probabilidad de que le toque el viaje a un hombre soltero? R/ 1/6 b) Si del afortunado se sabe que es casado, ¿cuál será la probabilidad de que sea una mujer? 56.25% 39) Sean A y B dos sucesos aleatorios con: Hallar: 1 R/ 5/8 2 R/ 5/8 3 R/ 1/2 4 R/ 3/8 37 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 5 R/ 3/4 6 R/ 1/8 7 R/ 1/4 40) Sean A y B dos sucesos aleatorios con: Hallar: 1 R/ 1/3 2 R/ 2/3 3 R/ 1/12 4 R/ 5/12 41) Se sacan dos bolas de una urna que se compone de una bola blanca, otra amarilla, otra verde y otra negra. Escribir el espacio muestral cuando: A) La primera bola se devuelve a la urna antes de sacar la segunda R/16 ELEMENTOS EN EL ESPACIO MUESTRAL B) La primera bola no se devuelve R/ 12 ELEMENTOS EN EL ESPACIO MUESTRAL 42) Una urna tiene ocho bolas negras, 5 amarilla y siete azules. Si se extrae una bola al azar calcular la probabilidad de: A) Sea negra. R/40% amarilla R/75% B) Sea azul . R/35% C) No sea 43) Una urna contiene tres bolas rojas y siete blancas. Se extraen dos bolas al azar. Escribir el espacio muestral y hallar la probabilidad de los sucesos: a) Con reemplazamiento. R/ b) Sin reemplazamiento/ 6/90 38 21/90 21/90 42/90 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 44) Se extrae una bola de una urna que contiene 4 bolas verdes, 5 blancas y 6 negras, ¿cuál es la probabilidad de que la bola sea verde o blanca? ¿Cuál es la probabilidad de que no sea blanca? R/ 2/3 45) En la clase de estadística hay 10 alumnas rubias, 20 morenas, cinco alumnos rubios y 10 morenos. Un día asisten 45 alumnos, encontrar la probabilidad de que un alumno: Sea hombre o mujer. R/ 1 46) Se lanzan dos dados al aire y se anota la suma de los puntos obtenidos. Se pide: a) La probabilidad de que salga el 7.R/ 1/6 b) La probabilidad de que el número obtenido sea par. R/ ½ c) La probabilidad de que el número obtenido sea múltiplo de tres. R/ 1/3 47) Un estudiante lanzan tres dados. Encontrar la probabilidad de que Salga 6 en todos R/ 1/216 48) Un jugador de azar si lanza al aire dos monedas, realiza el diagrama de árbol Hallar la probabilidad de ganar si salen: A) Salgan Dos caras. R/ 25% B) Dos sellos R/ 25% c) Una cara y un sello R/1/2 49) Sean p(A A y B dos sucesos aleatorios con p(A) = 1/2, p(B) = 1/3, B)= 1/4. Determinar: a) R/ 75% b) R/ 50% c) R/ 7/12 d) R/ 5/8 e) R/ 5/6 50) En Colombia los alumnos pueden optar por cursar como lengua extranjera inglés o francés. En un determinado curso, el 90% de los alumnos estudia inglés y el resto francés. El 30% de los que estudian 39 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR inglés son chicos y de los que estudian francés son chicos el 40%. El elegido un alumno al azar a) Realizando un diagrama de árbol mostrar las probabilidades posibles b) ¿cuál es la probabilidad de que sea chica? R/ 69% 51) A veces ocurre que ante un examen, un alumno sólo ha estudiado 15 de los 25 temas correspondientes a la materia del mismo. Éste se realiza extrayendo al azar dos temas y dejando que el alumno escoja uno de los dos para ser examinado del mismo. Hallar la probabilidad de que el alumno pueda elegir en el examen uno de los temas estudiados. R/ 85% 52) En el taller de matecho donde llevan estadísticas de autos ingresados se sabe que por término medio acuden: por la mañana tres automóviles con problemas eléctricos, ocho con problemas mecánicos y tres con problemas de chapa, y por la tarde dos con problemas eléctricos, tres con problemas mecánicos y uno con problemas de chapa. a) Hacer una tabla ordenando los datos anteriores. b) Calcular el porcentaje de los que acuden por la tarde. R/ 30% c) Calcular el porcentaje de los que acuden por problemas mecánicos. R/ 55% d) Calcular la probabilidad de que un automóvil con problemas eléctricos acuda por la mañana. R/ 60% 53) Una clase de matemáticas consta de seis niñas y 10 niños. Si se escoge un comité de tres al azar, dibuje un diagrama de árbol y hallar la probabilidad de: a) Seleccionar tres niños. R/ 21.4% b) Seleccionar exactamente dos niños y una niña. R/ 48,2% c) Seleccionar por lo menos un niño. R/ 96.4% d) Seleccionar exactamente dos niñas y un niño. R/ 26.8% 54) Una bolsa contiene tres monedas. Una moneda es corriente, otra tiene dos caras y la otra está cargada de modo que la probabilidad de obtener cara es de 1/3. Se selecciona una moneda al azar y se lanza al aire dibuje su diagrama de árbol y Hallar la probabilidad de que salga 40 a) Cara. TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR R/61.1% b) Sello 55) El maestro Uriel Quitian tiene una urna contiene 5 bolas rojas y 8 verdes. Se extrae una bola y se reemplaza por dos del otro color. A continuación, se extrae una segunda bola. Se pide: a) Dibuje el diagrama de árbol b) Probabilidad de que la segunda bola sea verde. R / 58.2% C) Probabilidad de que las dos bolas extraídas sean del mismo color. R/ 41.8% 56) En una clase dirigida por Idelfonso Cobo y en un diagnostico acostumbrado por el docente encontró que todos los estudiantes de su curso practican algún deporte, donde el 60% de los alumnos juega al fútbol o al baloncesto y el 10% practica ambos deportes. Si además hay un 60% que no juega al fútbol, cuál será la probabilidad de que escogido al azar un alumno de la clase: A) Juegue sólo al fútbol. R/ 40% B) Juegue sólo al baloncesto R/20% C) Practique uno solo de los deportes. R/ 50% 57) En Tulua Colombia, el 40% de la población tiene cabellos castaños, el 25% tiene ojos castaños y el 15% tiene cabellos y ojos castaños. Se escoge una persona al azar: A) Si tiene los cabellos castaños, ¿cuál es la probabilidad de que tenga también ojos castaños? R/ 37.5% B) Si tiene ojos castaños, ¿cuál es la probabilidad de que no tenga cabellos castaños R/ 40% C) ¿Cuál es la probabilidad de que no tenga cabellos ni ojos castaños? 58) La federación de oftalmólogos supone que en Colombia 25 de cada 100 hombres y 600 de cada 1000 mujeres usan gafas. Si el número de mujeres es cuatro veces superior al de hombres, se pide la probabilidad de que: a) Muestre las probabilidades a través de un diagrama de árbol b) Halla una persona sin gafas. R/47% 41 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR c) Halla una mujer con gafas/48% 59) Un edificio de 3 pisos hay tres llaveros A, B y C; el primero con cinco llaves, el segundo con siete y el tercero con ocho, de las que sólo una de cada llavero abre la puerta del trastero. Se escoge a Lázaro llavero y, de él, una llave intenta abrir el trastero. Se pide: a) Muestre las probabilidades a través de un diagrama de árbol R/ 15.59% b) ¿Cuál será la probabilidad de que se acierte con la llave?R/15.59% c) ¿Cuál será la probabilidad de que el llavero escogido sea el tercero y la llave no abra? R/29.17% d)Y si la llave escogida es la correcta, ¿cuál será la probabilidad de que pertenezca al primer llavero A?42,75% 60) Tenemos tres urnas: A con 3 bolas verdes y 5 negras, B con 2 bolas verdes y 1 negra y C con 2 bolas verdes y 3 negras. Escogemos una urna al azar y extraemos una bola. Si la bola ha sido verde , ¿cuál es la probabilidad de haber sido extraída de la urna A? R/26% 61) El profesor Guillermo Vallecilla realiza un lanzamiento de un dado normal. ¿Cuál es la probabilidad de obtener un 1 si se sabe que el resultado ha sido impar? R/ 33.3% 62) La empresa de Tornillos El 60% de los tornillos producidos por la empresa proceden de la maquina A y el 40% de la maquina B. La proporción de defectuosos en A es 0.1 y en B es 0.5. ¿Cuál es la probabilidad de que un tornillo de dicha fabrica sea defectuoso? ¿Cuál es la probabilidad de que, sabiendo que un tornillo es defectuoso, proceda de la maquina A?.R/ 23.1% 63) En el Hospital Tomas Uribe de Tulua se encontró que un 15% de los pacientes atendidos son hipertensos, un 10% son obesos y un 3% son hipertensos y obesos. ¿Qué probabilidad hay de que elegido un paciente al azar sea obeso o hipertenso? R/ 22% 64) Se sabe por estudios previos que el 0,1% de la población Colombiana tiene problemas vasculares. Un estudio sobre individuos con problemas vasculares revela que el 20% de ellos son placas de ateroma. Si el 10% de los individuos con placas de ateroma están expuestos a muerte súbita por desprendimiento de trombos ¿qué probabilidad tiene un individuo cualquiera de estar expuesto a muerte súbita por desprendimiento de trombos de una placa de ateroma. R/ 65) La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del 0,1%. Si la prevalencia de hipertensión en una 42 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR cierta población es del 25% ¿Cuál es la prevalencia del infarto en esa población? R/ 0,15% 66) Tenemos 5 cajones con productos de una cierta industria. Dos cajones contienen cada uno 4 productos buenos y 1 fallado; otros dos cajones contienen cada uno 3 productos buenos y 2 fallados; y el último cajón contiene 6 productos buenos. Se elige al azar un cajón, del cual, también al azar, se extrae un producto. Calcular la probabilidad de que el producto extraído resulte bueno. R/ 76% 67) e lanzan dos dados equilibrados con seis caras marcadas con los números del 1 al 6. Se pide: a. Halla la probabilidad de que la suma de los valores que aparecen en la cara superior sea múltiplo de tres. R/ 33.3% b. ¿Cuál es la probabilidad de que los valores obtenidos difieran en una cantidad mayor de dos? R/ 33.3% 43 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR CAPITULO II DISTRIBUCIONES I) LA DISTRIBUCIÓN BINOMIAL: B(n, p) Si en una experiencia aleatoria únicamente consideramos dos posibilidades: que ocurra el suceso A o que no ocurra ( que ocurra A’, el complementario de A ) , se trata de una experiencia dicotómica. Al suceso A se le suele llamar Éxito y a la probabilidad de que ocurra, p. Es decir p=P(A). A la probabilidad de que no ocurra A P(A’)=1-P(A) se le llama con la letra q. Es decir, q=1-p Si repetimos n veces una experiencia dicotómica y lamamos X a la variable que cuenta el número de éxitos, resulta que: X es una variable 0,1,2,3,4,5,...........n. discreta que puede tomar los valores: Pues bien, a la distribución de probabilidad de la variable X se le llama Distribución Binomial B(n,p). La media es n. p y la desviación típica es n. p.q . n P( X k ) . p k .q n k k La probabilidad de que X tome el valor k es : n n! Donde k k!.(n k )! y n! 1.2.3.4.5.......(n 1).n n El número k se llama número combinatorio y representa todas las combinaciones posibles de n elementos tomados de k en k. Es decir: 44 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR con n elementos, cuántos grupos distintos de k elementos pueden formarse. Llamamos experiencia aleatoria dicotómica a aquella que sólo puede tener dos posibles resultados A y A'. Usualmente A recibe el nombre de éxito, además representaremos como p = p(A) y q = 1-p=p(A'). A la función de probabilidad de una variable aleatoria X resultado de contar el número de éxitos al repetir n veces una experiencia aleatoria dicotómica con probabilidad de éxito p la llamamos distribución binomial y la representamos por B (n, p) Para esta distribución se verifica que, la variable X puede tomar los valores: 0, 1, 2, ... , n y que la variable toma cada uno de estos valores con probabilidad: De acuerdo a lo anterior se puede definir la DISTRIBUCIÓN BINOMIAL como una experiencia aleatoria dicotómica a aquella que sólo puede tener dos posibles resultados A y A'. Usualmente A recibe el nombre de éxito, además representaremos como p = p(A) y q = 1-p=p(A'). A la función de probabilidad de una variable aleatoria X resultado de contar el número de éxitos al repetir n veces una experiencia aleatoria dicotómica con probabilidad de éxito p la llamamos distribución binomial y la representamos por B (n, p) Para esta distribución se verifica que, la variable X puede tomar los valores: 0, 1, 2, ... , n y que la variable toma cada uno de estos valores con probabilidad: 45 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR En donde: = nCx lo que implica que EJEMPLO: 2.1 5 10 Mire 3 porque EJEMPLO 2.2 SIMPLIFICAR: EJEMPLO2.3: Cuál es la probabilidad de obtener exactamente 2 caras en 6 tiradas de monedas? X= salga exactamente 2 caras 46 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Si n=6 x=2 p= 1/2 pruebe que f(2) = 0,2344 La probabilidad de obtener 2 caras en 6 lanzamientos es de 23,44% EJEMPLO 2.4: ¿Cuál es la probabilidad de obtener al menos 4 caras en 6 tiradas? n= 6 x= 4, 5, 6 PRUEBE SI ES CORRECTO P(4)+P(5)+P(6)= 34,38% la probabilidad de obtener al menos 4 caras en 6 tiradas es de 34,38% EJEMPLO 2.5 EN VIDEOS Mirar la explicación en los siguientes videos a)http://www.youtube.com/watch?v=k_W_A-EqnRA b)http://www.youtube.com/watch?v=ANaWgIud0bc&feature=related c)http://www.youtube.com/watch?v=bfbp2WaMYV8&feature=related d)http://www.youtube.com/watch?v=bfbp2WaMYV8&feature=related e)http://www.youtube.com/watch?v=nHeiIR_Gaug&feature=related 47 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR ELEMENTOS DE ESTADISTICA PARA RESOLVER PROBLEMAS DE PROBABILIDADES Distribuciones discretas Esperanza matemática o media Varianza Desviación típica 0 ≤ pi ≤ 1 p1 + p2 + p3 + · · · + pn = Σ pi = 1 Distribución binomial n es el número de pruebas. k es el número de éxitos. p es la probabilidad de éxito. q es la probabilidad de fracaso. El número combinatorio Media Varianza 48 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Desviación típica II) DISTRIBUCIÓN DE POISSON. Características: En este tipo de experimentos los éxitos buscados son expresados por unidad de área, tiempo, pieza, etc, etc.,: - # de defectos de una tela por m2 - # de aviones que aterrizan en un aeropuerto por día, hora, minuto, etc, etc. - # de bacterias por cm2 de cultivo - # de llamadas telefónicas a un conmutador por hora, minuto, etc, etc. - # de llegadas de embarcaciones a un puerto por día, mes, etc, etc. Para determinar la probabilidad de que ocurran x éxitos por unidad de tiempo, área, o producto, la fórmula a utilizar sería: Donde: p(x, ) = probabilidad de que ocurran x éxitos, cuando el número promedio de ocurrencia de ellos es l = media o promedio de éxitos por unidad de tiempo, área o producto e = 2.718 x = variable que nos denota el número de éxitos que se desea que ocurra Hay que hacer notar que en esta distribución el número de éxitos que ocurren por unidad de tiempo, área o producto es totalmente al azar y que cada intervalo de tiempo es independiente de otro intervalo dado, así como cada área es independiente de otra área dada y cada producto es independiente de otro producto dado. 49 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Para que una variable siga una distribución de Poisson deben cumplirse varias Condiciones: 1. En un intervalo muy pequeño (p. e. de un milisegundo) la probabilidad de que ocurra un evento es proporcional al tamaño del intervalo. 2. La probabilidad de que ocurran dos o más eventos en un intervalo muy pequeño es tan reducida que, a efectos prácticos, se puede considerar nula. 3. El número de ocurrencias en un intervalo pequeño no depende de lo que ocurra en cualquier otro intervalo pequeño que no se solape con aquél. Estas propiedades pueden resumirse en que el proceso que genera una distribución de Poisson es estable (produce, a largo plazo, un número medio de sucesos constante por unidad de observación) y no tiene memoria (conocer el número de sucesos en un intervalo no ayuda a predecir el número de sucesos en el siguiente). El parámetro de la distribución, lambda, representa el número promedio de eventos esperados por unidad de tiempo o de espacio, por lo que también se suele hablar de lambda como “la tasa de ocurrencia” del fenómeno que se observa. EJEMPLOS 2.6: 1. Si el banco BBVA recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades de que reciba, a) cuatro cheques sin fondo en un día dado, b) 10 cheques sin fondos en cualquiera de dos días consecutivos? Solución: a) x = variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3, ....., etc, etc. = 6 cheques sin fondo por día e = 2.718 50 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR R/ El 13,39% los 6 cheques están sin fondo por día b)x= variable que nos define el número de cheques sin fondo que llegan al banco en dos días consecutivos = 0, 1, 2, 3, ......, etc., etc. = 6 x 2 = 12 cheques sin fondo en promedio que llegan al banco en dos días consecutivos Nota: siempre debe de estar en función de x siempre o dicho de otra forma, debe “hablar” de lo mismo que x. EJEMPLO 2.7 En Grafiartes en el proceso de impresión, se realizo una inspección de hojalata producida por un proceso electrolítico continuo, donde se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar a) una imperfección en 3 minutos, b) al menos dos imperfecciones en 5 minutos, c) cuando más una imperfección en 15 minutos. Solución: a) x = variable que nos define el número de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3, ...., etc., etc. = 0.2 x 3 =0.6 imperfecciones en promedio por cada 3 minutos en la hojalata b) x = variable que nos define el número de imperfecciones en la hojalata por cada 5 minutos = 0, 1, 2, 3, ...., etc., etc. = 0.2 x 5 =1 imperfección en promedio por cada 5 minutos en la hojalata 51 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 1-(0.367918+0.367918) = 0.26416 R/La imperfección en promedio por cada 5 minutos en la hojalata es de 26,64% c) x = variable que nos define el número de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3, ....., etc., etc. = 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata = 0.0498026 + 0.149408 = 0.1992106 R/ 19,92% Presenta 3 imperfecciones en promedio por cada 15 minutos en la hojalata NOTA Por lo general se toma para muestras grandes, no indicando que no se puede aplicar en muestras pequeñas y sino observemos los siguientes ejemplos. P(x)= x.e -λ X! donde: λ= n.p λ es un promedio EJEMPLO: 2.8 En la clínica Maria Angel la estadística muestra que la probabilidad de que un individuo sufra una reacción negativa de cierto suero es de 0,001. Hallar la probabilidad de que entre 300 individuos exactamente 3 individuos sufra reacciones negativas. Por poisson Datos: n=300 52 λ= n.p x= 3 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR P= 0,001 λ= (300)(0,001) λ= 0,3 P(3)= = 0,003= 0,33% R/ La probabilidad de que un individuo sufra una reacción negativa en la clínica Maria Angel de cierto suero es de 0.33% Por distribución binomial: (0,001)3 (0,999)297 planteamiento Terminar el ejercicio EJEMPLO 2.9 El 10% de tornillos producido en la fábrica metalúrgica Matecho son defectuosos. Hallar la probabilidad de que una muestra de 10 tornillos tomadas al azar exactamente 2 sean defectuosas. n= 10 p= 0,1 λ= n.p λ= (10)(0,1) p(2)= q= 0,9 x= 2 λ= 1 = 0,1839= 18,39% HACER EL MISMO EJERCICIO POR DISTRIBUCION BINOMIAL 53 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLO 2.10 EXPLICADOS EN VIDEOS USANDO INTERNET 1) http://www.youtube.com/watch?v=uAcWCOOPWa8&feature=related 2)http://www.youtube.com/watch?v=xN-fxZKJ-js&feature=related 3)http://www.youtube.com/watch?v=brykCv0HdRw&feature=related 4)http://www.youtube.com/watch?v=hB4owTsqQIs&feature=related 5)http://www.youtube.com/watch?v=luEmVW_Bnn8&feature=related 6)http://www.youtube.com/watch?v=U10yQnqsfas&feature=related 7)http://www.youtube.com/watch?v=N8uW_mqc1r4&feature=related 8)http://www.youtube.com/watch?v=J3lvuyArpEY&feature=related III) DISTRIBUCIÓN MULTINOMIAL. Características: a) Al llevar a cabo un experimento con esta distribución se esperan más de dos tipos de resultados. b) Las probabilidades asociadas a cada uno de los resultados son constantes. c) Cada uno de los ensayos o repeticiones del experimento son independientes. d) El número de repeticiones del experimento, n es constante. Si los sucesos E(1), E(2)……….. E(k) puede ocurrir con frecuencia P(1), P(2)……….. P(k) respectivamente entonces la probabilidad de que E (1), E(2)……….. E(k) ocurran X(1), X(2)……….. X(k), veces, se calcula por: Al igual que hicimos con la distribución binomial, en este caso partiremos de un ejemplo para obtener la fórmula general para resolver problemas que tengan este tipo de distribución. P(x)= EJEMPLO 2.11 Se lanza un dado 12 veces cual es la probabilidad de obtener el 1, 2, 3, 4, 5, 6, dos veces cada uno? 54 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR N= 12 X(1) =X(2) =X(3)=X(4)=X(5)=X(6)= 2 P(1) =P(2)=P(3)=P(4)=P(5)=P(6)= 1/6 P(x)= ( )6= 0,0034= 0,34% R/ Cada uno de los números del dado que puede salir 2 veces cada uno es del 34% IV) DISTRIBUCION HIPERGEOMETRICA Lo que se ha hecho hasta ahora es analizar distribuciones que modelizan situaciones en las que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli o binomial ) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantenía constante. Si el proceso consistía en una serie de extracciones o selecciones ello implicaba la reposición de cada extracción o selección, o bien la consideración de una población muy grande. Sin embargo si la población es pequeña y las extracciones no se remplazan las probabilidades no se mantendrán constantes. En ese caso las distribuciones anteriores no nos servirán para la modelizar la situación. La distribución hipergeométrica viene a cubrir esta necesidad de modelizar procesos de Bernouilli o binomiales con probabilidades no constantes (sin reemplazamiento) La distribución hipergeométrica es de mucha aplicabilidad en aquellos casos en los que se extraigan muestras o se realizan experiencias repetidas sin devolución del elemento extraído o sin retornar a la situación experimental inicial y donde se modeliza , de hecho, situaciones en las que se repite un número determinado de veces una prueba dicotómica de manera que con cada sucesivo resultado se ve alterada la probabilidad de obtener en la siguiente prueba uno u otro resultado. Es una distribución .fundamental en el estudio de muestras pequeñas de poblaciones .pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes aplicaciones en el control de calidad en otros procesos experimentales en los que no es posible retornar a la situación de partida.2 Los experimentos que tienen este tipo de distribución tienen las siguientes características: 2 http://www.uv.es/ceaces/base/modelos%20de%20probabilidad/hipergeometrica.htm 55 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de resultados. b) Las probabilidades asociadas a cada uno de los resultados no son constantes. c) Cada ensayo o repetición del experimento no es independiente de los demás. d) El número de repeticiones del experimento (n) es constante. Se caracteriza por tener submuestras y su expresión está dada por: P(x)= y “N” es Donde “n” pertenece a la submuestras y “a+b=N” la población escogida, x pertenece a muestra a n-x pertenece b muestra b EJEMPLO 2.12: El siguiente ejemplo va por partes hasta que se aplica el concepto de distribución hipergeometrica De 16 vehículos de una transportadora de leche 5 tienen los frenos dañados cuantos no tienen los frenos dañados? a= 5 frenos dañados N= 16 b= frenos buenos 5+b= 16 b= 11 ¿Si de ese lote, 3 tienen los frenos dañados, escriba el elemento correspondiente a la formula? X= 3 ¿Si se toman 7 camiones al azar, como se expresa? n= 7 56 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Ahora si construyamos el ejemplo en forma total De 16 vehículos de una transportadora de leche 5 tienen los frenos dañados. Si de ese lote, 3 tienen los frenos dañados .Si se toman 7 camiones al azar Cual es la probabilidad de que 3 o más tengan los frenos dañados Entonces: P(3)= 5 11 3 4 = 11 7 = = 0,2884= 28,84% P(3)+ P(4)+ P(5)= 36,54% VERIFICAR SI LA RESPUESTA ES CORRECTA EJEMPLO 2.13 Un extranjero al llegar a cualquier aeropuerto de Colombia es revisado. Si un extranjero X para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?. Solución: a) N = 9+6 =15 total de tabletas a = 6 tabletas de narcótico n = 3 tabletas seleccionadas x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas 57 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico) Otra forma de resolver; p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas seleccionadas no haya una sola de narcótico) b) p(no sea arrestado por posesión de narcóticos) EJEMPLOS 2.14 EN VIDEOS 1)http://www.youtube.com/watch?v=xgVxHHMJbu0 2)http://www.youtube.com/watch?v=49dTucA-kHU&feature=related 3)http://www.youtube.com/watch?v=wfEDEDRmAro&feature=related V) DISTRIBUCION NORMAL Variable aleatoria de la distribución normal Una variable aleatoria continua, X, sigue una distribución normal de media μ y desviación típica σ, y se designa por N(μ, σ), si se cumplen las siguientes condiciones: 58 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 1. La variable puede tomar cualquier valor: (-∞, +∞) 2. La función de densidad, es la expresión en términos de ecuación matemática de la curva de Gauss: Curva de la distribución normal El campo de existencia es cualquier valor real, es decir, (-∞, +∞). Es simétrica respecto a la media µ. Tiene un máximo en la media µ. Crece hasta la media µ y decrece a partir de ella. En los puntos µ − σ y µ + σ presenta puntos de inflexión. El eje de abscisas es una asíntota de la curva. El área del recinto determinado por la función y el eje de abscisas es igual a la unidad. Al ser simétrica respecto al eje que pasa por x = µ, deja un área igual a 0.5 a la izquierda y otra igual a 0.5 a la derecha. En estadística la distribución normal es una de las distribuciones más usadas e importantes porque se volvió una herramienta indispensable en cualquier rama de la ciencia, la industria y el comercio. Muchos eventos reales y naturales tienen una distribución de frecuencias cuya forma es muy parecida a la distribución normal. La distribución normal es llamada también campana de Gauss por su forma acampanada. 59 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Y X PROPIEDADES DE LA DISTRIBUCIÓN NORMAL La distribución normal tiene forma de campana. La distribución normal es una distribución de probabilidad que tiene media = 0 y desviación estándar = 1. El área bajo la curva o la probabilidad desde menos infinito a más infinito vale 1. La distribución normal es simétrica, es decir cada mitad de curva tiene un área de 0.5. La escala horizontal de la curva se mide en desviaciones estándar. La forma y la posición de una distribución normal dependen de los parámetros y , en consecuencia hay un número infinito de distribuciones normales. Existe una relación del porcentaje de población a la desviación estándar. En la figura observamos por ejemplo que el área bajo la curva para 1 tiene un porcentaje de 68.26%, 2 = 95.46% y 3 99.73% -3s -2s -1s +1s +2s +3s 68.26% 95.46% 60 99.73% TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La población incluye todos los datos, la muestra es una porción de la población. Población Muestra x-3s x-2s x-s x x+s x+2s x+3s X La desviación estándar sigma representa la distancia de la media al punto de inflexión de la curva normal X x-3 x-2 x- La distribución normal estándar -3 -2 -1 x x+ x+2 x+3 z 0 1 2 3 El valor de z Determina el número de desviaciones estándar entre algún valor X y la media de la población . Para calcular el valor de Z usamos la siguiente fórmula. Z X La distribución de probabilidad f (Z) es una distribución normal con media 0 y desviación estándar 1; esto es Z se distribuye normalmente con media cero y desviación estándar = 1 Z~N(0,1): La gráfica de densidad de probabilidad se muestra en la figura. 61 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR F(z) 1 Z La distribución f (Z) se encuentra tabulada en la tabla de distribución 0 normal estándar. En esta tabla podemos determinar los valores de Z o la probabilidad de determinado valor Z. EJEMPLO 2.15 Siendo el señor Jairo Marín el gerente de personal de una gran compañía de aluminios requiere que los solicitantes a un puesto efectúen cierta prueba y alcancen una calificación de 500. Si las calificaciones de la prueba se distribuyen normalmente con media 485 y desviación estándar 30 ¿Qué porcentaje de los solicitantes pasará la prueba? Calculando el valor de Z obtenemos: Z X 500 485 0.5 30 = Buscamos el valor correspondiente Z en las tabla de distribución normal. Z0.5 = .69146 = 69.146%. siendo esta la probabilidad de que la calificación sea menor a 500 P (X<500). Dado que el porcentaje pedido es P( X 500) la solución es 1-.69146 =.3085 , 30.85% de los participantes pasarán la prueba. 485 30.85% Z.05 EJEMPLO 2.16: Encuentre las probabilidades siguientes usando la tabla Z. a) P(-1.23 < Z > 0) 62 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Z -1.23 0 Solución: Buscamos el valor Z1..23 en las tablas siendo este = .89065. restando .89065-.05 = .3905, este valor es la probabilidad de 0 a 1.23 que es exactamente la misma de –1.23 a 0 por simetría. Por lo tanto la probabilidad es .3905 EJEMPLO2.17: En un examen de Estadística la calificación media es de 72 y la desviación típica 15. Determinar en unidades estándar las puntuaciones de los alumnos que obtuvieron 60. Datos: ẋ= 72 x¡= 60 σ= 15 EJEMPLO 2.18 El peso medio de 500 estudiantes de la Uceva es de 151 Lb y la desviación típica es de 15 Lb y suponiendo que los pesos están normalmente distribuidos. Hallar cuantos estudiantes pesan entre 120 y 155 Lb. 63 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR A= 0,4803+0,1026= 0,5829 500 100% X 58,29% X= 291 291. 1. la cantidad de estudiantes que pesan entre 120 y 155 LB es de Los que pesan 128Lb exactamente? 0,4418 0,4332 A=0,4418-0,4332= 0,0086 0,86% VI) DISTRIBUCION GEOMETRICA La distribución geométrica es un modelo adecuado para aquellos procesos en los que se repiten pruebas hasta la consecución del éxito a resultado deseado y tiene interesantes aplicaciones en los muestreos 64 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR realizados de esta manera. También implica la existencia de una dicotomía de posibles resultados y la independencia de las pruebas entre sí. Proceso experimental del que se puede hacer derivar Esta distribución se puede hacer derivar de un proceso experimental puro o de Bernouilli en el que tengamos las siguientes características El proceso consta de un número no definido de pruebas o experimentos separados o separables. El proceso concluirá cuando se obtenga por primera vez el resultado deseado (éxito). · Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A · La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no A es q siendo (p + q = 1). Las probabilidades p y q son constantes en todas las pruebas, por tanto, las pruebas, son independientes (si se trata de un proceso de "extracción" éste se llevará a , cabo con devolución del individuo extraído) . La distribución geométrica que se ha visto hasta ahora es que si se tira una moneda (con p = P (cara ) n veces, entonces el numero de sellos se distribuye como binomial. Consideramos otro experimento relacionado. Vamos a seguir tirando la moneda hasta que veamos el primer sello Cuantas tiradas necesitamos? Sea X el número de tiradas. Luego P (X = 1) = p P (X = 2) = (1 − p)p P (X = 3) = (1 − p)2p . . P (X = x) = (1 − p)x-1p Donde P(x)= qx-1p 65 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La distribución de X se llama la distribución geométrica. EJEMPLO 2.19 Calcular la probabilidad de que salga el No. 5 a la tercera vez que lanzamos un dado. Definir éxito: sale No. 5 x=3 p = 1/6 = 0. 1666 q = (1 - 0.16660) = 0.8333 P(X=3) = (0.8333)2(0.1666) =0.1156 NOTA OTRA FORMA DE INTERPRETAR LA DISTRIBUCION GEOMETRICA En una secuencia de experimentos binarios independientes (A se observa con probabilidad P y deja de observarse con probabilidad 1-P), el número de réplicas antes de la primera observación de A tiene una distribución geométrica o de Pascal, G(P). Para cada número natural r, la función de probabilidad se define como f (r ) P(1 P)r r 1 siendo su función de distribución F(r ) 1 (1 P) La media y varianza de la distribución geométrica son E( X) 1 1 P V( X) 1 P P 2 Respectivamente. De hecho, se trata de un caso especial de la distribución binomial negativa tomando n=1. Geométrica ( o de fracasos) EJEMPLO 2.20 Calcular la probabilidad de que salga cara la 6ta ocasión que lanzamos una moneda. Definir éxito: salga cara 66 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR x=6 p = 1/2= 0.5 q = 0.5 P(X=6) = (0.5)5(0.5)= 0.0156 VII) LA FUNCION DENSIDAD Y LA FUNCION DISTRIBUCION FUNCIÓN DE DENSIDAD O LEY DE PROBABILIDAD Es el conjunto de los valores de la variable aleatoria X y sus probabilidades respectivas f(x) = Pr(X=x). Para el caso discreto se suele adoptar la forma de representación siguiente : X F(X) X1 P1 X2 P2 X3 P3 XI PI Xn Pn Ante la equivalencia entre frecuencias relativas y probabilidades, se n verifica que : P i 1 n 1 FUNCIÓN DE DISTRIBUCIÓN Del mismo modo que se definían las frecuencias acumuladas, denominamos función de distribución a : F(x) = Pr(X≤x) MOMENTO ESPERANZA MATEMATICA Y Varianza 1) Momento ordinario k n K P.i X k 1 2) Momento de orden central K n k Pi ( xi E ( x)) K i 1 En particular: 67 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Esperanza matemática: Es el momento ordinario de orden 1 ( 1 ) , equivalente a la media aritmética. n E ( X ) 1 Pi X i i 1 Varianza : Es el momento central de 2º orden n n V ( X ) 2 Pi ( X i E ( X )) Pi X 2 i E ( X ) 2 2 1 2 ii 1 2 i 1 Desviación típica : Es la raíz cuadrada de la varianza. V (X ) EJEMPLO 2.21 Germán segura victoria lanza cuatro monedas, considerando que el número de sellos obtenidas. Calcular, de la variable aleatoria así definida: a) Ley de probabilidad b) Función de distribución c) Esperanza matemática y varianza d) Mediana y moda de la distribución Del mismo modo que se definían las frecuencias acumuladas, denominamos función de distribución a : F(x) = Pr(X≤x) SOLUCION Lanzadas cuatro monedas, consideremos el número de sellos obtenidas. Calcular, de la variable aleatoria así definida: a) Ley de probabilidad o función densidad b) Función de distribución c) Esperanza matemática y varianza d) Mediana y moda de la distribución Antes de desarrollar el ejercicio primero observemos el espacio muestal 68 CCCC TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Se obtienen 0 sellos =1 CCCs CCsC CsCC sCCC Se obtienen 3 caras y 1 sello =4 CCss CsCs CssC sCCs sCsC ssCC Se obtienen 2 caras y 2 sellos=6 Csss sCss ssCs sssC Se obtienen 1 cara y 3 sellos=4 ssss Se obtienen 4 sellos=1 AHORA SI CONTIMUEMOS a) Ley de probabilidad o función de densidad: X f(x)=Pr(X=x) 0 1/16 1 4/16 2 6/16 3 4/16 4 1/16 b) Función de distribución: X f(x)=Pr(X=x) F ( x) Pr( X x) 69 0 1/16 1/16 1 4/16 5/16 2 6/16 11/16 3 4/16 15/16 4 1/16 1/16 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Donde mas concretamente la funcion F(x) se ecribira asi 0 para x 0 1 / 16 para 0 x 1 5 / 16 Para 1 x 2 F ( x) 11 / 16 Para 2 x 3 15 / 16 Para 3 x 4 1 Para x 4 c) Para el cálculo de la esperanza matemática y la varianza de una variable aleatoria discreta, se aconseja construir la siguiente tabla auxiliar X P PX PX2 0 1/16 0 0 1 4/16 4/16 4/16 2 6/16 12/16 24/16 3 4/16 12/16 36/16 4 1/16 4/16 16/16 TOTALES 1 32/16=2 80/16=5 Definida la desviación típica como la raíz cuadrada de la varianza : D(X) = 1 PORQUE LA DESVIACION DA UNO EXPLICALO QUERIDO AMIGO Observando la ley de probabilidad o función de densidad, deducimos que la Moda = 2 (al tener X=2 la mayor probabilidad (6/16) ) 70 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Observando la función de distribución, deducimos que : Mediana = 2 (al ser X=2 el valor para el que F(X) (=11/16) primero iguala o supera a 0'5) EJEMPLO 2.22 En la extracción simultánea de tres bolas de una urna que contiene 6 bolas Rojas y cuatro verdes, Miguel observa el número de bolas blancas extraídas. De la variable aleatoria así definida, calcular: a) L a probabilidad de que las tres sean verdes, 1 roja y dos verdes, , 2 rojas y una verde, 3 rojas , b) ley de probabilidad c) Función de distribución d) Esperanza matemática, varianza y desviación típica. d) Mediana y moda de la distribución. SOLUCION a) AMIGO LECTOR USTED EN CAPACIDAD DE DESCUBRIR LAS RESPUESTAS DADAS LA SUGERENCIADE DE RECORDAR LA DISTRIBUCION HIPERGEOMETRICA P(3VERDES)= 3.3% P(1RY 2VERDES)=30% P(2RY1V) =50% P(3R)=16.7% b) Ley de probabilidad o función de densidad : X PROB 71 0 0.033 1 0.3 2 0.5 3 0.167 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR c) Función de distribución: 0 SI X 0 0.033 SI 0 X 1 F ( X ) 0.033 SI 1 X 2 0.833 SI 2 X 3 SI X 3 1 d) Esperanza matemática, varianza y desviación típica: X PROB=P PX PX2 0 0.033 0 0 1 0.0 0.0 0.3 2 0.5 1 2 3 0.167 0.5 1.5 TOTALES 1.8 3.8 POR LO TANTO PODEMOS DEDUCIR QUE E( X ) = 1. 8 V ( X ) = 3. 8 - 1.82 = 0.56 D= 0.56 =0.748 Mediana y Moda: Observando la función de distribución, deducimos que : Mediana = 2 (al ser X=2 el valor para el que F(X) (= 0'8333) primero iguala o supera a 0'5) Observando la ley de probabilidad o función de densidad, deducimos que: Moda = 2 (al tener X=2 la mayor probabilidad (0'5) ) EJEMPLO 2.23 El Dr Lores ha comprobado que el tiempo de vida de cierto tipo de marcapasos sigue una distribución exponencial con media de 16 años. ¿Cuál es la probabilidad de que a una persona a la que se le ha implantado este marcapasos se le deba reimplantar otro antes de 20 años? Si el marcapasos lleva funcionando correctamente 5 años en un paciente, Solución: Sea T la variable aleatoria que mide la duración de un marcapasos en una persona. 20 P(T 20) f (t )dt 1 e20 /16 0.7135 0 72 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR VIII) DISTRIBUCION EXPONENCIAL Distribución exponencial La distribución exponencial se dice que es equivalente continuo de la distribución geométrica discreta. Esta ley de distribución describe procesos en los que: Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo que, el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello ocurra en un instante tf, no depende del tiempo transcurrido anteriormente en el que no ha pasado nada. Ejemplos de este tipo de distribuciones son: El tiempo que tarda una partícula radiactiva en desintegrarse. El conocimiento de la ley que sigue este evento se utiliza en Ciencia para, por ejemplo, la datación de fósiles o cualquier materia orgánica mediante la técnica del carbono 14, C14; El tiempo que puede transcurrir en un servicio de urgencias, para la llegada de un paciente; En un proceso de Poisson donde se repite sucesivamente un experimento a intervalos de tiempo iguales, el tiempo que transcurre entre la ocurrencia de dos sucesos consecutivos sigue un modelo probabilístico exponencial. Por ejemplo, el tiempo que transcurre entre que sufrimos dos veces una herida importante. Concretando, si una v.a. continua X distribuida a lo largo de que su función de densidad es se dice parámetro que , sigue una distribución , es tal exponencial de . OJO CON EL ANALISIS QUE SIGUE Figura: Función 73 de densidad, f, de TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR una . Un cálculo inmediato nos dice que si x>0, luego la función de distribución es: Figura: Función de distribución, F, de , calculada como el área que deja por debajo de sí la función de densidad. 74 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Para calcular el valor esperado y la varianza de la distribución exponencial, obtenemos en primer lugar la función característica para después, derivando por primera vez y derivando por segunda vez, 75 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Entonces la varianza vale ojo 3 IX) DISTRIBUCIÓN UNIFORME Cuando tenemos una variable aleatoria X se dice que es uniforme en el intervalo [a, b] si su función de densidad es constante dentro de él. La distribución uniforme se puede modelizar de algún modo la incertidumbre más completa sobre una variable aleatoria continua lo que hace que tenga bastante importancia en el ámbito computacional, pues es a partir de ella que se pueden realizar simulaciones de cualquier otra variable aleatoria. La función de densidad de la distribución uniforme es f (x) 1 ba x a, b F( x ) xa ba x (a, b) Su media y varianza son, respectivamente, E( x ) ab 2 V( x ) 1 (b a) 2 12 La distribución uniforme tiene una característica que es que puede tomar cualquier valor dentro de un intervalo, donde todos ellos tienen la misma probabilidad lo que la vuelve en una distribución continua ya que puede tomar cualquier valor y no únicamente un número determinado (como ocurre en las distribuciones discretas). EJEMPLO 2.24 El precio medio del litro de ACPM durante el próximo año se estima que puede oscilar entre 9140 y 9160 pesos. Podría ser, por tanto, de 9143 3T 76 OMADO DE http://www.bioestadistica.uma.es/libro/node78.htm TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR pesos., o de 9143,4 pesos., o de 9143,45 pesos., o de 9143,455 pesos, etc. Hay infinitas posibilidades, todas ellas con la misma probabilidad. Si deseamos obtener la función de densidad, que nos permite conocer la probabilidad que tiene cada punto del intervalo, viene definida por: f (x) 1 ab Donde, b: es el extremo superior (en el ejemplo, $9160, y a: es el extremo inferior (en el ejemplo, 9140 pesos). Por lo tanto, la función de distribución del ejemplo sería: f ( x) 1 0.05 9160 9140 Lo que implica que el valor final esté entre 9140 pesos y 9141 pesos tiene un 5% de probabilidad, que esté entre 9141 y 9142, otro 5%, etc. El valor medio de esta distribución se calcula: (a+b)/2 X)DISTRIBUCION UNIFORME DISCRETA La distribución uniforme discreta es la que aparece en situaciones como el lanzamiento de una moneda, de un dado o en la extracción de una bola numerada de un urna de la lotería. En todos estos casos, si no hay truco, existe equiprobabilidad entre todos los sucesos elementales posibles: dos en el caso de la moneda, seis en el del dado y n en el caso de la urna de la lotería, siendo n el número de bolas. La función de probabilidad viene dada por f ( x) 1 n x (1,..., n) f ( x ) 0 x (1,..., n) y la de distribución por F( x ) x n x 1,n Donde [x] la parte entera de x. La media y la varianza de esta distribución vienen dadas por, respectivamente 1 n E( X) 2 77 n2 1 V ( X) 12 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La función característica es 1 e itb e ita x (t ) e dx a ba it (b a ) b itx Los momentos son ba E ( X) 2 (b a ) 3 E( X ) 3 2 (b a ) 2 V( X) 12 XI) DISTRIBUCIÓN T STUDENT En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño La distribución t difiere de la de Z en que la varianza de t depende del tamaño de la muestra y siempre es mayor a uno. Unicamente cuando el tamaño de la muestra tiende a infinito las dos distribuciones serán las mismas Se acostumbra representar con el valor t por arriba del cual se encuentra un área igual a . Como la distribución t es simétrica alrededor de una media de cero, tenemos ; es decir, el valor t que deja un área de a la derecha y por tanto un área de a la izquierda, es igual al valor t negativo que deja un área de en la cola derecha de la distribución. Esto es, t0.95 = -t0.05, t0.99=-t0.01, etc. 78 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Para encontrar los valores de t se utilizará la tabla de valores críticos de la distribución t del libro Probabilidad y Estadística para Ingenieros de los autores Walpole, Myers EJEMPLO Ejemplo: Encuentre la probabilidad de –t0.025 < t < t0.05. Solución: Como t0.05 deja un área de 0.05 a la derecha, y –t0.025 deja un área de 0.025 a la izquierda, encontramos un área total de 1-0.05-0.025 = 0.925. P( –t0.025 < t < t0.05) = 0.925 Para encontrar las unidades estándar se aplica t x u s n OTRAS DISTRIBUCIONES 1) DISTRIBUCIÓN DE CAUCHY La distribución de Cauchy, o de Lorentz, de parámetros a pertenece a los reales y b>0 es de uso frecuente en física para describir el patrón de impactos de partículas sobre una recta. También es de interés teórico por ser una distribución que carece de momentos. Sus funciones de densidad y de distribución son f ( x) 79 b π ( x a)2 b 2 1 1 x a F( x) arctan 2 π b x TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Como queda dicho más arriba, la distribución de Cauchy no tiene ni media ni varianza. EJEMPLO 2.23 Se trata de un modelo continuo cuya función de densidad es: Cuya integral nos proporciona la función de distribución: X F(X ) 1 (1 t 2 ) dt 1 arctan g ( x) = 2 POR FAVOR AMIGO LECTOR COMPROBAR LA IGUALDAD DADA 2) DISTRIBUCIÓN ERLANG La función de densidad de probabilidad, f ( x; , ) 1 1 x exp( x / ), x 0 () En donde es un entero positivo. La variable aleatoria de Erlang es la suma de variables independientes distribuidas exponencialmente, en donde cada valor se genera por 1 x Ln 1 u 1/ La distribución de erlang es la misma distribución Gamma se ha utilizado frecuentemente en variables tales como: – El tiempo ( ó espacio) requerido para observar ? ocurrencias del evento A en el intervalo t ( ó región del espacio ), sucesos del tipo Poisson. – Problemas de tráfico en líneas telefónicas, ERLANG, 1900. 80 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR –Flujos máximos, MARKOVIC, 1965. – Resistencia de componentes del concreto reforzado, TICHY VARLIETK, 1965. – Tiempo de falla de un sistema de α componentes, cada uno falla con frecuencia λ. –Ingresos familiares. – Edad del hombre al contraer matrimonio por primera vez. – Tiempo total para completar una operación, sí ésta se lleva a cabo en α subestaciones a una frecuencia λ . 3) DISTRIBUCIÓN DE LAPLACE La distribución de Laplace de parámetros a pertenece a los reales y b>0 se utiliza en ocasiones para modelar errores en observaciones de tipo real, de forma similar a como se hace con la distribución normal. La función de densidad es f (x) xa 1 exp 2b b 1 xa F( x ) exp 2 b x y 1 ax F( x ) 1 exp 2 b Si x es menor o igual, o a es mayor, respectivamente, que a. Su media es E[X]=a y su varianza V[X]=2b2. 4. DISTRIBUCIÓN DE PARETO La distribución de Pareto de parámetros a>0 y b>0, es tal que algunos de sus momentos existen cuando a supera cierta cota. Tiene aplicaciones en las ciencias medioambientales y en la estadística industrial. Su función de densidad es f ( x ) ab a x a1 f ( x) 0 x b xb En la que se notará que toma valores no nulos para x (b, ) . La función de distribución toma la forma 81 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR a b F( x ) 1 x b x F( x ) 0 xb La esperanza y la varianza de la distribución de Pareto son ab E( X) a 1 si a 1 y ab 2 V( X) (a 2)(a 1)2 si a2 5...DISTRIBUCIÓN LOGÍSTICA La distribución logística de parámetros a pertenece a los reales y b>0 se ha llegado a utilizar como sustituta de la normal, debido a su forma acampanada y de más fácil manejo. Más frecuente es su uso en la modelización de respuestas aleatorias binarias, como en la regresión logística. La función de densidad logística toma la forma xa exp b f (x) x a b1 exp b 1 F( x ) x a 1 exp b x x V( X ) Por último, sus momentos son E(X)=a y b2π 2 3 6) DISTRIBUCIÓN DE GUMBEL La distribución de Gumbel, o del valor extremo, de parámetros a , b 0 se utiliza en el análisis de la distribución asintótica de los extremos muéstrales, con aplicaciones concretas en la predicción de catástrofes naturales y en el diseño de estructuras de ingeniería civil que van a estar sometidas a condiciones climatológicas extremas. Su función de densidad es 82 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR f (x) ax 1 a x exp exp a b b a x F( X) exp exp b x x donde es la constante de Euler - Mascheroni, cuyo valor es aproximadamente 0.5772156649... Finalmente, la media y la varianza de esta distribución viene dada por la expresión E( X) a bγ y b2π 2 V( X) 6 7)DISTRIBUCIÓN DE RAYLEIGH La distribución de Rayleigh de parámetro a > 0, es un caso particular de la de Weibull, estando su uso muy extendido en el contexto del análisis de datos censurados. La función de densidad es f ( x ) 2a 2 xe a f (x) 0 2 2 x0 x x0 F( X) 1 e a 2 2 F( X) 0 x0 x0 x La media y la varianza de esta distribución son, respectivamente, π E( X) 2a y 1 π V( X) b 2 1 4 a 8) DISTRIBUCIÓN DE WEIBULL La variable aleatoria X tiene distribución de Weibull de parámetros a > 0 y b > 0 si su función de densidad es ax f (x) bb a 1 e x / b a x0 La función de distribución, o de probabilidad acumulada, es 83 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR F( x) PX x 1 e ( x / b) a x0 Igual que en el caso de la distribución exponencial, la de Weibull se suele utilizar como modelo paramétrico en problemas de análisis de supervivencia. En este ámbito, es de interés la probabilidad de que se presente el fallo o muerte después de transcurrido un tiempo x; de ahí que se defina la función de supervivencia S( x) PX x 1 F( x) e ( x / b )a 0 Por último, la esperanza y la varianza de esta distribución son, respectivamente, 1 E( X) bΓ 1 a 2 1 V( X) b 2 Γ 1 Γ 1 a a y donde siendo P>0. Γ (P) x P1e x dx 0 la función gamma de Euler con 9) DISTRIBUCIÓN BETA La distribución beta de parámetros a y b, ambos estrictamente positivos, tiene como soporte el intervalo (0,1), por lo que suele utilizarse en la modelización de datos que se encuentren dentro de este rango. La función de densidad es f ( x) 1 x a1(1 x )b1 β(a,b) x (0,1) y la de distribución F( x ) 0, x0 b 1 x 1 a 1 u ( 1 u ) du β(a, b) 0 F( x ) 1 x 1 F( X) x (0,1) Siendo la función Beta de Euler. La media y la varianza de esta distribución son, respectivamente, 84 E( X) a ab TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR ab y V( X) 2 (a b) (a b 1) ESTIMADO LECTOR QUE BUENO SERIA QUE INVESTIGARAS SOBRE EJEMPLOS Y APLICACIONES DE CADA UNA DE LAS PTRAS DISTRIBUCIONES EJERCICIOS DE REPASO CAPITULO II 1) La media de los pesos de 500 estudiantes de un colegio es 70 kg y la desviación típica 3 kg. Suponiendo que los pesos se distribuyen normalmente, hallar cuántos estudiantes pesan: a) Entre 60 kg y 75 kg. R/476 64 kg. R/11 b) Más de 90 kg. R/0 c) Menos de 2) Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces? R/20.5% 3) ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces? R/2.6% 4) La probabilidad de tener un accidente de tráfico el profesor Carlos Iván es de 0,02 cada vez que viaja a Cali, si realiza 300 viajes a Cali, durante 5 años ¿Cuál es la probabilidad de tener 3 accidentes? R/8.9% 5) La probabilidad de que un niño del físico Leonardo Campo nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recién nacidos haya 5 pelirrojos. R/4.6% 6) En una bolsa hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3 sean blancas? R/65.4% 7) En un evento familiar hay 20 personas: 14 casadas y 6 solteras. Se eligen 3 personas al azar ¿Cuál es la probabilidad de que las 3 sean solteras? R/1.75% 8) A unas elecciones se presentaron 2 partidos políticos: Los X que obtuvieron el 70% de los votos y Z el 30% restante. ¿Cuál es la 85 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR probabilidad de que al elegir 5 ciudadanos al azar, 4 de ellos hayan votado por Z? 9) A unas elecciones se presentaron 4 partidos políticos: : La U que obtuvo un 40% de los votos, Los progresistas el 30%, el polo 20% y el conservador 10% restante. ¿Cuál es la probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al por la U, 1 por progresista y 1 por el polo? 10) En un evento internacional, el 20% de los asistentes son españoles, el 30% franceses, el 40% italiano y el 10% portugueses. En un pequeño grupo se han reunido 4 invitados: ¿cuál es la probabilidad de que 2 sean españoles y 2 italianos? R/3.84% 11) En una caja hay 7 bolas blancas, 3 verdes y 4 amarillas: ¿cuál es la probabilidad de que al extraer 3 bolas sea cada una de un color distinto ?R/ 23.07% 12) Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad de que aparezca cara es de 2/3, mientras que la probabilidad de que aparezca sello es de 1/3, Determine la probabilidad de que en el último lanzamiento aparezca cara R/.0.0003048 13) Se supone que los resultados de un examen realizados Hugo Orosco siguen una distribución normal con media 78 y desviación típica36. Se pide ¿Cuál es la probabilidad de que una persona que se presenta el examen obtenga una calificación superior a 72? R/56.36% 14) Haciendo uso de la tabla que proporciona áreas a la izquierda de cada valor z de la distribución normal tipificada, calcular las probabilidades (áreas) siguientes: a) Pr(z<1'35) R/ 91.14% b) Pr(z<-0'338) R/ 36.69% c) Pr(z>2'1) R/1-78% d) Pr(z>-1) R/ 84.13% e) Pr(-1'39<z≤-0'44) R/24.77% f)Pr(-1'52≤z≤0'897)R/75.16% 14) Varios test de inteligencia realizados por Lucy Aponte dieron una puntuación que sigue una ley normal con media 100 y desviación típica 15.. Determinar el porcentaje de población que obtendría un coeficiente entre 95 y 110.R/37.8% 15) El ingeniero William Bolaños al visitar una empresa que hace productos en línea Supone que la probabilidad de tener una unidad 86 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR defectuosa en una línea de ensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes: a) Cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas? R/ 4,76% b).y de que a lo sumo dos se encuentren defectuosas? R/ 99.84% c) ¿Cuál es la probabilidad de que por lo menos una se encuentre defectuosa? R/ 40.13% 7) Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos de medición sometidos a prueba sea el primero en mostrar una desviación excesiva? R/ 3.9% b) El séptimo de estos dispositivos de medición sometidos a prueba, sea el primero que no muestre una desviación excesiva? R/0.0000000148 8) El nivel de colesterol en una persona adulta sana sigue una distribución normal N(192, 12). Calcula la probabilidad de que una persona adulta sana tenga un nivel de colesterol: a) Superior a 200 unidades. R/25.14% b) Entre 180 y 220 unidades. R/ 83.14% 9) Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos? R/ 30% 10) El Profesor Alejandro Londoño observa que en su salón hay 8 alumnos de ojos cafés, 9 de ojos azules, 7 de ojos negros, y 10 de ojos verdes; si extraemos 6 alumnos, calcular la probabilidad de que este último tenga los ojos claros/0.9341% 11) Sólo 24 de los 200 alumnos de la Institución Moderna miden menos de 150 cm. Si la estatura media de dichos alumnos es de 164 cm., ¿ cuál es su varianza ?R/141.96 12) Juan Guillermo Valderrama lanza un par de dados y define la variable aleatoria X como la suma de las puntuaciones obtenidas. Hallar la función de probabilidad, la esperanza matemática y la desviación R/ 7 desviación=2.415 87 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 13) En Tulua cada tres familias posee teléfono fijo. Si se eligen al azar 90 familias, calcular la probabilidad de que entre ellas haya por lo menos 30 tengan teléfono fijo R//50% 14) Un tren de carga traen en un vagón de ferrocarril a 60 reses donde el 20% de ellas están enfermas de vaca loca, si extraemos con propósito de inspección sanitaria una muestra del 10% de las reses ¿calcula la probabilidad de que hayan 2 vacas con dicha enfermedad? R/25.65% 15) Guillermo Mondragón lanza un dado corriente. Si sale número primo, gana tantos cientos de euros como marca el dado, pero si no sale número primo, pierde tantos cientos de euros como marca el dado. Determinar la función de probabilidad y la esperanza matemática del juego. R/ E=16.667 16) Sea X una variable aleatoria discreta cuya función de probabilidad es: X pi 0 0,1 1 0,2 2 0,1 3 0,4 4 0,1 5 0,1 1. Calcular, representar gráficamente la función de distribución. 2. Calcular las siguientes probabilidades: a) b) c) p (X < 4.5) R/90% p (X ≥ 3) R/60% p (3 ≤ X < 4.5) R/50% 17) Para ingresar a la Uceva en medicina se realiza un examen tipo test de 200 preguntas de elección múltiple, cada pregunta tiene una respuesta correcta y una incorrecta. Se aprueba si se contesta a más de 88 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 110 respuestas correctas. Suponiendo que se contesta al azar, calcular la probabilidad de aprobar el examen.R/ 7.9% 18) De 60 aspirantes a la Uceva a ingeniería industrial 40 son DE Tulua, si seleccionamos 20 aspirantes al azar ¿calcular la probabilidad de que 10 sea n de Tuluà ? 19) El gran maestro Efraín Vásquez lanza dos monedas. Gana 1 ó 2 € si aparecen dos caras o una. Por otra parte pierde 5 € si no aparece cara. Determinar la esperanza matemática del juego y si éste es favorable. R/−1/4. Es desfavorable 20) El maestro internacional Luis Fernando Plazas lanza una moneda cuatro veces. Calcular la probabilidad de que salgan más caras que sellos R/31.25% 21)) En la sala de juego Matecho se realiza la extracción simultánea de tres bolas de una urna que contiene 6 bolas Rojas y cuatro negras, observamos el número de bolas blancas extraídas. De la variable aleatoria así definida, calcular: a) ley de probabilidad R/ Ley de probabilidad o función de densidad : X Prob b) 0 0.033 1 0.3 2 0.5 3 0.167 función de distribución R/ 0 si x 0 0.033 si 0 x 1 F ( x) 0.333 si 1 x 2 0.833 si 2 x 3 1 si x 3 c) Esperanza matemática, varianza y desviación típica. E=1.8 V(x)=0.56 D=0.748 d) Mediana y moda de la distribución.R/ Mediana = 2 Moda =2 22) Complete la ley de probabilidad siguiente, sabiendo que su esperanza matemática es igual a 1.8: X Prob 89 0 0.2 1 M 2 N 3 0.3 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Hallar los valores de m yn R/ m=0.1 y n= 0.4 23) Calcular la esperanza matemática, varianza, y la desviación de la variable aleatoria que tiene como función de distribución: 0 0.2 F ( x) 0.55 0.85 1 R/ E(x)= 4.8 si x2 si 2 x 4 si 4 x 6 si 6 x 8 si x8 V(x)= 3.76 D=1.93 24) Si Victoria Duque plantea un proyecto para una sala de juegos, donde el proyecto consiste en lanzar dos dados y sumando los puntos obtenidos, los premios que ofrece el juego son los siguientes: - Devolución de lo apostado: si la suma es inferior a 4 o superior a 10. - Doble de lo apostado: si se obtiene 5 o 9. - Cuatro veces lo apostado: si la suma de puntos es 7 - Pierde lo apostado Si la suma es mayor o igual a 4 y menor o igual a 10 Indicar a través de un análisis si el proyecto dado por victoria favorable o no para la sala de juegos es R/ No es favorable para la sala de juegos 25) Las puntuaciones de un examen para ingresar a la Usaca se distribuyen normalmente con media 15 puntos. La puntuación A ha sido superada por un 23% de los alumnos. La puntuación B está situada a 5 puntos diferenciales por debajo de la media. Entre B y la media se encuentra el 30% de los alumnos. Calcular: a) La desviación típica de las notas. R/ 5.95 b) Las puntuaciones directas de A y B. A=20.21 y B=10 c) El porcentaje de alumnos entre A y B. R/57% 26) Un agente de seguros de la ciudad de Tulua vende pólizas a cinco personas de la misma edad y que disfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas condiciones 90 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30 años, vivan: a) Las cinco personas R/13.2% b) Al menos tres personas R/ 79.1% c) Exactamente dos personas. R/ 16.4% 27) El maestro Julio Arroyabe calculó que el promedio de enfriamiento de todas las neveras de Tulua para una línea de cierta compañía, emplean una temperatura de -4°C con una desviación típica de 1.2°C. a. ¿Cuál es la probabilidad de que una nevera salga con una temperatura superior a -3°C? R/20.33% b. ¿Cuál es la probabilidad de que una nevera salga con una temperatura menor a - 5.5°C? R/ 10.56% 28) Si de 31 productos comprado por Fanny Romero para una ancheta navideña, determinar cuál es la probabilidad de que 20 de los productos comprados por Fanny salgan defectuosos, si el 50% de los productos normalmente sale defectuoso/3.97% 29) Se calcula que en la ciudad de Tulua el 20% de las personas tienen defecto de la vista si tomamos una muestra de 50 personas al azar ¿Calcular la probabilidad de que 10 de ellos tengan defecto en la vista .R/12.51% 30) Un estudio realizado por el ingeniero Oscar Duque ha mostrado que, en un cierto barrio de Tulua el 60% de los hogares tienen al menos dos televisores Se elige al azar una muestra de 50 hogares en el citado barrio. Se pide: a. ¿Cuál es la probabilidad de que al menos 20 de los citados hogares tengan cuando menos dos televisores? R/ 99.81% b. ¿Cuál es la probabilidad de que entre 35 y 40 hogares tengan cuando menos dos televisores? R/ 7.16% 31) Un agente de seguros de Tulua Colombia vende pólizas a cinco personas de la misma edad y que disfrutan de buena salud. Según las tablas actuales, la probabilidad de que una persona en estas condiciones viva 30 años o más es 2/3. Hállese la probabilidad de que, transcurridos 30 años, vivan: a) Las cinco personas R/13.2% b) Al menos tres personas. R/79.1% c) Exactamente dos personas R/16.4% 91 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 32) La tipografía Franciscos dirigida por francisco senen colorado encontró que el 8% de sus impresiones presentan algún problema, para ello contrata un ingeniero industrial el cual toma una muestra de 40 Impresiones ¿ Calcular probabilidad de que existan 5 impresiones con problemas ?R/11.4% 33) El dueño de un criadero de árboles está especializado en la producción de árboles de Navidad. Estos crecen en filas de 300. Se sabe que por término medio 6 árboles no son aptos para su venta. Asume que la cantidad de árboles aptos para la venta por fila plantada sigue una distribución de Poisson. a) Calcula la probabilidad de encontrar 2 árboles no vendibles en una fila de árboles. R/4.46% b) Calcula la probabilidad de encontrar 2 árboles no vendibles en media fila de árboles. R/22.40% 34) En un estudio realizado por Héctor García de una pila X encontró que la vida media de operación de una pila de linterna es de 24 horas y está distribuida normalmente con una desviación de 3 horas. ¿Cuál es la probabilidad de que una muestra aleatoria de 100 pilas tenga una media que se desvíe por más de 30 minutos del promedio? R/4.85% 35) Una máquina para acuñar monedas es diseñada por el físico Leonardo Campo toma 36 observaciones donde el espesor promedio de las monedas es de 0.20 c m y una desviación de 0.01 c m. ¿Cuál es la probabilidad de que el promedio del espesor de las 36 monedas supere los 0.21 c m? R/ 0% 36) La densidad de cierta característica química de algunos compuestos viene dada por la función siguiente: 0 si x 0 2 x si 0 x 0.8 f ( x) 0.72 si 0.8 x 1.3 0 si x 1.3 Calcular: 1. los tres primeros momentos ordinarios; los cuales son b E(x) = x. f ( x)dx R/ 0.7193 a 92 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR R/0.6092 3 E(x ) R/ 0.5714 E(x2) 2. Varianza; Recordar que V(x)=E(x2)-- E (x) 2 37) En Vaiju un sitio turístico de Tulua hay 30 pericos rusos y 20 pericos chinos si extraemos 10 pericos al azar calcular posibilidad de que 3 de ellos hablen chino R/22.6% 38) El maestro Carlos Gil construye una maquina que detecta fallas en los productos que elabora una fabrica. Si los productos tienen una probabilidad de falla del 5%, calcular la probabilidad de que la maquina encuentre su primer producto defectuoso en la octava ocasión que selecciona un producto para su inspección. R/3.49% 39 En Tulua se estima que la temperatura máxima en el mes de junio sigue una distribución normal, con media 23° y desviación típica 5°. Calcular el número de días del mes en los que se espera alcanzar máximas entre 21° y 27°R/ 13 40) El entrenador MILLER MEDINA de un equipo de baloncesto opina que los jugadores A, B y C tienen similares aptitudes para ser titulares del equipo en la posición de base. Así, determina que jueguen el mismo número de minutos cada partido. Se sabe que el 40% de las canastas son de C, mientras que A y B consiguen un 30% de encestes. Calcular la probabilidad de que en un partido con 9 encestes de dos puntos, A consiguiera dos, B tres y C cuatro. R/ Multinomial 41) En el curso dirigido por el maestro Julio García de los 20 hombres y 18 mujeres del salón el 50% réprobo el examen de estadística, si tomamos 10 alumnos al azar probabilidad. A) 4 alumnos reprobados R/22.24% B) 3 mujeres reprobadas R/22.73% 42) Una empresa electrónica observa que el número de componentes que fallan antes de cumplir 100 horas de funcionamiento es una variable aleatoria de Poisson. Si el número promedio de estos fallos es ocho, 1. ¿Cuál es la probabilidad de que falle un componente en 25 horas/27.06% 2. ¿y de que fallen no más de dos componentes en 50 horas? R/23.81% 93 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 3. ¿Cuál es la probabilidad de que fallen por lo menos diez en 125 horas/41.7% 43) Para la siguiente situación, indica si sigue una distribución binomial. En caso afirmativo, identifica en ella los valores de n y p si la situación plantea que lanzamos cien veces un dado y nos preguntamos por el número de unos que obtenemos. R/ : R/ si y n=100 y p=1/6 44) De un curso de mercadeo dirigido por Rodrigo Herrera el 60% de los alumnos son hombres, calcular probabilidad de extraer el 1er hombre a la cuarta ocasión que extraemos un alumno/3.84% 45) El ingeniero William Buitrago crea unos focos solares y afirma que sus focos durará un promedio de 500 horas de trabajo. Para conservar este promedio esta persona verifica 25 focos cada mes. Si el valor y calculado cae entre –t 0.05 y t 0.05, él se encuentra satisfecho con esta afirmación. ¿Qué conclusión deberá él sacar de una muestra de 25 focos cuya duración fue?: 500 513 496 510 505 521 522 488 475 521 511 500 500 510 500 513 521 502 506 493 510 495 512 503 520 R/ Se puede concluir que la media poblacional no es 500, porque la muestra poblacional está por encima de esta, y por lo tanto debería estar por encima de 500. 46). El matemático Héctor Mario Mosquera Supone que la probabilidad de tener una unidad defectuosa en una línea de ensamblaje es de 0.05. Si el conjunto de unidades terminadas constituye un conjunto de ensayos independientes: 1. ¿Cuál es la probabilidad de que entre diez unidades dos se encuentren defectuosas? R/4.76% 2. ¿y de que a lo sumo dos se encuentren defectuosas? 99.84% 3. ¿Cuál es la probabilidad de que por lo menos una se encuentre defectuosa?40.13% 47) Lanzamos 5 veces una moneda no trucada es decir sesgada, ¿Cuál es la probabilidad de que obtengamos exactamente 2 caras? 94 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 48) En un juego de parques la probabilidad de ganar un chico es decir ganar el juego es 0,8. Calcula la probabilidad de que un jugador que juega 10 chicos las gane todas y la probabilidad de que gane al menos 8. 49) El Dr Milko Ferrer trae de la costa pantalones donde El 7% de los pantalones de una determinada marca le salen con algún defecto. Se empaquetan en caja 80 para distribuirlos a sus grandes amigos. ¿Cuál es la probabilidad de que en la caja haya más de 10 pantalones defectuosos R/1.58% 50) Respondemos al azar a un test de 8 preguntas, cada una de las cuales tiene 4 opciones (solo una de ellas es verdadera). Para aprobar necesitamos contestar correctamente al menos a 6 de ellas. ¿Cuál es la probabilidad de aprobar?. ¿Y la probabilidad de fallar las 8?. 51) El maestro Carlos Quintero lanza 5 chinches y observa que el número de ellas que caen con la punta hacia arriba. Al repetir la experiencia 350 veces obtenemos: nº de puntas hacia arriba 0 nº de veces en los 350 60 lanzamientos 1 2 3 4 5 133 101 45 10 1 ¿Ajustan los resultados a una distribución Binomial? ¿Cuál sería el valor de p en caso afirmativo? 52) La última novela García Márquez el autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura: a) ¿Cuál es la probabilidad de que en el grupo hayan leido la novela 2 personas? 15,36% b) ¿Y al menos 2? R/18,08% 53) Supongamos que la duración en minutos de las llamadas telefónicas sigue una distribución dada por la función 95 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 3x e F ( x) 1 2 3x e 2 para todo x 0 Calcular la probabilidad de que la duración de una llamada cualquiera sea superior a 6 minutos R/ e-2 54) Si el maestro Orlando Flavio Millán tiene la información de que solo el 3% de los alumnos de filosofía son muy inteligentes ¿Calcular la probabilidad de que si Orlando toma 100 alumnos al azar 5 de ellos sean muy inteligentes R/10.1% 55) La probabilidad de que Bernardo Tovar acierte en el blanco es 1/4. Si dispara 10 veces ¿cuál es la probabilidad de que acierte exactamente en tres ocasiones? ¿Cuál es la probabilidad de que acierte por lo menos en una ocasión? 56) En las doble calzada Tulua- Buga en un reten de la policía se hizo s pruebas de alcoholemia se ha observado que el 5% de los conductores controlados dan positivo en la prueba y que el 10% de los conductores controlados no llevan aprovechado el cinturón de seguridad. También se ha observado que las dos infracciones son independientes. Un guardia de tráfico para cinco conductores al azar. Si tenemos en cuenta que el número de conductores es suficientemente importante como para estimar que la proporción de infractores no varía al hacer la selección. A). Determinar la probabilidad a de que exactamente tres conductores hayan cometido alguna de las dos infracciones/2.23% B) Determine la probabilidad de que al menos uno de los conductores controlados haya cometido alguna de las dos infracciones/5.43% 57) Si el ingeniero Carlos Alberto Buitrago decide vender tv de marca X cuya producción de televisores trae asociada una probabilidad de defecto del 2%, si se toma un lote o muestra de 85 televisores, obtener la probabilidad de que existan 4 televisores con defectos R/6.35% 58) Si de 12am a 1 pm se admite que un número de teléfono de cada cinco está comunicando, ¿cuál es la probabilidad de que, cuando se marquen 10 números de teléfono elegidos al azar, sólo comuniquen dos? R/30.20% 96 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 59) Al centro turístico VAIJU trae en una jaula con 100 pericos 15 de ellos hablan ruso calcular la probabilidad de que si tomamos 20 pericos al azar 3 de ellos hablen ruso/22.40% 60) El laboratorio Ángel afirma que una droga causa de efectos secundarios en una proporción de 3 de cada 100 pacientes. Para contrastar esta afirmación, otro laboratorio elige al azar a 5 pacientes a los que aplica la droga. ¿Cuál es la probabilidad de los siguientes sucesos? A) Ningún paciente tenga efectos secundarios/85.87% B) Al menos dos tengan efectos secundarios/0,847% C) Cuál es el número medio de pacientes que espera laboratorio que sufran efectos secundarios si elige 100 pacientes al azar? R/3 61) El Dr Saúl García Mendieta comprobó que el tiempo de vida de cierto tipo de marcapasos sigue una distribución exponencial con media de 16 años. a) ¿Cuál es la probabilidad de que a una persona a la que se le ha implantado este marcapasos se le deba reimplantar otro antes de 20 años? R/71.35% b) Si el marcapasos lleva funcionando correctamente 5 años en un paciente, ¿cuál es la probabilidad de que haya que cambiarlo antes de 25 años? R/52.20% 62) Se sabe que el 7% de los útiles quirúrgicos en un lote de 100 no cumplen ciertas especificaciones de calidad. Tomada una muestra al azar de 10 unidades sin reemplazo, interesa conocer la probabilidad de que no más de dos sean defectuosos. R/98% 63) La probabilidad de que cierto examen médico dé lugar a una reacción “positiva” es igual a 0,8, ¿cuál es la probabilidad de que ocurran menos de 5 reacciones “negativas” antes de la primera positiva? R /99.97% 64) Se lanza determinando dos monedas, construir Dada la función densidad: 0 f(x)= 97 si x<0 2X si 0≤x≤1 1 si x>1 una función distribución TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Encontrar F(x): 65) Un sujeto responde al azar un examen de 5 preguntas, cada una con 5 alternativas. a) Obtener ρ. R/ ρ=0.2 b) Obtener E (X1) y σ 2x R/ E (X1) = 0.2 y σ2x =0.16 c) Obtener E (X), x2 , E (P) y σ2p R/ E (X)= 1 x2 =0.8 , E (P)= 0.2 y σ2p=0.023 d) Obtener P (X ≤ 3) 98.75% 66) Encuentre el valor de k tal que P(k < t < -1.761) = 0.045, para una muestra aleatoria de tamaño 15 que se selecciona de una distribución normal. R/K= -2.977 Lolo que significa P(-2.977 < t < -1.761) = 0.045 67) El químico Diego Giraldo de la Institución Moderna afirma que el rendimiento medio de la población de cierto proceso en lotes es 500 gramos por milímetro de materia prima. Para verificar esta afirmación toma una muestra de 25 lotes cada mes. Si el valor de t calculado cae entre –t0.05 y t0.05, queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra que tiene una media de 518 gramos por milímetro y una desviación estándar de 40 gramos? Suponga que la distribución de rendimientos es aproximadamente normal R/ Si se desea obtener la probabilidad de obtener un valor de t con 24 grados de libertad igual o mayor a 2.25 se busca en la tabla y es aproximadamente de 0.02. De aquí que es probable que el fabricante concluya que el proceso produce un mejor producto del que piensa. 68) En estudio realizado por el Dr RODRIGO BEVERRA sobre la movilidad en Tulua encontró que 16 recorridos realizados de prueba una hora cada uno por la buseta se encontró que, el consumo de gasolina de un motor es de 16.4 gal, con una desviación estándar de 2.1 gal. Demuestre que la afirmación que el consumo promedio de gasolina de este motor es 12.0 gal/hora R/ Para el cual en las tablas, el valor de t=8.38 corresponde un α=5% y 15 gl es insignificante, y por tanto se puede concluir que el consumo de 12 gal/h es real AYUDA SOLUCION DE ALGUNOS http://www.vitutor.net/1/54.html 98 PROBLEMAS ESTAN EN TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR CAPITULO III ERROR MUESTRAL Cualquier medida conlleva algún error. Si se usa la media para medir, estimar, la media poblacional m, entonces la media muestral, como medida, conlleva algún error. Por ejemplo, supongamos que se ha obtenido una muestra aleatoria de tamaño 20 de una población con media m = 10: si la media de la muestra es x=8, entonces a la diferencia observada x-μ = -2 se le denomina el error muestral. Una media muestral x puede pensarse como la suma de dos cantidades, la media poblacional m y el error muestral; si e denota el error muestral, entonces: X = μ + e EJEMPLO 3.1 Se toman muestras de tamaño 2 de una población consistente en tres valores, 2,4 y 6, para simular una población “grande” de manera que el muestreo pueda realizarse un gran número de veces, supondremos que éste se hace con reemplazo, es decir, el número elegido se reemplaza antes de seleccionar el siguiente, además, se seleccionan muestras ordenadas. En una muestra ordenada, el orden en que se seleccionan las observaciones es importante, por tanto, la muestra ordenada (2,4) es distinta de la muestra ordenada (4,2). En la muestra (4,2), se seleccionó primero 4 y después 2. La siguiente tabla contiene una lista de todas las muestras ordenadas de tamaño 2 que es posible seleccionar con reemplazo y también contiene las medias muestrales y los correspondientes errores muestrales. La media poblacional es igual a μ = (2+4+6)/3 = 4. Ver la tabla La media de la colección de medias muestrales es 4, la media de la población de la que se extraen las muestras. Si μx denota la media de todas las medias muestrales entonces tenemos: μx = (2+3+4+4+5+6+5+4+3)/9 = 4 La suma de los errores muestrales es cero. e1 + e2 + e3 + . . . + e9 = (-2) + (-1) + 0 + (-1) + 0 + 1 + 0 + 1 + 2 = 0 MUESTRAS ORDENADAS X e=x-μ (2,2) 2 2 – 4 = -2 99 (2,4) TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 3 3 – 4 = -1 (2,6) 4 4–4=0 (4,2) 3 3 – 4 = -1 (4,4) 4 4–4=0 (4,6) 5 5–4=1 (6,2) 4 4–4=0 (6,4) 5 5–4=1 (6,6) 6 6–4=2 En consecuencia, si x se usa para medir, estimar, la media poblacional μ, el promedio de todos los errores muestrales es cero. ESTIMACION Estimación de parámetros Es el procedimiento utilizado para conocer las características de un parámetro poblacional, a partir del conocimiento de la muestra. Con una muestra aleatoria, de tamaño n, podemos efectuar una estimación de un valor de un parámetro de la población; pero también necesitamos precisar un: Intervalo de confianza Se llama así a un intervalo en el que sabemos que está un parámetro, con un nivel de confianza específico. Nivel de confianza Probabilidad de que el parámetro a estimar se encuentre en el intervalo de confianza. Estimación puntual y por intervalo Las medias o desviaciones estándar calculadas de una muestra se denominan ESTADÍSTICOS, podrían ser consideradas como un punto estimado de la media y desviación estándar real de población o de los PARAMETROS. 100 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR ¿Qué pasa si no deseamos una estimación puntual como media basada en una muestra, qué otra cosa podríamos obtener como margen, algún tipo de error? R/ generaríamos “Un Intervalo de Confianza” ESTIMADOR PUNTUAL: Utiliza un número único o valor para localizar una estimación del parámetro. ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango dentro del cual se puede encontrar el parámetro y el nivel de confianza que el intervalo contiene al parámetro. LIMITES DE CONFIANZA: Son los límites del intervalo de confianza inferior (LIC) y superior (LSC), se determinan sumando y restando a la media de la muestra X un cierto número Z (dependiendo del nivel o coeficiente de confianza) de errores estándar de la media X . INTERPRETACIÓN DEL INTERVALO DE CONFIANZA: Tener un 95% de confianza en que la media poblacional real y desconocida se encuentra entre los valores LIC y LSC. P(Z<= - Zexcel ) = alfa/2 P(Z>= + Zexcel ) = alfa/2 Intervalo de confianza donde se encuentra el parámetro con un NC =1- NIVEL DE SIGNIFICANCIA = 1- INTERVALO DE CONFIANZA = ERROR TIPO 1 = ALFA Error de estimación admisible Que estará relacionado con el radio del intervalo de confianza. Estimación de la media de una población 101 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR El intervalo de confianza, para la media de una población, con un nivel de confianza de 1 − α , siendo x la media de una muestra de tamaño n y σ la desviación típica de la población, es: El error máximo de estimación es: Cuanto mayor sea el tamaño de la muestra, n, menor es el error. Cuanto mayor sea el nivel de confianza, 1-α, mayor es el error. EJEMPLO 3.1 El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes sigue una ley normal con media desconocida y desviación típica 0,5 minutos. Para una muestra aleatoria de 25 clientes se obtuvo un tiempo medio de 5,2 minutos. 1. Calcula el intervalo de confianza al nivel del 95% para el tiempo medio que se tarda en cobrar a los clientes. 2. Indica el tamaño muestral necesario para estimar dicho tiempo medio con un el error de ± 0,5 minutos y un nivel de confianza del 95%. n≥4 ESTIMACIÓN DE UNA PROPORCIÓN 102 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Si en una población, una determinada característica se presenta en una proporción p, la proporción p’, de individuos con dicha característica en las muestras de tamaño n, se distribuirán según: Intervalo de confianza para una proporción El error máximo de estimación es: OTRAS FORMULAS P( Z Z ) 2 E a 1 2 a la probabilid ad del area LS LI 2 Cuando n 30 la proporción de la muestra es una variable aleatoria que N ( p; se aproxima a una distribución normal pq ) n EJEMPLO 3.2 El ingeniero Misael Hernández al visitar una fábrica de componentes electrónicos, encontró que la proporción de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analizó una muestra aleatoria de 500 componentes, encontrándose que 90 de ellos eran defectuosos. ¿Qué nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido variaciones? p = 0.2 q = 1 - p =0.8 E = 0.2 - 0.18 = 0.02 103 p'= 90/ 500 = 0.18 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR P (1 - zα/2 <1.12) = 0.86861 - 0.8686 = 0.1314 0.8686 - 0.1314 = 0.737 Nivel de confianza: 73.72% El error máximo de estimación esta dado por: Donde “n” es el tamaño de la muestra E= zα/2. EJEMPLO: 3.3 Se desea estimar la emisión promedio diaria en toneladas de óxido de sulfuro emitidos por una planta industrial para este fin disponemos de los datos siguientes que se constituyen en una muestra aleatoria de la planta de óxido de sulfuro en 40 días. 17 15 20 29 19 18 22 25 27 9 24 20 17 6 24 14 15 23 24 26 19 23 28 19 16 22 24 17 20 13 19 10 23 18 31 13 20 17 24 14 a) Encontrar los intervalos por la prueba de sturges y hallar la media por calculadora y por datos agrupados obtenidos. b) Que podemos decir con la probabilidad del 0,95 acerca del tamaño máximo de nuestro error. SOLUCION - K= 1+3,3Log40= 6,286= 6 Ri= 31-6= 25 104 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Ci= Cn= 5 Rn=(5)(6)= 30 Dr= 30-25= 5 A=5-1= 4 Sesgo= 6-2= 4 y Intervalos 4-8 9-13 14-18 19-23 24-28 29-33 ∑ 31+2= 33 Ni 1 4 11 13 9 2 40 X´ 6 11 16 21 26 31 - Nix´ 6 44 176 273 234 62 797 Promedio en la calculadora= 19,6 Promedio a mano= a) E= E= (0,475)(0,8717) E= (1,96)(0,8717) E= 1,71 El tamaño máximo de error es del 1,71 en toneladas de óxido de sulfuro con un nivel de confianza de 95% INTERVALO DE CONFIANZA Objetivo: es que al analizar una muestra, este debe caer en el intervalo, si no cae la muestra tomada no es significativa. El intervalo de confianza esta dado por: Ẋ-E≤ u ≤ + E EJEMPLO: 3.4 Construya un intervalo de confianza del 95%con respecto a la emisión diaria en promedio real de óxido de sulfuro de la planta. DATOS: ẋ= 19,6 105 E=1,71 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 19,6 -1,71≤ U ≤ 19,6+ 1,71 17,89≤ U≤ 21,31 INTERVALO DE CONFIANZA DE UNA PROPORCIÓN Proporción es una fracción, razón o porcentaje que indica la parte de la muestra de la población que posee un rasgo de interés particular. La proporción muestral viene dada por: p= x/n Recordemos que π es el porcentaje de éxito en la distribución binomial y “p” es similar al concepto de π. El intervalo de confianza para la proporción de una población es: pz p(1 p) n En este caso, interesa construir un intervalo de confianza para una proporción o un porcentaje poblacional (por ejemplo, el porcentaje de personas con hipertensión, fumadoras, etc.) Si el tamaño muestral n es grande, el Teorema Central del Límite nos asegura que: O bien: Donde p es el porcentaje de personas con la característica de interés en la población (o sea, es el parámetro de interés) y p es su estimador muestral. Luego, procediendo en forma análoga al caso de la media, podemos construir un intervalo de 95% de confianza para la proporción poblacional p. EJEMPLO 3.5 106 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR En un estudio de prevalencia de factores de riesgo en una cohorte de 412 mujeres mayores de 15 años en el centro del valle, se encontró que el 17.6% eran hipertensas. Un intervalo de 95% de confianza para la proporción de mujeres hipertensas del centro del valle está dado por: Luego, la proporción de hipertensas varía entre (0,139 , 0,212) con una confianza de 95% LONGITUD DEL INTERVALO DE CONFIANZA Para responder a la pregunta se puede razonar diciendo que, fijos todos los parámetros menos la longitud del intervalo, si se quiere mayor certeza no queda más remedio que ampliar el intervalo, es decir, aumentar su longitud. La manera rigurosa de justificar esto es recurriendo a la fórmula del intervalo, que nos dice que su longitud es L 2Z 2 n Ahora, si σ y n permanecen fijos, para estudiar cómo varía L al cambiar α basta ver cómo varía el cuantil. Al intervalo del 95% le correspondería: • α = (100-95)/100 = 0,05 → α disminuye • Ahora la cantidad z α/ 2 debe dejar menos área (probabilidad) a su derecha → aumenta. Por tanto, de la expresión anterior se ve que L aumenta. zα/ 2 MUESTREO Antes de entrar al mundo de aplicaciones resaltaremos algunos de aspectos generales de un cuestionario pues son muy pocos libros que abarcan una teoría con respecto al modo de preguntar A la hora de formular un cuestionario o encuesta como desarrollo de una investigación en el área social y, a manera de ejemplo se debe tener en cuenta: 1. Tener en cuenta cuál es el objetivo de una investigación y delimitar sus características dentro de un determinado contexto. 2. Desarrollar el cuestionario de manera clara, concisa y concreta. 3. Verificar que tipo de población se escogerá para la realización del cuestionario o encuesta 107 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR LA ENCUESTA Esta herramienta es la más utilizada en la investigación de ciencias y es el medio principal para allegarse información de tal que el sujeto encuestado plasme por sí mismo las respuestas en el papel. Es importantísimo que el investigador sólo proporcione la información indispensable, la mínima para que sean comprendidas las preguntas. Más información, o información innecesaria, puede derivar en respuestas no veraces. De igual manera, al diseñar la encuesta y elaborar el cuestionario hay que tomar en cuenta los recursos (tanto humanos como materiales) de los que se disponen, tanto para la recopilación como para la lectura de la información, para así lograr un diseño funcionalmente eficaz. Según M. García Ferrando, "prácticamente todo fenómeno social puede ser estudiado a través de las encuestas", y podemos considerar las siguientes cuatro razones para sustentar ésto: 1. Las encuestas son una de las escasas técnicas de que se dispone para el estudio de las actitudes, valores, creencias y motivos. 2. Las técnicas de encuesta se adaptan a todo tipo de información y a cualquier población. 3. Las encuestas permiten recuperar información sobre sucesos acontecidos a los entrevistados. 4. Las encuestas permiten estandarizar los datos para un análisis posterior, obteniendo gran cantidad de datos a un precio bajo y en un período de tiempo corto. TIPOS DE ENCUESTAS Según Cadoche y sus colaboradores, las encuestas se pueden clasificar atendiendo al ámbito que abarcan, a la forma de obtener los datos y al contenido, de la siguiente manera: Encuestas exhaustivas y parciales: Se denomina exhaustiva cuando abarca a todas las unidades estadísticas que componen el colectivo, universo, población o conjunto estudiado. Cuando una encuesta no es exhaustiva, se denomina parcial. Encuestas directas e indirectas: Una encuesta es directa cuando la unidad estadística se observa a través de la investigación propuesta registrándose en el cuestionario. Será indirecta cuando los datos obtenidos no corresponden al objetivo principal de la encuesta pretendiendo averiguar algo distinto o bien son deducidos de los resultados de anteriores investigaciones estadísticas. Encuestas sobre hechos y encuestas de opinión: Las encuestas de opinión tienen por objetivo averiguar lo que el público en general piensa acerca de una determinada materia o lo que considera debe hacerse en una circunstancia concreta. Se realizan con un procedimiento de muestreo y son aplicadas a una parte de la población ya que una de sus ventajas es la enorme rapidez con que se obtienen sus resultados. 108 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR No obstante, las encuestas de opinión no indican necesariamente lo que el público piensa del tema, sino lo que pensaría si le planteásemos una pregunta a ese respecto, ya que hay personas que no tienen una opinión formada sobre lo que se les pregunta y contestan con lo que dicen los periódicos y las revistas. A veces las personas encuestadas tienen más de una respuesta a una misma pregunta dependiendo del marco en que se le haga la encuesta y por consecuencia las respuestas que se dan no tienen por qué ser sinceras. Las encuestas sobre hechos se realizan sobre acontecimientos ya ocurridos, hechos materiales. TIPOS DE PREGUNTA Como los cuestionarios están formados por preguntas, consideremos las características que deben reunir, pues deben excluyentes y exhaustivas, lo que se refiere a que una pregunta no produzca dos respuestas y, simultáneamente, tenga respuesta. (A cada pregunta le corresponde una y sólo una respuesta.) Por otro lado, una manera de clasificar a las preguntas es por la forma de su respuesta: Preguntas cerradas: que consiste en proporcionar al sujeto observado una serie de opciones para que escoja una como respuesta. Tienen la ventaja de que pueden ser procesadas más fácilmente y su codificación se facilita; pero también tienen la desventaja de que si están mal diseñadas las opciones, el sujeto encuestado no encontrará la opción que él desearía y la información se viciaría. Una forma de evitar esto es realizar primero un estudio piloto y así obtener las posibles opciones para las respuestas de una manera más confiable. También se consideran cerradas las preguntas que contienen una lista de preferencias u ordenación de opciones, que consiste en proporcionar una lista de opciones al encuestado y éste las ordenará de acuerdo a sus interes, gustos, etcétera Preguntas abiertas: que consisten en dejar totalmente libre al sujeto observado para expresarse, según convenga. Tiene la ventaja de proporcionar una mayor riqueza en las respuestas; mas, por lo mismo, puede llegar a complicar el proceso de tratamiento y codificación de la información. Una posible manera de manipular las preguntas abiertas es llevando a cabo un proceso de categorización, el cual consiste en estudiar el total de respuestas abiertas obtenidas y clasificarlas en categorías de tal forma que respuestas semejantes entre sí queden en la misma categoría. Preguntas de identificación: edad, sexo, profesión, nacionalidad, etcétera. Preguntas de hecho: referidas a acontecimientos concretos. Por ejemplo: ¿terminó la educación básica? 109 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Preguntas de acción: referidas a actividades de los encuestados. Por ejemplo: ¿ha tomado algún curso de capacitación? Preguntas de información: para conocer los conocimientos del encuestado. Por ejemplo: ¿sabe qué es un hipertexto? Preguntas de intención: para conocer la intención del encuestado. Por ejemplo: ¿utilizará algún programa de computación para su próxima clase?i) Preguntas de opinión: para conocer la opinión del encuestado. Por ejemplo: ¿qué carrera cursarás después del bachillerato? Preguntas filtro: son aquéllas que se realizan previamente a otras para eliminar a los que no les afecte. Por ejemplo: ¿Tiene usted coche? ¿Piensa comprarse uno? Preguntas trampa o de control: son las que su utilizan para descubrir la intención con que se responde. Para ello se incluyen preguntas en diversos puntos del cuestionario que parecen independientes entre sí, pero en realidad buscan determinar la intencionalidad del encuestado al forzarlo a que las conteste coherentemente (ambas y por separado) en el caso de que sea honesto, pues de lo contrario «caería» en contradicciones. Preguntas de introducción o rompehielos: utilizadas para comenzar el cuestionario o para enlazar un tema con otro. Preguntas muelle, colchón o amortiguadoras: son preguntas sobre temas peligrosos o inconvenientes, formuladas suavemente. Preguntas en batería: conjunto de preguntas encadenadas unas con otras complementándose. Preguntas embudo: se empieza por cuestiones generales hasta llegar a los puntos más esenciales. REGLAS FUNDAMENTALES PARA LA ELABORACION DE UN CUESTIONARIO Para la realización de un cuestionario eficaz y útil, Cadoche y su equipo proponen 17 reglas fundamentales para su elaboración: 1Las preguntas han de ser pocas (no más de 30). 2. Las preguntas preferentemente cerradas y numéricas. 3. Redactar las preguntas con lenguaje sencillo 4. Formular las preguntas de forma concreta y precisa. 5. Evitar utilizar palabras abstractas y ambiguas. 6. Formular las preguntas de forma neutral. 7. En las preguntas abiertas no dar ninguna opción alternativa. 8. No hacer preguntas que obliguen a esfuerzos de memoria. 9. No hacer preguntas que obliguen a consultar archivos. 10. No hacer preguntas que obliguen a cálculos numéricos complicados. 11. No hacer preguntas indiscretas. 12. Redactar las preguntas de forma personal y directa. 13. Redactar las preguntas para que se contesten de forma directa e inequívoca. 14. Que no levanten prejuicios en los encuestados. 15. Redactar las preguntas limitadas a una sola idea o referencia. 110 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 16. Evitar preguntas condicionantes que conlleven una carga emocional grande. 17. Evitar estimular una respuesta condicionada. Es el caso de preguntas que presentan varias respuestas alternativas y una de ellas va unida a un objetivo tan altruista que difícilmente puede uno negarse. LA ENTREVISTA La entrevista es muy utilizada también en investigación social, y sus características son similares a las del cuestionario, siendo la principal diferencia el hecho de que es el encuestador u observador quien anota las respuestas a las preguntas conlleva a tener una mayor habilidad por parte del encuestador u observador en conducir el tema de la entrevista, debido a que las respuestas son por lo general abiertas y permiten implementar nuevas preguntas no contempladas por el encuestador inicialmente. Las recomendaciones en general y las referentes al tipo de preguntas utilizadas, son las mismas que las realizadas para el caso del cuestionario, aunque se le añade el uso de una grabadora (de audio o de vídeo) para la posterior transcripción de los diálogos. 4 TIPOS DE MUESTREO En el estudio de muestreo existen diferentes criterios de clasificación de los tipos de muestreo, pero por lo general pueden dividirse en dos grandes grupos: métodos de muestreo probabilísticos y métodos de muestreo no probabilísticos. I. MUESTREO PROBABILÍSTICO En estadística las técnicas o métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad donde todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, por lo tanto , todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. La ventaja de los de métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Y los encontramos de varios tipos: 2. MUESTREO ALEATORIO SIMPLE El muestreo aleatorio simple se caracteriza por obtener una muestra, donde se numeran los elementos de la población y se seleccionan al azar los n elementos que contiene la muestra. VENTAJAS 4 http://www.rrppnet.com.ar/comohacerunaencuesta.htm 111 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Sencillo y de fácil comprensión. Cálculo rápido de medias y varianzas. Se basa en la teoría estadística, y por tanto existen paquetes informáticos para analizar los datos DESVENTAJAS Requiere que se posea de antemano un listado completo de toda la población. Cuando se trabaja con muestras pequeñas es posible que no represente a la población adecuadamente EJEMPLO3.6 La facultad de ingeniería Industrial tiene 120 alumnos y se quiere extraer una muestra de 30 alumnos. Explica cómo se obtiene la muestra: SOLUCION -Se enumeran los alumnos del 1 al 120. -Se sortean 30 números de entre los 120. -La muestra estará formada por los 30 alumnos a los que les correspondan los números obtenidos. 3. MUESTREO ALEATORIO SIN REPOSICIÓN Los elementos no son devueltos a la población. Sólo pueden aparecer una vez en la muestra y el número de muestras posibles se obtiene así VN , n N! ( N n)! EJEMPLO POBLACION PERSONA A B C EDAD 1 2 3 DETERMINAR a) μ b) 2 c) El numero de muestras posibles si n=2 d) COMPLETE EL SIGUIENTE CUADRO CON EL NUMERO DE MUESTRAS OBTENIDAS EN EL PUNTO ANTERIOR MUESTRA X1 X2 S2 PROB X 1 1 2 112 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR SOLUCION 1 2 3 2 a) 3 12 22 32 22 0.67 3 3! c) V3, 2 6 1! d) CUADRO DE MUESTRAS SIN REPOSICION MUESTRA X1 X2 X 1 1 2 1.5 2 1 3 2 3 2 1 1,5 4 2 3 2.5 5 3 1 2 6 3 2 2.5 b) 2 S2 0.25 1 0,25 0.25 1 0.25 PROB 1/6 1/6 1/6 1/6 1/6 1/6 ESTIMADO LECTOR VERIFICAR LOS DATOS OBTENIDOS EN EL CUADRO ANTERIOR 4. MUESTREO ALEATORIO CON REPOSICIÓN Los elementos son devueltos a la población. Pueden aparecer más de una vez en la muestra. Muestreo aleatorio simple (muestreo aleatorio) Se puede calcular el n número de muestras posibles: VN Nn En nuestro ejemplo anterior construya el cuadro con reposición para N=3 y n=2 MUESTREO ALEATORIO EN POBLACIÓN INFINITA • Se asume que la población tiene infinitos elementos. • El número de posibles muestras es infinito. • Muestreo aleatorio simple: 1. Con reposición. 113 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 2. En población infinita. 5. MUESTREO ALEATORIO SISTEMÁTICO Si se elige un individuo al azar y a partir de él, a intervalos constantes, se eligen los demás hasta completar la muestra. EJEMPLO 3.7 Por ejemplo si tenemos una población formada por 100 elementos y queremos extraer una muestra de 25 elementos, en primer lugar debemos establecer el intervalo de selección que será igual a 100/25 = 4. A continuación elegimos el elemento de arranque, tomando aleatoriamente un número entre el 1 y el 4, y a partir de él obtenemos los restantes elementos de la muestra. 2, 6, 10, 14,..., 98 VENTAJAS Define un intervalo k= N/n Fácil de aplicar. No siempre es necesario tener un listado de toda la población. Cuando la población está ordenada siguiendo una tendencia conocida, asegura una cobertura de unidades de todos los tipos. DESVENTAJAS Si la constante de muestreo está asociada con el fenómeno de interés, las estimaciones obtenidas a partir de la muestra pueden contener sesgo de selección 6.MUESTREO ALEATORIO ESTRATIFICADO Se divide la población en clases o estratos y se escoge, aleatoriamente, un número de individuos de cada estrato proporcional al número de componentes de cada estrato. Un muestreo puede hacerse con o sin reposición, y la población de partida puede ser infinita o finita. En todo nuestro estudio vamos a limitarnos a una población de partida infinita o a muestreo con reposición. Si consideremos todas las posibles muestras de tamaño n en una población, para cada muestra podemos calcular un estadístico (media, desviación típica, proporción, ...) que variará de una a otra. Así obtenemos una distribución del estadístico que se llama distribución muestral. 114 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR VENTAJAS Tiende a asegurar que la muestra represente adecuadamente a la población en función de unas variables seleccionadas. Se obtienen estimaciones más precisa Su objetivo es conseguir una muestra lo más semejante posible a la población en lo que a la o las variables estratificadoras se refiere. DESVENTAJAS Se ha de conocer la distribución en la población de las variables utilizadas para la estratificación EJEMPLO 3.8 En una fábrica harinera que consta de 600 trabajadores queremos tomar una muestra de 20. Sabemos que hay 200 trabajadores en la sección A, 150 en la B, 150 en la C y 100 en la D. Cuantos trabajadores hay eb cada sesccion COMPRUEBA QUE HAY 5 TRABAJADORES EN LA SECCION B Y 5 EN C Y 3 EN D 7. MUESTREO POR CONGLOMERADO El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto número de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muéstrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. 115 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". En el campo de la investigación educativa, es frecuente obtener muestras de alumnos, profesores, etc. Recurriendo a conglomerados tales como aulas, centro, localidades. Usando este procedimiento evitamos la dispersión de unidades a la que nos conduciría un muestreo aleatorio simple, y se reducirían los costes y el tiempo de un posible trabajo de recogida de datos. VENTAJAS Es muy eficiente cuando la población es muy grande y dispersa. No es preciso tener un listado de toda la población, sólo de las unidades primarias de muestreo. DESVENTAJAS El error estándar es mayor que en el muestreo aleatorio simple o estratificado. El cálculo del error estándar es complejo II. MÉTODOS DE MUESTREO NO PROBABILÍSTICOS A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones (estimaciones inferenciales sobre la población), pues no se tiene certeza de que la muestra extraída sea representativa, ya que no todos los sujetos de la población tienen la misma probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo determinados criterios procurando, en la medida de lo posible, que la muestra sea representativa. En algunas circunstancias los métodos estadísticos y epidemiológicos permiten resolver los problemas de representatividad aun en situaciones de muestreo no probabilístico, por ejemplo los estudios de caso-control, donde los casos no son seleccionados aleatoriamente de la población. Entre los métodos de muestreo no probabilísticos más utilizados en investigación encontramos: 1.- MUESTREO POR CUOTAS: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en 116 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Tulua. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. 2.- MUESTREO INTENCIONAL O DE CONVENIENCIA: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. También puede ser que el investigador seleccione directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos) 3.- BOLA DE NIEVE: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc. TAMAÑO DE MUESTRA 1) TAMAÑO DE MUESTRA PARA ESTIMAR LA MEDIA DE LA POBLACIÓN Para determinar el tamaño de muestra y estimar la media de la población es necesario emplear el muestreo aleatorio simple. Para ello es necesario partir de dos supuestos: en primer lugar el nivel de confianza al que queremos trabajar; en segundo lugar, cual es el error máximo que estamos dispuestos a admitir en nuestra estimación. Así pues los pasos a seguir son: 1.- Obtener el tamaño muestral imaginando que Donde: 117 : TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR : z correspondiente al nivel de confianza elegido : varianza poblacional e: error máximo NOTA: En el Tamaño de la muestra Si aumentamos el nivel de confianza, aumenta el tamaño de la muestra. Si disminuimos el error, tenemos que aumentar el tamaño de la muestra. 2.- Comprobar si se cumple si esta condición se cumple el proceso termina aquí, y ese es el tamaño adecuado que debemos muestrear. Si no se cumple, pasamos a una tercera fase: 3.- Obtener el tamaño de la muestra según la siguiente fórmula: Veamos un ejemplo: El ministerio de trabajo en Colombia planea un estudio con el interés de conocer el promedio de horas semanales trabajadas por las mujeres del servicio doméstico. La muestra será extraída de una población de 10000 mujeres que figuran en los registros de la Seguridad Social y de las cuales se conoce a través de un estudio piloto que su varianza es de 9.648. Trabajando con un nivel de confianza de 0.95 y estando dispuestos a admitir un error máximo de 0,1, ¿cuál debe ser el tamaño muestral que empleemos?. 118 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Buscamos en las tablas de la curva normal el valor de corresponde con el nivel de confianza elegido: seguimos los pasos propuestos arriba. que = ±1.96 y 1.- 2.- Comprobamos que no se cumple este caso , pues en 10000 < 3706 (3706 - 1); 10000 < 13730730 3.- 2) TAMAÑO DE MUESTRA PARA ESTIMAR LA PROPORCIÓN DE LA POBLACIÓN Para calcular el tamaño de muestra para la estimación de proporciones poblacionales hemos de tener en cuenta los mismos factores que en el caso de la media. La fórmula que nos permitirá determinar el tamaño muestral es la siguiente: donde : z correspondiente al nivel de P: proporción de una categoría e: error N: tamaño de la población confianza de la elegido variable máximo Siguiendo con el estudio planteado en el punto anterior, supongamos que tratamos de estimar la proporción de mujeres que trabajan diariamente 10 horas o más. De un estudio piloto se dedujo que P=0.30, fijamos el nivel de confianza en 0.95 y el error máximo 0.02. 119 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR OTRAS FORMAS DE TOMAR EXPLICADOS EN INTERNET TAMAÑO DE MUESTRA http://www.youtube.com/watch?v=Y0XLJnGbFQs 3) CÁLCULO DEL TAMAÑO DE LA MUESTRA DE BASE El tamaño adecuado de la muestra para una encuesta relativa a la población está determinado en gran medida por tres factores: a) prevalencia estimada de la variable considerada b) nivel deseado de fiabilidad; y c) margen de error aceptable y para ello vamos a presentar dos fórmulas a) Siendo la primera la que se aplica en el caso de que no se conozca con precisión el tamaño de la población, y es: n Z 2 P * Q 2 E2 Lo que indica que el tamaño de la muestra para un diseño de encuesta basado en una muestra aleatoria simple, puede calcularse fórmula anterior donde :: n= tamaño de la muestra requerido Z = nivel de fiabilidad de 95% (valor estándar de 1,96) 2 p= prevalencia estimada en la zona E = margen de error de 5% (valor estándar de 0,05) del proyecto Ejemplo En el proyecto del Dr Patarroyo con respecto la vacuna contra la malaria en todo el pacifico colombiano, se ha calculado que cerca del 30% (0,3) de los niños de la zona del proyecto padecen de malaria. Este dato se basa en estadísticas nacionales sobre malaria en las zonas rurales. Utilizando los valores estándar indicados encontrar el tamaño de muestra ideal para aplicar la vacuna: Cálculo: SOLUCION 120 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 1.96 0.3 * (1 0.3) n 323 0.52 2 b) La segunda formula se aplica en el caso de que sí se conozca el tamaño de la población entonces se aplica la siguiente fórmula: donde n Z p q N E es el tamaño de la muestra; es el nivel de confianza; es la variabilidad positiva; es la variabilidad negativa; es el tamaño de la población; es la precisión o el error. La ventaja sobre la primera fórmula es que al conocer exactamente el tamaño de la población, el tamaño de la muestra resulta con mayor precisión y se pueden incluso ahorrarse recursos y tiempo para la aplicación y desarrollo de una investigación. EJEMPLO 3.9 En LA INSTITUCION EDUCATIVA MODERNA DE TULUA se desea realizar una investigación sobre los alumnos inscritos en los sextos , para lo cual se aplicará un cuestionario de manera aleatoria a una muestra, pues los recursos económicos y el tiempo para procesar la información resultaría insuficiente en el caso de aplicársele a la población estudiantil completa. En primera instancia, suponiendo que no se conoce el tamaño exacto de la población, pero con la seguridad de que ésta se encuentra cerca a los diez millares, se aplicará la primera fórmula. Se considerará una confianza del 95%, un porcentaje de error del 5% y la máxima variabilidad por no existir antecedentes en la institución sobre la investigación y porque no se puede aplicar una prueba previa. Primero habrá que obtener el valor de Z de tal forma que la confianza sea del 95%, es decir, buscar un valor de Z tal que P(-Z<z<Z)=0.95. Donde al buscar en la tabla nos arroja un resultado de Z=1.96.y por no tener antecedente se supone un P=0.5 121 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR De esta manera se realiza la sustitución y se obtiene: Esto quiere decir que el tamaño de la muestra es de 385 alumnos. Supongamos ahora que sí se conoce el tamaño de la población estudiantil y es de 9,408, entonces se aplicará la segunda fórmula. Utilizando los mismos parámetros la sustitución queda como: Con lo que se tiene una cota mínima de 370 alumnos para la muestra y así poder realizar la investigación sin más costo del necesario, pero con la seguridad de que las condiciones aceptadas para la generalización (confiabilidad, variabilidad y error) se mantienen. DISTRIBUCIONES MUESTRALES La distribución de frecuencia de un estadístico muestral se denomina distribución muestral. En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño. Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la madia muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en la siguiente figura: EJEMPLO 3.7 122 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2, 4 y 6. Encuentre: a) μ, la media poblacional 0246 3 4 b) σ, la desviación estándar poblacional. Verificar que σ=2.2336 c) μx la media de la distribución muestral de medias. A continuación se listan los elementos de la distribución muestral de la media y la correspondiente distribución de frecuencias. Muestra media (0,0) 0 (0,2) 1 (0,4) 2 (0,6) 3 (2,0) 1 (2,2) 2 (2,4) 3 (2,6) 4 (4,0) 2 (4,2) 3 (4,4) 4 (4,6) 5 123 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 3 (6,0) (6,2) 4 (6,4) 5 (6,6) 6 Distribución de frecuencias de la media X f 0 1 1 2 2 3 3 4 4 3 5 2 6 1 La media de la distribución muestral de medias es: x fx 0 *1 1* 2 2 * 3 3 * 4 4 * 3 5 * 2 6 *1 3 n 16 d) σx, la desviación estándar de la distribución muestral de medias. x x x n COMPROBAR QUE ALAPLICAR LA FORMULA ANTERIOR X 1.58 Y QUE ESTE VALOR TAMBIEN SE PUEDE CALCULAR POR 124 X TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR n Como para cualquier variable aleatoria, la dsitribución muestral de medias tiene una media o valor esperado, una varianza y una desviación estándar, se puede demostrar que la distribución muestral de medias tiene una media igual a la media poblacional. Esto es: μx = E(x) = μ = 3 TEOREMA DEL LÍMITE CENTRAL Si se seleccionan muestras aleatorias de n observaciones de una población con media m y desviación estándar s, entonces, cuando n es grande, la distribución muestral de medias tendrá aproximadamente una distribución normal con unamedia igual a m y una desviación estándar de . La aproximación será cada vez más exacta a medida de que n sea n cada vez mayor. EJEMPLO 3.10 Para la distribución muestral de medias del ejercicio anterior, encuentre: a) El error muestral de cada media En la tabla siguiente se ven las muestras, las medias de las muestras y los errores muestrales: Muestra media Error muestral, e=x-m (0,0) 0 0 - 3 = -3 125 (0,2) TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 1 1 - 3 = -2 (0,4) 2 2 - 3 = -1 (0,6) 3 3–3=0 (2,0) 1 1 – 3 = -2 (2,2) 2 2 – 3 = -1 (2,4) 3 3–3=0 (2,6) 4 4–3=1 (4,0) 2 2 – 3 = -1 (4,2) 3 3–3=0 (4,4) 4 4–3=1 (4,6) 5 5–3=2 (6,0) 3 3–3=0 (6,2) 4 4–3=1 (6,4) 5 5–3=2 (6,6) 6 6–3=3 Verifique que a) La media de los errores muestrales es cero b) La desviación estándar de la distribución de los errores muestrales está dada por e e e f 2 N , y su resultado es 1.58 La desviación estándar de la distribución muestral de un estadístico se conoce como error estándar del estadístico. Para el ejercicio anterior el error estándar de la media denotado por 126 x , es 1.58. Con esto se TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR puede demostrar que si de una población se eligen muestras de tamaño n con reemplazo, entonces el error estándar de la media es igual a la desviación estándar de la distribución de los errores muestrales. En general se tiene: x e Cuando las muestras se toman de una población pequeña y sin reemplazo, se puede usar la formula siguiente para encontrar x n N n N 1 donde σ es la desviación estándar de la población de donde se toman las muestras, n es el tamaño de la muestra y N el de la población y la expresión N n se le denomina factor de correcion. N 1 EJEMPLO 3.11 Suponga que la tabla siguiente muestra la antiguedad en años en el trabajo de tres decanos de tres facultades distintas: Decanos Antiguedad A 6 B 4 C 2 Suponga además que se seleccionan muestras aleatorias de tamaño 2 sin reemplazo. Calcule a) La antigüedad media para cada muestra Se pueden tener 3C2 =3 muestras posibles. La tabla lista todas las muestras posibles de tamaño 2, con sus respectivas medias muestrales. Muestras Antigüedad A,B (6,4) 5 A,C (6,2) 4 B,C (4,2) 3 127 Media Muestral TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 246 4 3 b) La media de la distribución muestral x 543 4 3 SE INVITA AL LECTOR QUE TERMINE LOS PUNTOS CY D Y VERIFIQUE SUS RESPUESTAS c) El error estándar, o la desviación estándar de la distribución muestral ES 0.816 d) Que diferencia encuentra entre al aplicar la formula error estándar, o la desviación estándar de la distribución muestral sin factor de correcion y con factor de corrección ERROR ESTANDAR SIN CORRECCION =1.152 ERRROR ESTANDAR CON CORRECION =0.816 DISTRIBUCIÓN MUESTRAL DE MEDIAS Si recordamos a la distribución normal, esta es una distribución continua, en forma de campana en donde la media, la mediana y la moda tienen un mismo valor y es simétrica. Con esta distribución podíamos calcular la probabilidad de algún evento relacionado con la variable aleatoria, mediante la siguiente fórmula: Z X En donde z es una variable estandarizada con media igual a cero y varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de probabilidad para cualquier ejercicio, utilizando la tabla de la distribución z. 128 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien de cualquier tamaño de una población normal, la distribución muestral de medias tiene un comportamiento aproximadamente normal, por lo que se puede utilizar la formula de la distribución normal con X Y X , entonces la fórmula para calcular la probabilidad del comportamiento del estadístico, en este caso la media de la muestra , quedaría de la siguiente manera: Z X n y para poblaciones finitas y muestro con reemplazo: Z x n N n N 1 EJEMPLO 3,12 Una empresa eléctrica fabrica de lámparas que tienen una duración que se distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar de 40 horas. Encuentre la probabilidad de que una muestra aleatoriade 16 lámparas tenga una vida promedio de menos de 775 horas. La interpretación sería que la probabilidad de que la media de la muestra de 16 lámparas sea menor a 775 horas es de 0.0062. VALOR ESPERADO El valor esperado es el más importante concepto en el estudio de las distribuciones de probabilidad. Desde hace muchos años dicho concepto ha sido aplicado ampliamente en el negocio de seguros y en los últimos 129 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR veinte años ha sido aplicado por otros profesionales que casi siempre toman decisiones en condiciones de incertidumbre. Para encontrar el valor esperado de una variable aleatoria discreta, multiplicamos cada valor que ésta puede asumir por la probabilidad de ocurrencia de ese valor y luego sumamos los productos. Es un promedio ponderado de los resultados que se esperan en el futuro. Sea X una Variable Aleatoria que toma valores en un conjunto discreto (en un conjunto finito de números en uno infinito como: los naturales, los enteros o los racionales), por ejemplo si la variable aleatoria X toma los siguientes valores: X = 0, 1, 2, 3, … decimos que es discreta La probabilidad de que X tome cada uno de sus valores viene dada por la función de probabilidad: P(X = i ), para i = 0, 1, 2, 3, ... ; Sea P(X = i ) = pi para i = 0, 1, 2, 3, ... Se tiene que p1 + p2 + p3 +...+ pn +... = 1 Se define el Valor Esperado de una Variable Aleatoria con distribución discreta como: µ = E(X) = Xf (X ) Y para una variable aleatoria con distribución continua como µ = E(X) = x( f ( x)dx EJEMPLO 3.13 La variable ‘edad de la clase’ tiene µ=20 y σ 2=2. Asumiendo que X es normal: a) Tomamos todas las posibles muestras de n=4 y calcular la media y Obtener E( X ) y x2 b) Obtener la probabilidad de encontrar un sujeto con X > 22 c) Obtener la probabilidad de encontrar una muestra con media > 22 SOLUCION 130 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 2 2 a) E( X ) =μ=20 y x2 = 0.5 n 4 x u 22 20 b) Z 1,41 donde P(X>22)= P(Z>1.41)= 0.0973 2 Valor encontrado en la tabla de Z _ c) Z X u 22 20 n 2 2,83 4 P( X 22) P( Z 2,83) 0.0023 DISTRIBUCIÓN MUESTRAL DE LA MEDIA CON σ2 DESCONOCIDA En caso de que se desconozca σ2 entonces la distribución muestral puede calcularse: T X Sn n 1 Cuya distribución es t con n-1 grados de libertad en caso de muestra pequeña DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN n variables dicotómicas: X1, X2, ..., Xn tiene como E(xi)=ρ y σ2=ρ(1-ρ) y donde n será X=X1+X2+ + + + Xn= X i y su i 1 proporción será P=X/n NOTA: Cuando se vaya a tomar los valores dado y la proporción dada se pueden diferenciar el valor esperado y la varianza a través de las siguientes expresiones VALORES DADO DE X PROPORCION DADA P E(X)=nρ E(P)=ρ 131 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR (1 ) 2P n =nρ(1-ρ) 2 NOTA Parámetros estadísticos de una distribución muestral de las proporciones de tamaño n: Una distribución muestral de las proporciones se comporta como una distribución normal descrita por los parámetros N EJEMPLO 3.14 Cuál es el valor esperado y la varianza entre 3 estudiantes de derecho de la UCEVA de primer semestre si se sabe que el 20% no les gusta las matemáticas por tener contenidos difíciles contestar a) Encontrar el valor esperado y la varianza sise toma un estudiante al azar b) Cual su proporción si resulto uno de los tres que no les gustaba matematicas c) Encontrar el valor esperado y la varianza entre los tres estudiantes Y LA PROPORCION de su valor esperado y la varianza con respecto al no gustarle las matemáticas y 2 =nρ(1-ρ)= 1*0.2(0.8)=0.16 a) E=(X)=nρ=1*(0.2)=0.2 b) P=1/3= 0.33 C) E(X ) = nρ = 3(0,2) = 0,6 Y 2 =nρ(1-ρ)=3*0.2(0.8)=0.48 E(P)=ρ=0.2 132 y 2P (1 ) n =0.2*0.8/3=0.05 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR =nρ(1-ρ)=3*0.2(1-0.2)=0.16 2 EJEMPLO 3.15 Suponga que se tiene un lote de 12 piezas, las cuales 4 son defectuosos. Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución muestral de proporciones para el número de piezas defectuosas. SOLUCION Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están defectuosas. El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos es 12C5=792, las cuales se pueden desglosar de la siguiente manera: ARTICULOS ARTICULOS PROPORCION DE ARTICULOS BUENOS MALOS DEFECTUOSOS Nro DE MANERAS QUE SE PUEDE OBTENER UNA MUESTRA 1 4 0.8 8 2 3 0.6 112 3 2 0.4 336 4 1 0.2 280 5 0 0 56 INDIQUE COMO SE OBTUVIERON LOS RESULTADOS DE LA COLUMNA 3 Y 4 VERIFIQUE QUE 133 a) p b) TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 0.3333 p 0.1681 DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE MEDIAS Partamos de media 1 que se tienen dos poblaciones distintas, la primera con y desviación estándar 1, y la segunda con media 2y desviación estándar 2. Ahora bien si elegimos una muestra aleatoria de tamaño n1 de la primera población y una muestra independiente aleatoria de tamaño n2 de la segunda población; se calcula la media muestral para cada muestra y la diferencia entre dichas medias. La colección de todas esas diferencias se llama distribución muestral de las diferencias entre medias o la distribución muestral del estadístico Ahora debemos recordar que la distribución es aproximadamente normal para n1 30 y n2 30. Si las poblaciones son normales, se puede deducir que la distribución muestral de medias es normal sin importar los tamaños de las muestras. En anteriores ejercicios del texto que ,por lo que no es difícil deducir que y que 134 se había demostrado que . y TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de medias es: EJEMPLO 3.16: En un estudio para comparar los pesos promedio de niños y niñas de sexto grado en una escuela primaria ANTONIO JOSE DE SUCRE se usará una muestra aleatoria de 20 niños y otra de 25 niñas. Se sabe que tanto para niños como para niñas los pesos siguen una distribución normal. El promedio de los pesos de todos los niños de sexto grado de esa escuela es de 105 libras y su desviación estándar es de 14.152, mientras que el promedio de los pesos de todas las niñas del sexto grado de esa escuela es de 90 libras y su desviación estándar es de 12.257 libras. Si representa el promedio de los pesos de 20 niños y es el promedio de los pesos de una muestra de 25 niñas, encuentre la probabilidad de que el promedio de los pesos de los 20 niños sea al menos 20 libras más grande que el de las 25 niñas. Solución: Datos: 1= 2 105 libras = 90 libras 1= 14.142 libras 2= 12.247 libras n1 = 20 niños n2 = 25 niñas =? 135 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 20 (105 90) z (14.142) 2 (12.457) 2 20 2 1.25 Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de niños sea al menos 20 libras más grande que el de la muestra de las niñas es 0.1056. EJEMPLO:3.17 Uno de los principales fabricantes de celulares compra simcard a dos compañías. Las simcard de la compañía A tienen una vida media de 7.2 años con una desviación estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 simcard de la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de 40 simcard de la compañía B. Solución: Datos: A= B 7.2 años = 6.7 años A= 0.8 años B= 0.7 años nA = 34 simcard nB = 40 simcard 136 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR =? EJEMPLO 3.18 Se prueba el rendimiento en km/L de 2 tipos de ETANOL , encontrándose una desviación estándar de 1.23km/L para el primer etanol y una desviación estándar de 1.37km/L para el segundo etanol; se prueba el primer etanol en 35 autos y el segundo en 42 autos. a. ¿Cuál es la probabilidad de que el primer etanol de un rendimiento promedio mayor de 0.45km/L que el segundo etanol? b. ¿Cuál es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor del primer etanol?. Solución: En este ejercicio no se cuenta con los parámetros de las medias en ninguna de las dos poblaciones, por lo que se supondrán que son iguales. Datos: 1= 1.23 Km/Lto 2= 1.37 Km/Lto n1 = 35 autos n2 = 42 autos a. 137 =? TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR b. ? La probabilidad de que la diferencia en rendimientos promedio en las muestras se encuentre entre 0.65 y 0.83 Km/Lto a favor de la gasolina 1 es de 0.0117. DISTRIBUCIÓN MUESTRAL DE DIFERENCIA DE PROPORCIONES Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuación se citan algunos ejemplos: 138 Educación.- ¿Es mayor la proporción de los estudiantes que aprueban matemáticas que las de los que aprueban Estadística? TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Medicina.- ¿Es menor el porcentaje de los usuarios del medicamento X que presentan una reacción adversa que el de los usuarios del fármaco Y que también presentan una reacción de ese tipo? Administración.- ¿Hay diferencia entre los porcentajes de hombres y mujeres en puestos administrativos. Ingeniería.- ¿Existe diferencia entre la proporción de artículos defectuosos que produce la máquina X a los que genera la máquina Y? Cuando el muestreo proviene de dos poblaciones binomiales y se trabaja con dos proporciones muestrales, la distribución muestral de diferencia de proporciones es aproximadamente normal para tamaños de muestra grande (n1p1 5, n1q1 5,n2p2 5 y n2q2 5). Entonces p1 y p2 tienen distribuciones muestrales aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución muestral aproximadamente normal. Cuando se estudió a la distribución muestral de proporciones se comprobó que que y que y que , por lo que no es difícil deducir . La fórmula que se utilizará para el cálculo de probabilidad del estadístico de diferencia de proporciones es: 139 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLO 3.19 Los hombres y mujeres adultos radicados en Tulua difieren en sus opiniones sobre la promulgación de la pena de muerte para personas culpables de violación de niños. Se cree que el 12% de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres. Solución: Datos: PH = 0.12 PM = 0.10 nH = 100 nM = 100 p(pH-pM 0.03) = ? Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución binomial y se está utilizando la distribución normal. 140 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562. EJEMPLO 3.20 Una encuesta realizada por la sutev constó de 320 docentes del Valle del cauca fueron despedidos entre 2006 y 2011, encontró que 20% habían estado sin trabajo durante por lo menos dos años. Supóngase que tuviera que seleccionar otra muestra aleatoria de 320 docentes de entre todos los empleados despedidos entre 2006 y 2011. ¿Cuál sería la probabilidad de que su porcentaje muestral de docentes sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta de la sutev , en 5% o más? Solución: En este ejercicio se tiene únicamente una población, de la cual se están extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los porcentajes en esas dos muestras, por lo que se debe de utilizar la distribución muestral de proporciones con P1= P2, ya que es una misma población. Otra de las situaciones con la cual nos topamos es que desconocemos la proporción de trabajadores despedidos entre 2006 y 2011 que estuvieron desempleados por un período de por lo menos dos años, sólo se conoce la p1= 0.20 ya que al tomar una muestra de 320 trabajadores se observó esa proporción. En la fórmula de la distribución muestral de proporciones para el cálculo de probabilidad se debe saber las proporciones de las poblaciones, las cuales en este ejercicio las desconocemos, por lo que se utilizará el valor de 0.20 como una estimación puntual de P. En el siguiente tema se abordará el tema de estimación estadística y se comprenderá el porque estamos utilizando de esa manera el dato. 141 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR También debe de comprenderse la pregunta que nos hace este problema, ¿cuál sería la probabilidad de que su porcentaje muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta dela sutev, en 5% o más?, la palabra difiera quiere decir que puede existir una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que se tendrán que calcular dos áreas en la distribución y al final sumarlas. Datos: p1 = 0.20 n1 = 320 trabajadores n2 = 320 trabajadores P1 = P 2 La probabilidad de que su proporción muestral de trabajadores sin empleo durante por lo menos dos años, difiera del porcentaje obtenido en la encuesta realizada por la sutev, en 0.05 o más es de 0.1260. 142 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR EJEMPLO 3.21 Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se toman muestras de 120 objetos de cada máquina: a. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 2 rebase a la máquina 1 en por lo menos 0.10? b. ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la máquina 1 rebase a la máquina 2 en por lo menos 0.15? Solución: Datos: P1 = 3/6 = 0.5 P2 = 2/5 = 0.4 n1 = 120 objetos n2 = 120 objetos a. p(p2-p1 0.10) = ? Otra manera de hacer este ejercicio es poner P1-P2: 143 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 10% a favor de la máquina 2 es de 0.0011. b. p(p1-p2 0.15)=? La probabilidad de que exista una diferencia de proporciones de artículos defectuosos de por lo menos 15% a favor de la máquina 1 es de 0.2357. DISTRIBUCIÓN MUESTRAL DE NÚMERO DE DEFECTOS Cuando el mundo globalizado se habla de ontrol de calidad y específicamente en los gráficos de control "c" se aplica esta distribución, la cual consiste en que al extraer un artículo contabilicemos el número de defectos que tiene ese artículo. Esta distribución muestral proviene de la distribución de Poisson, en la cual le media es 144 y que en este caso es el número promedio de defectos TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR por unidad. Como ya es conocido la varianza de la distribución de Poisson es igual a manera: por lo que se puede deducir la formula de la siguiente Para la distribución muestral de número de defectos la nomenclatura utilizada es: c = número defectos por unidad de inspección C = número de defectos promedio por unidad de inspección Se debe de recordar que la distribución de Poisson es una distribución discreta, y se esta utilizando la aproximación de la normal a la Poisson, debiendo aplicar el factor de corrección de ± 0.5 según sea el caso. La formula para la dsitribución muestral de número de defectos quedaría de la siguiente manera: EJEMPLO 3.22 En cierta empresa se fabrican productos con un promedio de 8 defectos por unidad. Determine la probabilidad de que el próximo producto inspeccionado tenga un número de defectos: a. Mayor o igual a 6 b. Exactamente 7 c. Como máximo 9 a. 145 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La probabilidad de que el siguiente producto inspeccionado tenga por lo menos 6 defectos es de 0.8106. b. La probabilidad de que el siguiente producto inspeccionado tenga exactamente 7 defectos es de 0.1344. c. 146 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR La probabilidad de que el siguiente producto inspeccionado tenga a lo más 9 defectos es de 0.7019. EJERCICIO DE REPASO CAPITULO III 1) Realiza 5 preguntas posibles de un cuestionario individual. 2) Realiza 5 preguntas cerradas de una investigación hacer. que pienses 3) Enuncia 5 preguntas abiertas de una investigación que pienses hacer. 4) Realice 2 preguntas correspondientes a cada tipo de pregunta . Preguntas de identificación: . Preguntas de hecho: . Pregunta de acción: . Preguntas de información: . Preguntas de intención: . Preguntas de opinión: . Pregunta filtro: . Preguntas trampa o de control: . Preguntas de introducción ó rompe hielo: . Preguntas muelle, colchón o amortiguadores: . Preguntas en batería: . Preguntas de embudo: 5) En el barrio Belén de Cali se quiere hacer un estudio para conocer mejor el tipo de actividades de ocio que gustan más a sus habitantes. Para ello van a ser encuestados 100 individuos elegidos al azar. 1. Explicar qué procedimiento de selección sería más adecuado utilizar: muestreo con o sin reposición. ¿Por qué? 2. Como los gustos cambian con la edad y se sabe que en el barrio Belén de Cali viven 2.500 niños, 7.000 adultos y 500 ancianos, posteriormente se decide elegir la muestra anterior utilizando un muestreo estratificado. 147 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Determinar el tamaño muestral correspondiente a cada estrato. R/ 25 niños; 70 adultos; 25 ancianos 3. Suponga que una compañía de servicio de televisión por cable está pensando en prestar el servicio al barrio belén y para ello; la compañía planea realizar un estudio para determinar el porcentaje de familias de dicho barrio que utilizarían sus servicios, como no es práctico preguntar en cada casa. Qué tipo de muestreo recomienda 6) La variable altura de las alumnas que estudian en la facultad de idiomas de la UCEVA sigue una distribución normal de media 1,62 m y la desviación típica 0,12 m. ¿Cuál es la probabilidad de que la media de una muestra aleatoria de 100 alumnas sea mayor que 1.60 m? 95.15% 7) Se ha tomado una muestra de los precios de un mismo producto alimenticio en 16 graneros de Tulua, elegidos al azar, y se han encontrado los siguientes precios: 95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110. Suponiendo que los precios de este producto se distribuyen según una ley normal de varianza 25 y media desconocida: 1. ¿Cuál es la distribución de la media muestral? R/ 104 2. Determine el intervalo de confianza, al 95%, para la media poblacional. R/ (101.55; 106.45) 8. La media de las estaturas de una muestra aleatoria de 400 personas de Andalucía Valle es 1,75 m. Se sabe que la estatura de las personas de ese Pueblo es una variable aleatoria que sigue una distribución normal con varianza σ2 = 0,16 m2. 1. Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la población/ (1.7108, 1.7892) 2. ¿Cuál sería el mínimo tamaño muestral necesario para que pueda decirse que la verdadera media de las estaturas está a menos de 2 cm de la media muestral, con un nivel de confianza del 90%? R/ La muestra debe tener al menos 1083 personas. 9. Las ventas mensuales de una tienda de electrodomésticos en las islas canarias se distribuyen según una ley normal, con desviación típica 900 €. En un estudio estadístico de las ventas realizadas en los últimos nueve meses, se ha encontrado un intervalo de confianza para la media mensual de las ventas, cuyos extremos son 4 663 € y 5 839 €. 148 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 1. ¿Cuál ha sido la media de las ventas en estos nueve meses? R/ x=5251 2. ¿Cuál es el nivel de confianza para este intervalo? R/95% 10) Se desea estimar la proporción, p, de individuos daltónicos de una población a través del porcentaje observado en una muestra aleatoria de individuos, de tamaño n. 1. Si el porcentaje de docentes daltónicos de Tulua determinan una muestra igual al 30%, calcula el valor de n para que, con un nivel de confianza de 0,95, el error cometido en la estimación sea inferior al 3,1%.R// Al menos 840 individuos. 2. Si el tamaño de la muestra es de 64 docentes, y el porcentaje de docentes daltónicos en la muestra es del 35%, determina, usando un nivel de significación del 1%, el correspondiente intervalo de confianza para la proporción de daltónicos de la población. R/(0,196 , 0.504) 11) En una población adulta con una variable aleatoria sigue una ley normal de media desconocida y desviación típica 2. 1. Observada una muestra de tamaño 400, tomada al azar, se ha obtenido una media muestra al igual a 50. ¿Calcule un intervalo, con el 97 % de confianza, para la media de la población. (49.783, 50.217) 2. Con el mismo nivel de confianza, ¿qué tamaño mínimo debe tener la muestra para qué la amplitud del intervalo que se obtenga sea, como máximo, 1? Sugerencia tome E=0.5 R/ n 76 12) En el comercial la herradura de Tulua trabajan 150 personas en el departamento de personal, 450 en el departamento de ventas, 200 en el departamento de contabilidad y 100 departamentos de atención al cliente. Con objeto de realizar una encuesta laboral, se quiere seleccionar una muestra de 180 trabajadores. 1. ¿Qué tipo de muestreo deberíamos utilizar para la selección de la muestra si queremos que incluya a trabajadores de los cuatro departamentos mencionados? 2. ¿Qué número de trabajadores tendríamos que seleccionar en cada departamento atendiendo a un criterio de proporcionalidad? R/30 de personal, 90 de ventas ,40 de contabilidad 13) La ciencia ha determinado que La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviación típica de 2g/dl. 149 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media poblacional de hemoglobina en sangre está entre 13 y 15 g/dl. R/ 91.64% 14) En una fábrica de componentes electrónicos, la proporción de componentes finales defectuosos era del 20%. Tras una serie de operaciones e inversiones destinadas a mejorar el rendimiento se analizó una muestra aleatoria de 500 componentes, encontrándose que 90 de ellos eran defectuosos. ¿Qué nivel de confianza debe adoptarse para aceptar que el rendimiento no ha sufrido variaciones? R/73.72% 15) Supongamos que se desea realizar una encuesta sobre la brucelosis ovina en Barragan . Se estima una prevalencia del 15% y se requiere un 5% de precisión sobre una población de 2.000.000 de cabezas. El nivel de confianza se fija en el 95%. Determinar el tamaño de la muestra necesario para dicha encuesta. R/ 196 16) La media de edad de los alumnos que se presentan a pruebas de ingreso a la Uceva es de 18,1 años, y la desviación típica 0,6 años. a) De los alumnos anteriores se elige, al azar, una muestra de 100. ¿ Cuál es la probabilidad de que la media de la edad de la muestra esté comprendida entre 17,9 y 18,2 años?. R/95.21% b) ¿Qué tamaño debe tener una muestra de dicha población para que su media esté comprendida entre 17,9 y 18,3 años, con una confianza del 99,5%? R/ 72 personas 17) Las medidas de los diámetros de una muestra tomada al azar, de 200 cojinetes de bolas, hechos por una determinada máquina en la litografía franciscos, dieron una media de 2 cm y una desviación típica de 0,1 cm. Hallar los intervalos de confianza del : 68,26% R/ Z 1 (1,993,:2.007) 2 95,44% R/ Z 2 (1.986 , 2,014) 2 99,73% R/ (1.979; 2.021) Para el diámetro de todos los cojinetes. 18) El Ingeniero de control de calidad de la fábrica de focos necesita estimar la vida promedio de un gran embarque. Se sabe que la desviación 150 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR estándar del proceso es de 100 horas. Una muestra aleatoria de 50 focos mostró una vida promedio de 350 horas. Estime un intervalo de confianza del 95% de vida promedio real de los focos en este embarque R/ (322.27; 377.72) La vida promedio real de los focos se encuentra entre 322.67 y 377.72 horas 19) Supongamos que un curso exitoso d estadística 35 de 42 alumnos aprueban estadística. Estime un intervalo de confianza para la proporción de la población del 5%.R/ (0.71; 0.94) es el intervalo de confianza para la proporción, es decir que entre el 71% y 94% aprobaron el examen, con un nivel de confianza del 95% 20) Las bolsas de sal envasadas por una máquina tienen μ = 500 g y σ = 35 g. Las bolsas se empaquetaron en cajas de 100 unidades..Calcular la probabilidad de que la media de los pesos de las bolsas de un paquete sea menor que 495 g. R/7.64% 21) Calcule el tamaño muestral de una encuesta realizada por UCEVA sobre que se conoce del decreto 1030 de la reforma si el error teórico era de + 2, con un intervalo de confianza de 95,5% y P=Q en el supuesto de un muestreo aleatorio simple. R/2500 22) Los siguientes datos son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 5 6 8 8 9 9 10 11 11 11 13 13 14 14 14 14 14 14 15 15 16 16 16 16 16 16 16 16 17 17 17 18 18 18 19 19 19 19 19 19 19 19 20 20 Construir un intervalo de confianza para el puntaje promedio poblacional R/ Luego, el intervalo de confianza para es (13,2, 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%. 23) Supongamos que se plantea la hipótesis de que el promedio de peso de nacimiento la marina es igual a la media nacional de 3250 gramos.Al tomar una muestra de 30 recién nacidos de la población en estudio, se obtuvo: 151 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR = 2930 s= 450 n= 30 Construir un intervalo de 95% de confianza para la media poblacional R/ Luego, el peso de nacimiento varía entre 2769 y 3091 gramos, con una confianza de 95%. Como el intervalo no incluye el valor =3250 gramos planteado en la hipótesis, entonces esta es rechazada con confianza 95% (o un valor p menor a 0,5). 24) La nota de una prueba de aptitud siguen una distribución normal con desviación típica 28,2. Una muestra aleatoria de nueve alumnos arroja los resultados siguientes: N n=9 X I 1 I 1098 9 X 2 I 138148 I 1 a) Hallar un intervalo de confianza al 90% para la media poblacional μ R/106.5<μ<137.5 b) ¿Cuál será el tamaño de muestra mínimo necesario para obtener un intervalo al 90% de nivel de confianza, con longitud 10? (la longitud del intervalo es la diferencia entre sus extremos).R/ 866 25 Una empresa tiene 6.100 empleados se quiere determinar cómo es el clima laboral en la empresa, usando una confiabilidad del 95%. un error admisible de 6% y considerando que la proporción de empleados no satisfechos es del 30%. Calcule el número de empleados a consultar. si se tiene en cuenta además. que se tienen diferentes categorías de empleados que pueden influir en la opinión de los trabajadores. Se adicionó la siguiente información con respecto al número de trabajadores: Contabilidad y Costos 80 empleados, Administración 150. Operativos 5.600, seguridad 180 y otros cargos 90. R/216 26. La puntuación promedio de una muestra de 20 jueces de gimnasia rítmica, elegidos al azar, para una misma prueba presentó una media de 9,8525 y una cuasi desviación típica muestral de 0,0965. Calcular un intervalo de confianza con un 95% para la nota media. (Se sobreentiende 152 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR que la puntuación de la prueba sigue una distribución normal) R/ 9.807 9897 27 Un entrenador de fútbol está interesado en estimar, con un 99% de confianza, la fuerza máxima de los músculos cuadriceps de los futbolistas. Admitiendo que dicha fuerza sigue una distribución normal, selecciona al azar una muestra de 25 futbolistas, para la que obtuvo una media de 85 Nw y una cuasivarianza de 144. Determinar un intervalo de confianza para la media .R/ 78287 91713 28 En una encuesta hecha por los alumnos y alumnas de un Instituto a un total de 100 votantes elegidos al azar en su Ayuntamiento, se indica que el 55% volvería a votar por el alcalde actual. Calcular un intervalo de confianza al 99% para la proporción de votantes favorables al alcalde actual. R/= (0,422 , 0,677) 29 ¿Cuáles deben ser los tamaños muestrales en el sondeo del problema anterior para tener, con los mismos niveles de confianza, la certeza de que el alcalde actual salga reelegido por mayoría absoluta, en el caso de arrojar la encuesta los mismos resultados/ n>891. 30. En una encuesta a 360 alumnos de un centro, elegidos al azar, resultaron 190 a favor de la política del actual equipo directivo. ¿Cuál es el intervalo de confianza, con nivel del 95%, para la proporción de alumnos que apoyan a esta dirección R/ (,04762 , 0, 5794) 31 Se lanza una moneda 100 veces y se obtienen 62 cruces. ¿Cuál es el intervalo de confianza para la proporción de cruces con un 99% de nivel de confianza? R/ (0,495, 0, 745) 32. Para estimar el número de ranas que hay en un estanque procedemos a pescar cierta cantidad, 30, y las marcamos con un anillo, devolviéndolas al estanque. Transcurridos unos días volvemos a pescar otro montón y observamos qué proporción están marcadas con la anilla. Es esta última pesca obtenemos 100 ranas de las que 7 están marcadas. Calcular un intervalo al 99% de confianza para la proporción de ranas marcadas. R/(0,02816 0,11184) 33 - En una muestra de 65 sujetos las puntuaciones en una escala de extroversión tienen una media de 32,7 puntos y una desviación típica de 12,64. 153 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR a) Calcule a partir de estos datos el correspondiente intervalo de confianza, a un nivel del 90%, para la media de la población. R/( 30,06 , 35,34 ) b) Indique, con un nivel de confianza del 95%, cuál sería el máximo error que podríamos cometer al tomar como media de la población el valor obtenido en la estimación puntual. R/luego el máximo error que se puede cometer, a este nivel de confianza, es: 3,16 34. En una muestra de 300 universitarios el 80% ha respondido que asiste semanalmente al cine. Entre que valores se encuentra, con un nivel de confianza del 95%, la proporción de universitarios que acude todas las semanas al cine. R/( 0,755 ,, 0,845 ) 35. El índice de resistencia a la rotura, expresado en kg, de un determinado tipo de cuerda sigue una distribución Normal con desviación típica 15.6 kg. Con una muestra de 5 de estas cuerdas, seleccionadas al azar, se obtuvieron los siguientes índices: 280, 240, 270, 285, 270. a) Obtenga un intervalo de confianza para la media del índice de resistencia a la rotura de este tipo de cuerdas, utilizando un nivel de confianza del 95%. R/ (255,326 282,674) b) Si, con el mismo nivel de confianza, se desea obtener un error máximo en la estimación de la media de 5 kg, ¿será suficiente con elegir una muestra de 30 cuerdas? R/ 38 cuerdas 36. Un fabricante de pilas alcalinas sabe que el tiempo de duración, en horas, de las pilas que fabrica sigue una distribución Normal de media desconocida y varianza 3 600. Con una muestra de su producción, elegida al azar, y un nivel de confianza del 95 % ha obtenido para la media el intervalo de confianza (372,6; 392,2). Calcule el valor que obtuvo para la media de la muestra y el tamaño muestral utilizado. R/ media 382,4 y n =144 37. En un hospital se ha tomado la temperatura a una muestra de 64 pacientes para estimar la temperatura media de sus enfermos. La media de la muestra ha sido 37,1 ºC y se sabe que la desviación típica de toda la población es 1,04 ºC. a) Obtenga un intervalo de confianza, al 90 %, para la media poblacional. R/(36.89; 37,31) 154 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR b) ¿Con qué nivel de confianza podemos afirmar que la media de la población está comprendida entre 36,8ºC y 37,4 ºC? R/97,92% SUGERENCIA no olvidar formula de la longitud 38. Se sabe que los estudiantes del Huila duermen un número de horas diarias que se distribuye según una ley Normal de media µ horas y desviación típica σ =2 horas. a) A partir de una muestra de 64 alumnos se ha obtenido el siguiente intervalo de confianza (7.26, 8.14) para la media de la población. Determine el nivel de confianza con que se ha construido dicho intervalo. R/ 92.16% SUGERENCIA φ(Zα/2)=1-α y la formula de amplitud b) Determine el tamaño muestral mínimo necesario para que el error que se cometa al estimar la media de la población por un intervalo de confianza sea, como máximo, de 0.75 horas, con un nivel de confianza del 98 % 39) Para controlar la calidad de los exámenes complementarios realizados en un laboratorio clínico, el jefe de laboratorio decide repetir personalmente la prueba a 10 de las 250 extracciones de sangre realizadas ese día. Cuál es el número entero que representa al intervalo de selección si se realiza un muestreo sistemático R/ 25 40) Se asigna un número diferente a cada elemento del Universo y se seleccionan los que integrarán la muestra por medio de una Tabla de números aleatorios o por fichas numeradas que se extraen de un bombo. 41) el jefe de laboratorio Ángel para controlar la calidad de los exámenes complementarios realizados en su laboratorio clínico, decide repetir personalmente la prueba a 10 de las 250 extracciones de sangre realizadas ese día. N = 250 n =10 k =250/10 =25 Se escoge como punto de arranque cualquier número entero entre 1 y 25 para inicial la selección. Supongamos que se escoge el 8, la muestra quedará entonces integrada por las extracciones número: 8; 33; 58; 83; 108; 133; 158; 183; 208 y 233.¿Que tipo de muestreo se aplico? 42) En una campaña contra el tabaquismo se quiere determinar la proporción de fumadores entre los pobladores de una comunidad, según el sexo. Se fijó que el tamaño de la muestra debe ser de 300 individuos. Si las mujeres representan el 55% de los habitantes y por tanto los 155 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR hombres el 45% restante, se escogerían al azar para integrar la muestra un total de 165 mujeres y 135 hombres. Ellos representan el 55% y el 45% respectivamente de 300.Que tipo de muestreo es el más adecuado para determinar la proporción. 43) El ministerio de salud de Colombia para identificar los factores de riesgo vulnerables de la enfermedad ateroesclerótica en los trabajadores agrícolas de Barragán, se seleccionan aleatoriamente un número de cooperativas de producción agropecuaria y se estudian a todos los trabajadores de dichos centros. Para seleccionar las cooperativas cual es método de muestreo más aconsejable. 44) Entre 8 alumnos de la escuela matechana se pretende realizar 5 pruebas de velocidad lectora eligiendo cada vez al azar a uno de ellos. No tenemos ningún inconveniente en que un alumno pueda ser elegido más de una vez para realizar la prueba, por lo que vamos a realizar un muestreo aleatorio simple con reposición. a) ¿Cuántas muestras ordenadas posibles existen? R/ 32768 ¿Qué probabilidad se asocia a cada una de ellas? R/ 0.0000305. ¿Qué probabilidad tenemos de que la muestra esté constituida por alumnos que se encuentran entre los 5 de mejor nivel en el área de lenguaje? R/0.0000305 45) A partir del listado alfabético de los 500 alumnos matriculados en la universidad, se le pide a Bienestar universitario que construya una muestra de 30 alumnos utilizando el procedimiento de muestreo aleatorio sistemático. ¿Qué alumnos debo incluir en la muestra R Una de las posibles respuestas es 1, 18, 35, 52, hasta 485 46) Queremos extraer una muestra compuesta de 20 centros de Enseñanza de Cali respetando la estructura que presenta la población respecto a la característica público-privado. Sabemos que de los 225 centros existentes en esta ciudad, 201 son públicos y 24 de titularidad privada. ¿Cuántas elegiremos de cada tipo si realizamos un muestreo estratificado con asignación constante? R/10 y 10 públicos y 2 privados ¿Y con asignación proporcional? R/ 18 y 20 47) Entre los 8 alumnos de la zona rural de Santa Lucia se pretende elegir a 5 alumnos con el fin de medir su velocidad lectora. Para evitar que el profesor del aula trate de que sus alumnos obtengan un buen resultado y, para ello, nos proponga a los 5 alumnos que mejores calificaciones suelen obtener en el área de lenguaje, vamos a realizar un muestreo aleatorio simple sin reposición, ¿Cuántas muestras ordenadas posibles existen? R/6720 ¿Qué probabilidad se asocia a cada una de ellas? R/ 0,01488% 156 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR ¿Qué probabilidad tenemos de que la muestra, en contra de lo que pretendíamos, esté constituida por los 5 alumnos de mejor nivel en el área de lenguaje? R/ 1,786% 48) Los datos presentados a continuación son los puntajes obtenidos para 45 personas de una escala de depresión (mayor puntaje significa mayor depresión). 2 11 14 16 19 5 11 15 16 19 6 13 15 17 19 8 13 16 17 19 8 14 16 17 19 9 14 16 18 19 9 14 16 18 19 10 14 16 18 20 11 14 16 19 20 Para construir un intervalo de confianza para el puntaje promedio poblacional, asumamos que los datos tienen distribución normal, con varianza poblacional desconocida., Encontrar, un intervalo de confianza R/ el intervalo de confianza para es (13,2, 15,8). Es decir, el puntaje promedio poblacional se encuentra entre 13,2 y 15,8 con una confianza 95%. 49) En el 2012 la Unidad Central del valle tiene 5453 estudiantes, en la tabla se muestra un detalle de la composición. Necesitamos una muestra de tamaño 20 de la población de estudiantes: PREGRADO POSGRADO TOTAL MUJERES 2461 67 2528 HOMBRES 2848 77 2925 TOTAL 5309 144 5453 Elija muestras de tamaño 20 para 2 tipos de muestreo: a. Muestreo Aleatorio Simple. b. Muestreo Aleatorio Estratificado. 50) Una compañía de marketing saca una muestra aleatoria de la guía de teléfonos tomando 10 personas cuyos apellidos comiencen con letra A, 10 personas cuyos apellidos comiencen con la letra B, y así sucesivamente con cada letra del alfabeto, para una muestra total de 260 personas. a. ¿Qué clase de diseño muestral se usó aquí? b. ¿Tienen todos los que están en la guía de teléfonos igual posibilidad de ser elegidos en la muestra? 157 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 51) En el centro de Tulua hay dos semáforos consecutivos de modo que 2.5 minutos después de que el primero se ponga verde se pone rojo el segundo. Ambos se cierran cada 2 minutos, permaneciendo cerrados 30 segundos. Un conductor se ha detenido en el primero y el tiempo en recorren la distancia entre ambos semáforos es de (1,4). ¿Cuál es la probabilidad de que se pare en el segundo? R/0.166 % 62) Indicar que tipo de muestreo se aplico en cada uno de los siguientes enunciados a) Suponga que nos interesa obtener una muestra de las opiniones de los profesores de una gran universidad b) Suponga que una compañía de servicio de televisión por cable está pensando en abrir una sucursal en una ciudad grande; la compañía planea realizar un estudio para determinar el porcentaje de familias que utilizarían sus servicios, como no es práctico preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar c) Para obtener una muestra de suscriptores telefónicos en una ciudad grande, puede obtenerse primero una muestra aleatoria de los números de las páginas del directorio telefónico; al elegir el vigésimo nombre de cada página obtendríamos un muestreo sistemático, también podemos escoger un nombre de la primera página del directorio y después seleccionar cada nombre del lugar número cien a partir del ya seleccionado. Por ejemplo, podríamos seleccionar un número al azar entre los primeros 100; supongamos que el elegido es el 40, entonces seleccionamos los nombres del directorio que corresponden a los números 40, 140, 240, 340 y así sucesivamente. 63) COMPLETAR a) La distribución de frecuencia de un estadístico muestral se denomina __________________________. En general, la distribución muestral de un estadístico es la de todos sus valores posibles calculados a partir de muestras del mismo tamaño. b) Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población grande. Se calcula la media muestral x para cada muestra; la colección de todas estas medias muestrales recibe el nombre de_________________________________________, c) Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución muestral de ser ____________________________ 158 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 64)Se sabe que la resistencia a la ruptura de cierto tipo de cadena se distribuye normalmente con media de 2000 libras y una varianza de 25,000 lbs Si se selecciona una muestra aleatoria de 100 cuerdas; determine la probabilidadde que en esa muestra: a) La resistencia media encontrada sea de por lo menos 1958 libras. R/99.60% b) La resistencia media se mayor de 2080 libras. R/0 65). Como parte de un proyecto general de mejoramiento de la calidad, el fabricante textil Duke decide controlar el número de imperfecciones encontradas en cada pieza de tela. Se estima que el número promedio de imperfecciones por cada pieza de tela es de 12, determine la probabilidad de que en la próxima pieza de tela fabricada se encuentren: a) Entre 10 y 12 imperfecciones. R/ b) Menos de 9 y más de 15 imperfecciones. 66). En una prueba de aptitud la puntuación media de los estudiantes de once de Tulua es de 72 puntos y la desviación estándar es de 8 puntos. ¿Cuál es la probabilidad de que dos grupos de estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuación media en: a) 3 ó más puntos. b) 6 o más puntos. c) Entre 2 y 5 puntos. 67). Un especialista en genética ha detectado que el 26% de los hombres y el24% de las mujeres de cierta región de Colombia tiene un leve desorden sanguíneo; si se toman muestras de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen ese leve desorden sanguíneo sea.. de: a) Menos de 0.035 a favor de los hombres. b) Entre 0.01 y 0.04 a favor de los hombres. 70. La vida media de un computador es de siete años, con una desviación estándar de un año. Suponga que las vidas de estas máquinas siguen aproximadamente una distribución normal, encuentre: a) La probabilidad de que la vida media de una muestra aleatoria de 9 de estas máquinas caiga entre 6.4 y 7.2 años. b) El valor de la media a la derecha del cual caería el 15% de las medias calculadas de muestras aleatorias de tamaño nueve. 159 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR 71). Se llevan a cabo dos experimentos independientes en lo que se comparan dos tipos diferentes de pintura. Se pintan 18 especímenes con el tipo A y en cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estándar de la población son ambas 1.0. Suponga que el tiempo medio de secado es igual para los dos tipo de pintura. Encuentre la probabilidad de que la diferencia de medias en el tiempo de secado sea mayor a uno a favor de la pintura A.R/0.13% 72) Las estaturas de 1000 estudiantes de colegio Occidente de Tulua están distribuidas aproximadamente en forma normal con una media de 174.5 centímetros y una desviación estándar de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25 sin reemplazo de esta población, determine: a) El número de las medias muestrales que caen entre 172.5 y 175.8 centímetros.R/ 152 media muestrales b) El número de medias muestrales que caen por debajo de 172 centímetros.R/ 7 medias muestrales 73) Un Jarabe para el malestar estomacal tiene la advertencia de que algunos usuarios pueden presentar una reacción adversa a él, más aún, se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de 150 personas con malestar estomacal usa el jarabe , encuentre la probabilidad de que la proporción de la muestra de los usuarios que realmente presentan una reacción adversa, exceda el 4%. a) Resolverlo mediante la aproximación de la normal a la binomial R/p(x>6) = 0.1685. Este valor significa que existe una probabilidad del 17% de que al extraer una muestra de 150 personas, mas de 6 presentarán una reacción adversa. b) Resolverlo con la distribución muestral de proporciones R/ existe una probabilidad del 17% de que al tomar una muestrade 150 personas se tenga una proporción mayor de 0.04 presentando una reacción adversa. 74) Se ha determinado que 60% de los estudiantes Uceva fuman cigarrillos. Se toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción de la muestra de la gente que fuma cigarrillos sea menor que 0.55.Realizarlo por 2 métodos R//La probabilidad del 0.17% de que al extraer una muestra de 800 estudiantes, menos de 440 fuman cigarrillos. . 160 TOMO 1 DEL COMPULIBRO ESTADISTICA II DE CIR LINKGRAFIA http://www.bioestadistica.uma.es/libro/node78.htm aprendeenlinea.udea.edu.co/lms/moodle/mod/.../view.php?...true... http://www.vitutor.com/pro/2/a_h.html http://www.vitutor.com/pro/2/a_a.html http://www.uam.es/personal_pdi/psicologia/carmenx/Tema1.pdf http://juancarlosvergara.50webs.org/Apuntes/Ejercicios%20Parte%20I.pdf http://personal.telefonica.terra.es/web/pegonrui/tablas-estadisticas/tablasestadisticas.html http://dta.utalca.cl/estadistica/ejercicios/recoger/Muestro/propuesto%20mu estreo%20estra.pdf http://sancur22ceapuntes.iespana.es/administracion/ceneval/operacionesy metodos/02metodoscuantitativos/21pruebaship/pruebaship.htm http://www.mitecnologico.com/Main/PotenciaDeLaPrueba http://www.frasesypensamientos.com.ar/frases-de-estadistica.html http://www.itch.edu.mx/academic/industrial/estadistica1/u0102.pdf http://www.itescam.edu.mx/principal/sylabus/fpdb/recursos/r51634.PDF 161