Download e) Media de proporciones muéstrales
Document related concepts
Transcript
Distribución de Promedios Muéstrales Para comprender que significa distribución de promedios muéstrales, vamos a suponer que realizamos un experimento con bombos como los usados en la lotería. Colocamos un número muy grande de bolas blancas en un bombo blanco, en cada una de las cuales figura un dato X. Este bombo representa la población de observaciones X, y tiene media m y varianza s2. Supongamos que a continuación hacemos lo siguiente: 1) Tomamos una muestra de n=10 bolas blancas. 2) Calculamos la media y la anotamos en una bola azul. 3) Colocamos la bola azul en un segundo bombo de color azul. 4) Devolvemos las bolas blancas a su bombo y le damos vueltas. 5) Repetimos toda la operación muchas veces hasta que el bombo azul esté lleno de bolas azules. Entonces, los números del bombo azul forman una población de promedios muéstrales. Esta es una población derivada de la anterior, y tiene la misma media o promedio que la distribución original, pero su varianza es un enésimo de la varianza de la distribución original: En el caso del bombo azul, si denominamos media, tenemos: a la varianza y mm a la La distribución de medias muéstrales está situada en el mismo lugar (alrededor de la misma media) que la distribución original, pero es mucho mas estrecha, porque su varianza es la décima parte de la varianza original. La distribución original de observaciones representada por el bombo blanco se denomina comúnmente distribución madre o base. Al construir la población de promedios muéstrales, realizábamos extracciones de 10 bolas blancas después de dar vueltas al bombo. Es decir, que estábamos realizando un muestreo aleatorio de la población madre, porque cada una de las bolas blancas tenía la misma posibilidad de ser elegida para integrar la muestra. Aunque la población original no sea de distribución normal, si el muestreo es aleatorio, la población de promedios muéstrales se aproximará a la normalidad, es decir, será casi de distribución normal. Este efecto se debe a un teorema de estadística matemática denominado Teorema Central del Límite. En resumen, si se cumple la hipótesis de muestreo aleatorio, tenemos: En general, en los problemas que se presentan habitualmente, existe una población de observaciones cualesquiera, de la cual tomamos una muestra aleatoria, por medio de la cual intentamos conocer todo lo que sea posible acerca de la población de la cual fue extraída. El promedio de la muestra de n elementos pertenece a la distribución de promedios muéstrales de la población original. Es decir, que el promedio de la muestra que obtuvimos es uno de los muchos promedios muéstrales que se distribuyen alrededor de m con desviación estándar. Por lo tanto, si la muestra es mas grande (n mayor), estaremos en una distribución de promedios con desviación estándar mas pequeña, por lo cual, el promedio de la muestra estará mas cerca del promedio del universo. Es por esto que es razonable pensar que el promedio de la muestra es una estimación del promedio del universo. Distribución Muestral de Proporción. La necesidad de encontrar la proporción, porcentaje o porciento de una situación dada en una población es tarea frecuente en estadística. La distribución muestral de proporciones es el conjunto de todas las muestras posibles del mismo tamaño extraídas de una población, junto con el conjunto de todas las proporciones muéstrales. Ejemplo: Existen 6 vendedores en una compañía, los vendedores A, B, C, fuman y los vendedores X, Y, Z no fuman considerando los vendedores como población y el fumar como tipo de porcentaje, se pide: a) Proporción de números de fumadores considerando los datos de población. <m>P= {n(A)}/ {n (Omega)} </m> Donde: P => Proporción Poblacional n(A) => Cantidad de eventos pedidos <m>n (Omega) </m> => Tamaño de población P = 3/6 = 0.50 b) Desviación Estándar de Población <m>delta P = sqrt (PQ) </m> P = Proporción poblacional Q=1-P <m>delta P = sqrt (0.50 * 0.50) = 0.50</m> c) Cantidad de muestras de tamaño 4 <Sub>N</sub>C<sub>n</sub> N => Tamaño de Población n => Tamaño de Muestra <Sub>6</sub>C<sub>4</sub> = 15 muestras d) Distribución Muestral de Proporción Recordar que es el cuadro de las muestras y las p muéstrales. Donde p es el numero de elementos en la muestra que cumplen la característica pedida dividida entre el tamaño de la muestra. ^Muestra^<m>overline X</m>^ |abcx|3/4|0.75| |abcy|3/4|0.75| |abcz|3/4|0.75| |abxy|2/4|0.50| |abxz|2/4|0.50| |abyz|2/4|0.50| |acxy|2/4|0.50| |acxz|2/4|0.50| |acyz|2/4|0.50| |axyz|1/4|0.25| |bcxy|2/4|0.50| |bcxz|2/4|0.50| |bcyz|2/4|0.50| |bxyz|1/4|0.25| |cxyz|1/4|0.25| | | |‹m›Sigma p= 7.50</m>| e) Media de proporciones muéstrales <m>overline {p} = {Sigma p} /n</m> Nota: el **valor esperado de la proporción** es igual a la media de la población proporcional. <m>overline {p} = {Sigma 7.50} / 15 = 0.50</m> f) Error Estándar de la Proporción f.1) Para Muestras menores de 30 elementos <m>sigma _p=sqrt {{PQ/N}. {N-n}/ {N-1}} </m> <m>sigma _p=sqrt {{0.5*0.5/4}. {6–4}/ {6–1}} </m> <m>sigma _p=sqrt {0.0625 / 0.4} </m> <m>sigma _p=sqrt {0.025} = 0.15813883</m>. DISTRIBUCIÓN DE LAS MEDIAS MUESTRALES Si una población es N , o bien si n 30 , las medias muéstrales se distribuyen según una N , n X Es una N , n DISTRIBUCIÓN DE LAS PROPORCIONES MUESTRALES Si en una población se conoce la proporción de individuos que presenta una cierta característica p, en una muestra de tamaño n la proporción pr de individuos con esa característica se distribuye según una Normal: Pr es una N p, pq q=1-p n (Siempre que np 5 y nq 5 ) INTERVALO DE CONFIANZA PARA LA MEDIA . Con un nivel de confianza del 1 % INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN: X z , X z n n 2 2 Conociendo la proporción pr de individuos que presenta una cierta característica en una muestra de tamaño n, queremos estimar la proporción p de individuos de la población que presenta esa característica mediante un intervalo de confianza y un nivel de confianza del 1 Error máximo admisible: Error = z 2 n Aproximación de la Binomial mediante una Normal: Si X es B(n, p) sabemos que np y npq . Pues bien, si np 5 y nq 5 resulta que X coincide prácticamente con una Normal: X es N np, npq pr z 2 pr (1 pr ) , pr z n 2 Error = z 2 pr (1 pr ) n pr (1 pr ) n