Download probabilidad y estadística unidad 5: muestreo
Document related concepts
no text concepts found
Transcript
PROBABILIDAD Y ESTADÍSTICA UNIDAD 5: MUESTREO Es un proceso mediante el cual se puede determinar aproximadamente el comportamiento de la población o universo donde se aplica, a partir de inferir sus características de los resultados obtenidos del análisis de una muestra extraída del mismo. Los pasos a seguir en un muestreo son: 1º) Identificar y/o delimitar el universo o población 2º) Determinar el tamaño adecuado de la muestra 3º) análisis estadístico 4º) Inferencia de los resultados hacia el universo o población 5º) Interpretación de los resultados Identificación y/o delimitación del universo El universo o población de un conjunto de elementos bien definidos y con una característica en común. Hablaremos de: • Universo Finito. Cuando el numero de elementos sea menor o igual a 1000 (N<1000) • Universo Infinito. Cuando el numero de elementos es mayor a 1000(N>1000) • Universo homogéneo. Cuando el numero de elementos que conforman el universo tiene características muy parecidas y en algunos casos casi iguales. • Universo heterogéneo. En este caso los elementos no tienen características similares por lo que se procede a delimitarlo o simplificarlo por sus elementos mas relevantes para lograr una tendencia a la homogeneidad Determinación del tamaño adecuado de la muestra. Muestra la colección de elementos extraídos de un universo. Por lo que si el universo es homogéneo, tenemos una sola muestra; pero si el universo es heterogéneo las muestras pueden variar entre 5 a 20 (5<n<20). Universo finito: z 2 pq E2 n= 1 z 2 pq 1 + 2 − 1 N E Probabilidad y Estadística -Capítulo 5. Muestreo Lic. Eliana Arcoraci /Lic. Eduardo Grossi Página |1 Universo Infinito: n= z 2 pq E2 donde: n=tamaño de la muestra z=valor estándar correspondiente a la confianza (£) de la información a recopilar p=parte de la población que cumple con la característica principal q= parte de la población que no cumple con la característica principal E=máximo error proporcional permitido Selección de los elementos de la muestra Se pueden realizar dos tipos de selección Muestreos Probabilísticos: Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de muestreo probabilísticos encontramos los siguientes tipos: • Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy grande. • Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. El número i que empleamos como punto de partida será un número al azar entre 1 y k. El riesgo de este tipo de muestreo está en los casos en que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10 siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos sexos. Probabilidad y Estadística -Capítulo 5. Muestreo Lic. Eliana Arcoraci /Lic. Eduardo Grossi Página |2 • Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues exige un conocimiento detallado de la población (tamaño geográfico, sexos, edades). • Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para seleccionar directamente los elementos de la población, es decir, que las unidades muestrales son los elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de "muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar después todos los elementos pertenecientes a los conglomerados elegidos. • Muestreo por Rutas Aleatorias: La selección de los miembros de la muestra se realiza como parte del trabajo de campo. Establecida un área de muestreo, se define un punto de partida, sobre el que se aplica una ruta predefinida en la que se van seleccionando los miembros de la muestra con arreglo a un procedimiento heurístico. Busca asegurar una cobertura geográfica de la muestra y/o suplir la falta de censo. No es aconsejable en planos no lineales o poco homogéneos en manzanas y edificación. Métodos de muestreo no probabilísticos A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra extraída sea representativa, ya que seleccionan a los sujetos siguiendo determinados criterios procurando que la muestra sea representativa. • Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Mendoza. Una vez determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este método se utiliza mucho en las encuestas de opinión. • Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos. Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han marcado tendencias de voto. • Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios. Probabilidad y Estadística -Capítulo 5. Muestreo Lic. Eliana Arcoraci /Lic. Eduardo Grossi Página |3 • Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc. • Muestreo Discrecional: A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden aportar al estudio. Ejemplo: muestreo por juicios; cajeros de un banco o un supermercado; etc. Formas de Observar la Población Atendiendo a la fuente: • Observación directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los cuales se presenta el fenómeno que se pretende investigar, y los resultados obtenidos se consideran datos estadísticos originales. Para Ernesto Rivas González (1997)"Investigación directa, es aquella en que el investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama también a esta investigación primaria".Ejemplo: el seguimiento de la población agrícola por año, llevado en una determinada granja. • Observación Indirecta: es aquella donde la persona que investiga hace uso de datos estadísticos ya conocidos en una investigación anterior, o de datos observados por un tercero (persona o entidad). Con el fin de deducir otros hechos o fenómenos. Ejemplo; si un investigador pretende estudiar la producción por años de una granja avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a tal fin recurriría a las observaciones que posee la oficina administrativa de la granja durante estos cinco años, o dirigirse a la oficina de estadística de la localidad donde está registrada dicha granja. Es de notar que el investigador se vale de observaciones realizadas por terceros. Atendiendo a la periodicidad: • Observación continúa; como su nombre lo indica es aquella que se lleva acabo de un modo permanente. Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van registrando a medida que van produciéndose. • Observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc. Lo que debemos destacar es que los períodos de tiempo tomados como unidad deben tomarse constantes en lo posible. Ejemplo; el balance anual de una empresa. • Observación circunstancial, es aquella que se efectúa en forma ocasional o esporádica, esta observación hecha más por una necesidad momentánea, que de carácter regular o permanente. Ejemplo; la necesidad de realizar una auditoria a alguna empresa. Atendiendo a la cobertura: • Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los elementos de la población se habla de una observación exhaustiva. Observación Parcial. Dados que las poblaciones en general son grandes, la observación de todos sus elementos se ve imposibilitada. La solución para superar este inconveniente es observar una parte de esta población. • Observación Mixta. En este tipo de observación se combinan adecuadamente la observación exhaustiva con la observación parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra; o bien cuando la población es muy grande, parte de ella se observa parcialmente. Probabilidad y Estadística -Capítulo 5. Muestreo Lic. Eliana Arcoraci /Lic. Eduardo Grossi Página |4 • Encuesta. Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones parciales. El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es preguntárselo directamente a ellas. (Cadenas, 1974). Análisis Estadístico de la Muestra. Muestreo Simple Se determina: Media o promedio de la muestra: X Varianza segada de la muestra: S2 Desviación estándar sesgada de la muestra: S Muestreo Múltiple (5<n<20) Dado que se extrae de un universo o población heterogéneo, determinamos: Media de las medias muestrales: X Varianza segada de la muestra: S2 Desviación estándar sesgada de la muestra: S Inferencia de los resultados En esta etapa del proceso se debe efectuar una estimación de parámetros mediante los datos estadísticos. ¿Qué es inferir? Es emitir juicios o conclusiones basados en la muestra extraída de la población o universo. Identificación de estimadores • Estimador Insegado Establece que la medida/s de la/s muestras/s se corresponden directamente con el universo o población del cual fueron extraídas o Muestreo simple. La media muestral es igual a la media de la población X =µ o Muestreo múltiple. La media de las medias muestrales coincide con la media de la población X =µ En esta etapa de inferencia se establece que X o X se aplican directamente al universo o población. • Estimador Sesgado Probabilidad y Estadística -Capítulo 5. Muestreo Lic. Eliana Arcoraci /Lic. Eduardo Grossi Página |5 Establece que la medida de la/s muestra/s no corresponde a la medida del universo o población, en este caso la varianza de la muestra y la varianza de la población son distintas: S2 ≠ σ 2 Para que un estimados sesgado tenga utilidad en la inferencia de los datos, se debe insesgar a partir de un Factor de Insesgo denominado Grados de Libertad (D) y esta dado por N-1 para la población y n-1 para la muestra. ∧ n S = S para la muestra n − 1 donde: ∧ S = Varianza insesgada en n-1 grados de libertad S=varianza sesgada de la muestra n=tamaño de la muestra n-1=factor de insesgo ∧ 2 N Para la población N − 1 σ =σ 2 donde: ∧ σ = Varianza insesgada en n-1 grados de libertad σ=varianza sesgada de la muestra N=tamaño de la muestra N-1=factor de insesgo Por ser ahora un estimador insesgado, la desviación estándar se calcula ahora: Universo finito: ∧ σ =S N N −1 Universo infinito: ∧ σ =S Interpretación de los resultados No hay reglas generales de interpretación, sin embargo el conocimiento detallado de lo que los resultados representan individualmente y en su conjunto permite comprender el comportamiento de una población y obtener información de ella para la toma de decisiones Probabilidad y Estadística -Capítulo 5. Muestreo Lic. Eliana Arcoraci /Lic. Eduardo Grossi Página |6