Download probabilidad y estadística unidad 5: muestreo

Document related concepts
no text concepts found
Transcript
PROBABILIDAD Y ESTADÍSTICA
UNIDAD 5: MUESTREO
Es un proceso mediante el cual se puede determinar aproximadamente el comportamiento de la
población o universo donde se aplica, a partir de inferir sus características de los resultados obtenidos del
análisis de una muestra extraída del mismo.
Los pasos a seguir en un muestreo son:
1º) Identificar y/o delimitar el universo o población
2º) Determinar el tamaño adecuado de la muestra
3º) análisis estadístico
4º) Inferencia de los resultados hacia el universo o población
5º) Interpretación de los resultados
Identificación y/o delimitación del universo
El universo o población de un conjunto de elementos bien definidos y con una característica en
común.
Hablaremos de:
• Universo Finito. Cuando el numero de elementos sea menor o igual a 1000 (N<1000)
• Universo Infinito. Cuando el numero de elementos es mayor a 1000(N>1000)
• Universo homogéneo. Cuando el numero de elementos que conforman el universo tiene características
muy parecidas y en algunos casos casi iguales.
• Universo heterogéneo. En este caso los elementos no tienen características similares por lo que se procede
a delimitarlo o simplificarlo por sus elementos mas relevantes para lograr una tendencia a la
homogeneidad
Determinación del tamaño adecuado de la muestra.
Muestra la colección de elementos extraídos de un universo. Por lo que si el universo es homogéneo,
tenemos una sola muestra; pero si el universo es heterogéneo las muestras pueden variar entre 5 a 20
(5<n<20).
Universo finito:
z 2 pq
E2
n=
1  z 2 pq 
1 +  2 − 1
N E

Probabilidad y Estadística -Capítulo 5. Muestreo
Lic. Eliana Arcoraci /Lic. Eduardo Grossi
Página |1
Universo Infinito:
n=
z 2 pq
E2
donde:
n=tamaño de la muestra
z=valor estándar correspondiente a la confianza (£) de
la información a recopilar
p=parte de la población que cumple con la
característica principal
q= parte de la población que no cumple con la
característica principal
E=máximo error proporcional permitido
Selección de los elementos de la muestra
Se pueden realizar dos tipos de selección
Muestreos Probabilísticos:
Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de
equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser
elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n
tienen la misma probabilidad de ser elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más recomendables. Dentro de los métodos de
muestreo probabilísticos encontramos los siguientes tipos:
• Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna un número a cada
individuo de la población y 2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u ordenador, etc.) se eligen tantos
sujetos como sea necesario para completar el tamaño de muestra requerido. Este procedimiento, atractivo
por su simpleza, tiene poca o nula utilidad práctica cuando la población que estamos manejando es muy
grande.
• Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior, numerar todos los elementos
de la población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte de ese número
aleatorio i, que es un número elegido al azar, y los elementos que integran la muestra son los que ocupan
los lugares i, i+k, i+2k, i+3k,..., i+(n-1) k, es decir se toman los individuos de k en k, siendo k el resultado de
dividir el tamaño de la población entre el tamaño de la muestra: k=N/n. El número i que empleamos como
punto de partida será un número al azar entre 1 y k. El riesgo de este tipo de muestreo está en los casos en
que se dan periodicidades en la población ya que al elegir a los miembros de la muestra con una
periodicidad constante (k) podemos introducir una homogeneidad que no se da en la población.
Imaginemos que estamos seleccionando una muestra sobre listas de 10 individuos en los que los 5
primeros son varones y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k=10
siempre seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los dos
sexos.
Probabilidad y Estadística -Capítulo 5. Muestreo
Lic. Eliana Arcoraci /Lic. Eduardo Grossi
Página |2
• Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los anteriores ya que
simplifican los procesos y suelen reducir el error muestral para un tamaño dado de la muestra. Consiste en
considerar categorías típicas diferentes entre sí (estratos) que poseen gran homogeneidad respecto a
alguna característica (se puede estratificar, por ejemplo, según la profesión, el municipio de residencia, el
sexo, el estado civil, etc.). Lo que se pretende con este tipo de muestreo es asegurarse de que todos los
estratos de interés estarán representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado
para elegir los elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que
plantean son demasiado grandes, pues exige un conocimiento detallado de la población (tamaño
geográfico, sexos, edades).
• Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora están pensados para
seleccionar directamente los elementos de la población, es decir, que las unidades muestrales son los
elementos de la población. En el muestreo por conglomerados la unidad muestral es un grupo de
elementos de la población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los
departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales como, por
ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas suele hablarse de
"muestreo por áreas". El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
numero de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados elegidos.
• Muestreo por Rutas Aleatorias: La selección de los miembros de la muestra se realiza como parte del
trabajo de campo. Establecida un área de muestreo, se define un punto de partida, sobre el que se aplica
una ruta predefinida en la que se van seleccionando los miembros de la muestra con arreglo a un
procedimiento heurístico. Busca asegurar una cobertura geográfica de la muestra y/o suplir la falta de
censo. No es aconsejable en planos no lineales o poco homogéneos en manzanas y edificación.
Métodos de muestreo no probabilísticos
A veces, para estudios exploratorios, el muestreo probabilístico resulta excesivamente costoso y se
acude a métodos no probabilísticos, aun siendo conscientes de que no sirven para realizar generalizaciones,
pues no se tiene certeza de que la muestra extraída sea representativa, ya que seleccionan a los sujetos
siguiendo determinados criterios procurando que la muestra sea representativa.
• Muestreo por cuotas: También denominado en ocasiones "accidental". Se asienta generalmente sobre la
base de un buen conocimiento de los estratos de la población y/o de los individuos más "representativos"
o "adecuados" para los fines de la investigación. Mantiene, por tanto, semejanzas con el muestreo
aleatorio estratificado, pero no tiene el carácter de aleatoriedad de aquél. En este tipo de muestreo se
fijan unas "cuotas" que consisten en un número de individuos que reúnen unas determinadas condiciones,
por ejemplo: 20 individuos de 25 a 40 años, de sexo femenino y residentes en Mendoza. Una vez
determinada la cuota se eligen los primeros que se encuentren que cumplan esas características. Este
método se utiliza mucho en las encuestas de opinión.
• Muestreo opinático o intencional: Este tipo de muestreo se caracteriza por un esfuerzo deliberado de
obtener muestras "representativas" mediante la inclusión en la muestra de grupos supuestamente típicos.
Es muy frecuente su utilización en sondeos preelectorales de zonas que en anteriores votaciones han
marcado tendencias de voto.
• Muestreo casual o incidental: Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la población. El caso más frecuente de este procedimiento el utilizar
como muestra los individuos a los que se tiene fácil acceso (los profesores de universidad emplean con
mucha frecuencia a sus propios alumnos). Un caso particular es el de los voluntarios.
Probabilidad y Estadística -Capítulo 5. Muestreo
Lic. Eliana Arcoraci /Lic. Eduardo Grossi
Página |3
• Bola de nieve: Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así hasta
conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente cuando se hacen estudios con
poblaciones "marginales", delincuentes, sectas, determinados tipos de enfermos, etc.
• Muestreo Discrecional: A criterio del investigador los elementos son elegidos sobre lo que él cree que
pueden aportar al estudio. Ejemplo: muestreo por juicios; cajeros de un banco o un supermercado; etc.
Formas de Observar la Población
Atendiendo a la fuente:
• Observación directa: es aquella donde se tienen un contacto directo con los elementos o caracteres en los
cuales se presenta el fenómeno que se pretende investigar, y los resultados obtenidos se consideran datos
estadísticos originales. Para Ernesto Rivas González (1997)"Investigación directa, es aquella en que el
investigador observa directamente los casos o individuos en los cuales se produce el fenómeno, entrando
en contacto con ellos; sus resultados se consideran datos estadísticos originales, por esto se llama
también a esta investigación primaria".Ejemplo: el seguimiento de la población agrícola por año, llevado en
una determinada granja.
• Observación Indirecta: es aquella donde la persona que investiga hace uso de datos estadísticos ya
conocidos en una investigación anterior, o de datos observados por un tercero (persona o entidad). Con el
fin de deducir otros hechos o fenómenos. Ejemplo; si un investigador pretende estudiar la producción por
años de una granja avícola, en sus últimos cinco años de producción, tendría que hacer un seguimiento, a
tal fin recurriría a las observaciones que posee la oficina administrativa de la granja durante estos cinco
años, o dirigirse a la oficina de estadística de la localidad donde está registrada dicha granja. Es de notar
que el investigador se vale de observaciones realizadas por terceros.
Atendiendo a la periodicidad:
• Observación continúa; como su nombre lo indica es aquella que se lleva acabo de un modo permanente.
Ejemplo: la contabilidad comercial, llevada en cuanto a compras, ventas y otras operaciones que se van
registrando a medida que van produciéndose.
• Observación periódica; es aquélla que se lleva a cabo a través de períodos de tiempo constantes. Estos
períodos de tiempos pueden ser semanas, trimestres, semestres, años, etc. Lo que debemos destacar es
que los períodos de tiempo tomados como unidad deben tomarse constantes en lo posible. Ejemplo; el
balance anual de una empresa.
• Observación circunstancial, es aquella que se efectúa en forma ocasional o esporádica, esta observación
hecha más por una necesidad momentánea, que de carácter regular o permanente. Ejemplo; la necesidad
de realizar una auditoria a alguna empresa.
Atendiendo a la cobertura:
• Observación Exhaustiva. Cuando la observación es efectuada sobre la totalidad de los elementos de la
población se habla de una observación exhaustiva. Observación Parcial. Dados que las poblaciones en
general son grandes, la observación de todos sus elementos se ve imposibilitada. La solución para superar
este inconveniente es observar una parte de esta población.
• Observación Mixta. En este tipo de observación se combinan adecuadamente la observación exhaustiva
con la observación parcial. Por lo general, este tipo de observaciones se lleva a cabo de tal manera que los
caracteres que se consideran básicos se observan exhaustivamente y los otros mediante una muestra; o
bien cuando la población es muy grande, parte de ella se observa parcialmente.
Probabilidad y Estadística -Capítulo 5. Muestreo
Lic. Eliana Arcoraci /Lic. Eduardo Grossi
Página |4
• Encuesta. Se entiende por encuesta las observaciones realizadas por muestreo, es decir son observaciones
parciales. El diseño de encuestas es exclusivo de las ciencias sociales y parte de la premisa de que si
queremos conocer algo sobre el comportamiento de las personas, lo mejor, más directo y simple es
preguntárselo directamente a ellas. (Cadenas, 1974).
Análisis Estadístico de la Muestra.
Muestreo Simple
Se determina:
Media o promedio de la muestra: X
Varianza segada de la muestra: S2
Desviación estándar sesgada de la muestra: S
Muestreo Múltiple (5<n<20)
Dado que se extrae de un universo o población heterogéneo, determinamos:
Media de las medias muestrales: X
Varianza segada de la muestra: S2
Desviación estándar sesgada de la muestra: S
Inferencia de los resultados
En esta etapa del proceso se debe efectuar una estimación de parámetros mediante los datos estadísticos.
¿Qué es inferir?
Es emitir juicios o conclusiones basados en la muestra extraída de la población o universo.
Identificación de estimadores
• Estimador Insegado
Establece que la medida/s de la/s muestras/s se corresponden directamente con el universo o
población del cual fueron extraídas
o Muestreo simple. La media muestral es igual a la media de la población
X =µ
o Muestreo múltiple. La media de las medias muestrales coincide con la media de la población
X =µ
En esta etapa de inferencia se establece que X o X se aplican directamente al universo o
población.
• Estimador Sesgado
Probabilidad y Estadística -Capítulo 5. Muestreo
Lic. Eliana Arcoraci /Lic. Eduardo Grossi
Página |5
Establece que la medida de la/s muestra/s no corresponde a la medida del universo o población, en
este caso la varianza de la muestra y la varianza de la población son distintas:
S2 ≠ σ 2
Para que un estimados sesgado tenga utilidad en la inferencia de los datos, se debe insesgar a partir
de un Factor de Insesgo denominado Grados de Libertad (D) y esta dado por N-1 para la población y n-1 para la
muestra.
∧
 n 
S = S
 para la muestra
 n − 1
donde:
∧
S = Varianza insesgada en n-1 grados de libertad
S=varianza sesgada de la muestra
n=tamaño de la muestra
n-1=factor de insesgo
∧ 2
 N 
 Para la población
 N − 1
σ =σ 2
donde:
∧
σ = Varianza insesgada en n-1 grados de libertad
σ=varianza sesgada de la muestra
N=tamaño de la muestra
N-1=factor de insesgo
Por ser ahora un estimador insesgado, la desviación estándar se calcula ahora:
Universo finito:
∧
σ =S
N
N −1
Universo infinito:
∧
σ =S
Interpretación de los resultados
No hay reglas generales de interpretación, sin embargo el conocimiento detallado de lo que los
resultados representan individualmente y en su conjunto permite comprender el comportamiento de una
población y obtener información de ella para la toma de decisiones
Probabilidad y Estadística -Capítulo 5. Muestreo
Lic. Eliana Arcoraci /Lic. Eduardo Grossi
Página |6