Download Descargar PPT

Document related concepts

Intervalo de confianza wikipedia , lookup

Muestra estadística wikipedia , lookup

Distribución t de Student wikipedia , lookup

Estimador wikipedia , lookup

Estimación estadística wikipedia , lookup

Transcript
ESTADÍSTICAS
INFERENCIALES
DE LA POBLACIÓN A LA
MUESTRA
Prof. Gerardo A. Valderrama M.
“El
objetivo
principal
de
un
investigador del comportamiento
es
el
de
diagnosticar
describir,
y
analizar,
pronosticar
el
comportamiento de una variable
en una población determinada”
POBLACIÒN
PROBLEMA
VARIABLE(S)
MEDICIÓN DE
LA TOTALIDAD
DE LA POBLACIÓN
• Todos los sujetos
• Altos costos
• Sin errores
MEDICIÓN DE UN
SEGMENTO DE LA
POBLACIÓN:
MUESTRA
• Una parte de la población
• Costos más bajos
• Diferencias con la población
VARIABLES ALEATORIAS
1. Es aquella generada por un proceso
aleatorio :
• Todos los miembros de la población
deben tener la misma probabilidad de
ser seleccionados para la muestra
• El sujeto seleccionado, al momento de
medirse, debe reflejar uno de los
posibles resultados existentes en la
población
EJEMPLOS DE VARIABLES
ALEATORIAS
1. Sexo: (1)masculino, (2)femenino
EJEMPLOS DE VARIABLES
ALEATORIAS
2. Estatura:
EJEMPLOS DE VARIABLES
ALEATORIAS
3.Personalidad:
EVENTOS, VARIABLES Y
PROBABILIDADES
• Los diversos resultados que se pueden
obtener en una investigación, se
denominan eventos
• Cuando por experimentación dichos
eventos pueden asumir un valor, se
denominan variables
• Las variables pueden ser de dos tipos:
discretas y continuas
VARIABLES DISCRETAS
• También se les denomina categórica porque pueden
tener dos o más subconjuntos del tipo de objeto
medido
• Al momento de ser medidas, los resultados no
pueden asumir valores fraccionales
• Los sujetos que están en una categoría poseen o no
la propiedad medida
• Cada categoría se identifica con un nombre o un
número:
Hombre Mujer, o,
1
0
• En estos casos, el número no posee significado
cuantitativo
EJEMPLO DE VARIABLES DISCRETAS
• Tipo de bachillerato
Ciencias
Letras
Comercio
1
2
3
• Rendimiento académico
Alto
Medio
Bajo
1
2
3
• Inteligencia
Deficiente
Promedio
Alta
1
2
3
VARIABLES ALEATORIAS CONTÍNUAS
• Son aquellas capaces de asumir cualquier valor
dentro de un intervalo
• Refleja al menos, un orden de rango, o sea, un
valor mayor implica más de la propiedad que un
valor menor
• Se miden por lo menos en una escala de
intervalos
“Tanto las variables discretas como las
continuas, como resultado de la medición
aplicada en psicología, deben reflejar los
posibles eventos del estudio, además de sus
probabilidades”
EJEMPLOS DE VARIABLES
ALEATORIAS
4. Inteligencia:
DISTRIBUCIÓN DE PROBABILIDAD O
FUNCIÓN DE PROBABILIDAD
• Si X es una variable aleatoria que puede
asumir distintos valores y si cada valor
tiene una probabilidad (p) asignada,
entonces, la combinación de cada valor de
X con sus correspondiente probabilidad
(p), genera lo que se conoce como una
distribución de probabilidad
EJEMPLOS DE DISTRIBUCIONES DE
PROBABILIDAD DISCRETA
• Lanzamiento de un dado común
POSIBLES RESULTADOS
Resultado
“p”
1
2
3
4
5
6
1/6
1/6
1/6
1/6
1/6
1/6
• En este experimento se pueden dar 6
posibles resultados y cada uno de ellos
tiene una probabilidad establecida
EJEMPLOS DE DISTRIBUCIONES DE
PROBABILIDAD DISCRETA
• Seleccionar aleatoriamente un sujeto de
una población de hombres y mujeres
Sexo
Masculino
Femenino
Total
Sujetos
125
175
300
“p”
0.42
0.58
1.00
• Los eventos son las dos categorías de sexo y
para cada una hay una probabilidad
EJEMPLO DE DISTRIBUCIÓN DE PROBABILIDADES
CONTÍNUAS
LA DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN MUESTRAL DE MEDIAS
• Las medias de igual tamaño constituyen la
Distribución Muestral de las medias
aritméticas
• La media de todas las medias de un mismo
tamaño es igual a la µ poblacional
• Esta propiedad es cierta para cualquiera
distribución de muestras del mismo tamaño
• A partir de ésta propiedad se puede llegar a
las siguientes conclusiones:
1. La distribución muestral de todas las medias se
aproxima a una curva normal sin considerar la
forma de la distribución de los puntajes
originales.
2. Si se graficaran todas las medias, la forma se
aproximaría la curva normal.
3. Esta propiedad está fundamentada en el
Teorema Central del Límite
4. La media de una distribución de medias (media
de medias) es igual a la media de la población
original.
5. La “S” de la Distribución Muestral de medias es
menor que la σ de la población original
ERROR DE MUESTREO
• Al seleccionarse muestras, las medias
aritméticas de cada una de ellas son
diferentes por aleatoriedad.
• También es evidente que entre la media
muestral y la poblacional existan
diferencias
• A estas diferencias se les denomina
ERROR DE MUESTREO
• El error de muestreo es independiente del
proceso de selección: es inevitable
• El error de muestreo significa que, el
estadístico muestral obtenido, puede tener
un valor superior o inferior al parámetro
poblacional correspondiente, del cual no se
tiene información.
Error de
Muestreo
ERROR ESTÁNDAR DE LA MEDIA
• El error estándar de
la media aritmética es
un estimador de la
desviación estándar
de la distribución
muestral de medias
del mismo tamaño,
tomadas de una
población: σx
• Fórmula del error
estándar de la
media: σx
• σx = s / √ n – 1
• Donde:
• σx : Error estándar de la media
• S: desviación estándar de la
muestra
• n: tamaño de la muestra
EJEMPLO DE CÁLCULO DEL
σx
• Una muestra de 75 entrevistados alcanzó una media de
46 con una desviación estándar de 4.8. ¿Cuál sería el
σx ?
• σx = 4.8 / √ 75 – 1 = 0.56
• Esto significa que:
 El 68% de las medias se encuentran entre
46 +/- 0.56 = 45.44 – 46.56
 El 95% de las medias se encuentra ente 46 +/- (2)(0.56)
= 44.88 – 47.12
 El 99% de las medias se encuentra entre 46 +/- (3)(0.56)
 = 44.32 – 47.68
Probabilísticamente, la media poblacional desconocida
debe ubicarse dentro de estos intervalos
ESTIMACIÓN ESTADÍSTICA
• Se refiere al conjunto de procedimientos estadísticos
dirigidos a aproximar los valores muestrales, a los
correspondientes valores poblacionales
ESTIMACIÓN
PUNTUAL
ESTIMACIÓN
POR INTERVALOS
ESTIMACIÓN PUNTUAL
Paso 1
Paso 2
Paso 3
• Se selecciona una muestra aleatoria de la población
objetivo del estudio
• Se calcula uno o más valores estadísticos determinados
por el problema (media, varianza, desviación estándar, etc)
• A estos valores se les considera un buen estimador del
parámetro, aunque no se cuente con más evidencia
estadística.
ESTIMACIÓN POR INTERVALOS
• Procedimiento a través del cual se estima
probabilísticamente, que a partir de los
datos muestrales, el parámetro
poblacional se encuentre dentro de un
intervalo de confianza bajo la curva
normal
• Por estar ubicados bajo la curva, los
límites de dichos intervalos se determinan
a partir de los correspondientes valores Z
INTERVALOS DE CONFIANZA
Entre –z y + z hay un 0.6826 de
probabilidades: Zc = +/- 1.64
Entre-2z y +2z hay un 0.9544 de
probabilidades: Zc = +/- 1.96
Entre -3z y +3z hay un 0.9974 de
probabilidades : Zc = +/- 2.58
CÁLCULO DEL INTERVALO DE
CONFIANZA (IC)
1. El primer paso para establecer el IC es el
de determinar el nivel de probabilidad que
deseamos para la estimación
• Para el 95% (0.95) el valor de ZC es de
1.96
• Para el 99% (0.99) el valor de ZC es de
2.58
Por lo general, los IC se determinan al 95% o
al 99% de confianza
2. En segundo lugar se establece si la
población original es finita o infinita.
2. Se calcula el IC
•
•
IC para una media, población infinita:
IC= Media +/- Zc (s/√n)
IC para una media, población finita:
IC= Media +/- Zc (s/√n)√ Np – n
Np – 1
EJEMPLO DE CÁLCULO DE UN IC PARA
UNA POBLACIÓN INFINITA
1. n = 75
2. Media = 46; S = 4.8
3. σx = 0.56
4. P = 95%; Zc = 1.96
5. IC= Media +/- Zc (s/√n)
IC = 46 +/- (1.96)(4.8 / √ 75 = 46 +/- (0.55)
LS = 46 + 0.55 = 46.55
LI = 46 - 0.55 = 45.45
EJEMPLO DE CÁLCULO DE UN IC PARA UNA
POBLACIÓN FINITA
1. n = 75
2. Media = 46; S = 4.8
3. σx = 0.56
4. N = 500
5. P = 95%; Zc = 1.96
• IC= Media +/- Zc (s/√n)√ Np – n
Np – 1
• IC = 46 +/- (0.55) √ 500-75
500- 1
• IC = 46 +/- (0.55)(0.92) = 46 +/- 0.51
• LS = 46 + 0.51 = 46.51
• LI = 46 – 0.51 = 45.49
TAMAÑO DE LA MUESTRA
• El desarrollo de investigaciones
comportamentales requiere de la
definición de tamaños muestrales de
mucha confiabilidad.
• El tomar muestras muy grandes afecta los
costos de los estudios; si es muy
pequeña afecta la validez del estudio.
• Por lo tanto es necesario que “n” tenga un
tamaño adecuado para los fines que se
tratan de alcanzar.
ASPECTOS A CONSIDERAR AL MOMENTO DE
DEFINIR EL TAMAÑO DE “n”
1. La amplitud del intervalo de confianza; 95% ó 99%.
2. El valor de Zc correspondiente al nivel de probabilidad
seleccionado:}
• 95% ………Zc = 1.96
• 99%...........Zc = 2.58
3. La diferencia esperada con relación al parámetro
estimado: d2
4. El valor de S2 poblacional o de un estimador
4. Tipo de población: infinita o finita
ESPECIFICACIÓN DE LA σ2
POBLACIONAL
1. En la mayoría de las ocasiones, la σ2
poblacional es desconocida.
2. Por lo tanto, lo que se hace es una
estimación:
• Muestra piloto
• Estudios previos
• Estudios similares
FORMULAS PARA EL CALCULO DE n
• TAMAÑO DE POBLACIÓN DESCONOCIDO
• n = Z2σ2
d2
• Donde:
• z2: cuadrado de la puntuación z correspondiente
al 95% (1.96) o al 99% (2.58)
• σ2 : varianza de la población o un estimador de
ella
• d2: diferencia esperada entre la media de la
muestra y la de la población
TAMAÑO DE POBLACIÓN CONOCIDO
• TAMAÑO DE POBLACIÓN CONOCIDO
• n=
•
N z2σ2_____
z2σ2 + d2 (N – 1)
Donde:
• z2: cuadrado de la puntuación z correspondiente al 95%
(1.96) o al 99% (2.58)
• σ2 : varianza de la población o un estimador de ella
• d2: diferencia esperada entre la media de la muestra y la
de la población
• N : tamaño de la población
•