Download Descargar PPT
Document related concepts
Transcript
ESTADÍSTICAS INFERENCIALES DE LA POBLACIÓN A LA MUESTRA Prof. Gerardo A. Valderrama M. “El objetivo principal de un investigador del comportamiento es el de diagnosticar describir, y analizar, pronosticar el comportamiento de una variable en una población determinada” POBLACIÒN PROBLEMA VARIABLE(S) MEDICIÓN DE LA TOTALIDAD DE LA POBLACIÓN • Todos los sujetos • Altos costos • Sin errores MEDICIÓN DE UN SEGMENTO DE LA POBLACIÓN: MUESTRA • Una parte de la población • Costos más bajos • Diferencias con la población VARIABLES ALEATORIAS 1. Es aquella generada por un proceso aleatorio : • Todos los miembros de la población deben tener la misma probabilidad de ser seleccionados para la muestra • El sujeto seleccionado, al momento de medirse, debe reflejar uno de los posibles resultados existentes en la población EJEMPLOS DE VARIABLES ALEATORIAS 1. Sexo: (1)masculino, (2)femenino EJEMPLOS DE VARIABLES ALEATORIAS 2. Estatura: EJEMPLOS DE VARIABLES ALEATORIAS 3.Personalidad: EVENTOS, VARIABLES Y PROBABILIDADES • Los diversos resultados que se pueden obtener en una investigación, se denominan eventos • Cuando por experimentación dichos eventos pueden asumir un valor, se denominan variables • Las variables pueden ser de dos tipos: discretas y continuas VARIABLES DISCRETAS • También se les denomina categórica porque pueden tener dos o más subconjuntos del tipo de objeto medido • Al momento de ser medidas, los resultados no pueden asumir valores fraccionales • Los sujetos que están en una categoría poseen o no la propiedad medida • Cada categoría se identifica con un nombre o un número: Hombre Mujer, o, 1 0 • En estos casos, el número no posee significado cuantitativo EJEMPLO DE VARIABLES DISCRETAS • Tipo de bachillerato Ciencias Letras Comercio 1 2 3 • Rendimiento académico Alto Medio Bajo 1 2 3 • Inteligencia Deficiente Promedio Alta 1 2 3 VARIABLES ALEATORIAS CONTÍNUAS • Son aquellas capaces de asumir cualquier valor dentro de un intervalo • Refleja al menos, un orden de rango, o sea, un valor mayor implica más de la propiedad que un valor menor • Se miden por lo menos en una escala de intervalos “Tanto las variables discretas como las continuas, como resultado de la medición aplicada en psicología, deben reflejar los posibles eventos del estudio, además de sus probabilidades” EJEMPLOS DE VARIABLES ALEATORIAS 4. Inteligencia: DISTRIBUCIÓN DE PROBABILIDAD O FUNCIÓN DE PROBABILIDAD • Si X es una variable aleatoria que puede asumir distintos valores y si cada valor tiene una probabilidad (p) asignada, entonces, la combinación de cada valor de X con sus correspondiente probabilidad (p), genera lo que se conoce como una distribución de probabilidad EJEMPLOS DE DISTRIBUCIONES DE PROBABILIDAD DISCRETA • Lanzamiento de un dado común POSIBLES RESULTADOS Resultado “p” 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6 • En este experimento se pueden dar 6 posibles resultados y cada uno de ellos tiene una probabilidad establecida EJEMPLOS DE DISTRIBUCIONES DE PROBABILIDAD DISCRETA • Seleccionar aleatoriamente un sujeto de una población de hombres y mujeres Sexo Masculino Femenino Total Sujetos 125 175 300 “p” 0.42 0.58 1.00 • Los eventos son las dos categorías de sexo y para cada una hay una probabilidad EJEMPLO DE DISTRIBUCIÓN DE PROBABILIDADES CONTÍNUAS LA DISTRIBUCIÓN NORMAL DISTRIBUCIÓN MUESTRAL DE MEDIAS • Las medias de igual tamaño constituyen la Distribución Muestral de las medias aritméticas • La media de todas las medias de un mismo tamaño es igual a la µ poblacional • Esta propiedad es cierta para cualquiera distribución de muestras del mismo tamaño • A partir de ésta propiedad se puede llegar a las siguientes conclusiones: 1. La distribución muestral de todas las medias se aproxima a una curva normal sin considerar la forma de la distribución de los puntajes originales. 2. Si se graficaran todas las medias, la forma se aproximaría la curva normal. 3. Esta propiedad está fundamentada en el Teorema Central del Límite 4. La media de una distribución de medias (media de medias) es igual a la media de la población original. 5. La “S” de la Distribución Muestral de medias es menor que la σ de la población original ERROR DE MUESTREO • Al seleccionarse muestras, las medias aritméticas de cada una de ellas son diferentes por aleatoriedad. • También es evidente que entre la media muestral y la poblacional existan diferencias • A estas diferencias se les denomina ERROR DE MUESTREO • El error de muestreo es independiente del proceso de selección: es inevitable • El error de muestreo significa que, el estadístico muestral obtenido, puede tener un valor superior o inferior al parámetro poblacional correspondiente, del cual no se tiene información. Error de Muestreo ERROR ESTÁNDAR DE LA MEDIA • El error estándar de la media aritmética es un estimador de la desviación estándar de la distribución muestral de medias del mismo tamaño, tomadas de una población: σx • Fórmula del error estándar de la media: σx • σx = s / √ n – 1 • Donde: • σx : Error estándar de la media • S: desviación estándar de la muestra • n: tamaño de la muestra EJEMPLO DE CÁLCULO DEL σx • Una muestra de 75 entrevistados alcanzó una media de 46 con una desviación estándar de 4.8. ¿Cuál sería el σx ? • σx = 4.8 / √ 75 – 1 = 0.56 • Esto significa que: El 68% de las medias se encuentran entre 46 +/- 0.56 = 45.44 – 46.56 El 95% de las medias se encuentra ente 46 +/- (2)(0.56) = 44.88 – 47.12 El 99% de las medias se encuentra entre 46 +/- (3)(0.56) = 44.32 – 47.68 Probabilísticamente, la media poblacional desconocida debe ubicarse dentro de estos intervalos ESTIMACIÓN ESTADÍSTICA • Se refiere al conjunto de procedimientos estadísticos dirigidos a aproximar los valores muestrales, a los correspondientes valores poblacionales ESTIMACIÓN PUNTUAL ESTIMACIÓN POR INTERVALOS ESTIMACIÓN PUNTUAL Paso 1 Paso 2 Paso 3 • Se selecciona una muestra aleatoria de la población objetivo del estudio • Se calcula uno o más valores estadísticos determinados por el problema (media, varianza, desviación estándar, etc) • A estos valores se les considera un buen estimador del parámetro, aunque no se cuente con más evidencia estadística. ESTIMACIÓN POR INTERVALOS • Procedimiento a través del cual se estima probabilísticamente, que a partir de los datos muestrales, el parámetro poblacional se encuentre dentro de un intervalo de confianza bajo la curva normal • Por estar ubicados bajo la curva, los límites de dichos intervalos se determinan a partir de los correspondientes valores Z INTERVALOS DE CONFIANZA Entre –z y + z hay un 0.6826 de probabilidades: Zc = +/- 1.64 Entre-2z y +2z hay un 0.9544 de probabilidades: Zc = +/- 1.96 Entre -3z y +3z hay un 0.9974 de probabilidades : Zc = +/- 2.58 CÁLCULO DEL INTERVALO DE CONFIANZA (IC) 1. El primer paso para establecer el IC es el de determinar el nivel de probabilidad que deseamos para la estimación • Para el 95% (0.95) el valor de ZC es de 1.96 • Para el 99% (0.99) el valor de ZC es de 2.58 Por lo general, los IC se determinan al 95% o al 99% de confianza 2. En segundo lugar se establece si la población original es finita o infinita. 2. Se calcula el IC • • IC para una media, población infinita: IC= Media +/- Zc (s/√n) IC para una media, población finita: IC= Media +/- Zc (s/√n)√ Np – n Np – 1 EJEMPLO DE CÁLCULO DE UN IC PARA UNA POBLACIÓN INFINITA 1. n = 75 2. Media = 46; S = 4.8 3. σx = 0.56 4. P = 95%; Zc = 1.96 5. IC= Media +/- Zc (s/√n) IC = 46 +/- (1.96)(4.8 / √ 75 = 46 +/- (0.55) LS = 46 + 0.55 = 46.55 LI = 46 - 0.55 = 45.45 EJEMPLO DE CÁLCULO DE UN IC PARA UNA POBLACIÓN FINITA 1. n = 75 2. Media = 46; S = 4.8 3. σx = 0.56 4. N = 500 5. P = 95%; Zc = 1.96 • IC= Media +/- Zc (s/√n)√ Np – n Np – 1 • IC = 46 +/- (0.55) √ 500-75 500- 1 • IC = 46 +/- (0.55)(0.92) = 46 +/- 0.51 • LS = 46 + 0.51 = 46.51 • LI = 46 – 0.51 = 45.49 TAMAÑO DE LA MUESTRA • El desarrollo de investigaciones comportamentales requiere de la definición de tamaños muestrales de mucha confiabilidad. • El tomar muestras muy grandes afecta los costos de los estudios; si es muy pequeña afecta la validez del estudio. • Por lo tanto es necesario que “n” tenga un tamaño adecuado para los fines que se tratan de alcanzar. ASPECTOS A CONSIDERAR AL MOMENTO DE DEFINIR EL TAMAÑO DE “n” 1. La amplitud del intervalo de confianza; 95% ó 99%. 2. El valor de Zc correspondiente al nivel de probabilidad seleccionado:} • 95% ………Zc = 1.96 • 99%...........Zc = 2.58 3. La diferencia esperada con relación al parámetro estimado: d2 4. El valor de S2 poblacional o de un estimador 4. Tipo de población: infinita o finita ESPECIFICACIÓN DE LA σ2 POBLACIONAL 1. En la mayoría de las ocasiones, la σ2 poblacional es desconocida. 2. Por lo tanto, lo que se hace es una estimación: • Muestra piloto • Estudios previos • Estudios similares FORMULAS PARA EL CALCULO DE n • TAMAÑO DE POBLACIÓN DESCONOCIDO • n = Z2σ2 d2 • Donde: • z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58) • σ2 : varianza de la población o un estimador de ella • d2: diferencia esperada entre la media de la muestra y la de la población TAMAÑO DE POBLACIÓN CONOCIDO • TAMAÑO DE POBLACIÓN CONOCIDO • n= • N z2σ2_____ z2σ2 + d2 (N – 1) Donde: • z2: cuadrado de la puntuación z correspondiente al 95% (1.96) o al 99% (2.58) • σ2 : varianza de la población o un estimador de ella • d2: diferencia esperada entre la media de la muestra y la de la población • N : tamaño de la población •