Download Inferencia estadistica
Document related concepts
Transcript
Contenidos Conceptos de inferencia estadística Teoría de muestreo Distribución muestral Inferencia Estadística Procedimiento por medio del cual se elaboran conclusiones probabilísticas con relación a una población, valiéndose de la información proporcionada por una muestra de esa población. Interrogantes referidas a una o más poblaciones cuyas respuestas se obtienen al utilizar Inferencia Estadística ¿Cuál será la tasa de alcoholismo en los mayores de 15 años en la ciudad x ? b) ¿ Serán diferente las tasas de c) ¿Cuál será la tasa de mortalidad por cáncer del pulmón de la población de grandes fumadores (20 cigarrillos o más al día) ? d) ¿Serán iguales las tasas de mortalidad por cáncer de pulmón de los grandes fumadores y de los no fumadores? a) Característica de la población Estimación de Parámetros alcoholismo en las ciudades x e y? Comparación característica en dos poblaciones Dócima o hipótesis prueba de Esquema de procedimiento de la Estadística Inferencial. RECOLECCION DE LOS DATOS MEDIANTE UNA MUESTRA CALCULO DE ESTADIGRAFOS Inferencia de los parámetros mediante técnicas estadísticas apropiadas. Población o universo La estadística inferencial puede se utilizada para dos procedimientos: Probar hipótesis Para estimar parámetros Diagrama Población Muestra Parámetros Estimadores ¿Qué se entiende por parámetros? Son las estadísticas de la población o universo, es una característica asociada a una población. Es un valor constante , fijo, único Ej. % de hombres de una población. ● Los parámetros pueden ser inferidos de los “estadígrafos”, de ahí el nombre de “estadística inferencial”. ● La inferencia de los parámetros se lleva a cabo mediante => técnicas estadísticas apropiadas que se explicarán mas adelante. Ejemplos Media Proporción (p) Varianza Etc ¿Qué se entiende por estimadores? Es una estadística cuyo valor es un posible valor para el parámetro en estudio. Ejemplos A partir de una población, es posible obtener muchas muestras distintas de tamaño n y cada una de estas muestras arrojarán un valor diferente para una determinada estadística. = > La estadística es variable. - Media (X) - Proporción (p) - Varianza (S2) Otras definiciones ....... P = proporción de elementos que cumplen una característica en la población p= proporción de elementos que cumplen una característica en la muestra; es el estimador del P p= a / n ; donde a= número de elementos en la muestra que satisfacen la característica en estudio n= número de datos de la muestra A partir de una muestra de n elementos, los estimadores para cada uno de ellos son: Promedio de la población => el estimador es el promedio muestral Para la proporción de elementos que cumplen con una determinada característica de la población (P) => el estimador es la proporción en la muestra de elementos que cumplen la condición en estudio, se simboliza por p Para la varianza de la población => el estimador es la varianza muestral Teoría del Muestreo Estudia la relación entre una población y las muestras tomadas de ella. Es útil para estimar parámetros de una población , tales como : media , varianza, proporción También es útil para determinar si las diferencias observadas entre dos muestras son debidas a variaciones fortuitas o sin son realmente significativas Muestras Aleatorias Para que las conclusiones obtenidas de la teoría de muestreo sean válidas, las muestras escogidas deben ser representativas de la población Una forma de obtener una muestra representativa es mediante el muestreo aleatorio Cada miembro de la población tiene la misma probabilidad de ser incluido en la muestra Muestra Aleatoria simple Es una muestra de tamaño n extraída de una población de interés de tamaño N, de tal manera que cada muestra de tamaña n tiene la misma probabilidad de ser seleccionada. La calidad de aleatoriedad de una muestra asegura la aplicación correcta de la probabilidad para evaluar el riesgo inherente en un proceso inductivo. Muestreo con o sin reposición Con reposición Sin reposición Ejemplo Ejemplo Sacamos un número de una urna y lo volvemos a poner en ella Sacamos un número de una urna y no lo volvemos a poner en ella Población infinita Población finita Dos formas para obtener muestras aleatorias Muestreo aleatorio con reemplazo Muestreo aleatorio sin reemplazo Extraer la observación Xi de la población, regresarla y extraer X2,.......continuar el proceso hasta tener una muestra de n observaciones de la características medible X Extraer las n observaciones X1,X2,.......,Xn de la característica X de la población sin reemplazo Las obs. X1.....Xn es un conj, de v.a. independientes e idénticamente distribuidas, es decir, ninguna obs. Se ve afectada por otra y con distribución igual a la de la población Las observaciones X1,....Xn e un conjunto de variables aleatorias idénticamente distribuidas pero no independientes. Elección de una muestra aleatoria simple de una población grande mediante la tabla de números aleatorios Tabla de números aleatorios Es una colección de dígitos en que cada dígito 0,1,2,3,...9 ocurre con la misma probabilidad (1/10) e independiente. Ejemplo Se desea averiguar la efectividad de un programa de tratamiento para la HTA, hay 1000 participantes al programa, pero los recursos alcanzan para 20 . Por lo cual se desea elegir una muestra aleatoria de tamaño 20 ¿Cómo lo hacemos? 1. Rotular los participantes con los números 000 al 999 2.- Elegir arbitrariamente tres filas de números aleatorios para seleccionar la muestra como sigue: 3. Tres filas del listados de 1.000 números aleatorios de la tabla adjunta 32924 22324 18125 09077 54632 90374 94143 42295 88720 43035 97081 83373 4. Una muestra aleatoria elegida sería 329 242 232 418 125 090 775 463 290 374 941 434 929 588 720 430 359 708 183 373 ¿Qué es una distribución muestral? Una distribución muestral es un conjunto de valores sobre una estadística, calculada de todas las muestras posibles de determinado tamaño. Las distribuciones muéstrales de medias, son las más comunes Si calculáramos la media de todas las medias de las muestras posibles, obtendríamos el valor de la media poblacional. Es más bien un concepto estadístico para los investigadores; lo que comúnmente se hace es extraer una sola muestra. Ver ejemplo Aplicado el concepto de probabilidad a la distribución muestral podemos tomar el área de ésta como “1”. Cualquier área comprendida entre dos puntos corresponderá a la probabilidad de la distribución. Para probar hipótesis inferenciales respecto a la media, el investigador debe evaluar si es alta o baja la probabilidad de que la media de la muestra esté cerca de la media de la distribución muestral. Si es baja el investigador dudará de generalizar a la población. Si es alta, el investigador podrá hacer generalizaciones. Es aquí donde entra el nivel de significancia o nivel alfa (α) => nivel de probabilidad de equivocarse. Distribuciones de Muestreo Distribución de muestreo de medias Distribución de muestreo de proporciones Distribución de muestreo de diferencias y sumas Distribución muestral de la media El promedio de los promedios muéstrales es igual al promedio de la población μx = μ La varianza de los promedios muéstrales es igual a la varianza de la población original dividida por el tamaño de la muestra Además, la desviación estándar dividida por la raíz cuadrada del tamaño de la muestra n , se denomina ERROR ESTANDAR Los promedios muéstrales presentan un comportamiento de una distribución normal X ~ N(μ;σ2/n) Distribución muestral de la proporción Veamos el caso de una distribución de proporciones muéstrales.... El promedio de las proporciones muéstrales es igual a la proporción de la población, es decir, P; luego μp= P La varianza de las proporciones muéstrales es igual a PQ/n donde Q=1 – P Si se construye un gráfico con las proporciones muéstrales, este es aproximadamente una normal P~N(P,PQ/n) Inferencia estadística La Inferencia estadística procede a formular estimaciones y probar hipótesis acerca de datos resumidos, y utiliza predominantemente estimaciones puntuales, por intervalo y contraste de hipótesis. A.-Estimación puntual El proceso de estimación puntual calcula a partir de los datos de una muestra, valores aproximados del parámetro de la población, de la cual fue extraída la muestra. Por ejemplo la media y la desviación estándar. B.- Estimación por intervalo (intervalo de confianza) Una estimación por intervalo de confianza para un parámetro es un intervalo construido alrededor del estimador puntual del parámetro de tal manera que podemos esperar que el verdadero valor del parámetro quede incluido en dicho intervalo. El nivel de confianza de un intervalo Por ejemplo el intervalo de confianza para medias o una proporción. MUCHAS GRACIAS ¿ALGUNA DUDA? Y