Download Presentación de PowerPoint
Document related concepts
Transcript
Inferencia Estadistica REPÚBLICA BOLIVARIANA DE VENEZUELA LA UNIVERSIDAD DEL ZULIA FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES ASIGNATURA: ESTADÍSTICA Inferencia Estadística •Estimación y Prueba de Hipótesis de la Media Mgs. Anaís Álvarez Econ. Martha Ariza Mgs. María C. González Maracaibo, Marzo de 2003 1 Inferencia Estadistica OBJETIVO GENERAL Evaluar las estimaciones de intervalos de confianza para tomar decisiones empresariales eficientes. Evaluar las suposiciones de los valores estadísticos de la población sobre la representación de la población. OBJETIVO TERMINAL Al finalizar el tema estarás en capacidad de: •Aplicar adecuadamente la formula de estimación de intervalo de la media de la población dado las características de la variable y si se conoce o no la desviación estándar poblacional. . •Aplicar adecuadamente los procedimientos de las pruebas de hipótesis para la media de los parámetros dado un caso hipotético o real 2 Inferencia Estadistica OBJETIVOS ESPECÍFICOS •Conocer las partes que comprende la inferencia estadística. •Interpretar la estimación de intervalo de confianza de la media dado un caso hipotético o real. •Explicar el significado del error tipo I y Error tipo II. •Formular las Hipótesis nulas y hipótesis alternativa. •Distinguir entre Prueba unilateral y prueba bilateral. •Calcular los valores estadísticos de pruebas para docimar la media poblacional de acuerdo a si se conoce o no la desviación estándar poblacional. . 3 Inferencia Estadistica PRE-TEST La evaluación que a continuación se presenta tiene como objetivo fundamental diagnosticar los conocimientos previos relacionados con el tema, es por esta razón que las respuestas se evaluarán cualitativamente para que puedas responder libremente en forma clara y sencilla de acuerdo a tus aprendizajes adquiridos con anterioridad. 4 Inferencia Estadistica PRE-TEST Lee detenidamente cada una de las preguntas. Escribe en forma clara y legible. 1.Define con tus propias palabras: a) b) c) d) e) Parámetro:____________________________________________________ _____________________________________________________________ ____________________________________________________________ Estadístico:____________________________________________________ _____________________________________________________________ _____________________________________________________________ Inferencia:_______________________________________________ _____________________________________________________________ _____________________________________________________________ Estimación:____________________________________________________ _____________________________________________________________ _____________________________________________________________ Hipótesis:____________________________________________ _____________________________________________________________ _____________________________________________________________ 5 Inferencia Estadistica 1. INFERENCIA ESTADÍSTICA . DEFINICIÓN La inferencia estadística es un proceso que consiste en utilizar los resultados de una muestra para llegar a conclusiones acerca de las características de la población. (Stevenson, William) La teoría de Inferencia Estadística consiste en aquellos métodos con los cuales se puede inferir o generalizar acerca de la población. Actividad: a. Define con tus propias palabras INFERENCIA ESTADISTICA. ________________________________________________________________ ________________________________________________________________ ________________________________________________________________ 6 Inferencia Estadistica 2.Clasificación de la inferencia La Inferencia puede dividirse en dos principales áreas: • Estimación • Prueba de Hipótesis Actividad: Investigar en las paginas web y formular su propia definición de estimación y pruebas de hipótesis a. b. Estimación:_________________________________________________________ __________________________________________________________________ __________________________________________________________________ Pruebas de Hipótesis :_________________________________________________________ ____________________________________________________________________________ ___________________________________________________________________________ 7 Inferencia Estadistica 2.Estimación. Definición La estimación es un proceso de utilizar datos muéstrales para estimar los valores de parámetros desconocidos de una población. Esencialmente, cualquier características de la población se pueden estimar a partir de una muestra al azar. Debemos hacer la distinción entre estimador y estimaciones. Cualquier estadística de muestra que se utiliza para estimar un parámetro de la población se conoce como estimador, es decir, un estimador es una estadística de muestra utilizada para estimar un parámetro de la población. La media de la muestra x puede ser un estimador de la media de la población. Una estimación es un valor especifico observado de una estadística. Hacemos una estimación si tomamos una muestra y calculamos el valor que toma el estimador en esa muestra. Por ejemplo, se toma la lectura media en kilometraje a partir de una muestra de taxis en servicio, el valor obtenido es de 160.000 kilómetros. Estimador: lectura media del recorrido en kilometraje Estimación: 160.000 kilómetros recorridos en promedio por taxis Actividad: Indique la(s) diferencia(s) entre el estimador y la estimación ____________________________________________________________________________ ____________________________________________________________________________ ____________________________________________________________________________ 8 Inferencia Estadistica 3.Estimación. Criterios para Seleccionar un Buen Estimador Podemos evaluar la calidad de una estadística como un buen estimador mediante el uso de cuatro criterios: a. Imparcialidad. El termino Imparcialidad se refiere al hecho de que una media de muestra es un estimador no sesgado de la media de la población porque la media de la distribución de muestreo de las medias de muestra tomadas de una población es igual a la media de la población misma. b. Eficiencia. Se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de una muestra del mismo tamaño y tratamos de decidir cual de ellas es un mejor estimador más eficiente, escogeríamos la que tuviera el menor error estándar o la menor desviación estándar de la distribución de muestreo. c. Coherencia. Una estadística es un estimador coherente de un parámetro de la población si al aumentar el tamaño de la muestra, se tiene la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de la población. d. Suficiente. Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra que ningún otro estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está estimando. 9 Inferencia Estadistica 3. Tipos de Estimación Podemos hacer dos tipos de estimaciones concernientes a una población: Estimación Puntual Estimación por intervalos Actividad: Dada la bibliografía recomendada indica las características con sus propias palabras: Estimación puntual:_____________________________________________________________ ____________________________________________________________________________ ____________________________________________________________________________ Estimación de intervalo:__________________________________________________________ _________________________________________________________________________________ Distribución de Muestreo: _________________________________________________________ _________________________________________________________________________________ _________________________________________________________________________ 10 Inferencia Estadistica 3. Tipos de Estimación a. Estimación Puntual La estimación puntual es un solo número que se utiliza para estimar un parámetro de la población desconocido. Los valores estadísticos muéstrales se utilizan como estimadores de los parámetros de la población. Así, la media de la muestra se utiliza como estimación del valor de la media de la población; la desviaron Estándar de la muestra se emplea como una estimación de la desviación estándar de la población. , la cual se expresa: X S 11 Inferencia Estadistica 3. Tipos de Estimación b. Estimación de intervalos Una estimación de intervalo es un conjunto de valores entre dos extremos dados que se utiliza para estimar un parámetro. Esta estimación indica el error de dos maneras por la extensión del intervalo y por la probabilidad de obtener el verdadero valor de la población que se encuentra dentro del intervalo. Es decir, estas estimaciones proporcionan un intervalo de los valores posibles para el parámetro de la población. La estimación por intervalo de un parámetro poblacional( ) es un intervalo de la forma inferior superior, donde inferior y superior depende del valor del estadístico para una muestra particular y también de la distribución muestral El intervalo de estimación indica, por su longitud, la precisión de la estimación puntual. 12 Inferencia Estadistica 3. Tipos de Estimación A partir de la distribución muestral de la estimación de cualquier parámetro ( será posible determinar valores inferior y superior tales que la P ( inferior ≤ ≤ superior ) = 1 - Donde • 1 - se denomina intervalo de confianza o grado de confianza, el cual proporciona unos intervalos de valores, centrado en el valor estadístico de la muestra, en el cual supuestamente se ubica el parámetro de la población, con un riesgo de error. • , se denomina nivel de significación, indica la porción que se encuentra en los extremos de la distribución que están fuera del intervalo de confianza, el nivel de riesgo. Los valores van comprendido 0 < < 1. • inferior ≤ ≤ superior, son los puntos extremos o limites de confianza inferior y superior. De tal manera que cuando = 0.05, se tiene un intervalo de confianza del 95% y cuando = 0.01, se tiene una seguridad de que 99% en el intervalo dado que contiene el parámetro desconocido. 13 Inferencia Estadistica 3. Tipos de Estimación La estimación de intervalo es un método que nos permite no sólo encontrar la mejor estimación del valor de un parámetro, sino también el probable grado de error en la estimación. Lo que implica que nos proporciona en rango de valores posibles de un parámetro. Cada intervalo de confianza incluye o no al verdadero valor del parámetro que se estima, el nivel de confianza (1-), nos indica que en el limite, el (1-) de los intervalos así construidos incluyen el valor poblacional. Por ejemplo, la interpretación del intervalo de confianza, sería: Una estimación de intervalo de confianza de 95%, nos indica como si se tomaran todas las muestras posibles del mismo tamaño, n, 95% de ellas incluirían el valor de la media real en alguna parte del intervalo alrededor de sus medias de muestras, y solamente el 5% de ellas no están incluidas.(Berenson y Levine,1996:346) 14 Inferencia Estadistica 3. Estimación De La Media De La Población. Del conocimiento de la distribución de la población, podemos determinar el porcentaje de medias de muestra que caen dentro de ciertas distancias de la media de la población. El método empleado para estimar la media de la población depende de sí se conoce la desviación estándar de la misma o si ésta se debe estimar a partir de los datos muéstrales: Estimación De Intervalo De Confianza De La Media, Conociendo La Desviación Estándar Poblacional ( Estimación De Intervalo De Confianza De La Media, Desconociendo La Desviación Estándar Poblacional ( Actividad: definir Desviación estándar e indicar para que sirve. _________________________________________________________________________ _______________________________________________________________________________ 15 Inferencia Estadistica 4. Estimación De La Media De La Población. La estimación de intervalo de la media poblacional se basa en el supuesto de que la distribución del muestreo sea normal. Cómo se puede detectar si una variable tiene una distribución Normal? 1. Explorando los datos recopilados de la variable a través de una representación gráfica, en un histograma. Se debe tener en cuenta las características de la distribución normal, la forma, de modo que se sabe que alrededor de 68% de los valores estadísticos de la muestra están comprendidos dentro de la una desviación estándar de la media de la distribución del muestreo que es igual a la media de la población, y que casi el 95% de los valores medios de la muestra estarán dentro de 1.96 desviaciones estándar de la media. Con lo cual se mide la distancia de la media poblacional a partir de la desviación estándar de la población. En consecuencia, si se establece la proposición de que la media de una muestra esta dentro de 1.96 desviaciones estándar de la media verdadera, es posible esperar estar en lo cierto un 95% de las veces, y estar equivocado el 5% restantes. 16 Inferencia Estadistica 4. Estimación De La Media De La Población. 2. Si se cumple el teorema de limite central, a continuación se exponen algunos definiciones de diferentes autores Se cumple, cuando independientemente de la población de origen, la distribución de la medias aleatorias se aproxima a una distribución normal a medida que el tamaño de la muestra crece .( Bencardino,321:2.000) Al hacerse lo bastante grande el tamaño de la muestra la distribución de muestreo de la media puede aproximarse mediante la distribución normal. Esto es cierto no importa la forma de la distribución de los valores individuales de la población. Para la mayoría de distribuciones de la población, sin importar la forma , la distribución de muestreo de la media tendrá una distribución aproximadamente normal si se seleccionan muestras de al menos 30 observaciones.(Berenson y Levine: 1996:329) 17 Inferencia Estadistica 4. Estimación De La Media De La Población. De acuerdo al teorema de limite central, es de esperarse que la distribución muestral de tenga una distribución aproximadamente normal con una media x y desviación estándar x .(Ver figura Nº 1) Figura Nº 1 El intervalo de confianza esta centrado respecto al valor medio de la muestra intervalo de confianza X–Zx X X + Z x 18 Inferencia Estadistica 5.Procedimiento para Estimación intervalo de confianza De La Media De La Población cuando se conoce la Desviación Estándar poblacional. Cuando se conoce la desviación estándar de la población, la estimación del intervalo de la media se calcula de la siguiente manera: X Zx Sustituyendo, queda P X Z1 / 2 * / n X Z1 / 2 * / n 1 Donde Limite inferior Limite superior X : es la media muestral Z 1- : Es el valor de Z a la derecha de la cual se tiene el área de , representa la confianza deseada, se conoce como el valor critico de la distribución. : el error de una estimación de intervalo que se refiere a la desviación o diferencia x / n Es entre el valor medio de la media muestral y la media real de la población. 19 Inferencia Estadistica 5. Procedimiento para Estimación De La Media De La Población cuando se conoce la Desviación Estándar poblacional. Para la mayor comprensión se realizan los procedimientos para estimar el intervalo de confianza de la media poblacional por medio de un ejercicio. Un fabricante de papel para computadora tiene un proceso de producción que opera en forma continua a través de un turno de producción completo. Se espera que el papel tenga una longitud promedio de 11 pulgadas y se sabe que la desviación estándar es de 0.02 pulgadas. A intervalos se selecciono una muestra para determinar si la longitud promedio del papel sigue siendo igual o si hay fallas en el proceso de producción. ¨ Se ha seleccionado una muestra aleatoria de 100 hojas y se ha encontrado que el largo promedio del papel es de 10.998 pulgadas. Si se desea un estimado del intervalo de confianza del 95% de la longitud promedio del papel, se tendría: * Primer paso: Identificar la variable y extraer los datos del problema Variable: ________________ Datos: 20 Inferencia Estadistica 5. Procedimiento para Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. * Segundo paso: usar la formula (1) y sustituir El valor Z se obtiene de la siguiente manera: El valor de _____ se ubica en la tabla de los valores de Z del anexo No. 1, buscando de adentro hacia fuera, dando como resultado . (figura Nº 2) Figura Nº2 Área bajo la curva normal Z .00 .01 .02 .03. .06 ...... .09 0.0 1.9 0.975 3.0 3.1 3.2 21 Inferencia Estadistica 5. Procedimiento para Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ *Tercer paso: se sustituye el valor de Z en la formula y se procese a calcular los puntos extremos. Por lo tanto se estima, con una confianza del %, que la media esta entre _____________________________________, el valor que indica que el proceso de la producción esta operando en forma adecuada, no hay motivos para pensar que haya problemas en la fabrica. 22 Inferencia Estadistica 5. Procedimiento para Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. Ejercicios de estimación de intervalo de la media poblacional a. Una maquina de refrescos está ajustada de tal manera que la cantidad de líquido despachada se distribuye aproximadamente en forma normal con una desviación estándar igual que 0.15 decilitros. Encuentre el intervalo de confianza del 95% para la media de todos los refrescos que sirve esta maquina si una muestra aleatoria de 36 refrescos tiene un contenido promedio de 2.25 decilitros Aplique el procedimiento indicado: 1. Variable _____________________ datos del problema. 2. Sustituir en la formula los valores detectados en el problema . 3. Buscar el valor de Z en la tabla 23 Inferencia Estadistica .Ejercicios de estimación de intervalo de la media poblacional ¨ 4. Calcular los intervalos de confianza Conclusión : ___________________________________________________________________________________ ___________________________________________________________________________________ ___________________________________________________________________________________ 24 Inferencia Estadistica 6. Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ Por lo general se desconoce la desviación estándar real de la población, por lo tanto los cálculos de los intervalos de confianza se deben basar en la Distribución T de Student, su origen se remonta a principios del siglo XX, fue William S. Gosset el que planteo esta distribución, empleado de una cervecería en Irlanda, puesto que no se les permitía publicar investigaciones con los nombres propios adopta un seudónimo de Student. Si la variable X esta distribuida en forma normal, entonces el estadístico es s n 25 Inferencia Estadistica 6. Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ Propiedades Student Figura N° 3 Distribución t’student de la distribución t de Tiene forma de campana y es simétrica, al igual que la distribución normal. Sin embargo, la distribución t tiene mas área en las colas y menos en el centro. Debido a que se usa S en vez de . (Ver la Figura Nº 3) ¨ La distribución t es bastante sensible con respecto al tamaño de la muestra, sin embargo esta sensibilidad disminuye en el caso de tamaños muéstrales grandes. La distribución t presenta un área ( probabilidad) mayor en los extremos que la distribución normal. Esto significa, para un nivel de confianza dado, el valor t será un poco mayor que el correspondiente a Z. El aspecto interesante de la distribución t es que no es una de tipo estandarizado, en caso de cada tamaño de la muestra existe una distribución t diferente, t’student Normal ¨ Hay una tabla para los valores t al igual que para los valores z, para utilizarla debemos conocer el nivel de confianza y los grados de libertad. 26 Inferencia Estadistica 6. Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ Los grados de libertad están relacionados con la forma del cálculo de la desviación estándar muestral n 2 2 2 Xi X X *n i 1 s S n 1 n 1 Los grados de libertad son n-1, que se pueden definir como el número de valores que pueden escoger libremente. El hecho de que n=5 y que X = 20 , nos indica que Xi = 100. Por lo tanto una vez que se conocen cuatro de los valores, el quinto no tendrá libertad para variar, puesto que la suma tiene que dar 100. La Formula para La estimación por intervalo de confianza con nivel de (1- para la media, desconociendo x, se expresa en la siguiente forma: P X t n 1; / 2* S / n X t n 1; / 2* S / n 1 Limite inferior Donde: n-1: grados de libertad t : distribución t S: desviación estándar de la muestra Limite superior 27 Inferencia Estadistica 6. Procedimiento para la Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ El director de una gran cadena de departamentos le gustaría tomar una muestra de mujeres con tarjetas de créditos para obtener información relacionada con el comportamiento de actitudes y de compras. De hecho quiere estimar la cantidad que gastan al mes las mujeres en compras de ropa para uso personal. Se selecciono una muestra de 25 mujeres con tarjetas de créditos. Los resultaron mostraron un promedio muestral de $ 86, 40 y una desviación estándar de $ 37.50. Estimar con un nivel de confianza del 95% de que el intervalo contenga la cantidad promedio real de la población de los gastos en ropa. Se tendría que: ¨ Primer paso: identificar la variable y extraer los datos del problema Variable: __________________ Datos : 28 Inferencia Estadistica 6. Procedimiento para la Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ Segundo paso: utilizar la formula para calcular los intervalos Tercer paso: para obtener el valor de t se utiliza la tabla del anexo 2.La cual tiene las siguientes características: La parte superior de cada columna señala la cola derecha de la distribución t, cada renglón representa un valor particular para grado de libertad.(Ver Figura N°4) En la fila se encuentran los grados de libertad desde 1 hasta infinito. Si como en este caso se ubica con un 95% y 24 grados de libertad. Se observa en la columna /2=0.025, el renglón correspondiente a 24 grados de libertad se tiene como resultado el valor de la cola superior de _____________. Figua N°4 gl Valores distribución t’student .001 1 2 .24 . 29 .01 .025. .05 ...... .10 2.064 29 Inferencia Estadistica 6.Procedimiento para la Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. ¨ ¨ Cuarto paso: una vez ubicado el valor de t, se sustituye en la formula y se calcula el intervalo. Se llega a la conclusión, a un nivel de confianza del 95%, que la cantidad promedio gastada al mes en ropa por las mujeres con tarjetas de créditos esta entre $____________. Esta confianza de 95% en realidad significa que si se selecciona todas las muestras posibles de tamaño 25, el 95% de los intervalos elaborados incluiría la media real de la población en algún lugar dentro del intervalo. 30 Inferencia Estadistica 6. Procedimiento para la Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. a. En el departamento de personal de una compañía grande se quieren estimar los gastos familiares en odontología de sus empleados para determinar la factibilidad de proporcionarles un plan de seguro dental. Una muestra aleatoria de 10 empleados reveló los siguientes gastos durante el año anterior: $110,362,246,85,510,208,173,425,316,179 Se pide: Establezca una estimación de intervalo de confianza del 90% de los gastos promedio familiares en odontología para todos los empleados de la compañía. 1. Identificar la variable y extraer los datos. 2. S Se debe calcular la media muestral y desviación estándar muestral con las siguientes formulas ( Xi X ) n 1 2 31 Inferencia Estadistica 6. Procedimiento para la Estimación De La Media De La Población cuando no se conoce la Desviación Estándar poblacional. 3.Sustituir los valores en la formula. 4.Buscar el valor de t en la tabla 5.Calcular los intervalos de confianza. Interpretación: ________________________________________________________________________ ________________________________________________________________________ ______________________________________________________________________ 32 Inferencia Estadistica 7. Diferencias de las medias poblaciones cuando se conoce 1 y 2. 3. Buscar el valor de z en la tabla 4. Calcular las diferencia entre las medias poblacionales. Interpretación :___________________________________________________________________________ ____________________________________________________________________________ ____________________________________________________________________________ 33 Inferencia Estadistica 8. Diferencias de las medias poblaciones cuando no se conoce 1 y 2. Procederemos a aplicar la formula con un ejercicio. Para una muestra de 50 empresas de una determinada rama industrial se encuentra que el número promedio de empleados por empresa es con S1 = 55.7; existe un total de 380 empresas en esta rama. En una segunda rama industrial que cuenta con 200 empresas, el número promedio de empleados de una muestra de 50 de ellas es de empleados con S2 = 87.9 Estime la diferencia del número promedio de empleados por empresa en ese ramo industrial utilizando un intervalo de confianza del 95%. -Procedimiento: 1. Identificar la variable y extraer los datos. variable datos: 2. Calcular la desviación estándar amalgamada(Sp). . 34 Inferencia Estadistica 8. Diferencias de las medias poblaciones cuando no se conoce 2. 1 y 3.Sustituir los valores en la formula y Buscar el valor de z en la tabla 4. Calcular las diferencia entre las medias poblacionales. Interpretación :___________________________________________________________________________ ____________________________________________________________________________ ____________________________________________________________________________ 35 Inferencia Estadistica 9. Autoevaluación. a. De las siguientes nomenclaturas, especificar el significado de cada una µ:____________________ Β:____________________ S:____________________ :____________________ :____________________ t:_____________________ :____________________ :____________________ Sp:___________________ 1-:__________________ X:___________________ 36 Inferencia Estadistica 9. Autoevaluación. b.Para un determinado producto de consumo popular, el promedio de ventas por tienda fue, el año anterior, en una muestra de n1 = 10 tiendas,un promedio de 3425000 y una desviación estándar 200000. Para un segundo producto, el promedio de ventas por tienda de una muestra de n2 = 12 tiendas, un promedio de 3250000 y una desviación estándar 175000. Se supone que los montos de las ventas por tienda tienen una distribución normal, para ambos productos. Estime la diferencia entre el nivel promedio de ventas por tienda del año anterior utilizando un intervalo de confianza del 98%. Resolver según el procedimiento: 37 Inferencia Estadistica 9. Autoevaluación. c. El diámetro promedio de una muestra de 12 varillas incluidas en un embarque es de 2350 mm, con una desviación estándar de 0.050 mm. Se supone que la distribución de los diámetros de todas las varillas incluidas en el embarque tiene una distribución aproximadamente normal. Determine el intervalo de confianza del 99% para estimar el diámetro promedio de todas las varillas. 38 Inferencia Estadistica 9. Autoevaluación. d. Un analista de un departamento de personal elige al azar los expedientes de 16 trabajadores a destajo y encuentra que el salario promedio por pieza es de Bs. 950. Se supone que los salarios de esta empresa tienen una distribución normal. Si se sabe que la desviación estándar de los salarios es de Bs. 100, estime la tasa promedio de los salarios en la empresa utilizando un intervalo de confianza del 80%. ¿Si un trabajador gana de salario por pieza gana Bs. 1500, se considera normal?. Explique su respuesta. e. Un proceso químico, se comparan dos catalizadores para verificar su efecto en el resultado de la reacción del proceso. Se preparó una muestra de 12 procesos utilizando el catalizador 1 y una de 10 con el catalizador 2. En el primer caso se obtuvo un rendimiento promedio de 85 con una desviación estándar de 4, mientras que el promedio para la segunda muestra fue de 81 y la desviación estándar de 5. Encuentre un intervalo de confianza del 90% para la diferencia entre las medias poblacionales, suponiendo que las poblaciones están distribuidas aproximadamente en forma normal con varianzas iguales. 39 Inferencia Estadistica 9.PRUEBAS DE HIPÓTESIS. DEFINICIÓN La finalidad de la prueba de significación es decidir si una afirmación acerca de un parámetro es verdadera El Propósito de una prueba de Hipótesis es determinar si el valor supuesto (Hipotético) de un parámetro poblacional, como la media de la población debe aceptar como verosímil con base a evidencia muéstrales..(Kazmier, Leonard. 1.996) • El tiempo promedio de un examen es de 80 minutos. 40 Inferencia Estadistica 10.Términos a utilizar en los test de Hipótesis • • Hipótesis Nula: La hipótesis de que el parámetro de la población es igual a las especificaciones investigadas se conoce como hipótesis nula. Es un enunciado que expresa que el parámetro de la población es como se especifica, es decir la proposición es verdadera . (Berenson y Levine,1996:385) Hipótesis Alternativa, es un enunciado que ofrece lo opuesto o una alternativa a la proposición de la hipótesis nula. Representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir que es improbable que la hipótesis nula sea verdadera (Berenson y Levine,1996:385) • Nivel de significación, es la probabilidad de rechazar una hipótesis nula que sea verdadera. Se simboliza con la letra griega . • Valor estadístico de prueba, mide que tan cerca de la hipótesis nula se encuentra el valor de la muestra. Su formulas dependerá de la distribución de probabilidad que se desee aplicar y de la situación si se conoce o no la desviación estándar de la población. 41 Inferencia Estadistica 11. Errores De Tipo I Y II Pueden ocurrir dos tipos de problemas al aplicar el enfoque de la prueba de hipótesis a la toma de decisiones relacionados con los parámetros de la población. (ver Figura Nº6) ¨ Error Tipo I se da cuando se rechaza la hipótesis nula cuando en realidad es cierta, se conoce como α. También denominado nivel de significación. ¨ El error tipo II ocurre cuando no se rechaza la Ho nula siendo falsa y se debería rechazar, se le conoce con la llamada β . El complemento de la probabilidad de un error tipo II se conoce como potencia de una prueba estadística. Es la probabilidad de rechazar la hipótesis nula cuando es falsa. Figura Nº 5 Pruebas de Hipótesis Decisión Estadística Ho Verdadera Ho Falsa Aceptar Ho 1-α Conclusión Correcta Error tipo II probabilidad β Rechazar Ho Error Tipo I Conclusión correcta 42 Inferencia Estadistica 12.Procedimiento Para Realizar Pruebas De Hipótesis de la media poblacional 1. El primer paso constituye en formular la hipótesis nula, en el ámbito general las hipótesis son explicaciones potenciales que intenta información acerca de hechos observados en situaciones que existen algunos factores desconocidos. Esta se puede establecer como: Ho: = o Ho: o Ho: o 2. Establecer la Hipótesis Alternativa, se utiliza para indicar que aspecto de variación no aleatoria resulta de interés. Existen tres tipos posibles: concentrarse en ambas direcciones; concentrarse en desviaciones por debajo del valor esperado; concentrarse en desviaciones por encima del valor esperado. Simbólicamente, se expresaría los tres casos de la siguiente manera: Hi : Hi : Hi : = o (demasiado o muy pocas, prueba bilateral o de dos colas) < o (Desviaciones por debajo, prueba de una sola cola o Unilateral ) > o(Desviaciones por arriba, prueba de una sola cola o Unilateral ). 43 Inferencia Estadistica 12.Procedimiento Para Realizar Pruebas De Hipótesis de la media poblacional 3. El tercer paso, es seleccionar un nivel de significación que sea aceptable que es la probabilidad de rechazar una hipótesis nula que sea verdadera, tambien es conocido como error tipo I. Esto, a su vez, indicara el valor critico correspondiente que servirá como un estándar de comparación respecto al cual juzgar un valor critico de prueba. 4. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo, el trazado dependerá de cómo este formulada la hipótesis alternativa, si es mayo, menor o diferente., quedando dividida en dos regiones. Si por ejemplo la Hipótesis alternativa tiene el signo de menor, el valor critico se trazará en el extremo inferior de la distribución( Ver figura Nº 6) Figura N 6 Regiones de rechazo y no rechazo en una prueba de hipótesis RHo Valor critico No RHo Rho : Región de rechazo o región critica, se considera compuesta por los valores de la prueba estadística que es poco probable que ocurran si la hipótesis nula es cierta. No Rho:Región de no rechazo, si la prueba cae en esta región no se puede rechazar la hipótesis nula hipotético de 44 Inferencia Estadistica 12.Procedimiento de las Prueba De Hipótesis Para La Media, Cuando Se Conoce 5. x. Seleccionar y calcular El Valor Estadístico de Prueba , que dependerá de la distribución de probabilidad que se desee aplicar y de la situación si se conoce o no la desviación estándar de la población. Calcular el valor del estadístico de prueba con los datos muéstrales. V.E.P cuando se conoce z X 0 n V.E.P cuando se no conoce X 0 t S n Si se supone que se conoce la desviación estándar, entonces la distribución muestral de la media seguirá la distribución normal,en esta formula el numerador mide que tan lejos esta la media hipotética x de la media observada X. El denominador es el error estándar, por lo que Z representa los valores estándar de x. 45 Inferencia Estadistica 12.Prueba De Hipótesis Para La Media, Cuando Se Conoce 6. x. Determinar si la prueba estadística ha caído en la región de rechazo o en la de no rechazo y tomar una decisión. Expresar la decisión estadística en términos del problema o investigación. A continuación desarrollaremos un ejercicio, para aplicar el procedimiento expuesto anteriormente: Caso: Supóngase que se desea evaluar la afirmación de un fabricante que establece que sus llantas radiales tienen un promedio de vida de 40.000 millas y una desviación estándar de 3.500 millas, realiza una prueba siendo los resultados los siguientes: una muestra de 49, con un valor de la media muestral de 38.000 millas. Se desea investigar si el tiempo de vida de los neumáticos es mas corto que la media poblacional, a un nivel de confianza del 95%. 46 Inferencia Estadistica 12.Prueba De Hipótesis Para La Media, Cuando Se Conoce x. Procederemos a seguir los pasos de la sección 1. Determinar la variable y los datos • Variable :______________________ • Datos = 1-=0 = X 2. Establecer la Hipótesis nula Ho : 3. Establecer la Hipótesis alternativa Hi : 47 Inferencia Estadistica 12.Procedimiento Para Realizar Pruebas De Hipótesis de la media poblacional 4. 5. El tercer paso, es seleccionar un nivel de significación 1 - = siendo = Como se conoce la desviación estándar poblacional, se utiliza la distribución normal para conseguir el valor critico. El valor de Z 1 – en una cola se ubica dentro de la tabla del anexo Nº1. El valor Z es la cual representa el valor de la tabla. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo. Su trazado dependerá de cómo este planteada la hipótesis alternativa: Si es menor, el valor critico estará en la zona negativa; Si es mayor, se marcara en la zona positiva y si es diferente existirán dos valores cítricos uno en la zona negativa y otro en la zona positiva. Regiones de rechazo y no rechazo en una prueba de hipótesis 6. Se selecciona y calcula el Valor estadística de prueba cuando se conoce la desviación estándar poblacional comparándolo con los valores críticos de la distribución de muestreo para determinar si cae o no en la región de rechazo. Sustituyendo los valores z x 0 n En qué región cae el V.E.P? 48 Inferencia Estadistica 12.Procedimiento Para Realizar Pruebas De Hipótesis de la media poblacional Si [Valor estadístico de prueba < valor critico] Rho Si Zprueba < Z 1- Rho Sustituyendo Se toma la decisión de la prueba de hipótesis. Si la estadística cae en la región de no rechazo, no se puede rechazar la Ho y viceversa. En este caso se rechaza la hipótesis nula. Conclusión : De este modo se concluye que el promedio de vida útil de las llantas es _____________________, a un nivel de significación del 5%. 49 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblaciona Prueba De Hipótesis Para La Media, Desconocida x. En la mayor parte de los casos se desconoce la desviación estándar de la población, se estima la desviación estándar muestral (S). La prueba estadística para determinar la diferencia entre la media de la muestra y la media de la población x cuando se usa S se obtiene mediante: X 0 t S n El procedimiento aplicado es igual al anterior descrito, con la diferencia que la distribución utilizada es la t’student, explicada enteriormente. Indique las características de la Distribución t’student: __________________________________ __________________________________ __________________________________ 50 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblaciona Consideremos el siguiente caso, Para una muestra de 60 mujeres, tomadas de una población de más de 5000 inscritas en un programa de reducción de peso en una cadena nacional de balnearios de aguas termales, la presión sanguínea diastólica media de la muestra es de 101 y la desviación estándar es de 42. A un nivel de significación de 0.02 ¿Puede concluir que, en promedio, las mujeres inscritas en el programa tienen una presión diastólica que excede el valor de 75 recomendado por diversas sociedades médicas?. 1. • • Determinar la variable y los datos Variable : Datos = 1-= S= n= 2. Establecer la Hipótesis nula Ho : X 3. Establecer la Hipótesis alternativa Como se hace referencia a valores por debajo de la media , se expresa así: Hi : 51 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblaciona 4. Seleccionar un nivel de significación 1 - = siendo = = _______ , t = Como no se conoce la desviación estándar poblacional, se utiliza la distribución t para conseguir el valor critico. El valor de t , la cual se ubica en la tabla del anexo Nº 2. El valor que se intercepta con los grados de libertad _______ representa el valor de tabla. 5. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo. (Ver figura Nº7) Figura N º 7 Regiones de rechazo y no rechazo en una prueba de hipótesis 6. Se selecciona y calcula el Valor estadística de prueba cuando se no conoce la desviación estándar poblacional comparándolo con los valores críticos de la distribución de muestreo para determinar si cae o no en la región de rechazo. Sustituyendo los valores x 0 t s n 0 1.711 Dónde cae el V.E.P? 52 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblacional Si [Valor estadístico de prueba < valor critico] Rho Si t > t (n-1, ) RHo Se toma la decisión de la prueba de hipótesis. Si la estadística cae en la región de no rechazo, no se puede rechazar la Ho y viceversa. En este caso se rechaza la hipótesis nula. Conclusión : A un nivel de significación del ___ , ___ ___________________ ___, de este modo se concluye que el promedio de vida útil de las llantas 53 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblacional a. Para una muestra de 60 mujeres, tomadas de una población de más de 5000 inscritas en un programa de reducción de peso en una cadena nacional de balnearios de aguas termales, la presión sanguínea diastólica media de la muestra es de 101 y la desviación estándar es de 42. A un nivel de significación de 0.02 ¿Puede concluir que, en promedio, las mujeres inscritas en el programa tienen una presión diastólica que excede el valor de 75 recomendado por diversas sociedades médicas?. Procedimiento 1. Determinar la variable y los datos • Variable : _____________________ • Datos = 1-= S= n= 2. Establecer la Hipótesis nula Ho : 3. Establecer la Hipótesis alternativa : Hi : 54 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblacional 4. El tercer paso, es seleccionar un nivel de significación 1 - = siendo = t(n-1; )= 5. El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo. 6. Se selecciona y calcula el Valor estadística de prueba cuando se no conoce la desviación estándar poblacional comparándolo con los valores críticos de la distribución de muestreo para determinar si cae o no en la región de rechazo Sustituyendo los valores Regiones de rechazo y no rechazo en una prueba de hipótesis Dónde cae el V.E.P? 0 55 Inferencia Estadistica 13.Pruebas De Hipótesis de la media poblacional Desconocida la Desviación Estandar Poblacional Si [Valor estadístico de prueba valor critico] Rho Si t • t (n-1, ) RHo Se toma la decisión de la prueba de hipótesis. Si la estadística cae en la región de no rechazo, no se puede rechazar la Ho y viceversa. En este caso se rechaza la hipótesis nula. Conclusión : 56 Inferencia Estadistica 14.Formula de Pruebas de Hipótesis de la Media a utilizar de acuerdo a la Población y Tamaño de la muestra Población Tamaño de Muestra Con Distribución Normal Grande(n30) Pequeña(n<30) conocida z desconocida x 0 t z n x 0 t n Sin Distribución Normal Grande(n30) z x 0 n Pequeña(n<30) x 0 S n * o z x 0 * n x 0 S n x 0 t * S n z o x 0 n Se usaria pruebas no paramétricas **Se aplica el teorema de límite central Fuente : kazmier (1996) 57 * Inferencia Estadistica BIBLIOGRAFÍA ANDERSON, David; Sweeney, Dennis y otros. (1.990) Estadistica para Adiministación y Económia. International Thomson Editores BERENSON, M. y LEVINE, D. (1996). Estadística básica en administración. México. Prentice Hall. ELSTON, ROBERT C. Y JHONSON, WILLIAM. (1987). Principios de bioestadística. México.Editorial el Manual Moderno, S.A.. DOWNI, N.M. (1973). Métodos estadísticos aplicados .México. Editorial Harla. KAZMIER , L. (1998). Estadística aplicada a la administración y economía. México. Mc Graw Hill. LEVIN,RICHAR. y RUBIN DAVID(1.996). Estadística para administradores. Prentice Hall editorial . STEVENSON, WILLIAM. Estadística para administracion y economía. Ediciones Karla. 58 Inferencia Estadistica - ANEXOS ANEXO No.1 TABLA Z de Distribución Normal ANEXO No.2 TABLA DE t’Student 59