Download Práctica 4 CONTRASTE DE HIPÓTESIS
Document related concepts
Transcript
AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS 1. Objetivos: a) Calcular los parámetros de la distribución de medias o proporciones muestrales de tamaño n, extraídas de una población de media y varianza conocidas. b) Calcular el intervalo de confianza para la media con varianza conocida y desconocida. c) Hallar el intervalo de confianza para la varianza con media desconocida. d) Calcular el intervalo de confianza para la diferencia de medias con varianzas conocidas y desconocidas pero iguales. e) Utilizar distintos tamaños muestrales para controlar el nivel de confianza y el error máximo admitido. 2. Introducción a los contrastes de hipótesis: Partimos de una población de la que estudiamos una característica mediante una v.a. X de la que conocemos su función de distribución F(x; θ ) salvo un parámetro “ θ ”. Planteamos cierta hipótesis sobre el verdadero valor del parámetro θ ∈ Ω . A continuación extraemos una m.a.s. de la v.a. X y, a partir de ella, aceptamos o rechazamos la hipótesis planteada usando el criterio del contraste adecuado. Por tanto, podemos definir un test o contraste de hipótesis como una regla o procedimiento que nos permite aceptar o rechazar una hipótesis planteada sobre el parámetro desconocido mediante una muestra aleatoria simple de la población. 3. Elementos que intervienen en un contraste de hipótesis ¾ Hipótesis Nula : es lo que queremos verificar. Se representa por Ho. ¾ Hipótesis Alternativa: es lo contrario a lo que queremos comprobar. Se representa por H1. ¾ Región de aceptación: conjunto de realizaciones muestrales para las que aceptamos la hipótesis nula H0. ¾ Región de rechazo: conjunto de realizaciones muestrales para las que rechazamos la hipótesis nula H0. ¾ De forma general todo contraste de hipótesis lo podemos expresar de la forma: Ω o ∪ Ω1 = Ω H O :θ ∈ ΩO donde Ω o ∩ Ω1 = Φ H 1 : θ ∈ Ω1 3.1. Tipos de contrastes de hipótesis a) H o : θ = θ o Bilaterales o de dos colas: . H 1 : θ ≠ θ o siendo α = nivel de significación y 1-α = nivel de confianza. 1 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS b) H o : θ ≤ θ o Unilateral derecho o de una cola: . H 1 : θ > θ o siendo α = nivel de significación y 1-α = nivel de confianza. c) H o : θ ≥ θ o Unilateral izquierdo o de una cola: . H 1 : θ < θ o siendo α = nivel de significación y 1-α = nivel de confianza. 4. Pasos para resolver un contraste de hipótesis a) Plantear las hipótesis: Bilateral o unilateral b) Elección del estadístico adecuado al contraste: Se calcula el valor del estadístico en una realización muestral. X −µ Para contraste de media con varianza conocida se usa Z = ≡ N (0;1) . σ c) Cálculo de la región de aceptación: depende del tipo de contraste y del tipo de estadístico. d) Verificación: comprobar si el estadístico pertenece a la región de aceptación. e) Decisión: aceptamos o rechazamos H0. 5. Tipos de errores A partir de la información contenida en una muestra observada de la v.a. X, podemos ACEPTAR O RECHAZAR Ho. Se pueden cometer dos tipos de errores: El tratamiento de ambos errores no es el mismo, es decir, un error tiene más importancia que el otro. El ejemplo típico es el de un juicio, donde: H0: El acusado es inocente H1 : El acusado es culpable 2 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS α =ERROR tipo I = P( RHo | siendo verdadera)=P( condenar siendo inocente) β = ERROR tipo II = P( Aceptar Ho | siendo falsa) = P ( absolver siendo culpable) El test óptimo sería aquel en el que no puede cometerse ningún error, es decir, α= β . Para n fijo, cuando aumenta α disminuye β . Por ello, en general, no es posible obtener el test óptimo. El número α, llamado nivel de significación, puede fijarse dependiendo de la importancia que le demos al error tipo I. Los valores más comunes son α =0.1,0.05,0.01 y 0.001. α indica la fuerza con la que se rechaza Ho, pudiéndose fijar el valor que se quiera. Así, si rechazamos Ho para α =0.1 será menos significativo que si rechazamos Ho para a =0.001.Recíprocamente, si α =0.001 es más fácil que aceptemos Ho (por ser fuerza de rechazo menor) que si α =0.1. Por tanto, la aceptación de la hipótesis nula no debe verse como una demostración de que ésta es cierta, sino como que “ no se dispone de pruebas suficientes que demuestren su falsedad”. En el caso del juicio, si se declara culpable al acusado debe hacerse con una probabilidad pequeña de error tipo I, que nosotros fijamos de antemano, mientras que si es declarado inocente , esto no quiere decir que hayamos probado su inocencia sino que no se ha podido probar su culpabilidad. 6. Contrastes de hipótesis en poblaciones normales N(µ , σ) Para una muestra de tamaño n y un nivel de confianza 1- α 6.1. Contraste de hipótesis para µ conocida σ Η0 Η1 µ ≤µ0 µ >µ0 µ ≥µ0 µ <µ0 µ =µ0 µ ≠µ0 ESTIMADOR Z= X−µ σ ≡ N (0;1) n RECHAZAR H0 SI: Ζ > Ζα Ζ < −Ζα Ζ > Ζα/2 ó Ζ < −Ζα/2 6.2. Contraste de hipótesis para µ desconocida σ Η0 Η1 µ ≤µ0 µ >µ0 µ ≥µ0 µ <µ0 µ =µ0 µ ≠µ0 ESTIMADOR: t= X−µ → t n −1 s n −1 RECHAZAR H0 SI: t > t n-1,α t < −tn-1, α t > t n-1,α/2 ó t < −tn-1, α/2 3 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS 6.3. Contraste de hipótesis para σ2 conocida µ Η0 Η1 σ ≤σ0 σ >σ0 σ ≥σ0 σ <σ0 σ =σ0 σ ≠σ0 ESTIMADOR: ∑ (X X = − µ) I RECHAZAR H0 SI: X > X2 n,α 2 ≡ℵ σ 02 2 n X < X2 n,α X > X2 n,α/2 ó X < X2 n,1-α/2 6.4. Contraste de hipótesis para σ2 desconocida µ Η0 Η1 σ ≤σ0 σ >σ0 σ ≥σ0 σ <σ0 σ =σ0 σ ≠σ0 ESTIMADOR: ∑ (X X= I −X ) RECHAZAR H0 SI: X > X2 n-1,α 2 σ 02 ≡ℵ 2 n −1 X < X2 n-1,α X > X2 n-1,α/2 ó X < X2 n-1,1-α/2 6.5. Intervalo de confianza para µ1−µ2 conocidas σ1, σ2 Η0 Η1 µ1 − µ2 =δ ≤ δ0 µ1 − µ2 =δ > δ0 µ1 − µ2 =δ ≥ δ0 µ1 − µ2 =δ < δ0 µ1 − µ2 =δ = δ0 µ1 − µ2 =δ ≠ δ0 ESTIMADOR Z= (X − Y ) − δ σ 12 n + σ 22 0 RECHAZAR H0 SI: Ζ > Ζα ≡ N (0;1) m Ζ < −Ζα Ζ > Ζα/2 ó Ζ < −Ζα/2 6.6. Intervalo de confianza para µ1−µ2 desconocidas (σ1, σ2) pero iguales ( σ1, =σ2 ) Η0 Η1 µ1 − µ2 =δ ≤ δ0 µ1 − µ2 =δ > δ0 µ1 − µ2 =δ ≥ δ0 µ1 − µ2 =δ < δ0 µ1 − µ2 =δ = δ0 µ1 − µ2 =δ ≠ δ0 ESTIMADOR t= (X − Y ) − δ 0 ns12 + ms22 nm(n + m − 2) n+m RECHAZAR H0 SI: ≡ tn+ m−2 t > t n+m-2,α t < −tn+m-2, α t > t n+m-2,α/2 ó t < −tn+m-2,α/2 4 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS 7. Contraste de hipótesis usando EXCEL: 7.1. Inversa de la Función de distribución Normal =DISTR.NORM.INV(probabilidad;media;desv_estándar) Devuelve el inverso de la distribución acumulativa normal para la media y desviación estándar especificadas. ¾ Sintaxis DISTR.NORM.INV(probabilidad;media;desv_estándar) Probabilidad es una probabilidad correspondiente a la distribución normal. Media es la media de la distribución. Desv_estándar es la desviación típica de la distribución. ¾ Ejemplo Datos Descripción A2 = 0,908789 Probabilidad correspondiente a la distribución normal A3 = 40 Media de la distribución A4 =1,5 Desviación típica de la distribución Fórmula Descripción (Resultado) =DISTR.NORM.INV(A2;A3;A4) Inversa de la Función de distribución normal: 7.2. Inversa de la función de distribución de una Chi-cuadrado = PRUEBA.CHI.INV(probabilidad;grados_de_libertad) Devuelve, para una probabilidad dada, el valor de la variable aleatoria siguiendo una distribución chi cuadrado. Si el argumento probabilidad = DISTR.CHI(x;...), entonces PRUEBA.CHI.INV(probabilidad,...) = x. ¾ Sintaxis PRUEBA.CHI.INV(probabilidad;grados_de_libertad) Probabilidad es una probabilidad asociada a la distribución chi cuadrado. Grados_de_libertad es el número de grados de libertad. ¾ Ejemplo: en la práctica2. 5 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS 7.3. Inversa de la función de distribución de una t de Student Devuelve el valor t de la distribución t de Student como función de la probabilidad y los grados de libertad. ¾ Sintaxis =DISTR.T.INV(probabilidad;grados_de_libertad) Probabilidad es el nivel de significación α (dos colas) y 2*α ( 1 cola) Grados_de_libertad es el número de grados de libertad de la distribución. ¾ Observaciones Puede calcularse un valor t de una cola reemplazando probabilidad por 2*probabilidad. Para una nivel de significación de 0,05 y grados de libertad de 10, el valor de dos colas se calcula con DISTR.T.INV(0,05;10), que devuelve 2,28139. El valor de una cola para la misma probabilidad y los mismos grados de libertad puede calcularse con DISTR.T.INV(2*0,05;10), que devuelve 1,812462. ¾ Ejemplo Datos Descripción A2= 0,054645 = α Nivel de significación para t de Student de dos colas. A3 = 60 Grados de libertad Fórmula Descripción (Resultado) =DISTR.T.INV(A2;A3) Valor t α =1,959997462 2 6 AMPLIACIÓN DE ESTADÍSTICA Departamento de Métodos Cuantitativos e Informáticos Práctica 4 CONTRASTE DE HIPÓTESIS 8. Caso práctico 8.1. Contraste de hipótesis en una población Normal : 8.1.1. Crea una hoja de cálculo (HOJA1) mediante la cual se pueda realizar cualquier contraste de hipótesis (unilateral o bilateral) para la media de un población con varianza conocida. Utilizando la HOJA1 resuelve el siguiente problema: Un exportador de tomates empaqueta cajas que en término medio deben pesar 2 kg. Con una desviación típica de 0,15 kg. Reciente se ha producido una avería en la máquina de empaquetado que hace pensar que el peso medio ha podido cambiar. Para verificarlo se extrae una m.a..s. de pesos recogida en la HOJA 1. Suponiendo que la distribución de pesos sigue una distribución normal, se pide: i. Contrastar si el peso medio es igual, mayor o igual, o menor o igual que 2 kg al nivel de confianza del 90%, 95% y 99%. ii. Repetir el apartado anterior para 2,25 kg. 8.1.2. Crea una hoja de cálculo (HOJA2) mediante la cual se pueda realizar cualquier contraste de hipótesis (unilateral o bilateral) para la media de una población con varianza desconocida. Utilizando la HOJA 2 resuelve el siguiente problema: Una revista de gastronomía desea calificar los restaurantes de los restaurantes una región según la puntuación que recibe por parte de los usuarios. El baremo utilizado es el siguiente: Media Clasificación ≥ 7,5 Tres tenedores 5 ≤ µ < 7,5 Dos tenedores µ <5 Un tenedor Para evaluar un restaurante en particular se han recogido las puntuaciones que aparecen en la HOJA 2. Suponiendo que las puntuaciones siguen una distribución Normal, determine cuál es la clasificación de este restaurante con un nivel del confianza del 99%. 8.1.3. Crea una hoja de cálculo (HOJA3) mediante la cual se pueda resolver cualquier contraste de hipótesis (unilateral o bilateral) para la diferencia de medias con varianzas desconocidas pero iguales. Utilizando la HOJA 3 resuelve el siguiente problema: Una empresa de muebles puede acudir a dos proveedores de madera, A y B. Conservará al proveedor A si la media de su tiempo de entrega es igual o menor que del proveedor B y se supone que las varianzas son iguales. El proveedor B afirma que ha incorporado una nueva tecnología que reduce su tiempo de entrega medio sin alterar la varianza. La empresa decide simultanear sus pedidos a cada proveedor y obtiene los tiempos de entrega recogidos en la HOJA 3. Sabiendo que los tiempos de entrega se distribuyen según una normal y de acuerdo con los datos maestrales, ¿debería la empresa cambiar de proveedor al nivel 1% y 5%? 7