Download Document

Document related concepts
no text concepts found
Transcript
12. Contraste de hipótesis
"Es una verdad muy cierta que, cuando no esté a
nuestro alcance determinar lo que es verdad,
deberemos seguir lo que es más probable".
Descartes, en su Discurso del Método
1
Contraste de hipótesis:
¿Qué es una hipótesis estadística?
• Es una conjetura o creencia acerca de una o
varias poblaciones. Normalmente en referencia
a sus parámetros: la media, la varianza o una
proporción, por ejemplo.
• Si queremos contrastarla, debe establecerse
antes del análisis. Después se utilizan los
datos de las muestras para obtener evidencias
que confirmen o no la hipótesis propuesta.
2
Veamos un ejemplo:
El efecto "Mozart vs. El Fari":
Se sospecha que los individuos
rinden más en un test de
inteligencia tras escuchar música
de Mozart que cuando han
escuchado música de El Fari.
Hipótesis científica: Escuchar la música de Mozart tiene
un efecto sobre el CI diferente al de la música de El Fari.
Experimento: De la población española seleccionamos
20 niños al azar en dos grupos de 10. Un grupo
escuchará Mozart antes de hacer el test de CI. El otro
escuchará a El Fari. Después de realizar los test, se
calculan las medias y cuasivarianzas en cada uno de los
dos grupos.
3
Supongamos que la media del CI del grupo de
Mozart fue 110 con cuasivarianza = 100, mientras
que la media del grupo de El Fari fue de 102
y cuasivarianza = 64.
Entonces: ¿Podemos decir que hay diferencias
a nivel poblacional entre ambos grupos?
Para tomar tal decisión necesitaremos plantear
DOS hipótesis estadísticas:
4
Hipótesis estadísticas:
-Hipótesis nula. Es la que proporciona la solución "más
sencilla". En nuestro ejemplo sería que la media
poblacional de ambos grupos es la misma. Es decir,
que no hay un efecto de la música sobre el CI.
H 0: µ 1 = µ 2
-Hipótesis alternativa. Es la hipótesis complementaria (y
"más compleja"). En nuestro caso sería que la media
poblacional de ambos grupos es diferente. Es decir,
que hay un efecto de la música sobre el CI.
H 1: µ 1 ≠ µ 2
¿Cómo decidimos
entre ambas hipótesis?
Veamos otros ejemplos.5
Otro ejemplo:
Sometamos a la reina de
Inglaterra al siguiente
experimento:
Se le presentan 8 tazas de té
con leche, idénticas en su
aspecto. En 4 de ellas la
leche se añadió a la taza
con anterioridad al té. Y en
las 4 restantes, se añadió la
leche después.
La reina las prueba y
dictamina, acertadamente,
las tazas en las que se
sirvió primero la leche.
¿Chiripa?
6
¿Cuántas posibilidades había?
La reina debía escoger 4 tazas de las 8. Sin tener
en cuenta el orden tenía 70 posibilidades distintas
(Combinaciones de 8 elementos tomados de 4 en 4).
Si supusiéramos que respondió al azar, su probabilidad
de acertar hubiera sido de 1/70.
¿Cuáles son aquí las hipótesis estadísticas?
-Hipótesis nula: La reina acertó por chiripa.
H0: p = 1/70
-Hipótesis alternativa: La reina tiene un paladar
sobrenatural.
H1: p ≠ 1/70
7
Parece razonable en este caso rechazar la
hipótesis nula.
¿Por qué nos parece razonable rechazarla?
Hemos supuesto que la reina juzgaba al azar
(hipótesis nula). Por tanto hemos supuesto una
distribución de probabilidad : cualquier
combinación de las cuatro tazas tenía la misma
probabilidad de ser elegida: p = 1/70
(una distribución uniforme).
Con esa distribución la reina tenía 69/70 de
probabilidad de no acertar. Y sin embargo la reina
acertó…
8
“The title comes from the "lady tasting tea", an
example from the famous book, The Design of
Experiments, by Ronald A. Fisher”.
Wikipedia
Otro ejemplo más (lo tenéis en detalle en el libro
de Marta y Jose):
Pasados 2 años cierta vacuna solo es eficaz en un
25% de los casos.
Se experimenta con una nueva vacuna que tal vez
prolongue la eficacia.
Se inyecta a 20 sujetos experimentales.
Si más de 8 sujetos superan el periodo de dos años
sin contraer el virus, la nueva vacuna se considera
mejor que la anterior.
El número 8 es un tanto arbitrario, pero parece
razonable teniendo en cuenta que esperaríamos
5 casos para la vacuna anterior.
10
¿Quién es H0?
• Hipótesis nula H0 : ambas vacunas son iguales.
• Hipótesis alternativa H1: la nueva vacuna es mejor.
Con la vacuna antigua cada paciente tiene una
probabilidad p = 1/4 de no contraer la enfermedad
pasados 2 años.
H0: p = 1/4 y H1: p > 1/4
¿Podemos rechazar la hipótesis nula, que las dos
vacunas son igualmente eficaces?
El estadístico de prueba es X = número de individuos
de la prueba que reciben protección contra el
virus más allá de dos años. Y se distribuye como
11
X = B(20, p).
Dividiremos los posibles valores de X (de 0 a 20) en
dos grupos:
(1) Menores o iguales a 8 (Región de aceptación).
(2) Mayores a 8 (Región crítica o de rechazo).
8 es el valor crítico en este caso.
Si x es el número de pacientes experimentales que
no se han infectado después de 2 años, entonces:
Si x > 8 rechazamos H0 a favor de la hipótesis
alternativa H1. Si x ≤ 8, se acepta H0.
12
El procedimiento descrito nos puede conducir
a las siguientes conclusiones erróneas:
(1) La nueva vacuna realmente no es mejor
que la antigua (hemos rechazado la hipótesis
nula y cometido un error de tipo I ).
(2) Concluimos que la nueva vacuna no es mejor
que la anterior, cuando realmente sí lo es (hemos
aceptado la hipótesis nula y cometido un error
de tipo I I ).
13
La probabilidad de cometer un error de tipo I
se llama nivel de significación o tamaño de la
región crítica y se representa por α.
En nuestro ejemplo:
α = P(error de tipo I) = P(Rechazar H 0 | H 0 es cierta ) =
 20  1   3 
P( X > 8 | p = 1 / 4) = ∑     
x =9  x  4   4 
20
x
20 − x
= 0.0409
Se dice que la hipótesis nula, p = 1/4, se está
probando con un nivel de significación de
α = 0.0409. Nivel de significación bastante
pequeño, por tanto poco probable que hayamos
cometido un error de tipo I.
14
La probabilidad de cometer un error de tipo II
se representa por β. Sólo podemos calcularla
si tenemos una hipótesis alternativa “concreta”.
Por ejemplo en nuestro caso podíamos haber
tomado como hipótesis alternativa: p = 0.5.
En nuestro ejemplo:
β = P(error de tipo II) = P( Aceptar H 0 | H 0 es falsa ) =
 20  1   1 
P( X ≤ 8 | p = 1 / 2) = ∑     
x = 0  x  2   2 
8
x
20− x
= 0.2517
15
16
17
Contraste de hipótesis:
Los tres pasos básicos para contrastar una
hipótesis serán:
1- Formular dos hipótesis H0 y H1.
2- Derivar un estadístico de contraste a partir
de la muestra de observaciones e identificar su
distribución muestral bajo la hipótesis nula.
3- Derivar una regla de decisión y elegir una de
las dos hipótesis en base a la evidencia de una
muestra. Una regla de decisión que selecciona
una de las dos sentencias siguientes:
“rechace H0” o “no rechace H0”.
18
Contrastes para la media de una población
Población normal
(o n > 30) y σ conocida.
Hipótesis bilateral
Ho: µ = µ0
Estadístico:
H1: µ ≠ µ0
x−µ
z=
σ n
Si la media muestral está
fuera de este intervalo
rechazamos H0. No
rechazamos H0 en caso
contrario.
1-α
Región de aceptación
+ zα/2
- zα/2
x − µ0


P − zα / 2 <
< zα / 2  = 1 − α
σ/ n


Región de aceptación.
σ
σ


zα / 2 , µ 0 +
zα / 2 
 µ0 −
n
n


19
Ejemplo: Sea una población normal con σ2 = 20
µ0 = 30, n = 10 , x = 27 y α = 0.05.
• Hipótesis: H o : μ = 30 y H1 : μ ≠ 30
• Estadístico y distribución: z = x − µ ≡ N (0,1)
σ n
x−µ


P − zα / 2 <
< zα / 2  = 0.95
σ/ n


Para calcular intervalo de confianza:
σ
σ


P x −
zα / 2 < µ < x +
zα / 2  = 0.95
n
n


α/2 = 0.025
- zα/2
1 - α = 0.95
α/2 = 0.025
+ zα/2
Conociendo el tamaño
de la muestra, la
desviación poblacional
y la media muestral,
podemos determinar un
intervalo de confianza al
20
95%.
Valor crítico del estadístico de prueba: Se
busca en la tabla z, y nos preguntamos qué
valor de z tiene una probabilidad igual a α/2 =
0.025 y resulta ser z = -1.96.
α/2 = 0.025
- 1.96
1 - α = 0.95
α/2 = 0.025
+ 1.96
21
Pero ahora estamos haciendo una
hipótesis: que la media poblacional
es µ0 = 30, e intentando
contrastarla a partir de la media
muestral que es 27.
Regla de decisión:
Ho se rechaza si z cae en la
zona de rechazo (fuera de la
zona de aceptación), utilizando
α = 0.05 (error de tipo I) que
está dividida en dos partes
iguales (α/2 = 0.025).
27 − 30
−3
z=
=
= −2.12
20 / 10 1.4142
Región de aceptación
1 - α = 0.95
- 1.96
+ 1.96
- 2.12
Decisión estadística: Se puede rechazar Ho porque -2.12 está en la
región de rechazo con un nivel de significación de α = 0.05.
Conclusión: Se concluye que µ no igual a 30.
22
HIPOTESIS A
CONTRASTAR
Se definen:
 medida de discrepancia con una
distribución de probabilidad conocida
 Regla de decisión(nivel de significación α)
datos de la muestra
 Valor crítico o tabulado
Se comparan los valores
calculado con tabulado
Se calcula una medida
de discrepancia
Valor calculado
¿se rechaza
Ho?
H1
SI
NO
Se extraen conclusiones
Contrastes para la media de una población
Población normal (o n
> 30) y σ conocida.
Hipótesis unilateral
por la izquierda.
Ho: µ = µ0
H1: µ < µ0
Estadístico
x−µ
zc =
σ n
1-α
- zα

 x − µ0
P
> − zα  = 1 − α

σ / n
Región de aceptación:
Si la media muestral está fuera de
este intervalo, rechazamos H0.
Aceptamos H0 en caso contrario.
σ


zα , + ∞ 
 µ0 −
n


24
• Los datos y suposiciones se mantienen.
• Hipótesis:
H o : μ ≥ 30 y H a : μ < 30
(hipótesis nula e hipótesis alternativa)
• Cálculo del estadístico de prueba:
x − µ 0 27 − 30
z=
=
= −2.12
σ/ n
20 / 10
• Regla de decisión: Si el zcalc cae en la zona de rechazo
se rechaza Ho. Como es una prueba de una cola o
unilateral, se busca en la tabla qué valor de z tiene una
probabilidad de 0.05 y es igual a -1.645.
• Decisión estadística y conclusión: Como -2.12 es menor
que -1.645 se rechaza Ho y se concluye que la media de la
25
población es menor de 30.
Región crítica y nivel de significación
Región crítica
• Valores ‘improbables’ si...
• Es conocida antes de realizar el
experimento: resultados
experimentales que refutarían H0
Nivel de significación: α
• Número pequeño: 1% , 5%, ...
• Fijado de antemano por el
investigador
• Es la probabilidad de rechazar H0
cuando es cierta
α=5%
Reg. Crit.
Reg. Crit.
No rechazo H0
Η0: µ = 40
26
Contrastes: unilateral y bilateral
La posición de la región crítica depende de la hipótesis alternativa
Bilateral
H1: µ ≠ 40
Unilateral
Unilateral
H1: µ < 40
H1: µ > 40
27
La variable aleatoria poblacional X de nuestro interés es la duración
de un componente. Esta variable se distribuye en la población como
una exponencial: X = Exp(λ).
(a) Nos piden como contraste de hipótesis:
H0: µ=300
H1: µ<300
Disponemos de una muestra de n = 100 elementos. Para cada componente
se ha medido su duración: {x1, x2, ... , x100}. Y sabemos que la media
muestral, que la vida media de los 100 componentes es:
100
x=
1
xi = 260
∑
100 i =1
Usaremos como estimador a la media muestral:
1 n
x = ∑ xi
n i =1
Recuerda que es una variable aleatoria, de la que nosotros disponemos
de un valor particular: el que nos da nuestra muestra.
¿Qué distribución tiene nuestro estimador?
El de la suma de 100 variables aleatorias distribuidas exponencialmente.
En principio sería una Erlang, pero puesto que el número de variables
es mayor que 30, podemos utilizar una aproximación normal:
(
x ≡ N µ ,σ / n
)
Observa que para el caso particular de la exponencial, la media coincide
con la desviación típica y podemos escribir:
(
x ≡ N µ, µ / n
)
Tipifiquemos el estimador para que se distribuya como una N(0,1):
x−µ
z=
≡ N (0,1)
µ n
29
Región
crítica
α
Región de
aceptación
1-α
z=
x−µ
≡ N (0,1)
µ n
a = 250.65
α = 0.05 = P (Rechazar H 0 | H 0 cierta) =
a − 300 

= P ( x ≤ a | µ = 300) = P z ≤
 = 0.05
300 / 100 

a − 300
zcrit =
= −1.645 ⇒ a = 250.65
300 / 100
x = 260 > 250.65 ⇒ x ∈ Región de aceptación
⇒ No rechazamos H 0
30
Si en realidad µ = 250 y la hipótesis nula es que µ = 300,
"detectarlo" supondría rechazar la hipótesis:
P(Rechazar H 0 | µ = 250) = P( x ≤ a | µ = 250) =
250.65 − 250 

= P z ≤
 = P(z ≤ 0.03) = 0.512
250 / 100 

Si queremos elevar esta última probabilidad hasta el 70%:

b − 250 

µ
µ
0
.
70
(
Rechazar
H
|
250
)
(
|
250
)
P
P
=
=
=
x
≤
b
=
P
z
=
≤


0

250 / n 



0.05 = P(Rechazar H | µ = 300) = P( x ≤ b | µ = 300) = P z ≤ b − 300 
0

300 / n 

 b − 250
 250 / n = 0.525
⇒ n = 156.125 ≈ 157

 b − 300 = −1.645
31
 300 / n
La variable aleatoria poblacional X de nuestro interés es el número de
accidentes de tráfico en una semana. Esta variable se distribuye en la
población como una poisson: X = P(λ=2.5).
(a) Nos piden como contraste de hipótesis:
H0: λ=10 (reducir el límite de velocidad no influye)
H1: λ<10 (reducir el límite de velocidad disminuye el número de accidentes)
Pero observa que contrastaremos las hipótesis con la variable aleatoria
Y = número de accidentes en cuatro semanas
32
0.1 ≥ P(Rechazar H 0 | H 0 cierta ) =



Error tipo I
a
= P(Y ≤ a | λ = 10) = ∑ e −λ
x =0
λx
x! λ =10
Mirando en las tablas encontramos que a = 5. Si el número de accidentes
observado en las cuatro semanas es menor o igual que 5, entonces
rechazamos H0.
Si el número de accidentes disminuyó a 2 por semana, entonces
disminuyó a 8 accidentes por cada cuatro semanas
P(Rechazar H1 | λ = 8) =


Error tipo II
= P(Y > 5 | λ = 8) = 1 − P(Y ≤ 5 | λ = 8) =
5
= 1 − ∑ e −λ
x =0
λx
x! λ =8
= 1 − 0.19 = 0.81
33
Ejemplo: Se tiene interés en la rapidez de combustión de un agente
propulsor para los sistemas de salida de emergencia en aeronaves.
Esta rapidez es una variable aleatoria con alguna distribución de
probabilidad. Especialmente interesa decidir si la rapidez de
combustión promedio, que es un parámetro µ de dicha
distribución es o no 50 cm/seg.
Hipótesis Nula:
Hipótesis Alternativa:
Región Crítica
Se acepta H1
µ ≠ 50
H0: µ = 50 cm/seg
H1: µ ≠ 50 cm/seg
Región de aceptación
Se acepta H0
µ = 50
48.5
50
Valores Críticos
Región Crítica
Se acepta H1
µ ≠ 50
51.5
Condición real
H0 verdadera
H0 falsa
Rechazar H0
Error Tipo I
ok
Aceptar H0
ok
Error Tipo II
Decisión
α = P(error Tipo I)= P(rechazar H0 | H0 es verdadera)
Si calculamos α para el ejemplo de la rapidez de combustión
para una muestra de n = 10 datos, suponiendo que σ = 2.5
cm/seg, obtenemos:
α = P( x caiga en la región crítica | µ = 50 )=
= P( x < 48.5) + P( x > 51.5) = 0,0576
Esto significa que el 5,76% de las muestras de tamaño 10
conducirán al rechazo de la Hipótesis H0: µ = 50 cm/seg,
cuando ésta es verdadera.
β = P(error Tipo II) = P(aceptar H0 | H0 es falsa)
Recordemos que no es posible calcular β si no se tiene una hipótesis alternativa
específica, es decir, un valor particular del parámetro bajo prueba en lugar de un
rango de valores.
Por ejemplo, supongamos que es importante
rechazar H0 si la rapidez promedio de
combustión µ es mayor que 52 cm/seg o
menor que 48 cm/seg. Dada la simetría sólo se
requiere evaluar la probabilidad de aceptar H0:
µ = 50 cuando el valor verdadero es µ = 52.
0.7
0.6
H1 : µ =
52
H0 : µ =
50
0.5
0.4
De acuerdo a la figura:
β = P(48.5 ≤ x ≤ 51.5 | µ = 52) = 0.2643
La probabilidad de obtener un error de
tipo II aumenta muy rápido a medida
que el valor verdadero µ tiende al valor
Hipotético. Por ejemplo, si suponemos
que µ=50.5, y recalculamos β,
obtenemos 0,8923.
0.3
0.2
0.1
045
46
47
48
49
50
51
52
53
54
55
β también depende del tamaño de la
muestra, por ejemplo, si n = 16
obtenemos, cuando µ = 52:
σ = 0.625, por lo tanto β = 0,2119. Es decir, β disminuye cuando n aumenta, excepto si el
valor real de µ está muy cerca del hipotético.
Como uno puede elegir los valores críticos del intervalo de
aceptación, controlamos el valor de α, controlamos la
probabilidad de rechazar de manera errónea H0.
Es por eso que el rechazo de H0 siempre se considera como una
Conclusión Fuerte (los datos aportan fuerte evidencia de que H0
es falsa).
La decisión de aceptar H0 se considera una Conclusión Débil, a
menos que se sepa que β es considerablemente pequeño.
Por esto en lugar de decir: “se acepta H0”, se prefiere decir “no
rechazamos H0”, es decir, no se ha encontrado evidencia
suficiente para rechazar H0.
No quiere decir que exista gran evidencia de que H0 sea cierta,
sino que no hay gran evidencia de que sea falsa.
Hipótesis Unilaterales
En el ejemplo, supongamos que si la rapidez media de
combustión es menor que 50 cm/seg se desea demostrar esto
con una conslusión fuerte. ¿Cómo deben plantearse las
hipótesis?
H0: µ = 50 cm/seg
H1: µ < 50 cm/seg
Nótese que, aunque H0 está planteada como una igualdad, se
sobrentiende que incluye cualquier valor de µ no especificado por
H1. Es decir, la incapacidad de rechazar H0, no significa que µ = 50,
sino que no se tiene evidencia fuerte que apoye a H1. Es decir,
pudiera ser que µ = 50 o que µ > 50.
Ejemplo: Un embotellador de refresco desea estar seguro de que
las botellas que usa tienen en promedio un valor que supera el
mínimo de presión de estallamiento de 200 psi. El embotellador
puede formular una prueba de hipótesis de dos maneras:
(1)
H0: µ = 200 psi
H1: µ > 200 psi
(2)
H0: µ = 200 psi
H1: µ < 200 psi
Con el planteamiento (1) Como el rechazo de H0 es una conclusión
fuerte, esto obliga al fabricante a demostrar (aportar evidencia) de
que las botellas soportan mayor presión que 200 psi. Con el
planteamiento (2) si se rechaza H0 se concluye que las botellas no
soportan los 200 psi, es decir, se concluye que las botellas son
satisfactorias a menos que haya evidencia fuerte en sentido
contrario. ¿Cuál planteamiento es el correcto?
En la Hipótesis alternativa se debe poner la proposición sobre la
cuál es importante llegar a una conclusión fuerte.
Conclusiones Fuerte y Débil
Como uno puede elegir los valores críticos del intervalo de
aceptación, i.e. controlamos el valor de α. Uno puede entonces
controlar la probabilidad de rechazar de manera errónea H0.
Es por eso que el rechazo de H0 siempre se considera como una
Conclusión Fuerte: los datos aportan fuerte evidencia de que H0
es falsa.
La decisión de aceptar H0 se considera una Conclusión Débil, a
menos que se sepa que β es considerablemente pequeño.
Por esto en lugar de decir “se acepta H0” se prefiere decir
“incapaz de rechazar H0”, es decir, no se ha encontrado evidencia
suficiente para rechazar H0. O sea, no quiere decir que exista
gran evidencia de que H0 sea cierta sino que no hay gran
evidencia de que sea falsa.
Riesgos al tomar decisiones
Ejemplo 1: Se juzga a un individuo por la presunta comisión de un delito
Los datos pueden refutarla.
• H0: Hipótesis nula
– Es inocente
La que se acepta si las
pruebas no indican lo
contrario.
Rechazarla por error tiene
graves consecuencias.
• H1: Hipótesis alternativa
– Es culpable
No debería ser aceptada sin una
gran evidencia a favor.
Rechazarla por error tiene
consecuencias consideradas
menos graves que la anterior.
41
Tipos de error al tomar una decisión
(Ejemplo 1)
Realidad
Inocente
Inocente
OK
Culpable
Error
Menos grave
Veredicto
Culpable
Error
OK
Muy grave
42
Riesgos al contrastar hipótesis
Ejemplo 2: Se cree que un nuevo tratamiento ofrece buenos resultados
Ejemplo 3: Parece que hay una incidencia de enfermedad más alta de lo normal
• H0: Hipótesis nula
No especulativa
– (Ej.1) Es inocente
– (Ej.2) El nuevo tratamiento no tiene efecto
– (Ej.3) No hay nada que destacar
• H1: Hipótesis alternativa
– (Ej.1) Es culpable
– (Ej.2) El nuevo tratamiento es útil
– (Ej. 3) Hay una situación anormal
Especulativa
43
Tipos de error al contrastar hipótesis
Realidad
H0 cierta
No rechazo H0
H0 falsa
Error de tipo II
Correcto
El tratamiento sí tiene efecto
pero no lo percibimos.
El tratamiento no
tiene efecto y así se
determina.
Probabilidad
β
Error de tipo I
Rechazo H0
Acepto H1
El tratamiento no
tiene efecto pero se
decide que sí.
Probabilidad α
Correcto
El tratamiento tiene efecto y
el experimento lo confirma.
44
Para cualquier tipo de test de contraste hay 3
resultados posibles:
(1) - Se toma una decisión correcta.
Es decir se rechaza una hipótesis falsa o no se rechaza una
hipótesis verdadera.
(2) - Se rechaza una hipótesis verdadera.
El error de rechazar H0 cuando es verdadera se
denomina ERROR DE TIPO I (con probabilidad α).
(3) - No se rechaza una hipótesis falsa.
El error de no rechazar H0 cuando es falsa se denomina
ERROR DE TIPO II (con probabilidad β).
45
46
47
48
Contrastes para la media de una población
Población normal y σ desconocida.
Hipótesis bilateral
Ho: µ = µ0
H1: µ ≠ µ0
Estadístico
x−µ
tc =
≡ t n −1
s n
x − µ0


P − tα / 2 <
< tα / 2  = 1 − α
s/ n


Si la media muestral está fuera de
Región de aceptación.
este intervalo rechazamos H0.
Aceptamos en caso contrario.
s
s


zα / 2 , µ 0 +
zα / 2 
 µ0 −
n
n



x − µ0

Valor − p = P t n −1 >

s n





• Hipótesis:
H o : μ = 35 y H a : μ ≠ 35
• Estadístico de prueba: dado que se desconoce la
varianza de la población, utilizaremos s2.
• Distribución del estadístico de prueba es una t de
Student con n-1 grados de libertad.
• Regla de decisión: A un nivel de significancia de α =
0.05, si el valor de tcalc es mayor que tcrítico (2.1604)
entonces se rechaza H0.
• Cálculo del estadístico de prueba:
30.5 − 35
= −1.58
t=
10.64 / 14
• Decisión estadística: -1.58 cae en la zona de no
rechazo, por lo tanto no se rechaza H0.
50
65
66
67
Ejemplo para contraste en poblaciones
normales y de varianza conocida
Se quiere saber si hay diferencias en la concentración de
ácido úrico en sujetos normales y con síndrome de Down.
Se realizó la medición en 12 pacientes con Down y su
media fue de 4.5 mg/ml y en 15 individuos sanos cuya
media fue de 3.4 mg/ml.
• Datos: x1 = 4.5, σ 1 = 1; x2 = 3.4, σ 2 = 1.5; n1 = 12 y n 2 = 15
2
2
•Supuestos: los datos provienen de poblaciones con
distribuciones normales y se conocen sus varianzas.
• Hipótesis:
H 0 : µ1 − µ 2 = 0 y H A : µ1 − µ 2 ≠ 0
• Estadístico de prueba:
z=
( x1 − x2 ) − ( µ1 − µ 2 ) 0
σ 12
n1
+
σ 22
n2
=
(4.5 − 3.4) − 0
= 2.57
1 1.5
+
12 15
• Distribución del estadístico: normal estándar.
• Regla de decisión: H0 se rechaza a menos que el valor de
zcalc entre los valores críticos, si zcrítico está entre ±1.96, es
decir, que -1,96 < zcalc< 1,96.
• Decisión estadística: Se rechaza H0 porque 2,57 > 1,96.
• Conclusión: Con los datos disponibles es posible detectar
diferencias estadísticamente significativas entre las dos
concentraciones de ácido úrico de ambas poblaciones
(Down y normal).
Ejemplo con poblaciones normales y
varianzas desconocida.
Se quiere saber si los fumadores sufren mas daños
pulmonares que los no fumadores.
• Datos:
x f = 17.5, s f = 4.4711, n f = 9;
xnf = 12.4, s nf = 4.8492, nnf = 16
•Supuestos : la destrucción pulmonar sigue una distribución
normal y no se conocen las varianzas poblacionales, pero
se suponen que son iguales.
• Hipótesis:
H 0 : µ f ≤ µ nf , H A : µ f > µ nf
• Estadística de prueba:
t=
( x1 − x2 ) − ( µ1 − µ 2 ) 0
s 2p
n1
+
s 2p
n2
=
(17.5 − 12.4) − 0
= 2.6573
21.2165 21.2165
+
16
9
Y la varianza combinada se calcula como.
(n1 − 1) s + (n2 − 1) s
s =
n1 + n2 − 2
2
p
2
1
2
2
• Distribución de la estadística de prueba: Sigue una
distribución t de Student con n1+ n2 - 2 grados de libertad.
• Regla de decisión: Se rechaza H0 a menos que el tcalc
esté entre los valores críticos. En este caso, si tcrítico es
±1.7139, luego -1.7139 < tcalc< 1.7139.
• Decisión estadística: Se rechaza H0 porque 2.6573 >
1.7139 y cae en la zona de rechazo.
• Conclusión: Con los datos experimentales se puede
concluir que sí hay más daño pulmonar en los fumadores
que en los no fumadores.
73
(Recordatorio)
74
Ejemplo:
75
76
77
78
79
80
81
82
83
84
85
96
Valor-p de un contraste
Observa que el resultado de un test depende fuertemente de α...
El valor-p es la probabilidad de
obtener un resultado de la muestra
que sea al menos tan improbable
como lo que se observa.
Dos posibles valores de un
estadístico (puntos en la gráfica)
que conducen a rechazar la
hipótesis nula, aunque la evidencia
del rechazo es muy distinta según
el caso.
Este valor corresponde al valor de la
probabilidad asignada al z calculado a
partir del valor numérico sometido a la
prueba de hipótesis.
Si p es menor al nivel de significación
predefinido se debe rechazar H0
En una prueba bilateral se determina el valor-p duplicando el área
en la cola, para poder comparar el valor de p directamente con α y
mantener así la misma regla de rechazo.
Significación: p
α
H0: µ=40
Significación: p
No se rechaza
H0: µ = 40
α
H0: µ = 40
X = 43
Significación: p
Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor
del estadístico obtenido de la muestra.
Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0.
Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la
obtenida.
p es conocido después de realizar el experimento aleatorio
El contraste es no significativo cuando p>α
P
α
P
α
No se rechaza
H0: µ=40
X = 43
Significación : p
Se rechaza H0: µ = 40
Se acepta H1: µ > 40
α
X = 50
Significación : p
El contraste es estadísticamente significativo cuando p <
Es decir, si el resultado experimental discrepa más de “lo
tolerado” a priori.
Se rechaza H0: µ=40
Se acepta H1: µ>40
α
P
X = 50
α.
Resumen: α, p y criterio de rechazo
• Sobre α
• Sobre p
– Es número pequeño,
preelegido al diseñar el
experimento.
– Es conocido tras realizar el
experimento.
– Conocido α sabemos todo
sobre la región crítica.
– Conocido p sabemos todo
sobre el resultado del
experimento.
• Sobre el criterio de rechazo
– Contraste significativo = p menor que α