Download Significancia estadística y prueba Z

Document related concepts
no text concepts found
Transcript
Clase 4a
Significancia Estadística
y Prueba Z
Hoy veremos:



Que es un resultado estadísticamente
significativo (probabilidad de ser cierto)
Hipótesis Estadísticas y los diferentes Tipos
de Error
Prueba Z (prueba de hipótesis sobre
diferencias de promedios entre 2 grupos)
Dr. Carlos J. Vilalta
¿Qué es lo Estadísticamente
Significativo?
Concepto: Un resultado estadísticamente significativo
es aquel que tiene una baja probabilidad de ocurrir por
pura suerte (azar)
¿De dónde viene? Cuando estudiamos una muestra,
queremos saber si los resultados-valores que
obtenemos son “correctos” o bien si se deben a la
suerte o azar
Por lo tanto… cuanto más estadísticamente
significativo sea un resultado, más seguridad tenemos
de que ese resultado no se deba al azar y de que sea
correcto.
Hay Niveles de Confianza sobre
lo que E. S.
Nivel de
confianza
Un valor menor de p
(prob. de error)
significa que…
¿Azar? ¿Qué
significa ese
resultado?
90%
El resultado es confiable
con un 10% de error
(p < .10)
Tiene una probabilidad de
deberse al azar menor al
10%
95%
El resultado es confiable
con un 5% de error
(p < .05)
Tiene una probabilidad de
deberse al azar menor al
5%
99%
El resultado es confiable
con un 1% de error
(p < .01)
Tiene una probabilidad de
deberse al azar menor al
1%
La lógica de lo estadísticamente
significativo
Ejemplo:



¿Los que estudian para un examen sacan mejores
calificaciones?
2 grupos: Estudian (E) y No Estudian (NE)
Sobre los resultados, queremos un nivel de
significancia estadística (p < .05), o bien un nivel de
confianza del 95%.
Resultados posibles:
1.
2.
3.
Estudian y sacan mejores calificaciones (p = .33)
Estudian y sacan las mismas calificaciones (p = .33)
Estudian y sacan peores calificaciones (p = .33)
Lógica E. S. = Probabilidades
Nota probabilística: La probabilidad de que cada uno de los
resultados anteriores suceda por puro azar es del 33% (.33)
Resultados del Análisis: Analizamos 4 casos en cada
grupo y observamos que los 4 miembros del grupo “E”
efectivamente sacaron mejores calificaciones que todos
los del grupo “NE”
La probabilidad de que el resultado anterior se deba al
“azar” es:
(.33) * (.33) * (.33) *(.33) = .0119 = .012 (o 12%)
Es decir, p = .012
Estadísticamente significativo
Conclusión:


Ya que ese valor del .012 es menor a .05 predefinido
del nivel de significancia (p < .05), entonces el
resultado sí es estadísticamente significativo.
Podemos concluir que los estudiantes que estudiaron
efectivamente sí sacaron una mejor calificación (es
muy poco probable que se deba al azar)
Preguntas:


¿Podría concluir lo mismo con un nivel de
significancia estadística (probabilidad de error) del
10%? ¿(p < .10)?
¿Podría concluir lo mismo con un nivel de
significancia estadística (probabilidad de error) del
1%? ¿p < .01)?
Como interpretar lo E. S.
Cómo si verlo:

Como un nivel de confianza que tenemos de que
ese resultado inferido a partir de una muestra sea
correcto. Un resultado azaroso es incorrecto.
Cómo no verlo:

Una cosa es que una relación entre variables sea
estadísticamente significativa (o altamente
probable), y otra es la magnitud o la importancia de
esa relación. “Estadísticamente significativo” e
“Importancia” son aspectos independientes en el
análisis.
Repaso de Pruebas de hipótesis
Hipótesis: Una relación entre 2 variables
Prueba de hipótesis:

Procedimiento estadístico para poder aceptar
o rechazar la existencia de esa relación
Historia:

Fisher desarrolló este procedimiento llamado
“Prueba de la Hipótesis Nula” o (Ho)…
Las pruebas de hipótesis
¿Cómo lo hizo y cuál fue la lógica?
1.
2.
3.
Quería comparar las características de 2 grupos y
saber con certeza (estimando el azar) si eran
similares o diferentes
Primero definió una muestra y obtuvo un valor (la
media) de la variable bajo estudio para cada uno de
los grupos
Definió de manera artificial lo que es la Ho.
Ho = Los grupos no son diferentes
Ha = Los grupos sí son diferentes
Lógica de la prueba de hipótesis
Para poder concluir que los grupos no
son diferentes (no rechazar Ho) se
requiere que las medias de cada grupo
sean muy similares (cercanas).
Y viceversa, para poder concluir que los
grupos sí son diferentes (rechazar Ho)
se requiere que las medias de cada
grupo sean muy diferentes
Tipos de errores en las pruebas
de hipótesis
Decides:
Rechazar Ho
(decir que son
diferentes)
Decides:
No rechazar
Ho
(decir que son
iguales)
Realidad:
(son iguales)
Ho es verdadera
Realidad:
(son diferentes)
Ha es verdadera
Error del Tipo I =
Decir que son
diferentes cuando
no lo son
No hay error
No hay error
Error del Tipo II =
Decir que son
iguales cuando no
lo son
En Síntesis:
La relación entre prueba de hipótesis y
resultados estadísticamente
significativos es que...
Aceptar o rechazar una hipótesis depende
de una probabilidad. Para probar una
hipótesis siempre se define un nivel de
significancia estadística (.10, .05 o .01) o
probabilidad de error.
Prueba Z
Es una técnica para la prueba de
hipótesis
Objetivo: Saber si hay una diferencia
entre las medias de 2 grupos
Se puede utilizar para:


Variables Continuas: Utilizar fórmula de
valores absolutos
Variables dicotómicas (nominales con 2
opciones): Utilizar fórmula con
porcentajes
Las diferencias entre las Medias de 2
Grupos pueden convertirse en valores Z
A través de la siguiente fórmula:
Z
=
X
- m
s
n
Dif. de
Medias
Error
Estándar
Error Estándar: Medida de dispersión para un grupo de
Medias de muchas muestras y que siguen un
comportamiento normal teórico
Valores Z = numero de errores estándar desde la media
de la muestra a la media del universo (o media real)
Curva normal + niveles de
confianza + valores de Z
Rechazar
Ho
Aceptar Ho
Rechazar
Ho
Nivel de
Confianza
Valor
Crítico
(VC)
Si Z > VC

90%
+/- 1.64
Rechazar
Ho
95%
+/- 1.96
Rechazar
Ho
99%
+/- 2.58
Rechazar
Ho
Ejemplo de Prueba Z: VD continua
1. Alguien dice que la edad media de los
votantes del PT es de 29 años.
2. A partir de una muestra (n = 100)
descubrimos que el promedio de edad de
los votantes del PT es de 32 años y la
Desv. Estándar es de 5 años
3. Pregunta: ¿Es 32 años estadísticamente
diferente de 29 años? Podría ser que
nuestro resultado se debe al azar..
4. Formular hipótesis:
Ho: m = 29 años
Ha: m ≠ 29 años
Ejemplo de Prueba Z: VD continua
4. Asignamos un nivel de significancia estadística
del .05 (p < .05). Es decir, un nivel de confianza
del 95% (área bajo la curva normal de +/- 1.96).
5. Sentido de la prueba:
Si Z < a +/- 1.96, entonces aceptamos Ho; La
media de la población sí es de 29 años
Si Z > a +/- 1.96 (menor de –1.96, ej. –1.97),
entonces aceptamos Ha; La media de la
población sí es diferente a 29 años
Ejemplo de Prueba Z: VD continua
Prueba:




Media de nuestra muestra = 32 años
Media a prueba de Ho (m) = 29 años
Desviación Estándar (s) = 5 años
n = 100
X - m
Z = s
n
Es igual a:
Z = 32 – 29 = 3 = 6
5/√100 0.5
Ejemplo de Prueba Z: VD continua
Conclusión:
Ya que 6 > 1.96, rechazamos Ho


Esto es, con base en nuestra estudio, no podemos
aceptar que la edad promedio de los votantes del PT
sea de 29 años. Es poco probable que esta
diferencia entre 29 y 32 se deba al azar.
Lo anterior lo hacemos con un nivel de confianza del
95%
Prueba Z: VD dicotómica
Es una técnica para la prueba de
hipótesis estadísticas
Objetivo: Saber si hay una diferencia
entre los porcentajes (de una variable)
de 2 grupos o muestras
Hipótesis y Fórmula Z para VD
dicotómica
Hipótesis:
Ho: p = p
Ha: p ≠ p
Si Z > V.C. entonces rechazar Ho: Los porcentajes son diferentes
Donde:
Fórmula:
Z=
Z=
p -p
p * (1 - p) / n
p = Porcentaje Muestral
(1 - p) = q = Inverso
p = Porcentaje hipotético
n = Tamaño de la muestra
Ejemplo prueba Z: VD Dicotómica
• Caso:
En un examen de admisión a la universidad
pasaron el 52% (.52) de los candidatos de
cierta preparatoria. De todas las preparatorias
sólo pasaron el 50% (.50). El director de esa
escuela ve que su 52% es mayor al 50% del
resto, y hace la hipótesis de que sus alumnos
son mejores que el resto.
• Preguntas:
¿Es la diferencia entre 52% y 50% lo
suficientemente grande como para concluir una
diferencia estadísticamente significativa?
Ejemplo de Prueba Z: VD
dicotómica
Datos:




p = .50 (porcentaje de la muestra)
p = .52 (porcentaje a prueba)
n = 85
Nivel de confianza del 95%; V.C. de +/-1.96
Hipótesis
Ho: p = p
Ha: p ≠ p
.52 = .50
.52 ≠ .50
Si Z > +/- 1.96 entonces rechazar Ho
O… si son diferentes; si son mejores estudiantes
Ejemplo de Prueba Z: VD
dicotómica
Cálculo
Z=
p -p
p * (1 - p) / n
Ya que - .37 se encuentra entre +/- 1.96
Aceptamos Ho; son % iguales
Con un 95% de nivel de confianza podemos concluir que
no hay una diferencia significativa entre los estudiantes
de esa prepa y los demás estudiantes
Ni hablar… así son los posgrados y
sólo vamos empezando
Que sigue:


Vámonos al break
Seguimos con otra técnica para la prueba de
hipótesis: Ji Cuadrada