Download Significancia estadística y prueba Z
Document related concepts
no text concepts found
Transcript
Clase 4a Significancia Estadística y Prueba Z Hoy veremos: Que es un resultado estadísticamente significativo (probabilidad de ser cierto) Hipótesis Estadísticas y los diferentes Tipos de Error Prueba Z (prueba de hipótesis sobre diferencias de promedios entre 2 grupos) Dr. Carlos J. Vilalta ¿Qué es lo Estadísticamente Significativo? Concepto: Un resultado estadísticamente significativo es aquel que tiene una baja probabilidad de ocurrir por pura suerte (azar) ¿De dónde viene? Cuando estudiamos una muestra, queremos saber si los resultados-valores que obtenemos son “correctos” o bien si se deben a la suerte o azar Por lo tanto… cuanto más estadísticamente significativo sea un resultado, más seguridad tenemos de que ese resultado no se deba al azar y de que sea correcto. Hay Niveles de Confianza sobre lo que E. S. Nivel de confianza Un valor menor de p (prob. de error) significa que… ¿Azar? ¿Qué significa ese resultado? 90% El resultado es confiable con un 10% de error (p < .10) Tiene una probabilidad de deberse al azar menor al 10% 95% El resultado es confiable con un 5% de error (p < .05) Tiene una probabilidad de deberse al azar menor al 5% 99% El resultado es confiable con un 1% de error (p < .01) Tiene una probabilidad de deberse al azar menor al 1% La lógica de lo estadísticamente significativo Ejemplo: ¿Los que estudian para un examen sacan mejores calificaciones? 2 grupos: Estudian (E) y No Estudian (NE) Sobre los resultados, queremos un nivel de significancia estadística (p < .05), o bien un nivel de confianza del 95%. Resultados posibles: 1. 2. 3. Estudian y sacan mejores calificaciones (p = .33) Estudian y sacan las mismas calificaciones (p = .33) Estudian y sacan peores calificaciones (p = .33) Lógica E. S. = Probabilidades Nota probabilística: La probabilidad de que cada uno de los resultados anteriores suceda por puro azar es del 33% (.33) Resultados del Análisis: Analizamos 4 casos en cada grupo y observamos que los 4 miembros del grupo “E” efectivamente sacaron mejores calificaciones que todos los del grupo “NE” La probabilidad de que el resultado anterior se deba al “azar” es: (.33) * (.33) * (.33) *(.33) = .0119 = .012 (o 12%) Es decir, p = .012 Estadísticamente significativo Conclusión: Ya que ese valor del .012 es menor a .05 predefinido del nivel de significancia (p < .05), entonces el resultado sí es estadísticamente significativo. Podemos concluir que los estudiantes que estudiaron efectivamente sí sacaron una mejor calificación (es muy poco probable que se deba al azar) Preguntas: ¿Podría concluir lo mismo con un nivel de significancia estadística (probabilidad de error) del 10%? ¿(p < .10)? ¿Podría concluir lo mismo con un nivel de significancia estadística (probabilidad de error) del 1%? ¿p < .01)? Como interpretar lo E. S. Cómo si verlo: Como un nivel de confianza que tenemos de que ese resultado inferido a partir de una muestra sea correcto. Un resultado azaroso es incorrecto. Cómo no verlo: Una cosa es que una relación entre variables sea estadísticamente significativa (o altamente probable), y otra es la magnitud o la importancia de esa relación. “Estadísticamente significativo” e “Importancia” son aspectos independientes en el análisis. Repaso de Pruebas de hipótesis Hipótesis: Una relación entre 2 variables Prueba de hipótesis: Procedimiento estadístico para poder aceptar o rechazar la existencia de esa relación Historia: Fisher desarrolló este procedimiento llamado “Prueba de la Hipótesis Nula” o (Ho)… Las pruebas de hipótesis ¿Cómo lo hizo y cuál fue la lógica? 1. 2. 3. Quería comparar las características de 2 grupos y saber con certeza (estimando el azar) si eran similares o diferentes Primero definió una muestra y obtuvo un valor (la media) de la variable bajo estudio para cada uno de los grupos Definió de manera artificial lo que es la Ho. Ho = Los grupos no son diferentes Ha = Los grupos sí son diferentes Lógica de la prueba de hipótesis Para poder concluir que los grupos no son diferentes (no rechazar Ho) se requiere que las medias de cada grupo sean muy similares (cercanas). Y viceversa, para poder concluir que los grupos sí son diferentes (rechazar Ho) se requiere que las medias de cada grupo sean muy diferentes Tipos de errores en las pruebas de hipótesis Decides: Rechazar Ho (decir que son diferentes) Decides: No rechazar Ho (decir que son iguales) Realidad: (son iguales) Ho es verdadera Realidad: (son diferentes) Ha es verdadera Error del Tipo I = Decir que son diferentes cuando no lo son No hay error No hay error Error del Tipo II = Decir que son iguales cuando no lo son En Síntesis: La relación entre prueba de hipótesis y resultados estadísticamente significativos es que... Aceptar o rechazar una hipótesis depende de una probabilidad. Para probar una hipótesis siempre se define un nivel de significancia estadística (.10, .05 o .01) o probabilidad de error. Prueba Z Es una técnica para la prueba de hipótesis Objetivo: Saber si hay una diferencia entre las medias de 2 grupos Se puede utilizar para: Variables Continuas: Utilizar fórmula de valores absolutos Variables dicotómicas (nominales con 2 opciones): Utilizar fórmula con porcentajes Las diferencias entre las Medias de 2 Grupos pueden convertirse en valores Z A través de la siguiente fórmula: Z = X - m s n Dif. de Medias Error Estándar Error Estándar: Medida de dispersión para un grupo de Medias de muchas muestras y que siguen un comportamiento normal teórico Valores Z = numero de errores estándar desde la media de la muestra a la media del universo (o media real) Curva normal + niveles de confianza + valores de Z Rechazar Ho Aceptar Ho Rechazar Ho Nivel de Confianza Valor Crítico (VC) Si Z > VC 90% +/- 1.64 Rechazar Ho 95% +/- 1.96 Rechazar Ho 99% +/- 2.58 Rechazar Ho Ejemplo de Prueba Z: VD continua 1. Alguien dice que la edad media de los votantes del PT es de 29 años. 2. A partir de una muestra (n = 100) descubrimos que el promedio de edad de los votantes del PT es de 32 años y la Desv. Estándar es de 5 años 3. Pregunta: ¿Es 32 años estadísticamente diferente de 29 años? Podría ser que nuestro resultado se debe al azar.. 4. Formular hipótesis: Ho: m = 29 años Ha: m ≠ 29 años Ejemplo de Prueba Z: VD continua 4. Asignamos un nivel de significancia estadística del .05 (p < .05). Es decir, un nivel de confianza del 95% (área bajo la curva normal de +/- 1.96). 5. Sentido de la prueba: Si Z < a +/- 1.96, entonces aceptamos Ho; La media de la población sí es de 29 años Si Z > a +/- 1.96 (menor de –1.96, ej. –1.97), entonces aceptamos Ha; La media de la población sí es diferente a 29 años Ejemplo de Prueba Z: VD continua Prueba: Media de nuestra muestra = 32 años Media a prueba de Ho (m) = 29 años Desviación Estándar (s) = 5 años n = 100 X - m Z = s n Es igual a: Z = 32 – 29 = 3 = 6 5/√100 0.5 Ejemplo de Prueba Z: VD continua Conclusión: Ya que 6 > 1.96, rechazamos Ho Esto es, con base en nuestra estudio, no podemos aceptar que la edad promedio de los votantes del PT sea de 29 años. Es poco probable que esta diferencia entre 29 y 32 se deba al azar. Lo anterior lo hacemos con un nivel de confianza del 95% Prueba Z: VD dicotómica Es una técnica para la prueba de hipótesis estadísticas Objetivo: Saber si hay una diferencia entre los porcentajes (de una variable) de 2 grupos o muestras Hipótesis y Fórmula Z para VD dicotómica Hipótesis: Ho: p = p Ha: p ≠ p Si Z > V.C. entonces rechazar Ho: Los porcentajes son diferentes Donde: Fórmula: Z= Z= p -p p * (1 - p) / n p = Porcentaje Muestral (1 - p) = q = Inverso p = Porcentaje hipotético n = Tamaño de la muestra Ejemplo prueba Z: VD Dicotómica • Caso: En un examen de admisión a la universidad pasaron el 52% (.52) de los candidatos de cierta preparatoria. De todas las preparatorias sólo pasaron el 50% (.50). El director de esa escuela ve que su 52% es mayor al 50% del resto, y hace la hipótesis de que sus alumnos son mejores que el resto. • Preguntas: ¿Es la diferencia entre 52% y 50% lo suficientemente grande como para concluir una diferencia estadísticamente significativa? Ejemplo de Prueba Z: VD dicotómica Datos: p = .50 (porcentaje de la muestra) p = .52 (porcentaje a prueba) n = 85 Nivel de confianza del 95%; V.C. de +/-1.96 Hipótesis Ho: p = p Ha: p ≠ p .52 = .50 .52 ≠ .50 Si Z > +/- 1.96 entonces rechazar Ho O… si son diferentes; si son mejores estudiantes Ejemplo de Prueba Z: VD dicotómica Cálculo Z= p -p p * (1 - p) / n Ya que - .37 se encuentra entre +/- 1.96 Aceptamos Ho; son % iguales Con un 95% de nivel de confianza podemos concluir que no hay una diferencia significativa entre los estudiantes de esa prepa y los demás estudiantes Ni hablar… así son los posgrados y sólo vamos empezando Que sigue: Vámonos al break Seguimos con otra técnica para la prueba de hipótesis: Ji Cuadrada