Download Presentación de PowerPoint
Document related concepts
no text concepts found
Transcript
UNIVERSIDAD NACIONAL EXPERIMENTAL DEL LOS LLANOS OCCIDENTALES “EZEQUIEL ZAMORA” UNELLEZ – NÚCLEO TINAQUILLO ANÁLISIS DE DATOS ESTADÍSTICOS DE LA ACTIVIDAD FÍSICA Coordinador de unidad de apoyo de estadística: MSc Alexis Durán power021@gmail.com Desarrollado en 1.993 por Ross Ihaka y Robert Glenteman (University of Auckland, Nueva Zelanda). A partir de 1.995 comenzó a distribuirse gratuitamente (GNU, Free Software Foundation). CARACTERÍSTICAS: Es un conjunto integrado de programas. Efectiva manipulación y almacenamiento de datos. Una amplia, coherente e integrada colección de herramientas para el análisis de datos. Posibilidades gráficas para el análisis de datos. R – Commander (Rcmdr) Es una interfaz gráfica del programa R. Existe una dirección que descarga el R y el RCommader juntos para windows es la siguiente: http://knuth.uca.es/R/R-UCA Se ejecuta normal como cualquier programa. Para abrir el programa se le da doble clic a la R azul. Nota • Algunas veces cuando el R-Commander se abre, el programa puede preguntar que si se quieren instalar otros paquetes, si disponen de tiempo e internet coloquen si, de lo contrario coloquen no. Ventana de Instrucciones Ventana de Resultados CARGAR DATOS Importar datos desde Excel Colocar el nombre de la matriz ó conjunto de datos y luego aceptan Se busca el archivo y luego le da clic en abrir. Aparece algo como esto: Selecciona la hoja donde estén los datos dentro del archivo y le das ok ANÁLISIS INFERENCIAL • Es el estudio que parte de una muestra pequeña y representativa de miembros de gran una colectivo, donde se extraen conclusiones que afectan a todos los elementos del mismo. PRUEBAS DE HIPÓTESIS Objetivo: Tratar de determinar cuándo es razonable concluir, que la población entera posee determinada propiedad y cuando esto no es razonable, a partir del análisis de una muestra. Una hipótesis se define como una afirmación ó suposición que está sujeta a verificación o comprobación La prueba de hipótesis es el procedimiento estadístico que parte de una suposición del comportamiento de la población (hipótesis) y en función del análisis de la(s) muestra(s) se comprobará su veracidad TIPOS DE HIPOTESIS El procedimiento de toma de decisiones en la prueba de hipótesis, se basa en la elección de una opción entre dos conjuntos posibles de valores del parámetro, es decir, en dos hipótesis estadísticas, que son: Hipótesis nula H0 Hipótesis alternativa H1 HIPOTESIS NULA y ALTERNATIVA • Hipótesis nula corresponde a la ausencia de una modificación en la variable investigada, y por lo tanto se especifica de una forma exacta: H0 : = 0 • Hipótesis alternativa se especifica de manera más general : H1: 0 H1: > 0 H1: < 0. CUADRO DE DECISIONES Y ERRORES Rechazar Ho No Rechazar Ho Ho CIERTA Incorrecto error I Correcto Ho FALSA Correcto Incorrecto error II MEDICIÓN DE LOS ERRORES es la Probabilidad de cometer un Error tipo I. Se llama Nivel de significación (1-10 %) es la probabilidad de cometer un Error tipo II (5-20 %) Es deseable que estas dos probabilidades de error sean pequeñas. P - VALOR •Es la Probabilidad de obtener una discrepancia mayor o igual que la observada en la muestra n cuando Ho es cierta. •Es la probabilidad de observar un valor de prueba más extremo que el valor observado, dado que la hipótesis nula es verdadera. •Si el valor p es más chico que el nivel de significación la hipótesis nula es rechazada. Por el contrario, si es más grande que el nivel de significación la hipótesis nula no es rechazada. Pasos de una Prueba de Hipótesis Paso 1 Paso 2 • Establecer las hipótesis (Nula y Alternativa) • Seleccionar el nivel de significación (α) • Selección del estadístico de prueba ó prueba estadística Paso 3 Paso 4 • Procesar la información y tomar la decisión. PRUEBAS PARA PROMEDIOS • En primer lugar se debe hacer una análisis de normalidad a las variables para poder seleccionar el test adecuado. • Siempre se quiere realizar test paramétricos por ser más objetivos que los no paramétricos. Análisis de la Normalidad de los datos ANÁLISIS GRÁFICO • Se debe escribir lo siguiente en el programa en la ventana de instrucciones: attach(Nombre del conjunto de datos) qqnorm(variable, xlab="Cuantiles Teóricos“, ylab="Cuantiles de la Muestra" ,main="Gráfico Q-Q de Probabilidad Normal") qqline(variable) se sombrea y luego se da ejecutar y se obtiene: 30 35 Normal Q-Q Plot 25 20 15 10 Cuantiles de la Muestra • La recta indica la distribución teórica de una normal • Las interpretaciones se hacen en función de los puntos con su cercanía en la línea recta. • Entre los puntos estén mas cerca a la recta, mejor será su aproximación a una distribución normal. -2 -1 0 Cuantiles Teóricos 1 2 25 20 15 10 Cuantiles de la Muestra 30 35 Normal Q-Q Plot -2 -1 0 Cuantiles Teóricos 1 2 Pruebas de Normalidad • Establece: Ho: existe normalidad en los datos H1: no existe normalidad en los datos • Test de normalidad de Shapiro Wilk: se utiliza cuando la muestra es menor o igual a 50. En el programa: • Para muestras mayores a 50, se utiliza el test de komogorov – Smirnov, en el programa se escribe en la ventana de instrucciones lo siguiente: attach(Nombre del conjunto de datos) ks.test(variable, pnorm, mean(variable), sd(variable)) Medias para una población Para poblaciones normales Hipótesis Ho µ = Valor H1 µ ≠ Valor µ < Valor µ > Valor Se selecciona la opción De la hipótesis alternativa plateada Se selecciona la variable Se coloca el valor del promedio establecido en la Hipótesis nula Hipótesis H0 Xme=Valor H1 Xme≠Valor ("two.sided") Xme<Valor ("less") Xme>Valor ("greater") • Se coloca en la ventana de instrucciones: attach(nombre del conjunto de datos) wilcox.test(variable, mu=valor, alternative = c("ver H1") ) Luego se sombrea y se ejecuta NOTA: En caso de muestras grandes (Mayores de 30), de debe añadir correct=FALSE y quedaría: attach(nombre del conjunto de datos) wilcox.test(variable, mu=valor, alternative = c("ver H1"), correct=F) Prueba de hipótesis entre dos poblaciones • Muestras independientes y normales HIPÓTESIS: H0 µ1=µ2 H1 µ1≠µ2 µ1<µ2 µ1>µ2 Antes de realizar esta prueba se debe realizar una prueba para comparar las varianzas poblacionales que se necesitará más adelante PRUEBA F DE FISHER Hipótesis: H0 σ1=σ2 H1 σ1≠σ2 La matriz que se debe introducir en R: Grupo ó Tratamiento A B En el programa: Variable DATOS DATOS Se selecciona la Variable Se selecciona el grupo (debe ser cualitativo) Prueba de T-Student (poblaciones) Hipótesis: H0 µ1=µ2 H1 µ1≠µ2 µ1<µ2 µ1>µ2 En el programa: Se marca Sí, para el caso que se acepte H0 en la prueba F de Fisher, caso contrario si marca No Se selecciona la Se selecciona el grupo (debe ser Variable cualitativo) Se selecciona la opción planteada en la Se observa la hipótesis alternativa Diferencia Muestras dependientes y normales Hipótesis: H0 µi=µf H1 µi≠µf µi<µf µi>µf Nota: recordar que se debe calcular la diferencia entre las condiciones iniciales y finales para hacer el análisis de la normalidad La matriz que se debe introducir en R: Variable (Condición Inicial) Variable (Condición Final) DATOS DATOS En el programa: Se le da doble clic primero a la variable inicial, se coloca el signo – y luego se le da doble clic a la variable final Se coloca un nombre distinto para identificarla La matriz que se debe introducir en R: Variable (Condición Inicial) Variable (Condición Final) DATOS DATOS En el programa: Se selecciona la opción planteada en la hipótesis alternativa Se selecciona la condición final Se selecciona la condición inicial Muestras independientes y al menos una no normal Prueba de Suma de Rangos de Wilcoxon Hipótesis: H0 Xme1=Xme2 H1 Xme1≠Xme2 Xme1<Xme2 Xme1>Xme2 En el programa: Se observa la Para muestras menores a 30, se diferencia marca la opción Por defecto, para muestras mayores a 30 se marca Aproximación normal Se Selecciona el grupo Se Selecciona la variable Se selecciona la opción de la hipótesis alternativa planteada Muestras dependientes y al menos una no normal Prueba de Rangos con signos de Wilcoxon: Hipótesis: H0 Xmei=Xmef H1 Xmei≠Xmef Xmei<Xmef Xmei>Xmef Se selecciona la Para muestras menores a 30, se opción de la Por hipótesis marca la opción defecto, para alternativa planteada muestras mayores a 30 se marca Aproximación normal Se selecciona la condición inicial Se selecciona la condición final