Download MODELOS_CONTINUOS_t_de_estudent
Document related concepts
no text concepts found
Transcript
MODELOS CONTINUOS. T DE STUDENT Técnicamente se puede describir la prueba t de Student como aquella que se utiliza en un modelo en el que una variable explicativa (var. independiente) dicotómica intenta explicar una variable respuesta (var. dependiente) dicotómica. Es decir en la situación: dicotómica explica dicotómica. La prueba t de Student como todos los estadísticos de contraste se basa en el cálculo de estadísticos descriptivos previos: el número de observaciones, la media y la desviación típica en cada grupo. A través de estos estadísticos previos se calcula el estadístico de contraste experimental. Con la ayuda de unas tablas se obtiene a partir de dicho estadístico el p-valor. Si p<0,05 se concluye que hay diferencia entre los dos tratamientos. Las hipótesis o asunciones para poder aplicar la t de Student son que en cada grupo la variable estudiada siga una distribución Normal y que la dispersión en ambos grupos sea homogénea (hipótesis de homocedasticidad=igualdad de varianzas). Si no se verifica que se cumplen estas asunciones los resultados de la prueba t de Student no tienen ninguna validez. Por otra parte no es obligatorio que los tamaños de los grupos sean iguales, ni tampoco es necesario conocer la dispersión de los dos grupos Ejemplo. Cual es la probabilidad acumulada de una Distribución t de Student de 9 grados de libertad, de que x < 0,25. esto es: buscando en la tabla en la columna del 9, y la fila de 0,25 tenemos que: Probabilidad de x1 < t < x2 Para calcular la probabilidad de que la variable se encuentre entre dos valores x1 y x2, siendo x1 < x2 se tiene en cuenta que: Los valores de cada una de estas probabilidades se buscan en la tabla por separado, o se calculan según el caso, por los métodos anteriores. Ejemplo: Cual es la probabilidad acumulada de una variable t de Student de 25 grados de libertad, se encuentre entre: 0,75 y 1,25. según lo anterior, tenemos: en la tabla las probabilidades, tenemos los valores: sustituyendo tenemos: realizando la operación: que es el resultado de esta probabilidad acumulada DISTRIBUCION NORMAL. Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas. Su propio nombre indica su extendida utilización, justificada por la frecuencia o normalidad con la que ciertos fenómenos tienden a parecerse en su comportamiento a esta distribución. Muchas variables aleatorias continuas presentan una función de densidad cuya gráfica tiene forma de campana. En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos de frecuencias se aproximan a una curva en "forma de campana". En resumen, la importancia de la distribución normal se debe principalmente a que hay muchas variables asociadas a fenómenos naturales que siguen el modelo de la normal Caracteres morfológicos de individuos (personas, animales, plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras, diámetros, perímetros,... Caracteres fisiológicos, por ejemplo: efecto de una misma dosis de un fármaco, o de una misma cantidad de abono. Caracteres sociológicos, por ejemplo: consumo de cierto producto por un mismo grupo de individuos, puntuaciones de examen. Caracteres psicológicos, por ejemplo: cociente intelectual, grado de adaptación a un medio,... Errores cometidos al medir ciertas magnitudes. Valores estadísticos muestrales, por ejemplo : la media. Otras distribuciones como la binomial o la de Poisson son aproximaciones normales, ... Y en general cualquier característica que se obtenga como suma de muchos factores. FUNCIÓN DE DENSIDAD Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de la función de densidad que corresponde a tales distribuciones viene dado por la fórmula Representación gráfica de esta función de densidad La distribución normal queda definida por dos parámetros, su media y su desviación típica y la representamos así FUNCIÓN DE DISTRIBUCIÓN Puede tomar cualquier valor (- ¥, + ¥) Son más probables los valores cercanos a uno central que llamamos media m Conforme nos separamos de ese valor m , la probabilidad va decreciendo de igual forma a derecha e izquierda (es simétrica). Conforme nos separamos de ese valor m , la probabilidad va decreciendo de forma más o menos rápida dependiendo de un parámetro s , que es la desviación típica. F(x) es el área sombreada de esta gráfica TIPIFICACIÓN Por tanto su función de densidad es y su función de distribución es siendo la representación gráfica de esta función a la variable Z se la denomina variable tipificada de X, y a la curva de su función de densidad curva normal tipificada. Característica de la distribución normal tipificada (reducida, estándar) No depende de ningún parámetro Su media es 0, su varianza es 1 y su desviación típica es 1. La curva f(x) es simétrica respecto del eje OY Tiene un máximo en este eje Tiene dos puntos de inflexión en z =1 y z = -1 Aproximación de la Binomial por la Normal (Teorema de De Moivre): Demostró que bajo determinadas condiciones (para n grande y tanto p como q no estén próximos a cero) la distribución Binomial B(n, p) se puede aproximar mediante una distribución normal Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto más próximo sea p a 0.5, tanto mejor será la aproximación realizada. Es decir, basta con que se verifique gracias a esta aproximación es fácil hallar probabilidades binomiales, que para valores grandes de n resulten muy laboriosos de calcular. Hay que tener en cuenta que para realizar correctamente esta transformación de una variable discreta (binomial) en una variable continua (normal) es necesario hacer una corrección de continuidad. CHI CUADRADO. Además de la importancia de la distribución 2como la distribución a la que se ajusta la distribución muestral de la varianza de un población normal, y su posterior aplicación en el contraste de la varianza Definición de chi-cuadrado Si para todo , sigue una distribución normal con media 0 y varianza 1 sigue una distribución chi-cuadrado con entonces libertad. Esto lo expresamos del siguiente modo: grados de . Teorema Sean variables aleatorias independientes normalmente distribuidas, con media 0 y varianza comun . Entonces, , donde una matriz simétrica, sigue una distribución chi-cuadrado de de libertad si y sólo si es grados es una matriz idempotente. Demostración Teorema Sean variables aleatorias independientes normalmente distribuidas, con media 0 y varianza común 1. Sean, además y matrices simétricas de dimensión independientes si y sólo si Demostración . . Entonces y y con son Definición de distribución F de Fisher-Snedecor Si y son variables aleatorias independientes que se distribuyen como sendas chi-cuadrado de y grados de libertad respectivamente, entonces sigue una distribución F de Fisher de y grados de libertad en el numerador grados de libertad en el denominador. Definición de distribución t de Student Si es una variable aleatoria con distribución normal de media 0 y varianza 1 y es otra variable aleatoria, independiente de con distribución sigue una distribución t de Student de entonces grados de libertad. Relación entre las distribuciones t y F Como Suden de se deduce que si es una variable con una distribución t de grados de libertad, entonces con un grado de libertad en el numerador y sigue una distribución F de Fisher en el denominador.