Download MODELOS_CONTINUOS_t_de_estudent

Document related concepts
no text concepts found
Transcript
MODELOS CONTINUOS.
T DE STUDENT
Técnicamente se puede describir la prueba t de Student como aquella que se
utiliza en un modelo en el que una variable explicativa (var. independiente)
dicotómica intenta explicar una variable respuesta (var. dependiente)
dicotómica. Es decir en la situación: dicotómica explica dicotómica.
La prueba t de Student como todos los estadísticos de contraste se basa en el
cálculo de estadísticos descriptivos previos: el número de observaciones, la
media y la desviación típica en cada grupo. A través de estos estadísticos
previos se calcula el estadístico de contraste experimental. Con la ayuda de
unas tablas se obtiene a partir de dicho estadístico el p-valor. Si p<0,05 se
concluye que hay diferencia entre los dos tratamientos.
Las hipótesis o asunciones para poder aplicar la t de Student son que en cada
grupo la variable estudiada siga una distribución Normal y que la dispersión en
ambos grupos sea homogénea (hipótesis de homocedasticidad=igualdad de
varianzas). Si no se verifica que se cumplen estas asunciones los resultados de
la prueba t de Student no tienen ninguna validez.
Por otra parte no es obligatorio que los tamaños de los grupos sean iguales, ni
tampoco es necesario conocer la dispersión de los dos grupos
Ejemplo.
Cual es la probabilidad acumulada de una Distribución t de Student de 9 grados
de libertad, de que x < 0,25.
esto es:
buscando en la tabla en la columna del 9, y la fila de 0,25 tenemos que:
Probabilidad de x1 < t < x2
Para calcular la probabilidad de que la variable se encuentre entre dos valores
x1 y x2, siendo x1 < x2 se tiene en cuenta que:
Los valores de cada una de estas probabilidades se buscan en la tabla por
separado, o se calculan según el caso, por los métodos anteriores.
Ejemplo:
Cual es la probabilidad acumulada de una variable t de Student de 25 grados
de libertad, se encuentre entre: 0,75 y 1,25.
según lo anterior, tenemos:
en la tabla las probabilidades, tenemos los valores:
sustituyendo tenemos:
realizando la operación:
que es el resultado de esta probabilidad acumulada
DISTRIBUCION NORMAL.
Esta distribución es frecuentemente utilizada en las aplicaciones estadísticas.
Su propio nombre indica su extendida utilización, justificada por la frecuencia o
normalidad con la que ciertos fenómenos tienden a parecerse en su
comportamiento a esta distribución.
Muchas variables aleatorias continuas presentan una función de densidad cuya
gráfica tiene forma de campana.
En otras ocasiones, al considerar distribuciones binomiales, tipo B(n,p), para un
mismo valor de p y valores de n cada vez mayores, se ve que sus polígonos
de frecuencias se aproximan a una curva en "forma de campana".
En resumen, la importancia de la distribución normal se debe principalmente a
que hay muchas variables asociadas a fenómenos naturales que siguen el
modelo de la normal







Caracteres morfológicos de individuos (personas, animales,
plantas,...) de una especie, p.ejm. tallas, pesos, envergaduras,
diámetros, perímetros,...
Caracteres fisiológicos, por ejemplo: efecto de una misma dosis
de un fármaco, o de una misma cantidad de abono.
Caracteres sociológicos, por ejemplo: consumo de cierto producto
por un mismo grupo de individuos, puntuaciones de examen.
Caracteres psicológicos, por ejemplo: cociente intelectual, grado
de adaptación a un medio,...
Errores cometidos al medir ciertas magnitudes.
Valores estadísticos muestrales, por ejemplo : la media.
Otras distribuciones como la binomial o la de Poisson son
aproximaciones normales, ...
Y en general cualquier característica que se obtenga como suma de muchos
factores.
FUNCIÓN DE DENSIDAD
Empleando cálculos bastante laboriosos, puede demostrarse que el modelo de
la función de densidad que corresponde a tales distribuciones viene dado por
la fórmula
Representación gráfica de esta función de
densidad
La distribución normal queda definida por dos parámetros, su media y su
desviación típica y la representamos así
FUNCIÓN DE DISTRIBUCIÓN




Puede tomar cualquier valor (- ¥, + ¥)
Son más probables los valores cercanos a uno central que llamamos
media m
Conforme nos separamos de ese valor m , la probabilidad va
decreciendo de igual forma a derecha e izquierda (es simétrica).
Conforme nos separamos de ese valor m , la probabilidad va
decreciendo de forma más o menos rápida dependiendo de un
parámetro s , que es la desviación típica.
F(x) es el área sombreada de esta
gráfica
TIPIFICACIÓN
Por tanto su función de densidad es
y su función de distribución es
siendo la representación gráfica de esta función
a la variable Z se la denomina variable tipificada de X, y a la curva de su
función de densidad curva normal tipificada.
Característica de la distribución normal tipificada (reducida,
estándar)





No depende de ningún parámetro
Su media es 0, su varianza es 1 y su desviación típica es 1.
La curva f(x) es simétrica respecto del eje OY
Tiene un máximo en este eje
Tiene dos puntos de inflexión en z =1 y z = -1
Aproximación de la Binomial por la Normal (Teorema de De
Moivre):
Demostró que bajo determinadas condiciones (para n grande y tanto p como q
no estén próximos a cero) la distribución Binomial B(n, p) se puede aproximar
mediante una distribución normal
Debemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto más
próximo sea p a 0.5, tanto mejor será la aproximación realizada. Es decir,
basta con que se verifique
gracias a esta aproximación es fácil hallar probabilidades binomiales, que para
valores grandes de n resulten muy laboriosos de calcular.
Hay que tener en cuenta que para realizar correctamente esta transformación
de una variable discreta (binomial) en una variable continua (normal) es
necesario hacer una corrección de continuidad.
CHI CUADRADO.
Además de la importancia de la distribución 2como la distribución a la que se
ajusta la distribución muestral de la varianza de un población normal, y su
posterior aplicación en el contraste de la varianza
Definición de chi-cuadrado
Si para todo ,
sigue una distribución normal con media 0 y varianza 1
sigue una distribución chi-cuadrado con
entonces
libertad. Esto lo expresamos del siguiente modo:
grados de
.
Teorema
Sean
variables aleatorias independientes normalmente
distribuidas, con media 0 y varianza comun
. Entonces,
, donde
una matriz simétrica, sigue una distribución chi-cuadrado de
de libertad si y sólo si
es
grados
es una matriz idempotente.
Demostración
Teorema
Sean
variables aleatorias independientes normalmente
distribuidas, con media 0 y varianza común 1. Sean, además
y
matrices simétricas de dimensión
independientes si y sólo si
Demostración
.
. Entonces
y
y
con
son
Definición de distribución F de Fisher-Snedecor
Si
y son variables aleatorias independientes que se distribuyen como
sendas chi-cuadrado de
y
grados de libertad respectivamente, entonces
sigue una distribución F de Fisher de
y
grados de libertad en el numerador
grados de libertad en el denominador.
Definición de distribución t de Student
Si es una variable aleatoria con distribución normal de media 0 y varianza 1 y
es otra variable aleatoria, independiente de con distribución
sigue una distribución t de Student de
entonces
grados de libertad.
Relación entre las distribuciones t y F
Como
Suden de
se deduce que si
es una variable con una distribución t de
grados de libertad, entonces
con un grado de libertad en el numerador y
sigue una distribución F de Fisher
en el denominador.