Download Distribuciones-T_Chi2_F
Document related concepts
Transcript
Distribución T-Student En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Surge, en la mayoría de los estudios estadísticos prácticos, cuando la desviación típica de una población se desconoce y debe ser estimada a partir de los datos de una muestra. Existen dos versiones de la prueba t-Student: una que supone que las varianzas poblacionales son iguales y otra versión que no asume esto último. Para decidir si se puede suponer o no la igualdad de varianza en las dos poblaciones, se debe realizar previamente la prueba F-Snedecor de comparación de dos varianzas. Un poco de historia. La prueba t-Student fue desarrollada en 1899 por el químico inglés William Sealey Gosset (1876-1937), mientras trabajaba en técnicas de control de calidad para las destilerías Guiness en Dublín . Debido a que en la destilería, su puesto de trabajo no era inicialmente de estadístico y su dedicación debía estar exclusivamente encaminada a mejorar los costes de producción, publicó sus hallazgos anónimamente firmando sus artículos con el nombre de "Student". La distribución t de Student es la distribución de probabilidad del cociente: donde Z tiene una distribución normal de media nula y varianza 1 V tiene una distribución chi-cuadrado con ν grados de libertad Z y V son independientes Si μ es una constante no nula, el cociente es una variable aleatoria que sigue la distribución t de Student no central con parámetro de no-centralidad μ. Intervalos de confianza derivados de la distribución t de Student El procedimiento para el cálculo del intervalo de confianza basado en la t de Student consiste en estimar la desviación típica de los datos S y calcular el error estándar de la media= S/(raíz cuadrada de n), siendo entonces el intervalo de confianza para la media = x media +t (alfa/2) multiplicado por (S/(raíz cuadradada de n)). Es este resultado el que se utiliza en el test de Student: puesto que la diferencia de las medias de muestras de dos distribuciones normales se distribuye también normalmente, la distribución t puede usarse para examinar si esa diferencia puede razonablemente suponerse igual a cero. para efectos prácticos el valor esperado y la varianza son : E(t(n))= 0 y Var (t(n-1)) = n/(n-2) para > 3. Las distribuciones “t” de Student, Chi cuadrado ( 2) y F, se derivan de la distribución Normal y están relacionadas con la teoría del muestreo pequeño n< 30. Son muy importantes pues son la base de metodologías inferenciales, tales como Intervalos de Confianza y Pruebas de Hipótesis. Las variables “t”, 2 y F surgen de transformaciones de variables aleatorias en las que están involucrados estadísticos muestrales, tales como la media y la variancia. En la práctica, por lo tanto, no podemos decir por Ej. que el peso, la altura, etc., se distribuyen según t”, 2yF DISTRIBUCIÓN DE STUDENT O DISTRIBUCIÓN “t” En muchos casos se seleccionan de una población normal, muestras de tamaño pequeño n < 30 y x desconocido El estadístico “t” será DEFINICIÓN Una variable con distribución t de Student se define como el cociente entre una variable normal estandarizada y la raíz cuadrada positiva de una variable 2 dividida por sus grados de libertad. CARACTERISTICAS La distribución se denomina distribución de Student o distribución “t”. Es simétrica, con media de 0, y variancia mayor que 1. Es más achatada que la normal y adopta diferentes formas, según el número de grados de libertad. La variable t se extiende desde -a +. A medida que aumenta los (n -1) grados de libertad la distribución “t” se aproxima en su forma a una distribución normal. El parámetro de la distribución es (n-1) grados de libertad, originando una distribución diferente para cada tamaño de muestra. ¿Cómo se deduce una distribución de “t”? Extraigo K muestras de tamaño n < 30. Calculo para cada muestra el valor de “t”. Grafique la distribución para cada tamaño muestral DISTRIBUCIÓN CHI_ CUADRADO Para muestras extraídas de una población normal con variancia 2, con tamaño n < 30, siendo S2 la variancia de la muestra entonces el estadístico 2 será DEFINICIÓN Una variable Chi cuadrado se define como la suma de n variables normales estandarizadas elevadas al cuadrado. CARACTERISTICAS Por definición, una variable positivos: 0 " 2 adopta valores 2 " ". La distribución es asimétrica positiva. A medida que aumenta el tamaño de la muestra la curva es menos asimétrica, aproximándose a una curva normal. Para El cada tamaño parámetro muestral, se 2 diferente. tendrá una distribución que caracteriza a una distribución 2 son sus grados de libertad (n-1), originado una distribución para cada grado de libertad, ¿Cómo se deduce una distribución 2? Extraer K muestras de tamaño n < 30 Para cada muestra, por ejemplo n = 5, transformamos cada valor de x: x1, x2, x3, x4 y x5 en Z: z1, z2, z3, z4 y z5, utilizando: Para cada muestra calculamos: Entonces podríamos escribir , así: (1) Si cambiamos en (1) la media poblacional por X, resulta: Dado que: , despejando tenemos: (2) , al reemplazar en (2) llegamos a: Finalmente si se calcula para cada una de las K muestras y se grafica en un eje de coordenadas el 2 se genera una distribución de 2 con (n-1) grados de libertad. DISTRIBUCIÓN F DE FISHER Considerando dos muestras aleatorias independientes, de tamaño n1 y n2, extraídas de una población normal, el estadístico F será DEFINICIÓN Una variable F se define como el cociente entre dos variables ji-cuadrado divididas por sus correspondientes grados de libertad. CARACTERISTICAS Una variable con distribución F es siempre positiva por lo tanto su campo de variación es 0 " F " " La distribución de la variable es asimétrica, pero su asimetría disminuye cuando aumentan los grados de libertad del numerador y denominador. Hay una distribución F por cada par de grados de libertad. Parámetros: Grados de libertad asociados al numerador y denominador. chi-cuadrado Si para todo , sigue una distribución normal con media 0 y varianza 1 entonces sigue una distribución chi-cuadrado con grados de libertad. Esto lo expresamos del siguiente modo: . Teorema Sean variables aleatorias independientes normalmente distribuidas, con media 0 y varianza comun . Entonces, , donde es una matriz simétrica, sigue una distribución chi-cuadrado de grados de libertad si y sólo si es una matriz idempotente. Teorema Sean variables aleatorias independientes distribuidas, con media 0 y varianza común 1. Sean, además y matrices simétricas de dimensión . Entonces independientes si y sólo si . normalmente y con y son Distribución F de Fisher-Snedecor Si y son variables aleatorias independientes que se distribuyen como sendas chi-cuadrado de y grados de libertad respectivamente, entonces sigue una distribución F de Fisher de grados de libertad en el numerador y grados de libertad en el denominador. Definición de distribución t de Student Si es una variable aleatoria con distribución normal de media 0 y varianza 1 y es otra variable aleatoria, independiente de con distribución entonces sigue una distribución t de Student de grados de libertad. Relación entre las distribuciones t y F Como se deduce que si es una variable con una distribución t de Student de grados de libertad, entonces sigue una distribución F de Fisher con un grado de libertad en el numerador y en el denominador.