Download Distribución t de Student
Document related concepts
Transcript
Probabilidad t-student En probabilidad y estadística, la distribución t (de Student) es una distribución de probabilidad que surge del problema de estimar la media de una población normalmente distribuida cuando el tamaño de la muestra es pequeño. Aparece de manera natural al realizar la prueba t de Student para la determinación de las diferencias entre dos medias muestrales y para la construcción del intervalo de confianza para la diferencia entre las medias de dos poblaciones cuando se desconoce la desviación típica de una población y ésta debe ser estimada a partir de los datos de una muestra. La distribución t de Student es la distribución de probabilidad del cociente {\displaystyle T={\frac {Z}{\sqrt {V/\nu \ }}}=Z{\sqrt {\frac {\nu \ }{V}}}} donde Z es una variable aleatoria distribuida según una normal típica (de media nula y varianza 1). V es una variable aleatoria que sigue una distribución χ² con {\displaystyle \nu \ } libertad. grados de Z y V son independientes Si μ es una constante no nula, el cociente {\displaystyle {\frac {Z+\mu }{\sqrt {V/\nu \ }}}} es una variable aleatoria que sigue la distribución t de Student no central con parámetro de nocentralidad {\displaystyle \mu } . Probabilidades en distribuciones t de Student Las distribuciones t de Student son parecidas a la normal. Se pueden utilizar para hacer estimaciones de la media cuando se desconoce la varianza (es lo habitual) y se usan muestas pequeñas. Los intervalos así obtenidos son, no podría ser de otra manera, más grandes y menos precisos que los que se obtendrían si supusieramos conocida la varianza en una distribución normal. En el applet comparamos distribuciones t de Student con la normal estándar. Podemos elegir el valor del parámetro "grados de libertad" y modificar los extremos del intervalo simétrico en torno a la media. Con estos datos se obtiene unas probabilidades (cálculos aproximados) que se muestran. A1 representa el área de la zona central y A2 es el área de las dos colas de los extremos. La suma de ambas áreas es 1. Si consideramos esos mismos extremos del intervalo en el caso de una distribución normal estándar comprobamos que la probabilidad de la zona central (A1) es mayor para la distribución normal que para la t de Student. Si el parámetro grados de libertad es grande la diferencia es pequeña. Partiendo de un intervalo podemos obtener una probabilidad en una distribución t de Student. Nos podemos plantear el tamaño del intervalo que barre la misma área bajo la campana de Gauss. El extremo positivo del intervalo se calcula y se muestra en "x1 Normal". El segmento dibujado de color naranja debajo de las gráficas representa ese intervalo que es de menor amplitud que el correspondiente de la t de Student. Podemos ver cómo si el parámetro grados de libertad es suficientemente grande la diferencia entre ambos intervalos es pequeña. Los puntos grises controlan la escala vertical y horizontal de la gráfica y pulsando el boton derecho y arrastrando podemos moverla a derecha e izquierda. ENLACES Distribución t de Student La distribución t de Student fue estudiada por Gosset y se aproxima a una distribución normal. Distribución Normal La distribución normal fue estudiada por Gauss. Una, dos y tres desviaciones típicas Propiedad de las distribuciones normales. Cálculo de probabilidades en distribuciones normales Cálculo aproximado de probabilidades de diferentes intervalos en distribuciones normales. Distribución binomial La distribución binomial modela una situación en la que hay n ensayos independientes con una probabilidad constante de éxito. Aproximación normal a la distribución Binomial En algunos casos, una distribución Binomial puede aproximarse con una distribución Normal con la misma media y varianza. Distribución de Poisson La distribución de Poisson también se llama distribución de sucesos raros. La distribución Gamma Este modelo es una generalización del modelo Exponencial ya que, en ocasiones, se utiliza para modelar variables que describen el tiempo hasta que se produce p veces un determinado suceso. Su función de densidad es de la forma: Como vemos, este modelo depende de dos parámetros positivos: α y p. La función Γ(p) es la denominada función Gamma de Euler que representa la siguiente integral: que verifica Γ(p + 1) = pΓ(p), con lo que, si p es un número entero positivo, Γ(p + 1) = p! El siguiente programa permite visualizar la forma de la función de densidad de este modelo (para simplificar, se ha restringido al caso en que p es un número entero). Propiedades de la distribución Gamma Su esperanza es pα. Su varianza es pα2 La distribución Gamma (α, p = 1) es una distribución Exponencial de parámetro α. Es decir, el modelo Exponencial es un caso particular de la Gamma con p = 1. Dadas dos variables aleatorias con distribución Gamma y parámetro α común X ~ G(α, p1) y Y ~ G(α, p2) se cumplirá que la suma también sigue una distribución Gamma X + Y ~ G(α, p1 + p2). Una consecuencia inmediata de esta propiedad es que, si tenemos k variables aleatorias con distribución Exponencial de parámetro α (común) e independientes, la suma de todas ellas seguirá una distribución G(α, k).