Download Estimacion
Document related concepts
no text concepts found
Transcript
Distribución de la Media Muestral Experimentos de Simulación Este metodo permite obtener información acerca de la distribución muestral de una estadísitica. Para realizar el xperimento hay que especificar La estadística de interés ( promedio, desviación estándar, etc) La distribución poblacional El tamño de la muestra El número de réplicas Podemos por ejemplo una población normal con un promedio poblacional de 8.25 y una desviación estándar de 0.75. Podemos generar 1000 muestras de tamaños 2, 5, 10, 20 y 30. de cada experimento calculamos la media muestral, la desviación estándar de la media muestral y la desviación estándar de la muestra. Se generan los datos test1<-rnorm(500,8.25, 0.75) Se genera la matrix donde seran almacenadas las 1000 muestras de tamños diferentes, a continuación se presenta el caso de n =2 test<-matrix(nrow=1000,ncol=2) en seguida se toman muestras de tamaño 2 for(i in 1:1000) { test[i,]<-sample(test1,2) } Se sacan los promedios de cada muestra mean.size2<-apply(test,1,mean) se obtiene el promedio de todos los promedios muestrales mean(mean.size2) Tips R-codes For Simulation (a) Population 1: Right Skewed Distribution We can simulate from a Poisson distribution: > test1<-rpois(1000,2) > hist(test1) > mean(test1) [1] 2.029 > sd(test1) [1] 1.382777 (b) Population 1: Obtaining 1000 Samples With Size 2, 3, 6, 10, 20, 100 Here is the case for Size 2. Others are similar. > test<-matrix(nrow=1000,ncol=2) > for(i in 1:1000) { test[i,]<-sample(test1,2) } > mean.size2<-apply(test,1,mean) > mean(mean.size2) [1] 2.0945 > sd(mean.size2) [1] 0.9860487 (c) Population 2: Obtaining 1000 Samples With Size 2, 3, 6, 10, 20, 100 Again, only the case for size 2 is included. test<-matrix(nrow=1000,ncol=2) for(i in 1:1000) { test[i,]<-sample(test2,2) } mean.size2.norm<-apply(test,1,mean) > mean(mean.size2.norm) [1] 99.95793 8 > sd(mean.size2.norm) [1] 7.199265 (d) Population 1: Plotting Histograms and QQ-plots par(mfrow=c(3,2)) hist(mean.size2) hist(mean.size3) hist(mean.size6) hist(mean.size10) hist(mean.size20) hist(mean.size100) par(mfrow=c(3,2)) qqnorm(mean.size2) qqnorm(mean.size3) qqnorm(mean.size6) qqnorm(mean.size10) qqnorm(mean.size20) qqnorm(mean.size100) (e) Population 2: Plotting Histograms and QQ-plots par(mfrow=c(3,2)) hist(mean.size2.norm) hist(mean.size3.norm) hist(mean.size6.norm) hist(mean.size10.norm) hist(mean.size20.norm) hist(mean.size100.norm) par(mfrow=c(3,2)) qqnorm(mean.size2.norm) qqnorm(mean.size3.norm) qqnorm(mean.size6.norm) qqnorm(mean.size10.norm) qqnorm(mean.size20.norm) qqnorm(mean.size100.norm) > twosam <- function(y1, y2) { n1 <- length(y1); n2 <- length(y2) yb1 <- mean(y1); yb2 <- mean(y2) s1 <- var(y1); s2 <- var(y2) s <- ((n1-1)*s1 + (n2-1)*s2)/(n1+n2-2) tst <- (yb1 - yb2)/sqrt(s*(1/n1 + 1/n2)) tst } With this function defined, you could perform two sample t-tests tstat <- twosam(data$male, data$female); tstat Teorema del Límite Central Sean Una muestra aleatoria de una distribución con media Y varianza Entonces si n es suficientemente grande Tiene una distribución Normal aproximada con Y También tiene una distribución Normal con INTERVALOS DE CONFIANZA