Download TAREA_3_EAE_II_1 - Centro Cultural Universitario
Document related concepts
Transcript
CENTRO CULTURAL UNIVERSITARIO Estadística Aplicada a la Educación Licenciatura en Pedagogía Arely Valdéz Rivera (# Control. 314363) Unidad IV. Covarianza 12/Noviembre/2016 Covarianza En probabilidad y estadística, la covarianza es un valor que indica el grado de variación conjunta de dos variables aleatorias. Es el dato básico para determinar si existe una dependencia entre ambas variables y además es el dato necesario para estimar otros parámetros básicos, como el coeficiente de correlación lineal o la recta de regresión. Estimadores En estadística, un estimador es un estadístico (esto es, una función de la muestra) usado para estimar un parámetro desconocido de la población. Por ejemplo, si se desea conocer el precio medio de un artículo (el parámetro desconocido) se recogerán observaciones del precio de dicho artículo en diversos establecimientos (la muestra) y la media aritmética de las observaciones puede utilizarse como estimador del precio medio. Suma La adición es una operación básica de la aritmética de los números naturales, enteros, racionales, reales y complejos; por su naturalidad, que se representa con el signo "+", el cual se combina con facilidad matemática de composición en la que consiste en combinar o añadir dos números o más para obtener una cantidad final o total. La adición también ilustra el proceso de juntar dos colecciones de objetos con el fin de obtener una sola colección. Por otro lado, la acción repetitiva de sumar uno es la forma más básica de contar. Muestreo por error El error de muestreo es la desviación de la muestra seleccionada de las verdaderas características, rasgos, comportamientos, cualidades o figuras de toda la población. Covarianza y los Estimadores Covarianza y las Sumas Covarianza y las Muestras por Error ¿Por qué sucede? Los estimadores clásicos del valor medio μ y la varianza σ2 de una variable aleatoria o población X son la media muestral y la varianza muestral, respectivamente. Dada una muestra aleatoria X1, X2,..., Xn de tamaño n de una población X, se define el estimador media muestral como la siguiente variable aleatoria: ANCOVA de un factor El análisis de un factor es apropiado cuando se dispone de tres o más grupos. En los diseños equilibrados, cada grupo tiene el mismo número de datos (individuos), los cuales idealmente han sido asignados al azar a cada grupo a partir de una muestra original preferiblemente homogénea. La sumatoria o sumatorio se emplea para representar la suma de muchos o infinitos sumandos. El error del proceso de muestreo ocurre cuando los investigadores toman diferentes sujetos de la misma población, y aun así, los sujetos tienen diferencias individuales. Debes recordar que cuando tomas una muestra, se trata de un subconjunto de toda la población y, por lo tanto, puede haber una diferencia entre la muestra y la población. La expresión se lee: "sumatoria de Xi, donde i toma los valores de 1 a n". La operación sumatoria se expresa con la letra griega sigma mayúscula Σ. i es el valor inicial llamado límite inferior. n es el valor final llamado límite superior. Se trata, por tanto, de un estimador centrado del valor medio μ de una variable aleatoria X, cuya varianza decrece a medida que aumenta n, el tamaño muestral, es decir, a medida de que se disponga de "mayor información" de la población. Si la sumatoria abarca la totalidad de los valores, su expresión se puede simplificar: La causa más frecuente de dicho error es un procedimiento de muestreo sesgado. Todo investigador debe tratar de establecer una muestra que esté libre de sesgos y sea representativa de toda la población. Así, el investigador es capaz de minimizar o eliminar el error de muestreo. Otra causa posible de este error es la casualidad. Se lleva a cabo el proceso de aleatorización y muestreo de probabilidad para minimizar el error del proceso de muestreo, pero igualmente es posible que todos los sujetos asignados al azar no sean representativos de la población. La varianza muestral una muestra aleatoria X1, X2 ,..., Xn de tamaño n de una población X se define como: La suma de las frecuencias absolutas se puede expresar como: 1. 2. Y la media como: 1. 2. S2 es un estimador centrado de σ2 , cuya varianza se reduce al aumentar el tamaño muestral. Observación: conviene señalar en estos momentos que la gran mayoría de estadísticos o estimadores que aparecen en inferencia estadística pueden expresarse en función de medias y varianzas muestrales, que afectan a una o varias poblaciones univariantes o multivariantes. Ejemplo En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la media. Figura 1.1 El resultado más común de error de muestreo es el error sistemático en donde los resultados de la muestra difieren significativamente de los resultados de toda la población. Se entiende que si la muestra no es representativa de toda la población, lo más probable es que los resultados de la muestra difieran de los resultados de toda la población. Formas de eliminar el error de muestreo Sólo hay una manera de eliminar este error. Consiste en eliminar el concepto de muestra y probar a toda la población. En la mayoría de los casos esto no es posible. Por consiguiente, lo que el investigador debe hacer es minimizar el error del proceso de muestreo. Esto se puede lograr con un muestreo probabilístico adecuado y no sesgado y mediante el uso de un gran tamaño de la muestra. Figura 1.1 Fuentes Bibliográficas https://es.wikipedia.org/wiki/Covarianza https://es.wikipedia.org/wiki/Estimador https://es.wikipedia.org/wiki/Adici%C3%B3n_(matem%C3%A1tica) https://explorable.com/es/error-de-muestreo http://e-stadistica.bio.ucm.es/mod_intervalos/intervalos4.html http://www.ditutor.com/estadistica/sumatoria.html