Download Estadística en la experimentación
Document related concepts
Transcript
Estadística en la experimentación Muestreo En estadística se conoce como muestreo a la técnica para la selección de una muestra a partir de una población. En esta actividad se toman ciertas muestras de una población de elementos de los cuales vamos a tomar ciertos criterios de decisión, el muestreo es importante porque a través de él podemos hacer análisis de situaciones de una empresa o de algún campo de la sociedad. Al conjunto de muestras que se pueden obtener de la población se denomina espacio muestral. La variable que asocia a cada muestra su probabilidad de extracción, sigue la llamada distribución muestral. Espacio Muestral Espacio muestral (U) es el conjunto universo de todos los resultados posibles de un experimento dado. Cada uno de sus elementos se denomina punto muestral o muestra. Ejemplos 1) Lanzamiento de monedas: a) Si el experimento se basa en el lanzamiento de una moneda, el espacio muestral tiene dos elementos, cara (c) y sello (s): U = {c, s} b) Con dos monedas, el espacio muestral tiene 4 elementos: U = {(c,c),(c,s),(s,c),(s,s)} c) Con tres monedas, tiene 8 elementos: U = { ( c, c, c ), ( c, c, s ), ( c, s, c ), ( c, s, s ), ( s, c, c ), ( s, c, s ), ( s, s, c ), ( s, s, s ) } d) n monedas, tiene 2n elementos. Frecuencia Se llama Frecuencia a la cantidad de veces que se repite un determinado valor de la variable. Se suelen representar con histogramas y con diagramas de Pareto. Procedimiento para construir la Tabla de Frecuencias 1.- Determinar el rango.- El rango es la diferencia entre la medida más alta y la medida más baja. Rango = Max – Min 2.- Determinar el ancho de intervalo.- Se debe dividir el rango para 10 o 12. Habitualmente 10. W=Rango/10 1 José Sacarelo M. Generalmente el ancho no es un número entero, y debe ser redondeado hacia arriba o abajo para tener un número entero impar preferentemente. Cada intervalo deberá comenzar con un múltiplo del ancho del intervalo W pero menor que la calificación más baja. 3.- Cuente las cantidades y determine las veces que se repite en un determinado intervalo. 4.- Construya la tabla de Frecuencia. En una fila coloque el intervalo y en la siguiente fila coloque la frecuencia. Histograma de frecuencias Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Permite la comparación de los resultados de un proceso. Procedimiento para construir un Histograma 1.- Determinar el punto medio de cada intervalo, es el dato que se encuentra en la mitad del intervalo. 2.- En el eje horizontal se representa el punto medio del intervalo de clase. 3.- En el eje vertical se representa la frecuencia. 4.- Las barras se representan como columnas verticales. La altura es la frecuencia para ese intervalo y el ancho es el ancho del intervalo. La media o promedio de la distribución se define, como: N x x i 1 i N es la media aritmética de los valores observados. La moda corresponde al valor de la variable donde esta la máxima frecuencia, o sea, que en un histograma la moda corresponde al valor de la variable donde hay un pico o máximo. Si una distribución tiene dos máximos la denominamos distribución bimodal, y si tiene tres máximos trimodal y así sucesivamente. Mientras que a la media la calculamos usando una formula, a la moda la evaluamos directamente del histograma. La mediana es el valor de la variable que separa los datos entre aquellos que definen el primero 50% de los valores de los de la segunda mitad. O sea que la mitad de los datos de la población o muestra están arriba de la mediana y la otra mitad están abajo de la misma. 2 José Sacarelo M. Para estimar la mediana tenemos que observar la lista de datos ordenados de menor a mayor, y ubicar el valor central de la lista. Si el número de datos es impar, la mediana corresponde precisamente al valor central. Si el numero N de datos es par, la mediana se estima como xN xN Mediana 2 2 1 2 En una distribución dada, una línea vertical trazada desde la mediana divide a la distribución en dos partes de área equivalentes. Varianza La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza se representa por 2 . N 2 ( x1 x ) ( x 2 x ) ........ ( x N x ) N 2 2 2 2 ( x i 1 i x )2 N Para simplificar el cálculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores. N x12 x 22 ........ x N2 2 x2 N 2 x i 1 2 i N x2 Varianza para datos agrupados N 2 ( x1 x ) f1 ( x 2 x ) f 2 ........ ( x N x ) f N N 2 2 2 2 ( x i 1 i x )2 f i N N x f 1 x f 2 ........ x f N x2 N 2 2 1 2 2 2 N 2 x i 1 2 i N fi x2 Desviación estándar La desviación estándar (σ) mide cuánto se separan los datos. La fórmula es la raíz cuadrada de la varianza. Expresión de la desviación estándar muestral: N ( x i 1 i x )2 N 1 3 José Sacarelo M.