Download Introducción a la Estadística (118445)
Document related concepts
no text concepts found
Transcript
Estadística La estadística es la parte de las matemáticas que se ocupa de los métodos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. Dentro del campo de la estadística pueden estudiarse características de la sociedad, de las personas, de los animales, de las plantas, de determinados productos o de cualquier objeto de interés humano en general, bien lejos del concepto de las "cosas que pertenecen al Estado". Al hacer un estudio de una determinada población, observamos una característica o propiedad de sus elementos o individuos. Por ejemplo, con los alumnos y alumnas de nuestra clase, podemos estudiar el lugar donde viven, el número de hermanos, la estatura, etc. Cada una de estas características estudiadas se llama variable estadística. Si tenemos en cuenta las preguntas planteadas en la introducción: Primera variable: ¿En qué vienen a la escuela? Segunda variable: ¿Cuántas personas viven en su casa? El resultado de la primer variable puede ser: caminando, ómnibus, auto, moto, bicicleta, otros. Este tipo de variable se llama cualitativa. El resultado de la segunda variable puede ser: 2, 3, 4, 5, .... Este tipo de variable se llama cuantitativa. Una variable se llama cuantitativa cuando toma valores numéricos y cualitativos, cuando toma valores no numéricos. Una vez definidas las variables a estudiar tenemos que establecer cuál será la población a investigar. En algunos casos se trabaja con toda una población que es el conjunto formado por todos los elementos a estudiar, el cual puede llamarse conjunto completo. Otras veces no es posible trabajar con toda la población. Supongamos que debemos estudiar la altura de los niños que cumplen 10 años en el presente año. Nos damos cuenta que no podemos hacerlo con todos los cientos de miles de niños que cumplen 10 años en el país, lo que sería toda la población o conjunto completo. Podemos hacerlo con un grupo que sea manejable. O sea que vamos a usar una muestra. Queremos que esa muestra sea una buena representación de todo el conjunto. No podemos quedarnos con los más altos, porque en ese caso estaríamos deformando los resultados. Tampoco con los más bajos, ni siquiera con los que están en el medio. Tienen que estar todos mezclados. Podemos ver que hacer un muestreo tiene varias dificultades. Hay que buscar una muestra que no le de preferencia a ninguna de las cualidades a estudiar. Tiene que ser lo más heterogénea posible, pensando siempre que sea una representación en pequeño de toda la población. Por lo tanto un muestreo consiste justamente en tomar una parte de un conjunto, estudiar una de sus características y tratar de analizar si con cuidado podemos extender los resultados y conclusiones a todo el conjunto, a toda la población estudiada. MUESTRA: POBLACIÓN O CONJUNTO COMPLETO: Conjunto formado por todos los elementos a estudiar. Parte de una población que se considera representativa de la misma. MUESTREO: Acción de escoger muestras representativas. Cuando se han recogido los datos correspondientes a una variable estadística, hay que tabularlos; es decir, hay que confeccionar con ellos una tabla en la que aparezcan ordenadamente: Los valores de la variable que se está estudiando. El número de individuos de cada valor; es decir, su frecuencia. La frecuencia absoluta es el número de veces que se presenta un valor al estudiar una variable. Para hacer el recuento, se leen los datos uno a uno y se marca una señal en el correspondiente valor. Si las señales se agrupan, de cinco en cinco por ejemplo, es más fácil contarlas. Cuando se hace un estudio estadístico se obtiene una gran cantidad de datos numéricos. Para tener una información clara y rápida de lo obtenido en el estudio se han creado las gráficas estadísticas. Hay muchos tipos de gráficas estadísticas. Cada una de ellas es adecuada para un estudio determinado, ya que no siempre se puede utilizar la misma para todos los casos. Las más comunes son: Diagrama de barras Histograma Polígono de frecuencias Diagrama de sectores Se utiliza para representar los caracteres cualitativos y cuantitativos discretos. En el eje horizontal, o eje de abscisas, se representan los datos o modalidades; en el eje vertical o de ordenadas, se representan las frecuencias de cada dato o modalidad. Sobre el eje horizontal se levantan barras o rectángulos de igual base (que no se superpongan) cuya altura debe ser proporcional a la frecuencia que representan. Rápidamente podemos ver que el fútbol es el deporte preferido, por la longitud de la barra. Todas las barras deben ser del mismo ancho para no confundir al lector. Los espacios entre barras deben ser igual a la mitad del ancho de las barras. Se deben incluir las escalas y algunas indicaciones para que ayuden a la lectura de las gráficas. Los ejes de las gráficas se deben identificar en forma clara. Se deben incluir dentro del cuerpo de la gráfica, o debajo, todo tipo de "claves" para la interpretación de las gráficas. El título de la gráfica debe aparecer debajo del cuerpo. Las notas de pie de página, o sobre fuentes, cuando sean necesarias, se deben colocar después del título. Un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos. Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores. Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso. Ejemplo: Para realizar el polígono unimos los puntos medios de las bases superiores del diagrama de barras o del histograma. También conocido como gráfico de torta o gráfico circular. Se representan los datos en un círculo, de modo que la frecuencia de cada valor viene dada por un trozo de área del círculo. Así, el círculo queda dividido en sectores cuya amplitud es proporcional a las frecuencias de los valores. Sirve para representar cualquier tipo de variable. EJEMPLO: En la clase se realizó la siguiente encuesta: ¿Qué libros prefieres leer? Los resultados se ordenaron en esta tabla Tipos de libros De Misterio De Aventuras Historietas Total N° de alumnos 15 9 6 30 Si queremos representar esta información en un gráfico de torta tenemos que realizar unos cálculos previamente. Como la medida de la superficie de cada sector es directamente proporcional a la medida del ángulo central, se hace una proporcionalidad directa entre la cantidad de alumnos que hay en el sector con respecto al total de alumnos y el ángulo del sector (la incógnita) con respecto al ángulo central de todo el círculo, o sea 360°. Para el sector de libros de misterio tenemos: 30 alumnos ---------------360° (todo el círculo) 15 alumnos --------------- incógnita (sector del círculo correspondiente a libros de misterio) Ángulo sector Misterio = 360° X 15 alumnos / 30 alumnos = 180° (la mitad del círculo) Ángulo sector Aventuras = 360° X 9 alumnos / 30 alumnos = 108° Ángulo sector Historietas = 360° X 6 alumnos / 30 alumnos = 72° Si sumamos la amplitud de los tres sectores nos tiene que dar el círculo completo: 180° + 108° + 72° = 360° La estadística maneja gran cantidad de datos e intenta resumirlos en unos pocos representativos. Estos son los parámetros centrales. Los parámetros centrales más usados son: Media aritmética Mediana Moda La media y la mediana sólo se pueden obtener en variables cuantitativas, mientras que la moda se puede obtener en variables cualitativas y cuantitativas. La media de varias cantidades, es la suma de todas las cantidades dividida entre el número de ellas. También se llama promedio. EJEMPLO: Cinco amigos cuentan las canicas que tienen cada uno. Son: 10, 15, 5, 17 y 8. La media de esas cantidades es: media = (10 + 15 + 5 + 17 + 8) / 5 = 11 El significado del resultado es claro: es lo que le tocaría a cada uno de los cinco si se juntaran todas las canicas y se repartieran por igual. Para hallar la media de los datos de una tabla de frecuencias correspondiente a una variable cuantitativa: Se multiplica cada dato por su frecuencia y se suman los resultados. La suma total se divide por la suma de todas las frecuencias. EJEMPLO: El número de hijos de las familias de 40 alumnos se registró en la siguiente tabla: N° de hijos Frecuencia 1 7 2 14 3 9 4 8 5 2 Media = (1X7 + 2X14 + 3X9 + 4X8 + 5X2) / 40 = 2,6 Se llama mediana de un conjunto de datos numéricos al que ocupa el valor central. Para calcularla, ordenamos las cantidades de menor a mayor y elegimos la del medio. Si hay un número par de datos, la mediana es el promedio de los dos valores centrales. La moda es el valor que mayor frecuencia absoluta tiene en un estudio estadístico, o sea el que se repite más. Puede ocurrir que la moda no sea única, es decir, que haya más de un valor con la frecuencia máxima. Se habla entonces de distribuciones bimodales, trimodales ... EJEMPLO: En la siguiente tabla se registraron los datos de una encuesta realizada a 100 niñas de la escuela. La pregunta fue: Colores Frecuencia Azul 43 ¿Cuál es tu color preferido? Verde 15 Amarillo 12 Rojo 30 Si observamos la tabla vemos que el color azul es la moda, ya que es el valor con mayor frecuencia. 100 Introducción a la Estadística Matemática Liceo la coronilla Prof.: Richard Gómez