Download Apuntes Introducción a la estadistica
Document related concepts
no text concepts found
Transcript
Liceo Industrial Benjamín Dávila Larrain Laboratorio Químico Módulo Calidad Prof. Pamela Mondaca M NOMBRE: CURSO: INTRODUCCIÓN A LA ESTADÍSTICA. La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. La Estadística tiene por objeto recolectar, organizar, resumir, presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A través de la cuantificación y el ordenamiento de los datos intenta explicar los fenómenos observados, por lo que resulta una herramienta de suma utilidad para la toma de decisiones. Población o Universo: es el total del conjunto de elementos u objetos de los cuales se quiere obtener información. Aquí el término población tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas, actos, áreas geográficas e incluso al tiempo. Muestra: es un subconjunto de unidades de análisis de una población dada, destinado a suministrar información sobre la población. Para que este subconjunto de unidades de análisis sea de utilidad estadística, deben reunirse ciertos requisitos en la selección de los elementos. Variable: es la cualidad o cantidad medible que se estudia de las unidades de análisis y que varían de una unidad a otra. Por ejemplo: edad, ingreso de un individuo, sexo, cantidad de lluvia caída, etc. Las variables se clasifican en dos grupos de acuerdo al nivel de medición utilizado para su observación: 1) Variables cualitativas: son las variables medidas en escala nominal u ordinal, ya que la característica que miden de la unidad de análisis es una cualidad. - Nominal es la modalidad no numérica que no admite orden. Ej. Estado civil. - Ordinal es la modalidad no numérica que tiene orden. Ej. Medallas de Oro, plata, bronce. 2) Variables cuantitativas: son las variables que se expresan mediante un número, realizando operaciones aritméticas con ellas, puesto que lo que miden es una cantidad, pueden ser discretas o continuas. - Discreta es aquella que toma valores aislados - Continua puede tomar valores comprendidos entre dos números. Frecuencia: es el número de veces que se presenta cada valor de la variable. Tabla de frecuencias: es una tabla que presenta en forma ordenada los distintos valores de una variable y sus correspondientes frecuencias. Por ejemplo: consideremos la variable “número de aulas por escuela”, medida en las escuelas de una localidad. Número de aulas Frecuencia por escuela (1) (2) 8 7 9 7 10 12 11 11 12 15 13 10 14 5 67 En la columna (1) se observan los valores que toma la variable “número de aulas por escuela”, que varían de 8 a 14. En la columna (2) se ha colocado la cantidad de escuelas correspondiente a cada valor de la variable. Si sumamos esta columna obtenemos la cantidad total de escuelas bajo estudio. Representación gráfica: en general la representación gráfica de una tabla de frecuencias permite percibir con mayor claridad algunas características de la masa de datos que se investiga. Por ello, a través de gráficos, resulta bastante más fácil transmitir conclusiones a personas no habituadas a la interpretación de tablas de frecuencias. Liceo Industrial Benjamín Dávila Larrain Laboratorio Químico Módulo Calidad Prof. Pamela Mondaca M Para representar gráficamente una distribución de frecuencias se utiliza un par de ejes de coordenadas. En el eje de las abscisas se representará la variable estudiada y en el eje de las ordenadas, las correspondientes frecuencias. El siguiente es un gráfico de frecuencias confeccionado con los datos del ejemplo anterior. Frecuencia 15 10 5 1 2 3 4 5 6 7 8 Número de aulas 9 10 11 12 13 14 P ol í gonos de fre cue nc i as Un polígono de frecuencias se forma uniendo los extremos de las barras mediante segmentos. También se puede realizar trazando los puntos que representan las frecuencias y uniéndolos mediante segmentos. Ejemplo: Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones: Hora Te mpe ra tura 6 7º 9 12° 12 14° 15 11° 18 12° 21 10° 24 8° Diagrama de sectores. Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un círculo, de modo que el ángulo de cada sector es proporcional a la frecuencia absoluta correspondiente. El diagrama circular se construye con la ayuda de un transportador de ángulos. Ejemplo: En una clase de 30 alumnos, 12 juegan a baloncesto, 6 practican la natación, 9 juegan al fútbol y el resto no practica ningún deporte. Liceo Industrial Benjamín Dávila Larrain Laboratorio Químico Módulo Calidad Prof. Pamela Mondaca M Al umnos Án gul o Ba l onc e s to 12 144° Na ta c i ón 6 72° Fútbol 9 108° S i n de porte 3 36° Tota l 30 360° Histograma. Un histograma es una representación gráfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran número de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectángulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados. Polígono de frecuencia. Para construir el polígono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectángulo. Ejemplo: El peso de 65 personas adultas viene dado por la siguiente tabla: ci fi Fi [5 0 , 60 ] 55 8 8 [6 0 , 70 ] 65 10 18 [7 0 , 80 ] 75 16 34 [8 0 , 90 ] 85 14 48 [9 0 , 10 0 ] 95 10 58 [1 0 0 , 1 1 0 ] 110 5 63 [1 1 0 , 1 2 0 ] 115 2 65 65 Liceo Industrial Benjamín Dávila Larrain Laboratorio Químico Módulo Calidad Prof. Pamela Mondaca M Histograma y polígono de frecuencias acumuladas. Si se representan las frecuencias acumuladas de una tabla de datos agrupados se obtiene el histograma de frecuencias acumuladas o su correspondiente polígono. Parámetros estadísticos Al obtener de una población la distribución de frecuencias de una variable lo que se persigue es reducir o condensar en pocas cifras el conjunto de observaciones relativas a dicha variable. 1) Medidas de centralización: Moda o modo: (Mo) es el valor de la variable que más veces se repite, o sea, el valor que presenta mayor frecuencia. Se puede encontrar para variables cuantitativas y cualitativas. Es útil como medida de tendencia central, sólo en aquellos casos en que un valor de la variable es mucho más frecuente que el resto. Se basa en la idea de “lo que es moda” o en el “comportamiento de la mayoría” para tomar a cierto valor como representativo del comportamiento de los datos. Mediana: (Me) Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. Se encuentra solo en variables cuantitativas. Si todos los valores observados de la variable se ordenan en sentido creciente (o decreciente), la mediana es el valor de la variable que ocupa el lugar central, es decir, el que deja a un lado y a otro el mismo número de observaciones. Media aritmética ( ) : es el número que se obtiene al dividir la suma de todas las observaciones por la cantidad de observaciones sumadas. 2) Medidas de posición: Cuartiles: son los tres valores de la variable dividen a un conjunto de datos ordenados en cuatro partes iguales, cada uno corresponde al 25%. Deciles: son los nueve valores que dividen la serie de datos en diez partes iguales, corresponden a los valores de 10%, 20%, etc. Percentiles: son los 99 valores que dividen la serie de datos en 100 partes iguales, corresponden a los valores de 1%, 2%, etc. 3) Medidas de dispersión: Rango: es la diferencia entre el mayor y el menor de los datos de una distribución estadística. Desviación media ( ): La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. Liceo Industrial Benjamín Dávila Larrain Laboratorio Químico Módulo Calidad Prof. Pamela Mondaca M Varianza ( ): La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media. Desviación típica (σ): La desviación típica es la raíz cuadrada de la varianza. Coeficiente de variación: El coeficiente de variación es la relación entre la desviación típica de una muestra y su media. Puntuaciones típicas: Las puntuaciones típicas son el resultado de dividir las puntuaciones diferenciales entre la desviación típica. Este proceso se llama tipificación. Esquema de Estadística