Download ESTADÍSTICA
Document related concepts
Transcript
ESTADÍSTICA La ESTADÍSTICA es una rama de las Matemáticas que recoge, ordena, analiza e interpreta datos relativos a un conjunto de personas o cosas ( POBLACIÓN ). La población es FINITA cuando lo es el número de elementos que la componen. Y es INFINITA cuando el número de elementos es infinito. Si el número de elementos es muy grande, se consideran infinitos. Por ejemplo, el número de niños en edad escolar en España, es un número finito, pero se considera una población infinita. MUESTRA: cuando la población es muy grande o infinita, se trabaja con una parte pequeña de dicha población, llamada MUESTRA. Es imprescindible que dicha muestra sea representativa. Ej: elecciones en España. CARACTERES : Los caracteres de una población son las cualidades o propiedades que poseen. Por ejemplo,para los alumnos de ESO de este centro pueden ser : altura, peso, edad, color del pelo, deporte favorito,etc. Los caracteres de una población pueden ser CUALITATIVOS o Atributos y CUANTITATIVOS o Variables. CUALITATIVOS ( atributos ) : son los que se describen mediante palabras, por ejemplo, sexo, estado civil, lugar de nacimiento, profesión, color favorito, etc. CUANTITATIVOS ( variables) :son aquellos que son medibles, es decir, se pueden expresar mediante un número, por ejemplo, edad, peso, nº de hijos, sueldo, tiempo que vemos la Tv, etc. A su vez, las variables pueden ser : DISCRETAS : si toman un número finito de valores, no pudiendo tomar valores intermedios entre dos consecutivos,por ej : nº de hermanos, nº de asignaturas suspensas, etc. CONTINUAS : cuando pueden tomar infinitos valores dentro de un intervalo,es decir, pueden tomar valores entre dos consecutivos por pequeños que sea su diferencia,por ej: la altura, el peso, tiempo que se tarda en llegar de casa al instituto, el sueldo entre los empleados de una empresa,etc. ESTADÍSTICA DESCRIPTIVA : Tiene como objeto la recogida, recopilación y redución de datos a unas pocas medidas descriptivas, permitiendo conocer las características existentes en un conjunto de datos.Las medidas descriptivas que se usan son las de CENTRALIZACIÓN, DISPERSIÓN. DEFORMACIÓN y las de APUNTAMIENTO. ESTADÍSTICA INDUCTIVA : Tiene por objeto conocer las propiedades sobre ciertos conjuntos de datos o poblaciones a partir de observaciones relativas a una muestra. Para ello se utiliza el Cálculo de Probabilidades. FRECUENCIA ABSOLUTA de la variable = es el número de veces que se presenta el valor FRECUENCIA ABSOLUTA ACUMULADA : es la suma de las frecuencias ∑ absolutas hasta un valor determinado de la variable o sea : FRECUENCIA RELATIVA : ; siendo N el número total de datosl EJEMPLO : Se lanza un dado 20 veces obteniéndose los siguientes resultados : 6 2 6 5 1 2 3 4 5 6 4 3 2 5 2 6 3 2 3 4 N = 20 1 2 3 5 2 8 11 13 16 20 2 6 6 2 2/20 6/20 3/20 2/20 3/20 4/20 2 1 3 4 2/20 8/20 11/20 13/20 16/20 1 Si el número de valores que toma la variable es grande, a veces es conveniente agrupar los datos en intervalos, por ejemplo : Preguntadas 100 familias de una ciudad sobre el precio del alquiler mensual de su vivienda el resultado fué : < 100 [100, 300) [300, 500) [500, 800) [800, 1200) [1200,1800) [1800, ) 15 18 25 22 9 8 3 N=100 15 33 58 80 89 97 100 15/100 18/100 25/100 22/100 9/100 8/100 3/100 15/100 33/100 58/100 80/100 89/100 97/100 1 Los intervalos no tienen porque ser de la misma amplitud. Se llama MARCA DE LA CLASE al punto medio del intervalo, es decir,es el valor que representa a todos los elementos de ese intervalo. ¿qué número de intervalos deben fijarse? : depende de las características de cada variable.Fijar muchos intervalos dando gran detalle es conveniente si no se pierde la visión del conjunto; fijar pocos intervalos facilita el trabajo estadístico, pero se pierde demasiada información, por lo tanto deben reducirse los extremos. ¿qué amplitud deben tener los intervalos? : siempre que sea posible, es aconsejable que tengan todos la misma amplitud. Si no es posible, y hay algunos intervalos que agrupan muchos datos, y otros pocos, se debe dividir los primeros y agrupar los segundos. GRÁFICOS DE VARIABLES CUALITATIVAS DIAGRAMA DE BARRAS: DIAGRAMA DE SECTORES : PICTOGRAMA : CARTOGRAMA : suele utilizarse para estadísticas geográficas.Suelen ser mapas indicando sobre cada área la variable estudiada mediante símbolos adecuados ( densidad de población, l/ de lluvia, etc, PIRÁMIDE DE POBLACIÓN : muy usada en estadísticas demográficas, donde se representa la población. PERFIL ORTOGONAL : Muy usado en pedagogía y psicología. PERFIL RADIAL: se obtiene tomando desde un mismo punto o centro tantos radios(conservando una amplitud constante) como atributos tengan. Igual que la anterior se usa en pedagogía y psicología. GRÁFICOS DE UNA VARIABLE CUANTITATIVA DISCRETA : DIAGRAMA DE BARRAS : en unos ejes de coordenadas, sobre el eje X se ponen los valores de la variable y sobre cada valor, se levanta un segmento o barra de altura igual a su frecuencia , que puede ser absoluta o relativa. GRÁFICOS DE UNA VARIABLE CUANTITATIVA CONTINUA HISTOGRAMAS : sobre el eje X se marcan los extremos de los intervalos y sobre el eje Y se levantan rectángulos de altura que sea proporcional a la frecuencia relativa o absoluta. Si todos los intervalos tienen la misma amplitud, la altura coincide con su frecuencia, sino : altura = MEDIDAS DE CENTRALIZACIÓN ∑ MEDIA ARITMÉTICA: ̅ ( también hay la media geométrica, cuadrática y la armónica ) MEDIANA ( : es el valor que ocupa el lugar central, suponiendo que la variable esté ordenada de forma creciente o decreciente. Si el número de datos es impar la mediana es . Si el número de datos es par, la mediana es la media aritmética de los valores anterior y posterior. Para una variable discreta, calcular y el primer valor de la variable cuya frecuencia absoluta acumulada contenga a ,es la mediana. Si la variable es continúa, o aparecen los datos agrupados en intervalos, determinar el intervalo igual que antes. MODA ( es el valor de la variable de mayor frecuencia absoluta. Puede haber más de una moda. CUARTILES. DECILES. PERCENTILES. PRIMER CUARTIL : es el valor de la variable de tal forma que la cuarta parte (25%) son menores o iguales. Ejemplo : 0 1 2 3 4 5 14 10 15 26 20 15 14 24 39 65 85 100 Luego Evindentemente el segundo cuartil coincide con la mediana. DECILES : son los valores de la variable que dejan PERCENTILES “ “ “ “ “ “ “ “ RELACIÓN ENTRE MEDIA, MEDIANA Y MODA : Si la distribución es simétrica : ̅ Si es aproximadamente simétrica : ̅ ̅ se haría igual. de los datos por debajo. “ “ “ “ “ MEDIDAS DE DISPERSIÓN RECORRIDO o RANGO :es la diferencia entre los valores máximo y mínimo de la variable. ∑ DESVIACIÓN MEDIA: | ̅| VARIANZA ( var(x) = ) : es la media aritmética de los cuadrados de las desviaciones de los datos repecto ala media aritmética. Se calcula : ∑ DESVIACIÓN TÍPICA ̅̅̅̅ = ∑ -̅ : es la raíz cuadrada de la varianza. Como la varianza viene expresada en unidades diferentes a las de la variable, es mejor usar la desviación típica ( se coge el signo+ de la raíz) COEFICIENTE DE VARIACIÓN DE PEARSON: ̅ ·100 para comparar la dispersión de dos o más distribuciones, en las que las variables vienen expresadas en distintas unidades, no debe utilizarse la desviación típica para medir la dispersión de ambas variables, para ello utilizar el coeficiente de variación de Pearson. EJEMPLO :los vecinos de un pueblo se ha medido y pes TALLA PESO ̅ ̅ = ado obteniendo : = 9’49 Luego, hay mayor dispersión en las tallas, o sea, que los pesos están más concentrados.