Download estadística - Ecomundo Centro de Estudios
Document related concepts
no text concepts found
Transcript
ESTADÍSTICA Ciencia que estudia los fenómenos sociales, económicos y físicos y que, partiendo de datos numéricos, es capaz de llegar a predecir resultados. Estudio estadístico Consiste en recoger y observar una característica de un conjunto de individuos u objetos con el fin de extraer conclusiones. Población Conjunto objeto del estudio. Carácter estadístico. Propiedad que se estudia de una población. Puede ser: Cualitativo: cuando no se puede contar ni medir Cuantitativo Discreto: se puede contar Continuo: se puede medir Modalidad: Es cada uno de los valores que puede tomar el carácter estadístico: xi Distribución de frecuencias: Frecuencia absoluta, ni: Número de individuos de la muestra para los que el carácter estadístico toma esa modalidad. Se llama N a la suma de todas las frecuencias absolutas, N=Sni Frecuencia relativa, fi Es el cociente entre la frecuancia absoluta y el número total de individuos de la muestra: fi=ni/N Frecuencia porcentual, pi Es la frecuencia relativa con el formato porcentaje Frecuencias acumuladas Ni, Fi, Pi Suma de las frecuencias de los valores inferiores o iguales al valor considerado. MEDIDAS ESTADÍSTICAS: Medidas de centralización Valor que representa y resume “hacia donde se concentra” la información de los datos de una distribución. Media aritmética: =PROMEDIO(RANGO) Suma de todos los datos y dividir entre el número total de ellos: Mediana: =MEDIANA(RANGO) Valor que ocupa la posición central al ordenar los datos. Solo se puede hallar si los datos son cualitativos ordenables o cuantitativos. Moda =MODA(RANGO) Es la modalidad o valor que tiene mayor frecuencia. Se puede hallar siempre. Medidas de dispersión Indican si los valores estan concentrados sobre los valores centraleso, por el contrario, están alejados de estos. Por tanto miden la representatividad de los parámetros centrales. Solo se pueden acumular en datos cuantitativos. Rango o recorrido = MAX(RANGO) – MIN(RANGO) Es la diferencia entre el valor mayor y el valor menor de la variable. Varianza = VARP(RANGO) Es la media aritmética de los cuadrados de las desviaciones de los datos. Desviación típica (s)=DESVSTP(RANGO) Es la raíz cuadrada positiva de la varianza DISTRIBUCIONES BIDIMENSIONALES Son las que se obtienen el estudiar cualquier fenómeno respecto a dos características o modalidades. Por ejemplo: la estatura y el peso de los alumnos de una clase. Nube de puntos: Es la gráfica que se obtiene al representar una distribución bidimensional. Medidas marginales: Son la media aritmética de cada uno de los conjuntos de valores Centro de gravedad: Es el punto cuyas coordenadas son la medias marginales: Desviaciones típicas marginales: Son las desviaciones típicas de cada uno de los conjuntos de valores. La función que se usa para cada una de ellas es: =VARP(RANGO) Covarianza: Es la media aritmética de los productos de las desviaciones de los valores de cada variable por su respectiva frecuencia: Se calcula con la fórmula: =COVAR(RANGO) La covarianza puede ser positiva negativa. Positiva si los valores se relacionan de forma directa. Al aumentar los valores de la variable X, aumentan los valores de la Y Negativa, en caso contrario. Correlación La covarianza indica como es la relación entre dos variables, como se orienta la nube de puntos, pero no indica de forma objetiva y concreta la magnitud de esta relación. Por esta razón se necesita definir el concepto de correlación y coeficiente de correlación. Correlación Es la relación que existe entre las dos variables que intervienen en una estadística bidimensional. Puede ser: a. Correlación funcional (lineal, trigonométrica, exponencial, ..) b. Correlación directa: al aumentar una variable también aumenta la otra c. Correlación inversa: caso contrario d. Correlación nula: no existe relación entre las variables REGRESIÓN LINEAL: Coeficiente de correlación Nos indica el grado de aproximación de los puntos de la nube a la recta de regresión. Usar: =COEF.DE.CORREL(RANGO) Propiedades del coeficiente de correlación lineal (Coeficiente de Pearson): Cuantifica la dependencia lineal entre dos variables estadísticas. Está comprendido entre –1 y +1 con las siguiente implicaciones: a. Si r=-1 o r=1, la relación es perfecta. Existe correlación funcional. b. Si r está próximo a –1 o a 1 la correlación es fuerte c. Si r está próximo a cero la correlación es débil d. Si r>0 la correlación es positiva o directa. e. Si r<0 la correlación es negativa o inversa. Recta de regresión Es la recta que mejor se ajusta a la nube de puntos, y pasa siempre por el centro de gravedad. Ecuación de la recta de regresión y=mx+b El signo de la pendiente de la recta de regresión, m, es igual al del coeficiente de correlación, r. Procedimiento para hallar y representar la recta de regresión a. Representa la nube de puntos b. En el gráfico se seleccionan los puntos haciendo clic en uno de ellos. c. Se activa el menú contextual. d. Se elige Agregar línea de tendencia.... e. En la ficha Tipo se elige Lineal, en la ficha Opciones se activa la casilla Presentar la ecuación en el gráfico y Aceptar. Luego se puede mover la fórmula al lugar más conveniente. Predicción de resultados Después de trazar la recta de regresión, se puede predecir lo que ocurre a un valor de la variable que no se encuentre en la tabla. Para ello, basta averiguar el valor de la otra variable, utilizando la fórmula de la recta de regresión.