Download Estad stica_y_probabilidad_aplicada_a_los_negociosCap03
Document related concepts
Transcript
Estadística y probabilidad aplicada a los negocios Prof. Víctor Manuel Romero Medina DCB e I Enero de 2010 Unidad 3. Estadística descriptiva: Métodos numéricos Hay varias medidas numéricas de localización, dispersión y asociación; si se calculan a partir de una muestra se llaman estadísticos de la muestra, si se calculan a partir de datos de una población se denominan parámetros poblacionales. 3.1 .- Medidas de localización Media o promedio. Es una medida de la localización central. x Media de la muestra: Media de la población: 3.1 .- Medidas de localización Mediana. Es el valor intermedio cuando los valores se ordenan de forma ascendente. Depende de la cantidad de observaciones: Impar: La mediana es el valor intermedio. Par: Promedio de los dos valores intermedios. 3.1 .- Medidas de localización Moda. Es el valor de los datos que se presentan con más frecuencia. Bimodal: Si los datos tienen exactamente dos modas. Multimodal: Si los datos tienen más de dos modas. 3.1 .- Medidas de localización Percentil. El p-ésimo percentil es un valor tal que por lo menos p por ciento de las observaciones son menores o iguales que p y por lo menos (100 – p) por ciento de las observaciones son mayores o iguales que p 3.1 .- Medidas de localización Cálculo del p-ésimo Percentil. 1. Ordenar los datos de forma ascendente. 2. Calcular el índice i para el p de interés 3. Si i no es entero, se determina el máximo entero; si i es entero, p es el promedio de los valores ubicados en las posiciones i e i + 1. 3.1 .- Medidas de localización Cuartiles. Son percentiles específicos que dividen a los datos en cuatro partes en intervalos de 25%. 1. 2. 3. Q1 = primer cuartil, o percentil 25. Q2 = segundo cuartil, o percentil 50. Mediana. Q3 = tercer cuartil, o percentil 75. 25% 25% Q1 25% Q2 25% Q3 3.2 .- Medidas de variabilidad Rango. Es la diferencia entre los valores máximo y mínimo. Rango intercuartil. Es una medida de la dispersión que elimina la influencia de los valores extremos de los datos. 3.2 .- Medidas de variabilidad Varianza. Es una medida de la dispersión que emplea todos los datos. Se basa en la diferencia entre cada observación (xi) y la media. Varianza de la muestra: Varianza de la población: 3.2 .- Medidas de variabilidad Desviación estándar. Varianza de la muestra: Varianza de la población: 3.2 .- Medidas de variabilidad Coeficiente de variación. Es una medida estadística descriptiva que indica lo grande que es la desviación estándar en comparación con la media. 3.3 .- Medidas de localización relativa y detección de valores atípicos Valor z. Se interpreta como el número de desviaciones estándar que dista un dato con respecto a la media. 3.3 .- Medidas de localización relativa y detección de valores atípicos Teorema de Chebyshev. Cuando menos de los datos debe estar a menos de z desviaciones estandar de separación respecto de la media, siendo z cualquier valor mayor a 1. 3.4 .- Análisis exploratorio de datos Trabajo en equipo. Investigar el método DIAGRAMA DE CAJA y presentar tres ejemplos de aplicación. 3.5 .- Medidas de asociación entre dos variables Covarianza. Muestra: Población: 3.5 .- Medidas de asociación entre dos variables Coeficiente de correlación. Muestra: Población: 3.5 .- Medidas de asociación entre dos variables Trabajo en equipo. Investigar el tema MEDIA PONDERADA Y MANEJO DE DATOS AGRUPADOS y presentar tres ejemplos de aplicación. Ejercicios (Anderson Cap. 3) 3, 8, 17, 18, 27, 40, 43, 47, 55, 56 Ejemplo Semana 1 2 3 4 5 6 7 8 9 10 Cantidad de comerciales Volumen de ventas (cientos de pesos) x y 2 5 1 3 4 1 5 3 4 2 50 57 41 54 54 38 63 48 59 46