Download File - Portafolio STAT 555 2015
Document related concepts
Transcript
1 Taller 2: Preguntas Taller Núm. 2 | Preguntas Escuela de Estudios Profesionales Programa Ahora Universidad Metropolitana en Bayamón Estadística para la toma de decisiones gerenciales – STAT 555 Kelvin X. Crespo Soto 25 de junio de 2015 2 Taller 2: Preguntas Instrucciones Generales Tarea Antes del Taller Dos: Conteste las siguientes preguntas. Las mismas deben entregarse al facilitador identificando su nombre, número de estudiante, fecha y taller. Puede entregar copia impresa o enviar a través de Blackboard (e-mail). La tarea tiene un valor de 25 puntos. i. ¿Cuáles son las propiedades de un conjunto de datos numéricos? Tendencia Central: Variación: - Medias aritmética - Rango - Medina - Intercuartil varianza - Moda - Desviación Estándar - Rango medio - Coeficiente de variación - Eje medio Forma: - Sesgo ii. Explique a qué se refiere la propiedad de posición o tendencia central. Demuestre la propiedad con un ejemplo gráfico. o Representa una de tres medidas (media, mediana y moda) en estadística, diseñada para indicar el lugar en el que se concentra el mayor número de elementos en una curva de distribución. - Moda- Es el valor que tiene mayor frecuencia absoluta, se representa por Mo. - Mediana- Es el valor que ocupa el lugar central de todos los datos cuando estos están ordenados de menor a mayor, esta es representa como Me. - Media- Es el valor obtenido al sumar todos los datos y dividir el resultado entre el número de total de datos. 3 Taller 2: Preguntas iii. Compare la moda, media y mediana y detalle las ventajas y desventajas de la utilización de cada una de estas medidas de tendencia central. Prepare una tabla que incluya las fórmulas de cada medida, ventas y desventajas para datos no agrupados y datos agrupados. MODA MEDIA VENTAJAS DESVENTAJAS FORMULA Se utiliza cuando hay grupos con diferentes valores. Quizás no existe en algunos datos. Valor que más se repita. Fácil de calcular Sensibilidad a valores muy altos o muy bajos. Media = total de la suma del conjunto / total de observaciones No es sensible a los valores extremos. Se deben ordenar los datos para el cálculo. Fácil de interpretar. Valores extremos son importantes Se ponen todos los valores en orden y el valor que se encuentra a la mitad es la mediana Más estable con un número grande de observaciones. MEDIANA Puede estar lejos de los datos iv. Detalle la diferencia entre medidas de tendencia central y medidas de tendencia no central. Tendencia Central: o Las medidas de tendencia central son valores numéricos que quieren mostrar el centro de un conjunto de datos, nos interesan especialmente: la media y la mediana. Si los datos son una muestra, la media (o promedio) y la mediana se llamarán estadísticas. Si los datos son una población entonces estas medidas de tendencia central se llamarán parámetros. Tendencia no central: o Nos permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Suele utilizar una serie de valores que dividen la muestra en tramos iguales; es son los: - Cuartiles – son 3 valores que distribuyen una serie de datos ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados. - Deciles - son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados. - Percentiles – son 9 9valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados. 4 Taller 2: Preguntas v. ¿Qué significa la propiedad de variación? Demuestre a través de un gráfico dicha propiedad. vi. Desarrolle una tabla con la definición, diferencias, ventajas y desventajas en la utilización de las siguientes medidas de variación: 1. Rango 2. Rango intercuartil 3. Varianza 4. Desviación Estándar 5. Coeficiente de Variación Rango Rango Intercuartil Varianza Desviación Estándar Coeficiente de Variación La raíz cuadrada con signo Es una estimación Es una medida de Se calcula tomando la positivo de la varianza. Es Indica la relación existente diferencia entre el valor estadística de la dispersión dispersión que ostenta una un promedio de la distancia entre la desviación típica de máximo y el mínimo de una distribución de variable aleatoria respecto a de las observaciones a la una muestra y su media. observado. datos. su esperanza. media. Se relaciona con la Se recomienda cuando la desviación, se denota a Se calcula restando ambos medida de tendencia central datos. través de la letra griega utilizada es la mediana. denominada sigma. Es positiva y mientras más Permite comparar el nivel alejados están los valores de de dispersión de dos promedio mayor será la muestras de variables. desviación. Útil. Se puede elaborar el Nos permite saber y Simple y fácil de calcular. diagrama de caja, determinar que es normal, instrumento muy visual para grande, pequeño, etc. evaluar la dispersión de una Es única. Fácil de calcular. Se expresa en las mismas Emplea toda la información unidades que datos disponible en su cálculo. originales. Solo emplea 2 valores en Se eliminan los valores Es un proceso más largo y su cálculo. extremadamente alejados un poco complejo. Se ve muy afectada por la No es con respecto al presencia de valores centro de la distribución de atípicos. los datos. Taller 2: Preguntas 5 vii. ¿Cómo ayuda la regla empírica a explicar las formas en que un conjunto de datos numéricos se conglomeran y se distribuyen? o Es el resultado de la experiencia práctica de investigadores en muchas disciplinas, que han observado muy diferentes tipos de conjuntos de datos la vida real. o La regla empírica establece que en la mayoría de las series de datos encontraremos que aproximadamente dos de cada tres observaciones (es decir, el 67%), están contenidas en una distancia de una desviación estándar alrededor de la media y aproximadamente 90% a 95% de las observaciones están contenidas a una distancia de 2 desviaciones estándar alrededor de la media. viii. Defina y explique la propiedad de la forma de una distribución de datos numéricos. Presente dicha propiedad a través de los gráficos generalmente utilizados. o Los términos usados para describir la forma de una distribución son: o Simétrica: La distribución puede ser dividida en dos partes alrededor de un valor central y cada parte es el reflejo de la otra. o Sesgada: Un lado de la distribución se alarga más que el otro. La dirección del sesgo es la dirección del lado más largo. o Unimodal: La distribución tiene un único máximo que muestra el o los valores más comunes en los datos. o Bimodal: La distribución tiene dos máximos. Esto resulta amenudo cuando la muestra proviene de dos poblaciones. o Uniforme: Los valores posibles tienen la misma frecuencia. Taller 2: Preguntas 6 ix. ¿Por qué son útiles las técnicas de análisis exploratorio de datos resumen de cinco números y diagrama de caja y bigotes? x. ¿Cuáles son algunos aspectos éticos que están presentes cuando se hace la distinción entre el uso apropiado e inapropiado de medidas descriptivas de resumen que se publican en periódicos y revistas? xi. Conéctese a la dirección electrónica www.prenhall.com/berenson. Seleccione la edición 11 del libro Basic Business Statistics, de Berenson, Levine y Krehbiel. Entre al enlace “companion website”, seleccione en la parte superior el capítulo 3: “Numerical Descriptive Measures”. En la parte izquierda de la página seleccione “Self -Study Quizzes”. Entre al enlace de “Multiple Choice” conteste la prueba, sométala a evaluación. Envíe los resultados a la dirección electrónica del facilitador y a su dirección electrónica para que la imprima y la traiga al taller para aclarar dudas. Este ejercicio debe incluirse en el portafolio. o Ver email envío de resultados.