Download 160 - RI UAEMex
Document related concepts
Transcript
Universidad Autónoma del Estado de México Facultad de Contaduría y Administración 1 Coordinación General de Investigación y Estudios de Postgrado Cómputo Estadístico M. I. César Enrique Estrada Gutiérrez Agosto de 2016 2 Objetivo Proporcionar las herramientas fundamentales para que sean capaz de organizar, analizar e interpretar adecuadamente los cuadros estadísticos y gráficos; establecer conclusiones a partir de la lectura de los mismos y puedan identificar e interpretar los principales estimadores estadísticos, así como aplicar las técnicas estadísticas adecuadas, establecer conclusiones a partir de resultados, cuya finalidad es la toma de decisiones en aquellas situaciones que se tiene incertidumbre de realidades desconocidas. Temario (I) Introducción al análisis estadístico Representaciones estadísticas y análisis de gráficas Descripción de datos económicos y administrativos (Medidas de posición y de variabilidad) Probabilidad Introducción a SPSS Distribución de probabilidades para variables aleatorias discretas 4 Temario (II) Distribuciones de probabilidad para variables aleatorias continuas Distribuciones de muestreo e intervalos de confianza para la media Pruebas de hipótesis referentes al valor de la media de la población La prueba Chi cuadrada Análisis de varianza Análisis de regresión y correlación lineal 5 Bibliografía Estadística aplicada a la administración y a la economía. Leonard J. Kazmier. Ed. Mc Graw Hill Estadística para Administración y Economía. Levin, Rubin, Bohon, Ramos. Ed. Pearson Estadística con SPSS para Windows. Juan Camacho Rosales. Ed. Alfaomega Análisis estadístico con SPSS para windows. Visauta. Ed. Mc Graw Hill 6 Forma de evaluación 40% trabajos y artículos de investigación (durante el curso) 20% examen practico (20 de octubre) 40% proyecto de investigación (24 de noviembre) 7 Introducción al análisis estadístico Estadística. Es el conjunto de técnicas que se emplean para la recolección, organización, análisis e interpretación de datos. Los datos pueden ser cuantitativos o cualitativos Estadística aplicada. Sirve para tomar mejores decisiones a partir de la comprensión de las fuentes de variación y de la detección de patrones 8 Estadística descriptiva Comprende las técnicas que se emplean para resumir y describir datos numéricos. (gráficas o análisis computacional) Ejemplo 1 Volumen anual de ventas del año pasado, se puede graficar en barras o de lineas 9 Estadística inferencial Comprende las técnicas con las que, con base únicamente en una muestra sometida a observación se toman decisiones sobre una población o proceso estadístico (requiere de probabilidad) Censo. Procedimiento para la medición de las características de todos los miembros de la población Estadísticas muestrales. Se refiere a las características medidas de una muestra. Ejemplo 2 Muestra de focos y revisión de los mismos hasta poder estimarse la probabilidad de falla 10 Variables discretas y continuas Una variable discreta puede tomar valores observados únicamente en puntos aislados (proceso de conteo). Una variable continua puede adoptar un valor en cualquier punto fraccionario a lo largo de un intervalo especificado Ejemplo 3 Discretos. Número de personas por hogar en una colonia Continuas. Promedio de personas por hogar en una colonia 11 Obtención de datos Observación directa. El investigador ejerce un control deliberado de algunos o todos los factores que pueden influir en la variable Ejemplo 4 Una línea de ensamble para detectar elementos defectuosos en base a un criterio Encuesta. Cuando la información se debe obtener de fuentes individuales mediante entrevistas personales, entrevistas telefónicas o cuestionarios Ejemplo 5 Nivel de empleo en diferentes empresas mediante una encuesta a cada una de ellas 12 Muestreo aleatorio Es un tipo de muestreo en el que todos los elementos de la población de interés, o población objetivo tienen una oportunidad conocida, usualmente igual de ser elegidos Muestreo simple Muestreo Sistemático Muestreo Estratificado Muestreo por conglomerados 13 Muestreo aleatorio simple Es aquel cuyos elementos se seleccionan individualmente de la población objetivo entera con base en el azar Ejemplo 6 Uso de la función aleatorio de Excel 14 Muestreo sistemático Es una muestra aleatoria, cuyos elementos se seleccionan de la población de un intervalo uniforme en una lista ordenada Ejemplo 7 Seleccionar al azar una cuenta bancaria y a partir de ahí seleccionar las siguientes nueve 15 Muestreo estratificado Los elementos de la población son primeramente clasificados por el investigador en distintos subgrupos o estratos, sobre la base de una o más características importantes. Ejemplo 8 Las elecciones pasadas antes de la votación 16 Muestreo por conglomerados Es un tipo de muestreo aleatorio en el que los elementos de la población ocurren naturalmente en subgrupos Ejemplo 9 Un analista de un departamento estatal de seguridad económica desea estudiar los índices salariales por hora que se pagan en el área metropolitana, sería complicado hacerlo trabajador por trabajador, en cambio podría obtenerse una lista de las empresas en esa zona. El analista puede tomar una muestra simple de ese conglomerado 17 Problemas En el área de las mediciones estadísticas, como las representadas por cuestionarios, la confiabilidad se refiere a la consistencia del instrumento de medición y la validez a su precisión. Si un cuestionario ofrece resultados similares tras ser contestado por dos grupos equivalentes de informantes, puede describírsele como confiable. ¿El hecho de que sea confiable garantiza por lo tanto que sea valido? 18 Problemas En los siguientes tipos de valores, designe variables discretas y variables continuas A) El número de unidades de un artículo en existencia B) Razón de activos circulantes contra pasivos circulantes C) Tonelaje total embarcado D) Cantidad embarcada en unidades E) Volumen de tráfico en una carretera de paga F) Asistencia a la asamblea anual de una compañia 19 Problemas ¿Cuáles son muestra y cuales son una población? A) El universo completo B) Aplicación de conceptos de probabilidad C) Inspección de cada artículo ensamblado D) Inspección de cada décimo artículo ensamblado 20 Trabajo de investigación Un auditor desea tomar una muestra aleatoria sistemática de tamaño 50 (5) de 5250 cuentas por cobrar de una gran empresa. Las cuentas se enumeran secuencialmente de la 0001 a la 5250.Use la hoja de calculo Excel para obtener una lista de los 50 números aleatorios requeridos y mándela por correo electrónico 21 Correo electrónico cestradag@uaemex.mx ceeg1971@Gmail.com 22 Representaciones estadísticas y análisis de gráficas Distribución de frecuencias. Es una tabla en la cual se agrupan en clases valores posibles de una variable y donde se registra el número de valores observados correspondientes a cada clase 23 Datos agrupados Son los datos organizados en una distribución de frecuencias Ejemplo 10 Salario Semanal $ Numero de trabajadores (f) 240-259 260-279 280-299 300-319 320-339 340-359 Total 7 20 33 25 11 4 100 24 Límites nominales Son los valores incluidos en cada clase Ejemplo 11 Salario Semanal $ Numero de trabajadores (f) 240-259 260-279 280-299 300-319 320-339 340-359 Total 7 20 33 25 11 4 100 25 Limites exactos de clase Son los puntos específicos que sirven para separar clases adyacentes en una escala de medición de variables continuas Ejemplo 12 Salario semanal (límites nominales) Limites exactos de clase $ $ 240-259 260-279 280-299 300-319 320-339 340-359 239.50-259.50 259.50-279.50 279.50-299.50 299.50-319.50 319.50-339.50 339.50-359.50 26 Punto medio de clase Se refiere a la suma del límite inferior de la clase con el límite superior dividido entre dos Ejemplo 13 Salario semanal Limites exactos de Punto (límites nominales) clase Medio $ 240-259 260-279 280-299 300-319 320-339 340-359 $ 239.50-259.50 259.50-279.50 279.50-299.50 299.50-319.50 319.50-339.50 339.50-359.50 $249.50 269.50 289.50 309.50 329.50 349.50 27 Intervalo de clase Se identifica restando el limite exacto de clase inferior del limite exacto de la clase superior Ejemplo 14 Intervalo de clase=259.50-239.50=20 28 Intervalo aproximado Intervalo aproximado mayor valor en datos menor valor en datos no agrupados no agrupados número de clases deseadas Ejemplo 15 Intervalo aproximado=(360-240)/6=20 29 Histograma de frecuencias Un histograma es una gráfica de barras de distribución de frecuencias, se acostumbra a colocar los límites exactos Ejemplo 16 35 30 25 20 15 10 5 0 239.50 259.50 279.50 299.50 319.50 339.50 359.50 30 Polígono de frecuencias Es una gráfica de líneas de distribución de frecuencias, suele identificarse el punto medio de cada clase Ejemplo 17 35 30 25 20 15 10 5 0 229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5 31 Curva de frecuencias Es un polígono de frecuencias pero suavizado Ejemplo 18 35 30 25 20 15 10 5 0 229.5 249.5 269.5 289.5 309.5 329.5 349.5 369.5 32 Curtosis Platicurtica: Plana, con las observaciones distribuidas en forma relativamente pareja Leptocurtica: Afilada, con las observaciones concentradas en un estrecho rango de valores Mesocurtica: Ni plana ni afilada 33 Asimetría Asimétrica negativa Simétrica Asimétrica positiva 34 Frecuencias acumuladas Identifica el número acumulado de observaciones incluidas bajo el límite exacto superior de cada clase de la distribución Ejemplo 19 Salario semanal (límites nominales) Limites exactos de clase superior $ $ 240-259 260-279 280-299 300-319 320-339 340-359 259.50 279.50 299.50 319.50 339.50 359.50 Número de trabajadores 7 20 33 25 11 4 Frecuencias acumuladas 7 20+7=27 33+27=60 25+60=85 85+11=96 96+4=100 35 Ojiva Se le denomina a la gráfica de una distribución de frecuencias acumuladas 120 100 80 60 40 20 0 239.5 259.5 279.5 299.5 319.5 339.5 359.5 36 Diagramas circulares Es una figura en forma de pastel cuyas piezas representan divisiones de una cantidad total, como podría ser la distribución de las ventas de una compañia 25% Principal Nichos En Desarrollo En crecimiento 5% 5% 65% 37 Problemas En la siguiente tabla se enlistan los tiempos requeridos para la conclusión de una tarea de ensamble para una muestra de 30 empleados que presentaron su solicitud de ascenso a un puesto de ensamble de precisión 10 14 15 13 17 16 12 14 11 13 15 18 9 14 14 9 15 11 13 11 12 10 17 16 12 11 16 12 14 15 38 Problemas (2) Determine el tamaño del intervalo correspondiente Intervalo aproximado=(18-9)/5=1.80 Por lo que nuestro intervalo es conveniente cerrarlo a 2.0, así que nuestra distribución de frecuencias quedaría de la siguiente forma Tiempo, en min. 9-10 11-12 13-14 15-16 17-18 Número de Empleados 4 8 8 7 3 Total 30 Emp. 39 Problemas (3) La tabla con límites exactos y punto medio para cada clase quedaría de la siguiente forma Tiempo, en min. 8.5-10.5 10.5-12.5 12.5-14.5 14.5-16.5 16.5-18.5 Punto Medio 9.5 11.5 13.5 15.5 17.5 Número de Empleados 4 8 8 7 3 Total 30 Emp. 40 Problemas (4) Elaborar un histograma en Excel Elaborar el polígono de frecuencias en Excel Elaborar la curva de frecuencias en Excel Describir la curva de frecuencias 41 Problemas (5) Elaborar una distribución de frecuencias acumuladas y A) Trace la ojiva de porcentajes de esos datos B) ¿En que punto percentil se encontraría un tiempo de ensamble de 15.5 minutos? C) haga una grafica circular de los empleados con respecto a los tiempos 42 Problemas (6) Elaborar una distribución de frecuencias acumuladas Tiempo, en min. Frecuencia 8.5-10.5 10.5-12.5 12.5-14.5 14.5-16.5 16.5-18.5 4 8 8 7 3 Frecuencia acumulada 4 12 20 27 30 % acumulado 4*100/30=13.3 12*100/30=40 66.7 90 100 43 Problemas (7) Ojiva de la frecuencia acumulada y del porcentaje acumulado El porcentaje percentil en 15.5 minutos es 80 La grafica circular se muestra 120 100 80 60 40 20 0 8.5 10.5 10% 12.5 14.5 16.5 18.5 13% 23% 27% 8.5 10.5 12.5 14.5 16.5 27% 44 Trabajo de investigación 2 En la tabla siguiente se presentan las cantidades de 40 préstamos personales (en dólares) utilizados para financiar la compra de muebles y aparatos eléctricos. Ordene en una distribución de frecuencias con un total de 7 clases A)¿Cuál sería el intervalo de clase más conveniente? B) Elabore una distribución de frecuencias iniciando con un límite de clase inferior de 300 y aplicando el intervalo de clase del inciso A C) Elabore un histograma de distribución de frecuencias D) Elabore un polígono de frecuencias y una curva de frecuencias E) Describa la curva de frecuencias resultante F) Elabore una distribución de frecuencias acumuladas de la distribución de frecuencias y trace la ojiva con esos datos G) Genere una grafica circular H) Entregue todos los resultados anteriores en Excel 45 Trabajo de investigación 2 $1200 515 452 1900 $1000 554 973 660 $356 1190 300 1610 $2227 954 2112 445 1200 1278 2540 720 1388 1000 1525 1000 1890 784 870 630 586 329 935 3000 1650 1219 1423 727 592 655 534 1590 46 Descripción de datos económicos y administrativos (Medidas de posición y de variabilidad) Medida de posición. Es un valor calculado de un grupo de datos que sirve para describir a éstos de alguna manera 47 Media aritmética Es la suma de los valores del grupo de datos dividida entre el número de valores X N Media descriptiv a de una población X X n Media descriptiv a de una muestra 48 Media aritmética Ejemplo 20 Durante los meses del verano, ocho vendedores de una empresa de servicios de calefacción y aire acondicionado vendieron el siguiente número de unidades centrales de aire acondicionado: 8,11,5,14,8,11,16,11 X N 848 10.5unidades 49 Media ponderada Es una media aritmética en donde cada uno de los valores se pondera de acuerdo con su importancia en el grupo general. Las formulas de la media ponderada poblacional y muestral son idénticas ( wX ) w ó X w w 50 Media ponderada Ejemplo 21 El margen de utilidad en el último año fiscal de las cuatro líneas de productos de una compañía fabricante de múltiples bienes fue: Línea A=4.2%; Línea B=5.5%; Línea C=7.4%; Línea D=10.1% Si sacamos la media con la formula anterior quedaría X N 27.2 4 6.8% Sin embargo, como las ventas de los 4 productos no son iguales, éste promedio no ponderado es incorrecto 51 Media ponderada Así que debemos observar la tabla de ventas Línea de productos Margen de utilidad (X) Ventas (w) wX A B C D 4.2% 5.5% 7.4% 10.1% $30,000,000 20,000,000 5,000,000 3,000,000 1,260,000 1,100,000 370,000 303,000 Con respecto a la formula ( wX ) $3, 033, 000 w w $58,000,000 5.2% 52 Mediana La mediana de un grupo de elementos es el valor del elemento inmediato cuando todos los elementos de un grupo siguen, en términos de valor, un orden ascendente o descendente Med X ( n / 2 ) (1/ 2 ) De nuestro ejemplo 20, al ordenar en forma ascendente, quedaría 5,8,8,11,11,11,14,16, el valor de la mediana es: X(8/2+1/2)=X4.5=11 53 Moda Es el valor que ocurre más frecuentemente en un conjunto de valores . Para nuestro ejemplo anterior, la moda es 11 54 Relación entre media, mediana y moda Cuando la curva graficada es simétrica, la moda, mediana y media son iguales, cuando es asimétrica positiva, la media siempre es mayor que la mediana y la moda, viceversa en una asimétrica negativa ¿Cómo sería la curva para nuestro ejemplo anterior? 55 Uso de media, mediana y moda Con respecto a población El valor de la moda indica la posición de la mayoría de los valores observados. Puede ser útil como medida descriptiva de un grupo de la población, aunque solo si existe una moda claramente perceptible La mediana siempre es una medida excelente para representar el nivel “típico” de los valores La media también es un valor excelente siempre y cuando la población sea simétrica, por lo que para datos de población la mediana es más significativa 56 Uso de media, mediana y moda Con respecto a Muestras El valor de la moda no es aceptable La mediana es más aceptable La media para éste caso es mejor ya que es más estable Ejemplo 22 Índices salariales de los 650 empleados de una empresa Una muestra aleatoria de 100 trabajadores 57 Cuartiles, Deciles y Percentiles Es lo mismo que la mediana, solo que los cuartiles dividen la muestra en cuartos, los deciles en decimos y los percentiles en 100 partes K *n / X Q1 (primer cuartil) 1* n/4 ó (1* (n 1))/4 D3 (tercer decil) 3 * n/10 ó (3 * (n 1))/10 P70 (septuagesimo percentil) 70 * n/100 ó (70 * (n 1))/100 K es el percentil, cuartil o decil a obtener 58 Problemas En una muestra de las compras de 15 estudiantes en la tienda de una escuela primaria se observan las siguientes cantidades de ventas, dispuestas en orden de magnitud ascendente: $ 1.00,1.00,2.50, 2.50,2.50,3.50,4.00,5.30,9.00,12.50,13.50, 24.50,27.10,30.90,41.00 Determine la media, mediana y la moda Media=$12.05 Mediana=X8=$5.30 Moda=$2.50 Dado que la media es sustancialmente mayor que la mediana, la distribución de valores es claramente asimétrica positiva 59 Problemas En referencia a la siguiente tabla, determine el porcentaje global de artículos defectuosos ensamblados durante la semana muestreada Turno 1 2 3 Porcentaje de artículos Número de artículos defectuosos (X) en miles (w) 1.1% 1.5% 2.3% 210 120 50 wX 2.31 1.80 1.15 ( wX ) $5.26 Xw 1 . 4 % $ 380 w 60 Trabajo de investigación (3) El número de accidentes ocurridos en un mes dado en los 13 departamentos de manufactura de una planta industrial fue: 2,0,0,3,3,12,1,0,8,1,0,5,1. Calcule la media, la mediana y la moda. Describa la distribución de índices de accidentes en términos de asimetría Supongamos que los precios de menudeo de artículos seleccionados cambian como se indica en la tabla siguiente. Determine el cambio porcentual medio en precios al menudeo sin referencia a los gastos promedio incluidos en la tabla y posteriormente el cambio porcentual medio ponderado Artículo Incremento Porcentual Gastos promedio por mes Leche Carne de res Ropa Gasolina 15% 6 -20 30 $400 600 1000 1600 61 Trabajo de investigación (3) De los siguientes valores, obtenga el 3er cuartil, el 7° decil y el 65° percentil 0023455667789999 62 Medida de variabilidad en conjuntos de datos Las medidas de posición son útiles para la identificación del valor representativo de un grupo de valores. Por su parte, las medidas de variabilidad o dispersión se ocupan de la descripción de la variabilidad entre los valores mediante diversas técnicas: Rango, rangos modificados, desviación media, varianza, desviación estándar y el coeficiente de variación 63 Rango El Rango, o R, es la diferencia entre los valores más alto y más bajo incluidos en un conjunto de datos Ejemplo 23 Durante un mes de verano, los ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades:8,11,5,14,8,11,16,11 Rango=My-Mn=16-5=11 unidades 64 Rango modificado Es un rango que se construye eliminando algunos de los valores extremos de cada una de las porciones finales de la distribución. El 50% central es el rango entre los valores en el 25º punto percentil y el 75º punto percentil de la distribución. De este modo, también es el rango entre el primer y tercer cuartiles de la distribución. Por este motivo, el rango del 50% central suele llamársele rango intercuartil (RIC) RIC=Q3-Q1 65 Rango modificado Ejemplo 24 Los datos de ventas de unidades centrales presentados en el ejemplo anterior son en orden ascendente los siguientes: 5,8,8,11,11,11,14,16. En consecuencia, el número de observaciones es N=8 Q3=11 Q1=8 RIC=Q3-Q1=11-8=3 66 Desviación media Se basa en el valor absoluto de la diferencia entre cada valor del conjunto de datos y la media del grupo | X | DMA de la población N |X X | DMA de la muestra n 67 DMA Ejemplo 25 Durante un mes de verano, los ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades:8,11,5,14,8,11,16,11 La media aritmética o µ es 10.5 de acuerdo al ejemplo anterior X X-µ |X-µ| 5 8 8 11 11 11 14 16 -5.5 -2.5 -2.5 0.5 0.5 0.5 3.5 5.5 5.5 2.5 2.5 0.5 0.5 0.5 3.5 5.5 21.0 21/8=2.6 unidades 68 DMA Por lo tanto podemos decir que en promedio, la venta de unidades de equipo de aire acondicionado de un vendedor difiere en 2.6 unidades respecto de la media grupal, en cualquier dirección 69 Varianza La varianza se asemeja a la desviación media absoluta en que se basa en la diferencia entre cada valor del conjunto de datos y la media del grupo, pero se distingue de ella en un muy importante aspecto, cada diferencia se eleva al cuadrado V (X ) 2 ( x )2 N 70 Varianza A diferencia de lo que ocurre con las demás estadísticas muestrales, la varianza de una muestra no equivale exactamente, en términos de cálculo, a la varianza de una población. En esencia en esta formula se incluye un factor de corrección, a fin de que la varianza muestral sea un estimador insesgado s 2 (X X ) 2 n 1 71 Desviación estándar En general es difícil interpretar el significado de la varianza, porque las unidades en las que se expresa son valores elevados al cuadrado. Debido en parte a esta razón, es más frecuente el uso de la raíz cuadrada de la varianza, representada por la letra griega σ o por “s” en el caso de una muestra. A esto se le llama desviación estándar 72 Desviación estándar Las formulas son: De la población De la muestra s ( x )2 N ( x X )2 n 1 73 Desviación estándar Ejemplo 26 Durante un mes de verano, los ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades:8,11,5,14,8,11,16,11 La media aritmética o µ es 10.5 de acuerdo al ejemplo anterior X X-µ (X-µ)2 5 8 8 11 11 11 14 16 -5.5 -2.5 -2.5 0.5 0.5 0.5 3.5 5.5 30.25 6.25 6.25 0.25 0.25 0.25 12.25 30.25 86.00 74 Desviación estándar 86 ( x )2 10.75 3.3 N 8 75 Cálculos simplificados Varianza de la población 2 2 2 x N N X 2 N 2 Desviación estándar de la población N Varianza de la muestra s 2 X 2 nX 2 n 1 2 X 2 n X Desviación estandar de la muestra s n 1 76 Desviación estándar Ejemplo 27 Durante un mes de verano, los ocho vendedores de una empresa de equipos de calefacción y aire acondicionado vendieron los siguientes números de unidades:8,11,5,14,8,11,16,11 La media aritmética o µ es 10.5 de acuerdo al ejemplo anterior X X2 5 8 8 11 11 11 14 16 25 64 64 121 121 121 196 256 968 968 8(10.5) 2 X 2 N 2 10.75 3.3 N 8 77 Uso de la desviación estándar Cuando existe una distribución de valores, tanto simétrica como mesocurtica, la curva de frecuencias de una distribución se le llama curva normal, siempre que ocurre una curva semejante a esto, el 68% de los valores quedan dentro del margen de la desviación estándar y el 95% de los valores quedan incluidos dentro de un margen de dos unidades de desviación estándar 68 % 95% 78 Descripción de datos Ejemplo 28 Las cuentas de energía eléctrica de una zona residencial correspondientes al mes de junio tienen una distribución normal, si se calcula que la media de estas cuentas es de $84.00 con una desviación estándar de $24.00, de ello se desprende que el 68% de las cantidades facturadas están entre $60.00 y $108.00, así mismo se desprende que el 95% de los valores están entre $36.00 y $132.00 79 Coeficiente de variación Indica la magnitud relativa de la desviación estándar en comparación con la media de la distribución de las medidas, expresada como porcentaje, es útil cuando se desea comparar la variabilidad de dos conjuntos de datos en relación con el nivel general de los valores (y por lo tanto con la media) Población CV 100 s Muestra CV 100 X 80 Coeficiente de variación Ejemplo 29 En dos emisiones de acciones ordinarias de la industria electrónica, durante el periodo de un mes fue de $150 con una desviación estándar de $5 para las acciones A y de $50 con una desviación estándar de $3 para las acciones B. Con base a la comparación absoluta, la variabilidad del precio de las acciones A fue mayor a causa de una mayor desviación estándar. Pero en cuanto al nivel de los precios se deben comparan mediante el coeficiente de variación 5 100 100 3.3% 150 3 CV ( B ) 100 100 6.0% 50 CV ( A) Concluimos que las acciones B fueron casi dos veces mas variables que las acciones A 81 Coeficiente de asimetría de Pearson Mide la desviación respecto de la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo de medidas Asimetría de la población 3( Med ) 3( X Med ) Asimetría de la muestra s 82 Pearson Ejemplo 30 Con respecto a los datos de ventas de equipos de aire acondicionado, la media es 10.5, la mediana 11 y la desviación estándar 3.3 por lo que el coeficiente de asimetría es Asimetría=3(µ-Med)/σ=3(10.5-11.0)/3.3=-0.45 Por lo que la distribución de cantidades de ventas es en cierto modo asimétrica negativa o sesgada a la derecha 83 Problemas Una muestra de 20 obreros obtuvo los siguientes salarios por una semana dada, redondeados al dólar más cercano y dispuestos en orden ascendente: $240,240,240,240,240,240,240,240,255,255,265,265 ,280,280,290,300,305,325,330,340. Determine: A) El rango B) EL RIC C) DMA D) Varianza E) Desviación estándar F) Varianza y desviación estándar con la formula alternativa G) El Coeficiente de variación H) El coeficiente de asimetría de Pearson 84 Problemas A) Rango. R=My- Mn=$340-240=$100 B) 295-240=$55 C) Se debe obtener primero la media muestral=X=$5410/20= $270.50 X X-X |X-X| (X-X)2 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 240.00 -$ 30.50 $ 30.50 $ 930.25 $ 255.00 -$ 15.50 $ 15.50 $ 240.25 $ 255.00 -$ 15.50 $ 15.50 $ 240.25 $ 265.00 -$ 5.50 $ 5.50 $ 30.25 $ 265.00 -$ 5.50 $ 5.50 $ 30.25 $ 280.00 $ 9.50 $ 9.50 $ 90.25 $ 280.00 $ 9.50 $ 9.50 $ 90.25 $ 290.00 $ 19.50 $ 19.50 $ 380.25 $ 300.00 $ 29.50 $ 29.50 $ 870.25 $ 305.00 $ 34.50 $ 34.50 $ 1,190.25 $ 325.00 $ 54.50 $ 54.50 $ 2,970.25 $ 330.00 $ 59.50 $ 59.50 $ 3,540.25 $ 340.00 $ 69.50 $ 69.50 $ 4,830.25 $ 572.00 $21,945.00 85 Total Problemas Por lo que el DMA de la muestra quedaría: | X | $572.00 $28.60 N 20 D) La Varianza sería 2 ( X X ) 21945.00 2 s 1155.00 n 1 20 1 E) La desviación estándar s 1155.00 $33.99 86 Problemas F) ocupando las formulas obtenemos X 2 nX 1485350 20(270.5) 2 2 Varianza de la muestra s 1155 n 1 19 2 X 2 n X Desviación estandar de la muestra s 1155 33.9 2 n 1 G) Dado que X=$270.50 y s=$33.99 CV=s/X*100=33.99/270.50=.1256*100=12.6% H) Asimetría=3(X-Med)/s=3(270.5-260)/33.99=0.93 Por lo que concluimos que la distribución de los datos salariales es ligeramente asimétrica positiva 87 Trabajo de investigación 4 Las siguientes calificaciones en examen dispuestas en orden ascendente, fueron obtenidas por 20 estudiantes inscritos en un curso de análisis de decisión: 40,47,58,66,70,72,72,75,77,79,81,81,84,84,84,87,93,94, 100,100. Determine A) El rango B) EL RIC C) DMA D) Varianza E) Desviación estándar F) Varianza y desviación estándar con la formula alternativa G) El Coeficiente de variación H) El coeficiente de asimetría de Pearson 88