Download Diapositiva 1 - GEOCITIES.ws

Document related concepts

Medidas de dispersión wikipedia , lookup

Desviación típica wikipedia , lookup

Corrección de Bessel wikipedia , lookup

Parámetro estadístico wikipedia , lookup

Error cuadrático medio wikipedia , lookup

Transcript
Estadística
Capítulo 3.2
Resumen y descripción
de datos numéricos
1-2008
1
Medidas de
Variación
1-2008
2
Medidas de Variación
La variación es la cantidad de dispersión o
“separación” que presentan los datos entre sí.
Muestra A
Muestra B
Los edificios B están más separados
que los de grupo A. La dispersión en B es mayor que en A.
1-2008
3
Medidas de variación
La medidas de variación más importantes en
la estadística son:
•
•
•
•
•
1-2008
Rango
Rango intercuartil
Varianza
Desviación Estándar
Coeficiente de variación
4
Rango
Tal como se vio en las distribuciones de
frecuencia, el rango es el valor que se
encuentra restando los valores mayor y
menor de los datos de una muestra con sus
datos ordenados.
Rango  Dato mayor  Dato menor
1-2008
5
Para determinar el rango de los tiempos
necesario para arreglarse, los datos se
ordenan de mayor a menor
29
31
Rango
1-2008
35
39
39
40
43
44
=
53
-
29
=
24
44
53
6
Rango Intercuartil
El rango intercuartil se obtiene al restar el
primer cuartil del tercer cuartil.
Rango Intercuartil  Q3  Q1
Esta medida considera la dispersión de la mitad
de los datos; por lo tanto los valores extremos
no influyen en los resultados.
1-2008
7
El rango intercuartil de los rendimientos
anuales que obtuvieron los fondos
nacionales cuyos cargos de venta se pagan
con los activos de los fondos es de US$ 3.70
1-2008
8
Varianza y Desviación Estándar
El rango es una medida de dispersión total y el
rango intercuartil es una medida de dispersión
media; sin embargo, ninguna de ellas toma en
cuenta cómo se distribuyen o se agrupan las
observaciones.
1-2008
9
Varianza y Desviación Estándar
La varianza y la desviación estándar toman en
cuenta cómo se distribuyen los datos entre sí.
Estas medidas evalúan la manera en que
fluctúan los valores respecto a la media
aritmética (promedio).
Lo anterior la convierte en una fuerte
herramienta con la suficiente confianza para
preparar conclusiones y proyecciones.
1-2008
10
Varianza
(Muestral)
La varianza muestral es la suma de los cuadrados
de las diferencias con relación a la media
aritmética dividida entre el cuadrado de la muestra
menos 1
n
S2 
1-2008
•
•
•
•
2
(
X

X
)
 i
i 1
S2 Ξ Varianza
Xi Ξ Dato u observación
X Ξ Media Aritmética
n Ξ Tamaño de la muestra
n 1
11
Varianza
(Muestral)
n
S2 
2
(
X

X
)
 i
i 1
n 1
El proceso para calcular la varianza se resume así:
1.
2.
3.
4.
5.
Se calcula la media aritmética
A cada dato de la muestra se le resta el valor de media
aritmética
El resultado de la resta se eleva al cuadrado
Se suman todos los cuadrados obtenidos
Dividir el resultado entre total de muestra menos 1
1-2008
12
Para una muestra de 17 fondos de acciones
generales con cargos de venta pagados por activos
de los fondos, calcular la varianza.
32.2
29.5
29.9
32.4
30.5
30.1
32.1
35.2
10.0
20.6
28.6
30.5
38.0
33.0
29.4
37.1
28.6
n
S2 
1-2008
2
(
X

X
)
 i
i 1
n 1
13
Calcular la media aritmética
507.7
X 
 29.86
17
1-2008
32.2
29.5
29.9
32.4
30.5
30.1
32.1
35.2
10.0
20.6
28.6
30.5
38.0
33.0
29.4
37.1
28.6
507.7
14
Xi
X1
X2
X3
X4
X5
X6
X7
X8
X9
1-2008
=
=
=
=
=
=
=
=
=
X
32.2
29.5
29.9
32.4
30.5
30.1
32.1
35.2
10.0
29.86
29.86
29.86
29.86
29.86
29.86
29.86
29.86
29.86
Xi  X
2.34
-0.36
0.04
2.54
0.64
0.24
2.24
5.34
-19.86
( X i  X )2
5.4756
0.1296
0.0016
6.4516
0.4096
0.0576
5.0176
28.5156
394.4196
15
Xi
( X i  X )2
X10
= 20.6
X11
= 28.6
29.86
-1.26
1.5876
X12
= 30.5
29.86
0.64
0.4096
X13
= 38.0
29.86
8.14
66.2596
X14
= 33.0
29.86
3.14
9.8596
X15
= 29.4
29.86
-0.46
0.2116
X16
=
37.1
29.86
7.24
52.4176
X17
= 28.6
29.86
-1.26
1.5876
Total
1-2008
Xi  X
X
29.86
-9.26
85.7476
658.5592
16
n
S 
2
(X
i 1
i
 X)
2
n 1
658.5592
2
S 
17  1
2
S  41.15995
1-2008
17
Desviación Estándar
La desviación estándar de la muestra es la raíz
cuadrada de la varianza.
n
S 
1-2008
2
(
X

X
)
 i
i 1
n 1
18
Para la muestra que contiene 17 fondos de
acciones generales con cargos de venta pagados
por activos de los fondos, calcular la varianza.
32.2
29.5
29.9
32.4
30.5
30.1
32.1
35.2
10.0
20.6
28.6
30.5
38.0
33.0
29.4
37.1
28.6
n
S
1-2008
2
(
X

X
)
 i
i 1
n 1
19
En el ejemplo 3.11, se hizo el cálculo de la
varianza, con un resultado de 41.15995.
n
S
2
(
X

X
)
 i
i 1
n 1
S  S2
S  41.15995
1-2008
S  6.42
20
Coeficiente de Variación
A diferencia de las medidas que hemos estudiado
hasta ahora, el coeficiente de variación es una
indicación relativa de la variación. Siempre se
expresa en porcentajes, no en términos de la
unidad de medida de los datos estudiados.
Mide la dispersión en los datos con relación a la
media .Es más útil cuando se trata de hacer
comparaciones entre muestras.
1-2008
21
Coeficiente de Variación
El coeficiente de variación se calcula de la
siguiente manera:
S
CV 
*100
X
1-2008
22
Calcular el coeficiente de variación para los 17
fondos de acciones generales
1-2008
32.2
29.5
29.9
32.4
30.5
30.1
32.1
35.2
10.0
20.6
28.6
30.5
38.0
33.0
29.4
37.1
28.6
23
* El valor de la media aritmética es 29.86
* El valor de la desviación estándar es 6.42
S
6.42
CV 

(100)  21.50%
X
29.86
El coeficiente de variación es 21.50%
1-2008
24
Puntuaciones Z
Un valor extremo o atípico es un valor ubicado
muy lejos de la media. Las puntuaciones Z son
útiles para identificar atípicos. Cuanto mayor es
la puntuación Z, mayor es la distancia entre tal
valor y la media.
La puntuación Z es igual a la diferencia entre ese
valor y la media, dividida por la desviación
estándar.
1-2008
25
Puntuación Z
x X
Z
s
Una puntuación Z se considera atípica si es
menor que -3.0 o mayor que +3.0
1-2008
26
Se considera que la media para arreglarse en la
mañana es de 39.6 minutos y la desviación
estándar de 6.77 minutos.
Sí el día lunes se toma 39.0 minutos para
arreglarse. Calcular la puntuación Z para este día.
1-2008
39.0  39.6
Z
6.77
Z  0.09
27
Supongamos que el gerente de operaciones de un
servicio de paquetería desea adquirir una nueva
flotilla de vehículos. Cuando los paquetes se
guardan con eficiencia en el interior de los
vehículos – durante la preparación de las
entregas-, se deben considerar dos restricciones:
el peso (en libras) y el volumen (en pies cúbicos)
de cada paquete.
1-2008
28
Ahora supongamos que en una muestra de 200
paquetes, el peso promedio es de 26.0 libras
con una desviación estándar de 3.9 libras. Por
otro lado, el volumen promedio de cada paquete
es 8.8 pies cúbicos con una desviación estándar
de 2.2 pies cúbicos. ¿Cómo se puede comparar
la variación del peso y el volumen?
1-2008
29
Coeficiente de Variación del Peso
CV peso
3.9

(100%)  15%
26.0
Coeficiente de Variación del Volumen
CVvolumen
2.2

(100%)  25%
8.8
El volumen de un paquete es más variable que el peso. Ya que el
coeficiente de variación del volumen es 25% mientras que el peso es de
15%.
1-2008
30
Cada acción de la compañía “As” ha promediado
50 dólares en los últimos meses, con una
desviación estándar de 10 dólares. Además,
durante el mismo período el precio promedio de
las acciones de la compañía “Bonita” fue de 12
dólares con una desviación estándar de 4 dólares.
¿Cómo puede determinar un inversionista cuáles
acciones son más variables?
1-2008
31
Coeficiente de Variación de la Compañía “As”
CVas
10

(100%)  20%
50
Coeficiente de Variación de Compañía “Bonita”
CVbonita
4

(100%)  33.3%
12
El precio de las acciones de “Bonita” varía más que el
precio de las acciones de “As”. El inversionista puede
decidir comprar las acciones de “As”; su coeficiente de
variación fluctúa menos.
1-2008
32
Forma
Se refiere a la forma en que se distribuyen los
datos.
La observación de la forma puede obtenerse a
través de distribución de frecuencias o del
gráfico
1-2008
33
Forma
La distribución de los datos puede ser simétrica
o no. La no simetría también se le conoce
como:
• Asimétrica
• Sesgada
1-2008
34
Forma
La simetría se determina con la comparación de
la media y la mediana
• La media es igual a la mediana, la distribución es
simétrica (insesgada)
• La media es menor a la mediana, la distribución
es sesgada a la izquierda (sesgo negativo)
• Si la media es mayor que la medina, la
distribución es sesgada a la derecha (sesgo
positivo)
1-2008
35
Insesgada
14
12
10
8
6
4
2
0
1
2
3
4
5
6
7
8
9
• La media es igual a la mediana, la distribución es
simétrica.
1-2008
36
Sesgada a la izquierda
20
15
10
5
0
1
2
3
4
5
6
7
8
9
• La media es menor a la mediana, la
distribución es sesgada a la izquierda (sesgo
negativo)
1-2008
37
Sesgada a la derecha
25
20
15
10
5
0
1
2
3
4
5
6
7
8
9
• Si la media es mayor que la mediana, la
distribución es sesgada a la derecha (sesgo
positivo)
1-2008
38