Download Presentación de PowerPoint

Document related concepts

Error estándar wikipedia , lookup

Estimación estadística wikipedia , lookup

Intervalo de confianza wikipedia , lookup

Tamaño de la muestra wikipedia , lookup

Prueba t de Student wikipedia , lookup

Transcript
Inferencia Estadistica
REPÚBLICA BOLIVARIANA DE VENEZUELA
LA UNIVERSIDAD DEL ZULIA
FACULTAD DE CIENCIAS ECONÓMICAS Y SOCIALES
ASIGNATURA: ESTADÍSTICA
Inferencia Estadística
•Estimación y
Prueba de Hipótesis de la Media
Mgs. Anaís Álvarez
Econ. Martha Ariza
Mgs. María C. González
Maracaibo, Marzo de 2003
1
Inferencia Estadistica
OBJETIVO GENERAL
Evaluar las estimaciones de intervalos de confianza para
tomar decisiones empresariales eficientes.
Evaluar las suposiciones de los valores estadísticos de
la población sobre la representación de la población.
OBJETIVO TERMINAL
Al finalizar el tema estarás en capacidad de:
•Aplicar adecuadamente la formula de estimación de intervalo de la
media de la población dado las características de la variable y
si se conoce o no la desviación estándar poblacional.
.
•Aplicar adecuadamente los procedimientos de las pruebas de
hipótesis para la media de los parámetros dado un caso
hipotético o real
2
Inferencia Estadistica
OBJETIVOS ESPECÍFICOS
•Conocer las partes que comprende la inferencia estadística.
•Interpretar la estimación de intervalo de confianza de la
media dado un caso hipotético o real.
•Explicar el significado del error tipo I y Error tipo II.
•Formular las Hipótesis nulas y hipótesis alternativa.
•Distinguir entre Prueba unilateral y prueba bilateral.
•Calcular los valores estadísticos de pruebas para docimar la
media poblacional de acuerdo a si se conoce o no la
desviación estándar poblacional.
.
3
Inferencia Estadistica
PRE-TEST
La evaluación que a continuación se presenta tiene
como objetivo fundamental diagnosticar los conocimientos
previos relacionados con el tema, es por esta razón que las
respuestas se evaluarán cualitativamente para que puedas
responder libremente en forma clara y sencilla de acuerdo a tus
aprendizajes adquiridos con anterioridad.
4
Inferencia Estadistica
PRE-TEST
Lee detenidamente cada una de las preguntas.
Escribe en forma clara y legible.
1.Define con tus propias palabras:
a)
b)
c)
d)
e)
Parámetro:____________________________________________________
_____________________________________________________________
____________________________________________________________
Estadístico:____________________________________________________
_____________________________________________________________
_____________________________________________________________
Inferencia:_______________________________________________
_____________________________________________________________
_____________________________________________________________
Estimación:____________________________________________________
_____________________________________________________________
_____________________________________________________________
Hipótesis:____________________________________________
_____________________________________________________________
_____________________________________________________________
5
Inferencia Estadistica
1. INFERENCIA ESTADÍSTICA . DEFINICIÓN
La inferencia estadística es un proceso que consiste en utilizar los resultados de
una muestra para llegar a conclusiones acerca de las características de la
población. (Stevenson, William)
La teoría de Inferencia Estadística consiste en aquellos métodos con los cuales
se puede inferir o generalizar acerca de la población.
Actividad:
a. Define con tus propias palabras INFERENCIA ESTADISTICA.
________________________________________________________________
________________________________________________________________
________________________________________________________________
6
Inferencia Estadistica
2.Clasificación de la inferencia
La Inferencia puede dividirse en dos principales áreas:
•
Estimación
•
Prueba de Hipótesis
Actividad: Investigar en las paginas web y formular su propia definición de estimación
y pruebas de hipótesis
a.
b.
Estimación:_________________________________________________________
__________________________________________________________________
__________________________________________________________________
Pruebas de Hipótesis :_________________________________________________________
____________________________________________________________________________
___________________________________________________________________________
7
Inferencia Estadistica
2.Estimación. Definición
La estimación es un proceso de utilizar datos muéstrales para estimar los valores de parámetros
desconocidos de una población. Esencialmente, cualquier características de la población se pueden estimar a
partir de una muestra al azar.
Debemos hacer la distinción entre estimador y estimaciones.
Cualquier estadística de muestra que se utiliza para estimar un parámetro de la población se conoce como
estimador, es decir, un estimador es una estadística de muestra utilizada para estimar un parámetro de la
población. La media de la muestra x puede ser un estimador de la media de la población.
Una estimación es un valor especifico observado de una estadística. Hacemos una estimación si tomamos
una muestra y calculamos el valor que toma el estimador en esa muestra.
Por ejemplo, se toma la lectura media en kilometraje a partir de una muestra de taxis en servicio, el valor
obtenido es de 160.000 kilómetros.
Estimador: lectura media del recorrido en kilometraje
Estimación: 160.000 kilómetros recorridos en promedio por taxis
Actividad:
Indique
la(s)
diferencia(s)
entre
el
estimador
y
la
estimación
____________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
8
Inferencia Estadistica
3.Estimación.
Criterios para Seleccionar un Buen Estimador
Podemos evaluar la calidad de una estadística como un buen estimador mediante el uso de cuatro criterios:
a. Imparcialidad.
El termino Imparcialidad se refiere al hecho de que una media de muestra es un estimador no sesgado de la
media de la población porque la media de la distribución de muestreo de las medias de muestra tomadas de
una población es igual a la media de la población misma.
b.
Eficiencia.
Se refiere al tamaño del error estándar de la estadística. Si comparamos dos estadísticas de una muestra del
mismo tamaño y tratamos de decidir cual de ellas es un mejor estimador más eficiente, escogeríamos la que
tuviera el menor error estándar o la menor desviación estándar de la distribución de muestreo.
c.
Coherencia.
Una estadística es un estimador coherente de un parámetro de la población si al aumentar el tamaño de la
muestra, se tiene la certeza de que el valor de la estadística se aproxima bastante al valor del parámetro de
la población.
d.
Suficiente.
Un estimador es suficiente si utiliza una cantidad de la información contenida en la muestra que ningún otro
estimador podría extraer información adicional de la muestra sobre el parámetro de la población que se está
estimando.
9
Inferencia Estadistica
3. Tipos de Estimación
Podemos hacer dos tipos de estimaciones concernientes a una población:

Estimación Puntual

Estimación por intervalos
Actividad: Dada la bibliografía recomendada indica las características con sus propias palabras:
Estimación puntual:_____________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
Estimación de intervalo:__________________________________________________________
_________________________________________________________________________________
Distribución de Muestreo: _________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________
10
Inferencia Estadistica
3. Tipos de Estimación
a. Estimación Puntual
La estimación puntual es un solo número que se utiliza para estimar un parámetro de la
población desconocido.
Los valores estadísticos muéstrales se utilizan como estimadores de los parámetros de la
población. Así, la media de la muestra se utiliza como estimación del valor de la media de la
población; la desviaron Estándar de la muestra se emplea como una estimación de la
desviación estándar de la población. , la cual se expresa:
X  
S 
11
Inferencia Estadistica
3. Tipos de Estimación
b. Estimación de intervalos
Una estimación de intervalo es un conjunto de valores entre dos extremos dados que se
utiliza para estimar un parámetro. Esta estimación indica el error de dos maneras por la
extensión del intervalo y por la probabilidad de obtener el verdadero valor de la población
que se encuentra dentro del intervalo. Es decir, estas estimaciones proporcionan un intervalo
de los valores posibles para el parámetro de la población.
La estimación por intervalo de un parámetro poblacional(  ) es un intervalo de la forma
 inferior     superior, donde  inferior y  superior depende del valor del estadístico
 para una muestra particular y también de la distribución muestral
El intervalo de estimación indica, por su longitud, la precisión de la estimación puntual.
12
Inferencia Estadistica
3. Tipos de Estimación
A partir de la distribución muestral de la estimación de cualquier parámetro ( será posible
determinar valores  inferior y  superior tales que la
P (  inferior ≤  ≤  superior ) = 1 -
Donde
•
1 - se denomina intervalo de confianza o grado de confianza, el cual proporciona unos
intervalos de valores, centrado en el valor estadístico de la muestra, en el cual
supuestamente se ubica el parámetro de la población, con un riesgo de error.
•
, se denomina nivel de significación, indica la porción que se encuentra en los extremos de
la distribución que están fuera del intervalo de confianza, el nivel de riesgo. Los valores van
comprendido 0 <  < 1.
•
 inferior ≤  ≤  superior,
son los puntos extremos o limites de confianza inferior y
superior. De tal manera que cuando  = 0.05, se tiene un intervalo de confianza del 95% y
cuando  = 0.01, se tiene una seguridad de que 99% en el intervalo dado que contiene el
parámetro desconocido.
13
Inferencia Estadistica
3. Tipos de Estimación
La estimación de intervalo es un método que nos permite no sólo encontrar la mejor
estimación del valor de un parámetro, sino también el probable grado de error en la
estimación. Lo que implica que nos proporciona en rango de valores posibles de un
parámetro.
Cada intervalo de confianza incluye o no al verdadero valor del parámetro que se estima, el
nivel de confianza (1-), nos indica que en el limite, el (1-) de los intervalos así construidos
incluyen el valor poblacional. Por ejemplo, la interpretación del intervalo de confianza, sería:
Una estimación de intervalo de confianza de 95%, nos indica como si se tomaran todas las
muestras posibles del mismo tamaño, n, 95% de ellas incluirían el valor de la media real en
alguna parte del intervalo alrededor de sus medias de muestras, y solamente el 5% de ellas
no están incluidas.(Berenson y Levine,1996:346)
14
Inferencia Estadistica
3. Estimación De La Media De La Población.
Del conocimiento de la distribución de la población, podemos determinar el porcentaje de
medias de muestra que caen dentro de ciertas distancias de la media de la población.
El método empleado para estimar la media de la población depende de sí se conoce la
desviación estándar de la misma o si ésta se debe estimar a partir de los datos muéstrales:

Estimación De Intervalo De Confianza De La Media, Conociendo
La Desviación Estándar Poblacional (

Estimación De Intervalo De Confianza De La Media,
Desconociendo La Desviación Estándar Poblacional (
Actividad: definir Desviación estándar e indicar para que sirve.
_________________________________________________________________________
_______________________________________________________________________________
15
Inferencia Estadistica
4. Estimación De La Media De La Población.
La estimación de intervalo de la media poblacional se basa en el supuesto de que la
distribución del muestreo sea normal.
Cómo se puede detectar si una variable tiene una distribución
Normal?
1.
Explorando los datos recopilados de la variable a través de una
representación gráfica, en un histograma. Se debe tener en cuenta las
características de la distribución normal, la forma, de modo que se sabe que
alrededor de 68% de los valores estadísticos de la muestra están comprendidos
dentro de la una desviación estándar de la media de la distribución del muestreo
que es igual a la media de la población, y que casi el 95% de los valores medios
de la muestra estarán dentro de 1.96 desviaciones estándar de la media. Con lo
cual se mide la distancia de la media poblacional a partir de la desviación
estándar de la población.
En consecuencia, si se establece la proposición de que la media de una muestra
esta dentro de 1.96 desviaciones estándar de la media verdadera, es posible
esperar estar en lo cierto un 95% de las veces, y estar equivocado el 5%
restantes.
16
Inferencia Estadistica
4. Estimación De La Media De La Población.
2.
Si se cumple el teorema de limite central, a continuación se exponen algunos definiciones de
diferentes autores
Se cumple, cuando independientemente de la población de origen, la distribución
de la medias aleatorias se aproxima a una distribución normal a medida que el
tamaño de la muestra crece .( Bencardino,321:2.000)
Al hacerse lo bastante grande el tamaño de la muestra la distribución de
muestreo de la media puede aproximarse mediante la distribución normal. Esto
es cierto no importa la forma de la distribución de los valores individuales de la
población.
Para la mayoría de distribuciones de la población, sin importar la forma , la
distribución de muestreo de la media tendrá una distribución aproximadamente
normal si se seleccionan
muestras de al menos 30 observaciones.(Berenson y
Levine: 1996:329)
17
Inferencia Estadistica
4. Estimación De La Media De La Población.
De acuerdo al teorema de limite central, es de esperarse que la distribución muestral de
tenga una distribución aproximadamente normal con una media x   y desviación estándar
x  .(Ver figura Nº 1)
Figura Nº 1
El intervalo de confianza esta centrado respecto al valor medio de la muestra
intervalo
de confianza
X–Zx
X
X + Z x
18
Inferencia Estadistica
5.Procedimiento para Estimación intervalo de confianza De La Media
De La Población cuando se conoce la Desviación Estándar poblacional.
Cuando se conoce la desviación estándar de la población, la estimación del intervalo de la
media se calcula de la siguiente manera:
X  Zx
Sustituyendo, queda


P X  Z1 / 2 * / n    X  Z1 / 2 * / n  1  
Donde
Limite inferior
Limite superior
X : es la media muestral
Z 1- : Es el valor de Z a la derecha de la cual se tiene el área de  , representa la
confianza deseada, se conoce como el valor critico de la distribución.
:
el error de una estimación de intervalo que se refiere a la desviación o diferencia
 x   / n Es
entre el valor medio de la media muestral y la media real de la población.
19
Inferencia Estadistica
5. Procedimiento para Estimación De La Media De La
Población cuando se conoce la Desviación Estándar
poblacional.
Para la mayor comprensión se realizan los procedimientos para estimar el
intervalo de confianza de la media poblacional por medio de un ejercicio.
Un fabricante de papel para computadora tiene un proceso de producción que opera en forma
continua a través de un turno de producción completo. Se espera que el papel tenga una
longitud promedio de 11 pulgadas y se sabe que la desviación estándar es de 0.02 pulgadas.
A intervalos se selecciono una muestra para determinar si la longitud promedio del papel
sigue siendo igual o si hay fallas en el proceso de producción.
¨
Se ha seleccionado una muestra aleatoria de 100 hojas y se ha encontrado que el largo
promedio del papel es de 10.998 pulgadas. Si se desea un estimado del intervalo de
confianza del 95% de la longitud promedio del papel, se tendría:
* Primer paso: Identificar la variable y extraer los datos del problema
Variable: ________________
Datos:
20
Inferencia Estadistica
5. Procedimiento para Estimación De La Media De La
Población cuando no se conoce la Desviación Estándar
poblacional.
* Segundo paso: usar la formula (1) y sustituir
El valor Z se obtiene de la siguiente manera:
El valor de _____ se ubica en la tabla de los valores de Z del anexo No. 1, buscando de adentro
hacia fuera, dando como resultado
. (figura Nº 2)
Figura Nº2
Área bajo la curva normal
Z
.00
.01
.02
.03.
.06 ......
.09
0.0
1.9
0.975
3.0
3.1
3.2
21
Inferencia Estadistica
5. Procedimiento para Estimación De La Media De La
Población cuando no se conoce la Desviación Estándar
poblacional.
¨
*Tercer paso: se sustituye el valor de Z en la formula y se procese a calcular los puntos
extremos.
Por lo tanto se estima, con una confianza del
%, que la media esta entre
_____________________________________, el valor que indica que el proceso de la
producción esta operando en forma adecuada, no hay motivos para pensar que haya
problemas en la fabrica.
22
Inferencia Estadistica
5. Procedimiento para Estimación De La Media De La Población
cuando no se conoce la Desviación Estándar poblacional.
Ejercicios de estimación de intervalo de la media poblacional
a. Una maquina de refrescos está ajustada de tal manera que la cantidad de líquido
despachada se distribuye aproximadamente en forma normal con una desviación
estándar igual que 0.15 decilitros.
Encuentre el intervalo de confianza del 95% para la media de todos los refrescos
que sirve esta maquina si una muestra aleatoria de 36 refrescos tiene un
contenido promedio de 2.25 decilitros
Aplique el procedimiento indicado:
1.
Variable _____________________
datos del problema.
2.
Sustituir en la formula los valores detectados en el problema .
3.
Buscar el valor de Z en la tabla
23
Inferencia Estadistica
.Ejercicios de estimación de intervalo de la media poblacional
¨
4. Calcular los intervalos de confianza
Conclusión
:
___________________________________________________________________________________
___________________________________________________________________________________
___________________________________________________________________________________
24
Inferencia Estadistica
6. Estimación De La Media De La Población cuando no se
conoce la Desviación Estándar poblacional.
¨
Por lo general se desconoce la desviación estándar real de la población, por lo tanto los
cálculos de los intervalos de confianza se deben basar en la Distribución T de Student, su
origen se remonta a principios del siglo XX, fue William S. Gosset el que planteo esta
distribución, empleado de una cervecería en Irlanda, puesto que no se les permitía publicar
investigaciones con los nombres propios adopta un seudónimo de Student.
Si la variable X esta distribuida en forma normal, entonces el estadístico es

s
n
25
Inferencia Estadistica
6. Estimación De La Media De La Población cuando no se
conoce la Desviación Estándar poblacional.
¨
Propiedades
Student
Figura N° 3
Distribución t’student
de
la
distribución
t
de
 Tiene forma de campana y es simétrica, al igual que la
distribución normal. Sin embargo, la distribución t tiene mas
área en las colas y menos en el centro. Debido a que se usa
S en vez de . (Ver la Figura Nº 3)
¨
 La distribución t es bastante sensible con respecto al
tamaño de la muestra, sin embargo esta sensibilidad
disminuye en el caso de tamaños muéstrales grandes.
 La distribución t presenta un área ( probabilidad) mayor
en los extremos que la distribución normal. Esto significa,
para un nivel de confianza dado, el valor t será un poco
mayor que el correspondiente a Z.
 El aspecto interesante de la distribución t es que no es
una de tipo estandarizado, en caso de cada tamaño de la
muestra existe una distribución t diferente,
t’student
Normal
¨
Hay una tabla para los valores t al igual que para los
valores z, para utilizarla debemos conocer el nivel de
confianza y los grados de libertad.
26
Inferencia Estadistica
6. Estimación De La Media De La Población cuando no se
conoce la Desviación Estándar poblacional.
¨
Los grados de libertad están relacionados con la forma del cálculo de la desviación estándar
muestral
n
2
2
2
Xi  X

X


*n
i 1
s 
S
n 1
n 1



Los grados de libertad son n-1, que se pueden definir como el número de valores que pueden
escoger libremente. El hecho de que n=5 y que X = 20 , nos indica que  Xi = 100. Por lo
tanto una vez que se conocen cuatro de los valores, el quinto no tendrá libertad para variar,
puesto que la suma tiene que dar 100.
La Formula para La estimación por intervalo de confianza con nivel de (1- para la media,
desconociendo x, se expresa en la siguiente forma:


P X  t n  1; / 2* S / n    X  t n  1; / 2* S / n  1  
Limite inferior
Donde:
n-1: grados de libertad
t : distribución t
S: desviación estándar de la muestra
Limite superior
27
Inferencia Estadistica
6. Procedimiento para la Estimación De La Media De La
Población cuando no se conoce la Desviación Estándar
poblacional.
¨
El director de una gran cadena de departamentos le gustaría tomar una muestra de mujeres
con tarjetas de créditos para obtener información relacionada con el comportamiento de
actitudes y de compras. De hecho quiere estimar la cantidad que gastan al mes las mujeres
en compras de ropa para uso personal. Se selecciono una muestra de 25 mujeres con tarjetas
de créditos. Los resultaron mostraron un promedio muestral de $ 86, 40 y una desviación
estándar de $ 37.50.
Estimar con un nivel de confianza del 95% de que el intervalo contenga la cantidad promedio
real de la población de los gastos en ropa. Se tendría que:
¨
Primer paso: identificar la variable y extraer los datos del problema
Variable: __________________
Datos :
28
Inferencia Estadistica
6. Procedimiento para la Estimación De La Media De La
Población cuando no se conoce la Desviación Estándar
poblacional.
¨
Segundo paso: utilizar la formula para calcular los intervalos
Tercer paso: para obtener el valor de t se utiliza la tabla del anexo 2.La cual tiene las siguientes características:

La parte superior de cada columna señala la cola derecha de la distribución t, cada renglón representa un valor
particular para grado de libertad.(Ver Figura N°4)

En la fila se encuentran los grados de libertad desde 1 hasta infinito. Si como en este caso se ubica con un
95% y 24 grados de libertad. Se observa en la columna /2=0.025, el renglón correspondiente a 24 grados
de libertad se tiene como resultado el valor de la cola superior de _____________.
Figua N°4
gl
Valores distribución t’student
.001
1
2
.24
.
29

.01
.025.
.05 ......
.10
2.064
29
Inferencia Estadistica
6.Procedimiento para la Estimación De La Media De La Población
cuando no se conoce la Desviación Estándar poblacional.
¨
¨
Cuarto paso: una vez ubicado el valor de t, se sustituye en la formula y se calcula el intervalo.
Se llega a la conclusión, a un nivel de confianza del 95%, que la cantidad promedio gastada al mes en
ropa por las mujeres con tarjetas de créditos esta entre $____________. Esta confianza de 95% en
realidad significa que si se selecciona todas las muestras posibles de tamaño 25, el 95% de los
intervalos elaborados incluiría la media real de la población en algún lugar dentro del intervalo.
30
Inferencia Estadistica
6. Procedimiento para la Estimación De La Media De La Población
cuando no se conoce la Desviación Estándar poblacional.
a.
En el departamento de personal de una compañía grande se quieren estimar los gastos
familiares en odontología de sus empleados para determinar la factibilidad de
proporcionarles un plan de seguro dental. Una muestra aleatoria de 10 empleados reveló
los siguientes gastos durante el año anterior:
$110,362,246,85,510,208,173,425,316,179
Se pide:
Establezca una estimación de intervalo de confianza del 90% de los gastos promedio
familiares en odontología para todos los empleados de la compañía.
1.
Identificar la variable y extraer los datos.
2.
S
Se debe calcular la media muestral y desviación estándar muestral con las siguientes
formulas
 ( Xi  X )
n 1
2

31
Inferencia Estadistica
6. Procedimiento para la Estimación De La Media De La Población
cuando no se conoce la Desviación Estándar poblacional.
3.Sustituir los valores en la formula.
4.Buscar el valor de t en la tabla
5.Calcular los intervalos de confianza.
Interpretación:
________________________________________________________________________
________________________________________________________________________
______________________________________________________________________
32
Inferencia Estadistica
7. Diferencias de las medias poblaciones cuando se conoce
1 y 2.
3. Buscar el valor de z en la tabla
4. Calcular las diferencia entre las medias poblacionales.
Interpretación
:___________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
33
Inferencia Estadistica
8. Diferencias de las medias poblaciones cuando no se conoce
1 y 2.
Procederemos a aplicar la formula con un ejercicio.
Para una muestra de 50 empresas de una determinada rama industrial se encuentra que el
número promedio de empleados por empresa es con S1 = 55.7; existe un total de 380
empresas en esta rama. En una segunda rama industrial que cuenta con 200 empresas, el
número promedio de empleados de una muestra de 50 de ellas es de empleados con S2 =
87.9
Estime la diferencia del número promedio de empleados por empresa en ese ramo industrial
utilizando un intervalo de confianza del 95%.
-Procedimiento:
1. Identificar la variable y extraer los datos.
variable
datos:
2. Calcular la desviación estándar amalgamada(Sp).
.
34
Inferencia Estadistica
8. Diferencias de las medias poblaciones cuando no se conoce
2.
1 y
3.Sustituir los valores en la formula y Buscar el valor de z en la tabla
4. Calcular las diferencia entre las medias poblacionales.
Interpretación
:___________________________________________________________________________
____________________________________________________________________________
____________________________________________________________________________
35
Inferencia Estadistica
9. Autoevaluación.
a. De las siguientes nomenclaturas, especificar el significado de cada una
µ:____________________
Β:____________________
S:____________________
:____________________
:____________________
t:_____________________
:____________________
:____________________
Sp:___________________
1-:__________________
X:___________________
36
Inferencia Estadistica
9. Autoevaluación.
b.Para un determinado producto de consumo popular, el promedio de ventas por tienda fue,
el año anterior, en una muestra de n1 = 10 tiendas,un promedio de 3425000 y una
desviación estándar 200000. Para un segundo producto, el promedio de ventas por tienda
de una muestra de n2 = 12 tiendas, un promedio de 3250000 y una desviación estándar
175000. Se supone que los montos de las ventas por tienda tienen una distribución normal,
para ambos productos.
Estime la diferencia entre el nivel promedio de ventas por tienda del año anterior
utilizando un intervalo de confianza del 98%.
Resolver según el procedimiento:
37
Inferencia Estadistica
9. Autoevaluación.
c. El diámetro promedio de una muestra de 12 varillas incluidas en un embarque es de
2350 mm, con una desviación estándar de 0.050 mm. Se supone que la distribución de los
diámetros de todas las varillas incluidas en el embarque tiene una distribución
aproximadamente normal. Determine el intervalo de confianza del 99% para estimar el
diámetro promedio de todas las varillas.
38
Inferencia Estadistica
9. Autoevaluación.
d. Un analista de un departamento de personal elige al azar los expedientes de 16
trabajadores a destajo y encuentra que el salario promedio por pieza es de Bs. 950. Se
supone que los salarios de esta empresa tienen una distribución normal. Si se sabe que la
desviación estándar de los salarios es de Bs. 100, estime la tasa promedio de los salarios en
la empresa utilizando un intervalo de confianza del 80%.
¿Si un trabajador gana de salario por pieza gana Bs. 1500, se considera normal?. Explique
su respuesta.
e. Un proceso químico, se comparan dos catalizadores para verificar su efecto en el resultado
de la reacción del proceso. Se preparó una muestra de 12 procesos utilizando el catalizador 1
y una de 10 con el catalizador 2. En el primer caso se obtuvo un rendimiento promedio de 85
con una desviación estándar de 4, mientras que el promedio para la segunda muestra fue de
81 y la desviación estándar de 5. Encuentre un intervalo de confianza del 90% para la
diferencia entre las medias poblacionales, suponiendo que las poblaciones están distribuidas
aproximadamente en forma normal con varianzas iguales.
39
Inferencia Estadistica
9.PRUEBAS DE HIPÓTESIS. DEFINICIÓN
La finalidad de la prueba de significación es decidir si una afirmación acerca de
un parámetro es verdadera
El Propósito de una prueba de Hipótesis es determinar si el valor supuesto (Hipotético) de
un parámetro poblacional, como la media de la población debe aceptar como verosímil con
base a evidencia muéstrales..(Kazmier, Leonard. 1.996)
•
El tiempo promedio de un examen es de 80 minutos.
40
Inferencia Estadistica
10.Términos a utilizar en los test de Hipótesis
•
•
Hipótesis Nula: La hipótesis de que el parámetro de la población es igual a las
especificaciones investigadas se conoce como hipótesis nula. Es un enunciado que expresa
que el parámetro de la población es como se especifica, es decir la proposición es verdadera .
(Berenson y Levine,1996:385)
Hipótesis Alternativa, es un enunciado que ofrece lo opuesto o una alternativa a la
proposición de la hipótesis nula. Representa la conclusión a la que se llegaría si hubiera
suficiente evidencia de la información de la muestra para decidir que es improbable que la
hipótesis nula sea verdadera (Berenson y Levine,1996:385)
•
Nivel de significación, es la probabilidad de rechazar una hipótesis nula que sea
verdadera. Se simboliza con la letra griega .
•
Valor estadístico de prueba, mide que tan cerca de la hipótesis nula se encuentra el valor
de la muestra. Su formulas dependerá de la distribución de probabilidad que se desee aplicar
y de la situación si se conoce o no la desviación estándar de la población.
41
Inferencia Estadistica
11. Errores De Tipo I Y II
Pueden ocurrir dos tipos de problemas al aplicar el enfoque de la prueba de hipótesis a la toma de
decisiones relacionados con los parámetros de la población. (ver Figura Nº6)
¨ Error Tipo I se da cuando se rechaza la hipótesis nula cuando en realidad es cierta, se conoce
como α. También denominado nivel de significación.
¨ El error tipo II ocurre cuando no se rechaza la Ho nula siendo falsa y se debería rechazar, se le
conoce con la llamada β .
El complemento de la probabilidad de un error tipo II se conoce como potencia de una prueba
estadística. Es la probabilidad de rechazar la hipótesis nula cuando es falsa.
Figura Nº 5 Pruebas de Hipótesis
Decisión
Estadística
Ho
Verdadera
Ho
Falsa
Aceptar Ho
1-α Conclusión
Correcta
Error tipo II
probabilidad β
Rechazar Ho
Error Tipo I
Conclusión
correcta
42
Inferencia Estadistica
12.Procedimiento Para Realizar
Pruebas De Hipótesis de la media poblacional
1. El primer paso constituye en formular la hipótesis nula, en el ámbito general las hipótesis son
explicaciones potenciales que intenta información acerca de hechos observados en situaciones que
existen algunos factores desconocidos.
Esta se puede establecer como:
Ho:  = o
Ho:   o
Ho:   o
2. Establecer la Hipótesis Alternativa, se utiliza para indicar que aspecto de variación no aleatoria resulta
de interés.
Existen tres tipos posibles:
concentrarse en ambas direcciones;
concentrarse en desviaciones por debajo del valor esperado;
concentrarse en desviaciones por encima del valor esperado.
Simbólicamente, se expresaría los tres casos de la siguiente manera:
Hi :
Hi :
Hi :
 = o (demasiado o muy pocas, prueba bilateral o de dos colas)
 < o (Desviaciones por debajo, prueba de una sola cola o Unilateral )
 > o(Desviaciones por arriba, prueba de una sola cola o Unilateral ).
43
Inferencia Estadistica
12.Procedimiento Para Realizar
Pruebas De Hipótesis de la media poblacional
3. El tercer paso, es seleccionar un nivel de significación que sea aceptable que es la probabilidad de
rechazar una hipótesis nula que sea verdadera, tambien es conocido como error tipo I. Esto, a su vez,
indicara el valor critico correspondiente que servirá como un estándar de comparación respecto al cual
juzgar un valor critico de prueba.
4.
El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo, el
trazado dependerá de cómo este formulada la hipótesis alternativa, si es mayo, menor o diferente.,
quedando dividida en dos regiones. Si por ejemplo la Hipótesis alternativa tiene el signo de menor, el valor
critico se trazará en el extremo inferior de la distribución( Ver figura Nº 6)
Figura N 6
Regiones de rechazo y no rechazo en
una prueba de hipótesis
RHo
Valor
critico
No RHo
 Rho : Región de rechazo o región critica,
se considera compuesta por los valores de la
prueba estadística que es poco probable que
ocurran si la hipótesis nula es cierta.
 No Rho:Región de no rechazo, si la prueba
cae en esta región no se puede rechazar la
hipótesis nula
hipotético de 
44
Inferencia Estadistica
12.Procedimiento de las Prueba De Hipótesis Para La
Media, Cuando Se Conoce
5.
x.
Seleccionar y calcular El Valor Estadístico de Prueba , que dependerá de la distribución de
probabilidad que se desee aplicar y de la situación si se conoce o no la desviación estándar
de la población. Calcular el valor del estadístico de prueba con los datos muéstrales.
V.E.P
cuando
se conoce 
z
X  0

n
V.E.P
cuando
se no conoce 
X  0
t
S
n
Si se supone que se conoce la desviación estándar, entonces la distribución muestral de la
media seguirá la distribución normal,en esta formula el numerador mide que tan lejos esta la
media hipotética x de la media observada X. El denominador es el error estándar, por lo que
Z representa los valores estándar de x.
45
Inferencia Estadistica
12.Prueba De Hipótesis Para La Media,
Cuando Se Conoce
6.
x.
Determinar si la prueba estadística ha caído en la región de rechazo o en la de no rechazo y
tomar una decisión. Expresar la decisión estadística en términos del problema o
investigación.
A continuación desarrollaremos un ejercicio, para aplicar el procedimiento expuesto
anteriormente:
Caso:
Supóngase que se desea evaluar la afirmación de un fabricante que establece que sus
llantas radiales tienen un promedio de vida de 40.000 millas y una desviación estándar de
3.500 millas, realiza una prueba siendo los resultados los siguientes: una muestra de 49,
con un valor de la media muestral de 38.000 millas. Se desea investigar si el tiempo de
vida de los neumáticos es mas corto que la media poblacional, a un nivel de confianza del
95%.
46
Inferencia Estadistica
12.Prueba De Hipótesis Para La Media, Cuando
Se Conoce
x.
Procederemos a seguir los pasos de la sección
1. Determinar la variable y los datos
•
Variable :______________________
•
Datos
 =
1-=0
=
X
2. Establecer la Hipótesis nula
Ho :
3. Establecer la Hipótesis alternativa
Hi :
47
Inferencia Estadistica
12.Procedimiento Para Realizar
Pruebas De Hipótesis de la media poblacional
4.
5.
El tercer paso, es seleccionar un nivel de significación 1 -  =
siendo  =
Como se conoce la desviación estándar poblacional, se utiliza la distribución normal para conseguir el valor
critico. El valor de Z 1 –  en una cola se ubica dentro de la tabla del anexo Nº1.
El valor Z es
la cual representa el valor de la tabla.
El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo. Su
trazado dependerá de cómo este planteada la hipótesis alternativa: Si es menor, el valor critico estará en la
zona negativa; Si es mayor, se marcara en la zona positiva y si es diferente existirán dos valores cítricos uno
en la zona negativa y otro en la zona positiva.
Regiones de rechazo y no rechazo en
una prueba de hipótesis
6. Se selecciona y calcula el Valor estadística de prueba
cuando se conoce la desviación estándar poblacional
comparándolo con los valores críticos de la distribución de
muestreo para determinar si cae o no en la región de rechazo.
Sustituyendo los valores
z
x  0

n
En qué región cae
el V.E.P?
48
Inferencia Estadistica
12.Procedimiento Para Realizar
Pruebas De Hipótesis de la media poblacional
Si [Valor estadístico de prueba < valor critico] Rho
Si Zprueba < Z 1- Rho
Sustituyendo
Se toma la decisión de la prueba de hipótesis. Si la estadística cae en la región de no rechazo,
no se puede rechazar la Ho y viceversa. En este caso se rechaza la hipótesis nula.
Conclusión :
De este modo se concluye que el promedio de vida útil de las llantas es _____________________,
a un nivel de significación del 5%.
49
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblaciona
Prueba De Hipótesis Para La Media, Desconocida x.
En la mayor parte de los casos se desconoce la desviación estándar de la población, se estima la desviación
estándar muestral (S).
La prueba estadística para determinar la diferencia entre la media de la muestra y la media de la población x
cuando se usa S se obtiene mediante:
X  0
t
S
n
El procedimiento aplicado es igual al anterior descrito, con la diferencia que la
distribución utilizada es la t’student, explicada enteriormente.
Indique las características de la Distribución t’student:
__________________________________
__________________________________
__________________________________
50
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblaciona
Consideremos el siguiente caso,
Para una muestra de 60 mujeres, tomadas de una población de más de 5000 inscritas en un
programa de reducción de peso en una cadena nacional de balnearios de aguas termales, la
presión sanguínea diastólica media de la muestra es de 101 y la desviación estándar es de 42. A
un nivel de significación de 0.02 ¿Puede concluir que, en promedio, las mujeres inscritas en el
programa tienen una presión diastólica que excede el valor de 75 recomendado por diversas
sociedades médicas?.
1.
•
•
Determinar la variable y los datos
Variable :
Datos
 =
1-=
S=
n=
2. Establecer la Hipótesis nula
Ho : 
X
3. Establecer la Hipótesis alternativa
Como se hace referencia a valores por debajo de la media , se expresa así:
Hi :
51
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblaciona
4.
Seleccionar un nivel de significación 1 -  =
siendo  =
 = _______ , t =
Como no se conoce la desviación estándar poblacional, se utiliza la distribución t para conseguir el valor critico.
El valor de t , la cual se ubica en la tabla del anexo Nº 2. El valor
que se intercepta con los grados de
libertad _______ representa el valor de tabla.
5.
El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo.
(Ver figura Nº7)
Figura N º 7
Regiones de rechazo y no rechazo en
una prueba de hipótesis
6. Se selecciona y calcula el Valor estadística de prueba
cuando se no conoce la desviación estándar poblacional
comparándolo con los valores críticos de la distribución de
muestreo para determinar si cae o no en la región de rechazo.
Sustituyendo los valores
x  0
t
s
n
0
1.711
Dónde cae
el V.E.P?
52
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblacional
Si [Valor estadístico de prueba < valor critico] Rho
Si t > t (n-1, ) RHo
Se toma la decisión de la prueba de hipótesis. Si la estadística cae en la región de no
rechazo, no se puede rechazar la Ho y viceversa. En este caso se rechaza la hipótesis nula.
Conclusión :
A un nivel de significación del ___ ,
___ ___________________ ___, de este
modo se concluye que el promedio de vida útil de las llantas
53
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblacional
a.
Para una muestra de 60 mujeres, tomadas de una población de más de 5000 inscritas en un programa
de reducción de peso en una cadena nacional de balnearios de aguas termales, la presión sanguínea
diastólica media de la muestra es de 101 y la desviación estándar es de 42. A un nivel de significación de
0.02 ¿Puede concluir que, en promedio, las mujeres inscritas en el programa tienen una presión diastólica
que excede el valor de 75 recomendado por diversas sociedades médicas?.
Procedimiento
1. Determinar la variable y los datos
•
Variable : _____________________
•
Datos
 =
1-=
S=
n=
2. Establecer la Hipótesis nula
Ho : 
3. Establecer la Hipótesis alternativa
:
Hi : 
54
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblacional
4.
El tercer paso, es seleccionar un nivel de significación 1 -  =
siendo  =
t(n-1; )=
5.
El siguiente paso es establecer los valores critico que divide la región de rechazo y de no rechazo.
6.
Se selecciona y calcula el Valor estadística de prueba cuando se no conoce la desviación estándar poblacional
comparándolo con los valores críticos de la distribución de muestreo para determinar si cae o no en la
región de rechazo
Sustituyendo los valores
Regiones de rechazo y no rechazo en
una prueba de hipótesis
Dónde cae
el V.E.P?
0
55
Inferencia Estadistica
13.Pruebas De Hipótesis de la media poblacional
Desconocida la Desviación Estandar Poblacional
Si [Valor estadístico de prueba
valor critico] Rho
Si t • t (n-1, ) RHo
Se toma la decisión de la prueba de hipótesis. Si la estadística cae en la región de no
rechazo, no se puede rechazar la Ho y viceversa. En este caso se rechaza la hipótesis nula.
Conclusión :
56
Inferencia Estadistica
14.Formula de Pruebas de Hipótesis de la Media
a utilizar de acuerdo a la Población y Tamaño de la muestra
Población
Tamaño de
Muestra
Con
Distribución
Normal
Grande(n30)
Pequeña(n<30)
 conocida
z
 desconocida
x  0
t

z
n
x  0
t

n
Sin
Distribución
Normal
Grande(n30)
z
x  0

n
Pequeña(n<30)
x  0
S
n
*
o
z
x  0

*
n
x  0
S
n
x  0
t
*
S
n
z
o
x  0

n
Se usaria pruebas no paramétricas
**Se aplica el teorema de límite central
Fuente : kazmier (1996)
57
*
Inferencia Estadistica
BIBLIOGRAFÍA
ANDERSON, David; Sweeney, Dennis y otros. (1.990) Estadistica para
Adiministación y Económia. International Thomson Editores
BERENSON, M. y LEVINE, D. (1996). Estadística básica en administración.
México. Prentice Hall.
ELSTON, ROBERT C. Y JHONSON, WILLIAM. (1987). Principios de bioestadística.
México.Editorial el Manual Moderno, S.A..
DOWNI, N.M. (1973). Métodos estadísticos aplicados .México. Editorial Harla.
KAZMIER , L. (1998). Estadística aplicada a la administración y economía.
México. Mc Graw Hill.
LEVIN,RICHAR. y RUBIN DAVID(1.996). Estadística para administradores.
Prentice Hall editorial .
STEVENSON, WILLIAM. Estadística para administracion y economía. Ediciones
Karla.
58
Inferencia Estadistica
- ANEXOS
ANEXO No.1 TABLA Z de Distribución Normal
ANEXO No.2 TABLA DE t’Student
59