Download IC y valor de P

Document related concepts
no text concepts found
Transcript
IC y valor de P
MSP César Eduardo Luna Gurrola
INTERVALO DE CONFIANZA
•Intervalo de confianza: se describe la variabilidad entre la medida
obtenida en un estudio y la medida real de la población (el valor
real). Corresponde a un rango de valores, cuya distribución es
normal y en el cual se encuentra, con alta probabilidad, el valor
real de una determinada variable.
BIOESTADÍSTICA
MUESTRA
ESTSDÍSTICAMENTE
REPRESENTATIVA
POBLACIÓN
BIOESTADÍSTICA
¿QUE ES MEJOR?
CENSO
VS
MUESTREO
BIOESTADÍSTICA
Es importante conceptualizar:
Muestreo y tamaño de muestra.•Población
•Confiabilidad
•Error máximo aceptado
•Varaibilidad de los datos
BIOESTADÍSTICA
Parámetros poblacionales y Estadísticos Muestrales
Parámetros:
160
Histograma de la Poblacion
Media (m)
140
Frecuencia
120
Datos
(Población de Interés)
Varianza(s2)
100
80
Desv. Est. (s)
60
40
20
0
-4
Etc.
-2
0
Clases
2
4
Inferencias
Muestreo
Histograma de la Muestra
Estadísticos:
16
14
Promedio ( X )
Muestras
Frecuencia
12
10
Varianza muestral(S2)
8
6
Desv. Est. muestral(S)
4
2
0
-4
-2
0
Clases
2
4
Etc.
BIOESTADÍSTICA
¿Qué pasa si no deseamos una estimación puntual como media basada en una
muestra, qué otra cosa podríamos obtener como margen, algún tipo de error?
“Un Intervalo de Confianza”
ESTIMADOR PUNTUAL: Utiliza un número único o valor para localizar una estimación
del parámetro.
ESTIMADOR POR INTERVALO DE CONFIANZA: Denota un rango dentro del cual se
puede encontrar el parámetro y el nivel de confianza que el intervalo contiene al
parámetro.
LIMITES DE CONFIANZA: Son los límites del intervalo de confianza inferior (LIC) y
superior (LSC), se determinan sumando y restando a la media de la muestra un
cierto número Z (dependiendo del nivel o coeficiente de confianza) de errores
estándar de la media .
BIOESTADÍSTICA
P(Z<= - Zexcel ) = alfa/2
P(Z>= + Zexcel ) = alfa/2
Intervalo de confianza donde
se encuentra el parámetro con
un NC =1-a
1
2
1
2
BIOESTADÍSTICA
La inferencia estadística, como ya se mencionó, está relacionada con los métodos para
obtener conclusiones o generalizaciones acerca de una población.
Estas conclusiones sobre la población pueden estar relacionadas ó con la forma de la
distribución de una variable aleatoria, ó con los valores de uno o varios parámetros de la
misma.
Las pruebas de hipótesis a diferencia d elos intervalos no solo
nos indican diferencia sino que además nos idican en realidad
cual es mayor que cual.
BIOESTADÍSTICA
Intervalo de confianza para un promedio:
Esta fórmula es una buena aproximación para el intervalo de confianza de 95% para
con desconocido. Esta aproximación es mejor en la medida que el tamaño muestral sea
grande.
Cuando el tamaño muestral es pequeño, el intervalo de confianza requiere utilizar la
distribución t de Student (con n-1 grados de libertad, siendo n el tamaño de la
muestra), en vez de la distribución normal (por ejemplo, para un intervalo de 95% de
confianza, los límites del intervalo ya no serán construidos usando el valor 1,96).
BIOESTADÍSTICA
Intervalo de Confianza para una Proporción.
Donde p es el porcentaje de personas con la característica de interés en la
población (o sea, es el parámetro de interés) y p es su estimador muestral.
Luego, procediendo en forma análoga al caso de la media, podemos construir
un intervalo de 95% de confianza para la proporción poblacional p.
BIOESTADÍSTICA
PASOS DE LA PRUEBA DE HIPÓTESIS
Expresar la hipótesis nula
Expresar la hipótesis alternativa
Especificar el nivel de significancía
Determinar el tamaño de la muestra
Establecer los valores críticos que establecen las regiones de rechazo de las de no
rechazo.
• Determinar la prueba estadística.
• Coleccionar los datos y calcular el valor de la muestra de la prueba estadística
apropiada.
•Determinar si la prueba estadística ha sido en la zona de rechazo a una de no
rechazo.
•Determinar la decisión estadística.
•Expresar la decisión estadística en términos del problema.
•
•
•
•
•
BIOESTADÍSTICA
Hipótesis Nula.En muchos casos formulamos una hipótesis estadística con el único propósito de
rechazarla o invalidarla. Así, si queremos decidir si una moneda está trucada,
formulamos la hipótesis de que la moneda es buena (o sea p = 0,5, donde p es la
probabilidad de cara).
Es aquella que se opone a tu hipótesis
BIOESTADÍSTICA
Hipótesis Alternativa.
Toda hipótesis que difiere de una dada se llamará una hipótesis alternativa
Es aquella que concuerda con tu hipótesis
BIOESTADÍSTICA
Niveles de Significación
Al contrastar una cierta hipótesis, la máxima probabilidad con la que estamos
dispuesto a correr el riesgo de cometerán error de tipo I, se llama nivel de
significación.
En la práctica, es frecuente un nivel de significación de 0,05 ó 0,01, si bien se une
otros valores. Si por ejemplo se escoge el nivel de significación 0,05 (ó 5%) al
diseñar una regla de decisión, entonces hay unas cinco (05) oportunidades entre
100 de rechazar la hipótesis cuando debiera haberse aceptado; Es decir, tenemos
un 95% de confianza de que hemos adoptado la decisión correcta.
En tal caso decimos que la hipótesis ha sido rechazada al nivel de significación 0,05,
lo cual quiere decir que tal hipótesis tiene una probabilidad 0,05 de ser falsa.
BIOESTADÍSTICA
Pruebas de hipótesis
Al final se obtiene el valor de “P” que es la probabilidad de
obtener, cuando H0 es verdadera, un valor de prueba tan
extremo o más que el valor calculado.
Si el valor de “P” es menor o igual a la a, es posible rechazar
la H0, si es mayor que la a, no es posible rechazar H0
BIOESTADÍSTICA
Pruebas de hipótesis
ReglaHempírica
a : m > m0
f(z)
Ha : m < m0
-4
-3
-2
-1
0
z
Ha : m  m0
1
2
3
4
BIOESTADÍSTICA
Pruebas de hipótesis
• Para una media.
• Para dos medias.
- Correlacionadas
- No correlacionadas
• Para dos proporciones.
BIOESTADÍSTICA
Pruebas de hipótesis
Ji2.V. Independiente
SI
NO
V. Dependiente
SI
NO
La prueba ji-cuadrada sirve para
encontrar el grado de confianza
con que se puede afirmar que un
conjunto de datos sigue un
comportamiento semejante al que
se propone como representativo.
Este comportamiento propuesto
frecuentemente se representa por
la ecuación que describe la
distribución que, se presume,
tienen los datos.
BIOESTADÍSTICA
Correlación y regresión lineales
El coeficiente de correlación lineal mide el grado de intensidad de esta posible
relación entre las variables.
Este coeficiente se aplica cuando la relación que puede existir entre las varables es
lineal (es decir, si representaramos en un gáfico los pares de valores de las dos
variables la nube de puntos se aproximaría a una recta).
BIOESTADÍSTICA
Correlación y regresión lineales
El coeficiente de correlación lineal se calcula aplicando la siguiente fórmula:
BIOESTADÍSTICA
Correlación y regresión lineales
Si "r" > 0, la correlación lineal es positiva (si sube el valor de una variable sube el
de la otra). La correlación es tanto más fuerte cuanto más se aproxime a 1.
Por ejemplo: altura y peso: los alumnos más altos suelen pesar más.
Si "r" < 0, la correlación lineal es negativa (si sube el valor de una variable
disminuye el de la otra). La correlación negativa es tanto más fuerte cuanto más se
aproxime a -1.
Si "r" = 0, no existe correlación lineal entre las variables. Aunque podría existir
otro tipo de correlación (parabólica, exponencial, etc.)
BIOESTADÍSTICA
Correlación y regresión lineales
Regresión lineal
Si representamos en un gráfico los pares de valores de una distribución
bidimensional: la variable "x" en el eje horizontal o eje de abcisa, y la variable "y"
en el eje vertical, o eje de ordenada. Vemos que la nube de puntos sigue una
tendencia lineal:
BIOESTADÍSTICA
Correlación y regresión lineales
El coeficiente de correlación lineal nos permite determinar si, efectivamente,
existe relación entre las dos variables. Una vez que se concluye que sí existe
relación, la regresión nos permite definir la recta que mejor se ajusta a esta nube
de puntos
y=a+b·x
a = ym - ( b · x m )
El papel del Bioestadístico no comienza frente de una base de datos ni
termina al entregar una serie de gráficos y tablas…. ya que:
La medicina es la ciencia de entender las probabilidades y el arte de
manejar la incertidumbre.
GRACIAS
MSP César Eduardo Luna Gurrola
Correo.- cesar@lunagurrola.com
Móvil & SMS.- 044(81) 1077-5290