Download significacion-estadistica

Document related concepts
no text concepts found
Transcript
SIGNIFICACIÓN
ESTADISTICA
Y POTENCIA
DE UN
ESTUDIO
APUNTES DE INVESTIGACION
DOCENCIA RAFALAFENA
SIGNIFICACIÓN ESTADÍSTICA
La realización de cualquier estudio clínico-epidemiológico pretende
poner de manifiesto al final del mismo si existe o no asociación entre diferentes
variables. Esta asociación puede ser resultado de que realmente exista la
asociación indicada, pero esta asociación también puede ser producto del azar,
de la presencia de sesgos o de la presencia de variables de confusión.
En estadística, un resultado se denomina estadísticamente
significativo cuando no es probable que haya sido debido al azar. Una
"diferencia estadísticamente significativa" solamente significa que hay
evidencias estadísticas de que hay una diferencia entre las variables
estudiadas. No significa que la diferencia sea grande, importante, o significativa
en el sentido estricto de la palabra, sólo indica que hay diferencias.
Una de las aplicaciones de la estadística es hacer inferencias a
poblaciones, a partir de muestras. En la realización de este proceso, siempre
existe el riesgo de error o imprecisión ya sea por el azar o la variabilidad
biológica del fenómeno a estudiar.
DEFINICION
El nivel de significación de un test es un concepto estadístico asociado a
la verificación de una hipótesis. En pocas palabras, se define como la
probabilidad de tomar la decisión de rechazar la hipótesis nula (H 0) cuando
ésta es verdadera (decisión conocida como Error tipo I, o "falso positivo"). La
decisión se toma a menudo utilizando el valor P (o p-valor): si el valor P es
inferior al nivel de significación, entonces la hipótesis nula es rechazada.
Cuanto menor sea el valor P, más significativo será el resultado.
La Ho (hipótesis nula) representa la afirmación de que no hay asociación
entre las dos variables estudiadas y la H1 (hipótesis alternativa) afirma que hay
algún grado de relación o asociación entre las dos variables.
Realidad (Población)
No existe
Existe diferencia o
diferencia o
asociación
asociación
(H0 falsa)
Diferencia o
asociación
significativa
Resultado de
la prueba
(muestra)
(rechazo H0)
Diferencia o
asociación no
significativa
(H0 cierta)
No error
Error tipo I
(1-β)
Error α
Error tipo II
No error
Error β
(1-α)
(No rechazo H0)
 Ho (hipótesis nula) = No hay diferencia entre ambos tratamientos.
 H1 (hipótesis alternativa) = Sí existe diferencia.
El nivel de significación se estableció siguiendo los comentarios del
estadístico Fisher que señaló "...es conveniente trazar una línea de
demarcación a partir de la cual podamos decir: o bien hay algo en el
tratamiento...".
El valor de "p" que indica que la asociación es estadísticamente
significativa ha sido arbitrariamente seleccionado y por consenso se considera
en 0.05.


Una seguridad del 95% lleva implícito una p < de 0.05.
Una seguridad del 99% lleva implícita una p < 0.01.
Cuando rechazamos la Ho (hipótesis nula) y aceptamos la H1 (hipótesis
alternativa) como probablemente cierta afirmando que hay una asociación, o
que hay diferencia, estamos diciendo en otras palabras que es muy poco
probable que el azar fuese responsable de dicha asociación.
Del mismo modo si la p>0.05 decimos que el azar no puede ser excluido
como explicación de dicho hallazgo y no rechazamos la Ho (hipótesis nula) que
afirma que ambas variables no están asociadas o correlacionadas.
La significación estadística depende de 2 componentes fundamentales:
- Magnitud de la diferencia  Cuanto más grande sea la diferencia entre 2
variables, más fácil es demostrar que la diferencia es significativa.
- Tamaño muestral  A mayor tamaño muestral, más fácil es detectar
diferencias. Lo hace a través de del error estándar: “a mas pacientes
menor error estándar”.
Error de tipo I (α)
El error tipo I, conocido también como erro tipo alfa, se comete cuando el
investigador rechaza la hipótesis nula (H0), siendo ésta verdadera en la
población. Es equivalente a encontrar un resultado falso positivo, ya que el
investigador concluye que hay diferencia, cuando en realidad no existe.
La "p" no es un indicador de fuerza de la asociación ni de su
importancia. La significación estadística es por tanto una condición resultante
del rechazo de una hipótesis nula mediante la aplicación de una prueba
estadística de significación. El nivel de significación es el riesgo o la
probabilidad que voluntariamente asume el investigador de equivocarse al
rechazar la hipótesis nula, cuando en realidad es cierta. Este riesgo se
establece normalmente en 0.05 (95%)ó 0.01 (99%).


Si p < 0.05 se considera significativo, en cuyo caso se rechaza la
hipótesis nula
Si p> 0.05 se considera no significativo en cuyo caso no se rechaza
la hipótesis nula.
Error de tipo II (β)
El error tipo II o beta se comete en la situación contraria: cuando el
investigador NO rechaza la hipótesis nula (H0), siendo ésta FALSA en la
población. Es equivalente a un resultado falso negativo, ya que el investigador
concluye que ha sido incapaz de encontrar una diferencia que existe en la
realidad.
Su complemento, (1-β), conocido como PODER o POTENCIA
ESTADÍSTICA, representa la probabilidad de observar en la muestra una
determinada diferencia o un efecto, si existen en la población.

El error de tipo I, es por lo tanto rechazar la Ho cuando en realidad es
verdadera. Se podría considerar que para evitar este tipo de error
deberíamos de elegir un nivel de confianza más elevado, sin
embargo al aumentar el nivel de confianza aumenta la probabilidad
de cometer el error de tipo II.
Recomendaciones para disminuir el error de tipo I:


Disponer de una teoría que guíe la investigación, evitando el "salir de
pesca" con el ordenador buscando asociaciones entre variables.
Disminuir el número de test estadísticos llevados a cabo en el
estudio.
 Depurar la base de datos para evitar errores de valores
extremos que puedan producir hallazgos significativos.
 Utilizar valores de alfa más reducidos (0.01 ó 0.001).
 Reproducir el estudio. Si al reproducir el estudio se
obtienen resultados similares, estaremos más seguros de
no estar cometiendo el error de tipo I.
Recomendaciones para disminuir el error de tipo II:
 Incrementar el tamaño de la muestra.
 Estimar el poder estadístico (potencia) del estudio.
 Incrementar el tamaño del efecto a detectar.
 Incrementar el valor de alfa.
 Utilizar test paramétricos (más potentes) en lugar de test no
paramétricos.
POTENCIA DE UN ESTUDIO
DEFINICION DE POTENCIA
Los estudios cuyos resultados no son estadísticamente significativos
suelen denominarse “estudios negativo”. Sin embargo, la usencia de
significación no implica necesariamente que no exista en la realidad una
asociación relevante entre el factor de estudio y la respuesta.
La probabilidad de cometer este error se conoce como β, y su complemento 1β corresponde a la potencia estadística, que cuantifica la capacidad de un
estudio para detectar como estadísticamente significativo una determinada
diferencia o asociación que existe en la realidad.
El poder estadístico de un estudio depende de diferentes factores, como:
1. El tamaño del efecto a detectar, es decir, la magnitud mínima de la
diferencia o asociación entre los grupos que se considera clínicamente
relevante  Cuanto mayor sea el tamaño del efecto que se desea
detectar, mayor será la probabilidad de obtener hallazgos significativos
y, por lo tanto, mayor será el poder estadístico.
2. La variabilidad de la respuesta estudiada.
A mayor variabilidad en la respuesta, más difícil será detectar diferencias
entre los grupos que se comparan y menor será el poder estadístico de
la investigación.
De ahí que sea recomendable estudiar grupos lo más homogéneos
posibles.
3. El tamaño de la muestra a estudiar.
A mayor tamaño muestral, mayor será la potencia estadística de un
estudio.
4. El nivel de significación estadística. Si se disminuye el valor de
α también se disminuye el poder de la prueba.
Habitualmente se trabaja con un nivel de significación del 95% ( α = 0,05),
por lo que el equilibrio hay que en encontrarlo finalmente entre el tamaño
de la muestra que es posible estudiar y el poder que se quiere para el
estudio.
Los cuatro factores anteriores, junto con el poder estadístico, forman un
sistema cerrado. De este modo, una vez fijados tres de ellos, el cuarto queda
completamente determinado.
CÁLCULO DE LA POTENCIA
Generalmente, se suele trabajar con un poder en torno al 80% o al 90%.
Con frecuencia, las condiciones en las que se lleva a cabo una investigación
son diferentes de las que se habían previsto en un principio. En consecuencia,
y a la vista de hallazgos no significativos, es recomendable evaluar de nuevo a
posteriori su potencia con el fin de discernir si el estudio carece del poder
necesario para detectar una diferencia relevante o bien si realmente puede no
existir tal diferencia.
Existen fórmulas que calculan el poder estadístico en función de la
naturaleza de la investigación. Con estas fórmulas obtienes un valor, a partir
del cual se determina la potencia recurriendo a unas tablas de la distribución
normal.
Sin embargo, y aunque dichas fórmulas nos permitirían analizar el poder
estadístico en diferentes tipos de diseño, puede resultar más sencillo disponer
de algún software específico con el que poder realizar dichos cálculos.
Tabla 3. Valores de
,
y
más frecuentemente utilizados.
Test unilateral
Test bilateral
0,200
0,150
0,100
0,050
0,025
0,010
0,842
1,036
1,282
1,645
1,960
2,326
1,282
1,440
1,645
1,960
2,240
2,576
0,99
0,95
0,90
0,85
0,80
0,75
0,70
0,65
0,60
0,55
0,50
0,01
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
0,45
0,50
2,326
1,645
1,282
1,036
0,842
0,674
0,524
0,385
0,253
0,126
0,000
Seguridad
α
80 %
85 %
90 %
95 %
97,5 %
99 %
Poder estadístico
99 %
95 %
90 %
85 %
80 %
75 %
70 %
65 %
60 %
55 %
50 %
Tanto si los hallazgos son estadísticamente significativos como si no lo
son, la estimación de intervalos de confianza pueden también facilitar la
interpretación de los resultados en términos de magnitud y relevancia clínica,
proporcionándonos una idea de la precisión con la que se ha efectuado al
estimación, de la magnitud y de la dirección del efecto. De este modo, los
intervalos de confianza nos permiten tener una idea acerca del poder
estadístico de un estudio y, por tanto, de la credibilidad de la ausencia de
hallazgos significativos.