Download Pruebas diagnósticas y decisiones médicas

Document related concepts
no text concepts found
Transcript
Pruebas diagnósticas
y decisiones médicas
C. Diana Nicoll, MD, PhD, MPA
Michael Pignone, MD, MPH
Chuanyi Mark Lu, MD
43
La principal tarea del médico es tomar decisiones razonadas en relación con la atención del paciente,
tanto si la información es incompleta como si los resultados clínicos suscitan cierta incertidumbre.
Aunque los datos obtenidos del interrogatorio y la exploración física son a menudo suficientes para
establecer un diagnóstico o definir el tratamiento, tal vez se requiera más información. En tales
situaciones, el clínico recurre con frecuencia a las pruebas diagnósticas.
RENTABILIDAD Y RIESGOS
Cuando se utilizan en forma apropiada, las pruebas diagnósticas pueden ser de gran ayuda para el
médico y también útiles para el procedimiento de detección, por ejemplo, para identificar factores
de riesgo y descubrir alguna enfermedad oculta en personas asintomáticas. El reconocimiento de los
factores de riesgo posibilita una intervención temprana que previene la aparición de un trastorno;
asimismo, la detección oportuna de una enfermedad oculta puede disminuir la morbilidad y mortalidad
del padecimiento por la instauración oportuna del tratamiento. Las pruebas de detección recomendadas
para la atención preventiva en adultos asintomáticos de bajo riesgo incluyen medición de la presión
arterial y lípidos séricos. También está indicado solicitarlas para los cánceres mamario, cervicouterino
y colónico, no así para las malformaciones prostáticas y pulmonares en las que aún es controversial
(cap. 1). Los estudios de detección ideales deben satisfacer los criterios enumerados en el cuadro
43-1.
Las pruebas también pueden ser útiles con fines diagnósticos, es decir, para establecer o descartar
la presencia de una afección en personas sintomáticas. Algunas pruebas favorecen el diagnóstico
temprano después del inicio de los signos y síntomas, otras permiten delinear el diagnóstico
diferencial, y otras más contribuyen a definir la etapa o actividad del trastorno.
Cuadro 43-1. Criterios para utilizar los procedimientos de detección.
Características de la población
1. Prevalencia de la enfermedad suficientemente elevada.
2. Probabilidad de cumplir las pruebas y tratamientos subsiguientes.
Características de la enfermedad
1. Morbilidad y mortalidad significativas.
2. Tratamiento disponible efectivo y aceptable.
3. Periodo preclínico detectable.
4. Mejor resultado con el tratamiento temprano.
Características de la prueba
1. Sensibilidad y especificidad adecuadas.
2. Costo y riesgo bajos.
3. Prueba confirmatoria disponible y práctica.
McPhee-OLC43_3R.indd 1
22/4/10 19:19:07
Las pruebas tienen utilidad para la atención del paciente, ya que ayudan a: 1) valorar la gravedad
del padecimiento; 2) precisar el pronóstico; 3) vigilar la evolución de la enfermedad (progresión,
estabilidad o resolución); 4) detectar la recurrencia de la anomalía, y 5) seleccionar fármacos y
adecuar el tratamiento.
Al solicitar los estudios, el clínico debe comparar los beneficios potenciales respecto de los costos
potenciales y los efectos adversos. Algunos de estos procedimientos conllevan riesgo de morbilidad o
mortalidad, como la angiografía cerebral, que ocasiona apoplejía en 0.5% de los casos. Las molestias
vinculadas con las pruebas, como la colonoscopia, disuaden a algunos pacientes de completar el
estudio diagnóstico. Es posible que el resultado de una prueba diagnóstica obligue a solicitar estudios
adicionales o seguimientos frecuentes; por ejemplo, un sujeto con resultado positivo en la prueba de
sangre oculta en heces debe enfrentar el costo significativo, la molestia y el riesgo de la colonoscopia
de seguimiento.
Además, el resultado falso positivo en una prueba puede propiciar un diagnóstico incorrecto o pruebas
adicionales innecesarias. Considerar a un individuo sano como enfermo a partir de una prueba
diagnóstica con resultado falso positivo puede ocasionar estrés psicológico y exposición a riesgos
innecesarios o tratamientos inapropiados. Una prueba diagnóstica o de detección puede revelar
un trastorno que no se hubiera identificado de otra manera y no habría ocasionado molestias a la
persona. Un ejemplo es el descubrimiento de un cáncer prostático de grado bajo en etapa temprana
mediante antígeno prostático específico en un varón de 84 años con insuficiencia cardiaca congestiva
grave diagnosticada; en este caso, lo más probable es que el individuo no muestre síntomas ni
requiera tratamiento para el tumor en lo que le resta de vida.
Asimismo, es importante conocer y tomar en consideración los costos de las pruebas diagnósticas.
Algunas veces éstos son muy elevados o poco rentables. Incluso los estudios relativamente baratos
pueden ser poco rentables cuando suministran escasos beneficios clínicos.
Dos factores repercuten de manera negativa sobre la rentabilidad de los estudios diagnósticos: 1)
las pruebas paralelas o perfiles (p. ej., solicitar cierto número de análisis en el mismo momento para
reconocer rápidamente alguna anormalidad en cualquier estudio para establecer el diagnóstico), y 2)
pruebas excesivas (esto es, utilizar varias pruebas para vigilar la misma respuesta, como la progresión
de una enfermedad o la respuesta al tratamiento, solicitar estudios con más frecuencia de la necesaria
o indicar estudios sólo para documentar en el expediente). La pregunta pertinente al solicitar un
análisis es: “¿El análisis repercutirá en el tratamiento del paciente?” Si la respuesta es negativa, no se
justifica el análisis. Los análisis innecesarios generan trabajo, costos adicionales de trabajo, reactivos y
equipo, y provocan un gasto sanitario mayor.
La disponibilidad de pruebas genéticas y moleculares es cada vez mayor. La prueba genética
diagnóstica basada en síntomas (p. ej., la prueba para el cromosoma X frágil en un niño con retraso
mental) difiere de otras pruebas genéticas predictivas (p. ej., valoración de una persona sana con
antecedente familiar de enfermedad de Huntington) y de pruebas genéticas de predisposición, las
cuales indican la sensibilidad relativa a ciertos trastornos (p. ej., prueba de BRCA-1 para el cáncer
mamario). Los estudios farmacogenéticos (p. ej., valoración de la sensibilidad de la warfarina) han
evolucionado con rapidez. Las pruebas de portador (p. ej., fibrosis quística) y los estudios fetales
prenatales (p. ej., identificación del síndrome de Down) son otras de las aplicaciones de los estudios
genéticos. Todos estos protocolos requieren asesoramiento extenso de los pacientes para que
comprendan las consecuencias clínicas, sociales, éticas y, en ocasiones, legales de los resultados.
Los médicos solicitan e interpretan numerosos análisis todos los días y la complejidad de estas
pruebas no ha dejado de aumentar. La creciente variedad de análisis ha creado una serie de retos
para los médicos, por ejemplo, seleccionar el análisis correcto e interpretarlo con propiedad. Muchas
veces los médicos se equivocan al seleccionar o interpretar el estudio, pero esto es difícil de detectar.
Sin embargo, el uso de algunos algoritmos diagnósticos que guían la selección de los estudios en
determinadas enfermedades y permiten que un experto interprete el resultado (p. ej., interpretaciones
y notificación de los resultados por parte del patólogo clínico) ayuda a reducir estos errores y mejorar
la seguridad y precisión del diagnóstico.
Bailey DB et al. Ethical, legal, and social concerns about expanded newborn screening: Fragile X
syndrome as a prototype for emerging issues. Pediatrics. 2008 Mar; 121(3):e693–704.
[PMID: 18310190]
Ezzie ME et al. Laboratory testing in the intensive care unit. Crit Care Clin. 2007 Jul;23(3):435–65.
[PMID: 17900480]
McPhee-OLC43_3R.indd 2
22/4/10 19:19:08
Laposata M et al. “Pre-pre” and “Post-post” analytical error: high-incidence patient safety hazard
involving the clinical laboratory. Clin Chem Lab Med. 2007;45(6):712–19. [PMID: 17579522]
Plebani M et al. Errors in laboratory medicine and patient safety: the road ahead. Clin Chem Lab Med.
2007;45(6):700–7. [PMID: 17579520]
U.S. Preventive Services Task Force. Screening for prostate cancer: U.S. Preventive Services Task Force
recommendation statement. Ann Intern Med. 2008 Aug;149(3):185–91. [PMID: 18678845]
Van Den Bruel A et al. The evaluation of diagnostic tests: evidence on technical and diagnostic
accuracy, impact on patient outcome and cost-effectiveness is needed. J Clin Epidemiol. 2007
Nov;60(11):1116–22. [PMID: 17938052]
PRUEBAS DIAGNÓSTICAS
PREPARACIÓN DE LA PRUEBA
Los factores que afectan al paciente y la muestra son importantes. El elemento determinante en una
prueba de laboratorio bien realizada es la obtención de una muestra apropiada.
Preparación del paciente
La preparación del individuo es esencial para ciertas pruebas; por ejemplo, es necesario el estado de
ayuno para obtener mediciones óptimas de glucosa y triglicéridos; la postura y la ingestión de sodio
deben controlarse en forma estricta cuando se cuantifican las concentraciones de renina y aldosterona;
y debe evitarse el ejercicio vigoroso antes de la obtención de muestras para cuantificar cinasa de
creatina, ya que la actividad muscular intensa puede inducir resultados anormales falsos.
Recolección de la muestra
Es importante conceder especial atención a la identificación del paciente y rotulación de la muestra
(p. ej., deben utilizarse dos rótulos: nombre y fecha de nacimiento del individuo o nombre y clave
única de la institución). Algunas veces es importante conocer el momento en que se tomó la muestra.
Por ejemplo, para interpretar de manera correcta las cifras de aminoglucósidos es preciso saber si
la muestra se tomó justo antes (concentración “farmacológica mínima”) o después (concentración
“farmacológica máxima”) de administrar el medicamento. Las concentraciones farmacológicas no
pueden interpretarse si la muestra se obtiene durante la fase de distribución del compuesto (p. ej.,
los niveles de digoxina cuantificados en las 6 h siguientes a una dosis oral). La interpretación de
sustancias que tienen variación circadiana (p. ej., cortisol) sólo puede efectuarse en el contexto de la
hora del día en que se recogió la muestra.
Deben recordarse asimismo otros principios durante la recolección de muestras. Éstas no deben
obtenerse por arriba del catéter, puesto que se contaminan con líquidos intravenosos y fármacos (p.
ej., heparina). La permanencia de un torniquete por un tiempo excesivo produce hemoconcentración e
incrementa la concentración de sustancias unidas a proteínas, como el calcio. La lisis celular durante la
recolección de una muestra sanguínea produce valores séricos altos falsos de sustancias concentradas
en las células (p. ej., deshidrogenasa láctica y potasio). Algunas muestras necesitan una manipulación
o almacenamiento especiales (p. ej., muestras para gases arteriales y crioglobulina sérica). El retraso
en la entrega de muestras al laboratorio da lugar a que el metabolismo celular prosiga, lo que produce
resultados falsos en algunos estudios (p. ej., glucosa sérica baja).
Lippi G et al. Haemolysis: an overview of the leading cause of unsuitable specimens in clinical
laboratories. Clin Chem Lab Med. 2008;46(6):764–72. [PMID: 18601596]
Wagar EA et al. Specimen labeling errors: a Q-probes analysis of 147 clinical laboratories. Arch Pathol
Lab Med. 2008;132(10):1617–22. [PMID: 18834220]
CARACTERÍSTICAS DE LAS PRUEBAS
En el cuadro 43-2 se presentan las características generales de las pruebas diagnósticas útiles. La
mayor parte de los principios detallados a continuación se aplica no sólo a las pruebas de laboratorio
McPhee-OLC43_3R.indd 3
22/4/10 19:19:08
Cuadro 43-2. Propiedades de las pruebas diagnósticas útiles.
1. La metodología de la prueba se ha descrito de manera detallada, por lo que puede reproducirse
en forma exacta y confiable.
2. Se han confirmado la exactitud y la precisión de la prueba.
3. El intervalo de referencia está bien establecido.
4. La sensibilidad y especificidad se determinaron de forma confiable mediante la comparación con
un método de referencia. La valoración se realizó en diversos pacientes, incluidos los que padecen
trastornos diferentes, pero que a menudo se confunden, y otros con espectro patológico de leve a
grave, con y sin tratamiento. El proceso de selección de los individuos está bien descrito, de modo
que los resultados no se generalizan en forma inapropiada.
5. Está confirmada la contribución independiente del desempeño general de un panel de pruebas, si
la prueba se propone como parte de un panel de pruebas.
y radiográficas, sino también a elementos del interrogatorio y la exploración física. Para el médico es
muy útil conocer estas características al solicitar e interpretar los estudios.
Exactitud
La exactitud de un análisis es su correlación con el valor verdadero. Una prueba inexacta es aquella
en la que el resultado difiere del valor verdadero, aunque los resultados sean reproducibles (fig.
43-1A), el también llamado error sistémico (o sesgo). Por ejemplo, la creatinina sérica se mide por lo
general mediante el método cinético de Jaffe, que tiene un error sistémico hasta de 0.23 mg/100 ml,
en comparación con la espectrometría de masa con dilución de isótopos y cromatografía de gas. En el
laboratorio, la precisión de los análisis se incrementa tras calibrar el equipo con material de referencia
y participar en programas externos de control de calidad.
Precisión
La precisión es una medida de la reproducibilidad de una prueba cuando se repite en la misma
muestra. Si ésta se analiza varias veces, se obtienen con toda seguridad variaciones en los resultados
(error aleatorio); estas variaciones se expresan como coeficientes de variación (CV: desviación
estándar dividida entre la media, que a menudo se expresa como porcentaje). Por ejemplo, cuando
el laboratorio informa un CV de 5% para la creatinina sérica y acepta resultados dentro de ± 2
desviaciones estándar significa que, para una muestra con una creatinina sérica de 1.0 mg/100 ml, el
laboratorio informa el resultado de 0.90 a 1.10 mg/100 ml al medir en diversas ocasiones la misma
muestra.
Una prueba poco precisa es aquella que genera resultados muy variables (fig. 43-1B). La precisión
de los estudios diagnósticos, que se vigila en los laboratorios clínicos con material testigo, debe ser
suficiente para distinguir cambios notorios desde el punto de vista clínico en el estado del paciente a
partir de las variaciones analíticas (falta de precisión) de la prueba. Por ejemplo, la cuenta diferencial
A
B
C
Fig. 43-1. Relación entre la exactitud y la precisión de las pruebas diagnósticas. El centro del blanco
representa el valor verdadero de la sustancia de prueba. A: prueba diagnóstica precisa, pero inexacta;
con la medición repetida, la prueba produce resultados muy similares, pero todos están lejos del valor
real. B: prueba imprecisa e inexacta; la medición repetida suministra resultados muy diferentes y
éstos están lejos del valor real. C: una prueba ideal es precisa y exacta.
McPhee-OLC43_3R.indd 4
22/4/10 19:19:08
Número de
individuos valorados
Fig. 43-2. El intervalo de referencia suele definirse como
el delimitado por dos desviaciones estándar del resultado
promedio de la prueba (se muestra como –2 y 2) en una
pequeña población de voluntarios sanos. Obsérvese que
en este ejemplo los resultados de la prueba tienen una
distribución normal, pero muchas sustancias biológicas
poseen distribuciones sesgadas.
Promedio
Anormal
(2.5%)
Normal
Anormal
(95%)
(2.5%)
Resultados de la prueba
(porcentaje de población)
manual de leucocitos periféricos no es lo suficientemente precisa para identificar cambios relevantes
en la distribución de los tipos celulares, puesto que se calcula por medio de la valoración subjetiva
de una pequeña muestra (100 células). Las mediciones repetidas en la misma muestra por parte de
distintos técnicos arrojan resultados muy diferentes. Los recuentos diferenciales automáticos son más
precisos porque se obtienen con aparatos que utilizan características físicas objetivas para clasificar
una muestra mucho mayor (10 000 células).
Intervalo de referencia
Los resultados de algunas pruebas diagnósticas se formulan como positivos o negativos, pero
otros se presentan de manera cuantitativa. El uso de intervalos de referencia es una técnica para
interpretar estos últimos resultados. Los intervalos de referencia son específicos para cada método
y laboratorio. En la práctica, muchas veces representan los resultados de la prueba encontrados
en 95% de una pequeña población que se presupone sana; por consiguiente, 5% de los pacientes
sanos tiene resultados anormales en la prueba (fig. 43-2). Los resultados ligeramente anormales
deben interpretarse en forma crítica, ya que pueden ser anormales verdaderos o falsos. En términos
estadísticos, la probabilidad de que una persona sana tenga dos resultados distintos de una prueba
dentro del intervalo de referencia es de 0.95 × 0.95 = 0.9025 o 90.25%; para cinco pruebas es de
77.4%; para 10 pruebas de 59.9% y para 20 pruebas de 35.8%. Cuanto mayor sea el número de
estudios solicitados, mayor será la probabilidad de que uno o más de los resultados se encuentren
por fuera del intervalo de referencia (cuadro 43-3). Por el contrario, es factible que valores dentro del
intervalo de referencia no descarten la presencia real de una enfermedad, ya que dicho intervalo no
establece la distribución de resultados en pacientes con la afección. Por esa razón, los intervalos de
referencia deben usarse dentro del contexto del conocimiento médico sobre el trastorno en duda.
Es importante considerar también si los intervalos de referencia publicados son apropiados para el
individuo en estudio, dado que algunos intervalos dependen de la edad, sexo, peso, dieta, hora del
día, nivel de actividad, postura, e incluso la época del año. La variabilidad biológica se presenta
tanto entre individuos como en el mismo sujeto. Por ejemplo, el nivel de estrógeno sérico en las
mujeres puede variar de manera cotidiana, de acuerdo con el ciclo menstrual. el cortisol sérico
muestra variación diurna (en la mañana es mayor y decrece en el transcurso del día), y la vitamina D
experimenta una variación estacional con valores menores en invierno.
El cuadro 2 del Apéndice detalla los intervalos de referencia para las pruebas comunes de química
sanguínea y hematológicas. Más adelante se describen las características de desempeño de la prueba,
como sensibilidad y especificidad, que son necesarias para interpretar los resultados.
Cuadro 43-3. Relación entre el número de pruebas y la probabilidad de que una persona
sana tenga uno o más resultados anormales.
McPhee-OLC43_3R.indd 5
Número de pruebas
Probabilidad de que uno o más resultados
sean anormales
1
5%
6
26%
12
46%
20
64%
22/4/10 19:19:09
Factores de interferencia
Los resultados de las pruebas diagnósticas pueden alterarse por factores externos (como ingestión
de fármacos) e internos (como estados fisiológicos anormales). Estos factores contribuyen a las
variaciones biológicas y deben tomarse en consideración al interpretar los resultados.
Las interferencias externas influyen en los resultados de las pruebas in vivo o in vitro. In vivo, el
alcohol incrementa la concentración de transpeptidasa de glutamilo γ, y los diuréticos modifican las
concentraciones de sodio y potasio. El tabaquismo induce enzimas hepáticas, lo que reduce los niveles
de sustancias como la teofilina, que se metabolizan en el hígado. In vitro, las cefalosporinas pueden
suscitar niveles falsos de creatinina sérica por la interferencia con el método de análisis habitual de los
laboratorios.
Las interferencias internas derivan de estados fisiológicos anormales que influyen en la medición. Por
ejemplo, en sujetos con lipemia notable puede obtenerse un resultado bajo falso de sodio sérico, si la
metodología de la prueba incluye un paso en que se diluya el suero antes de medir el sodio. En virtud
de la posibilidad de interferencia con la prueba, los médicos deben ser cautos ante los resultados
inesperados e investigar razones distintas a la enfermedad que expliquen los resultados anormales,
incluidos los errores del laboratorio.
Smellie WS. What is a significant difference between sequential laboratory results? J Clin Pathol. 2008
Apr;61(4):419–25. [PMID: 17938161]
Srivastava T et al. Essentials of laboratory medicine for the nephrology clinician. Pediatr Nephrol. 2007
Feb;22(2):170–82. [PMID: 16947032]
Sensibilidad y especificidad
Los clínicos deben usar mediciones del desempeño de las pruebas (como su sensibilidad y
especificidad), con el propósito de juzgar la calidad de un método diagnóstico para una enfermedad
específica.
La sensibilidad de una prueba es su capacidad para detectar la enfermedad y se expresa como el
porcentaje de pacientes con la afección en que la prueba es positiva. En consecuencia, una prueba con
90% de sensibilidad proporciona resultados positivos en el mismo porcentaje de pacientes enfermos
y resultados negativos en 10% de los sujetos con la enfermedad (falsos negativos). Por lo general,
una prueba con alta sensibilidad ayuda a descartar un diagnóstico, dado que arroja pocos resultados
negativos falsos. Por ejemplo, para descartar infección por el virus que causa el sida, un médico podría
elegir un estudio muy sensible, como el de anticuerpo contra el virus de inmunodeficiencia humana
(VIH).
La especificidad de una prueba es su capacidad para detectar ausencia de enfermedad, y se expresa
como el porcentaje de pacientes sin la enfermedad en que la prueba es negativa. Por consiguiente,
una prueba con 90% de especificidad suministra resultados negativos en el mismo porcentaje de
sujetos sin enfermedad y resultados positivos en 10% de individuos no enfermos (falsos positivos).
Una prueba con alta especificidad contribuye a confirmar el diagnóstico, ya que tiene pocos resultados
positivos falsos. Por ejemplo, para establecer el diagnóstico de artritis gotosa, un médico puede elegir
una prueba muy específica, como la presencia de cristales en forma de aguja con birrefringencia
negativa dentro de los leucocitos en el estudio microscópico del líquido sinovial.
Para determinar la sensibilidad y especificidad de una prueba para una enfermedad particular, la
técnica debe compararse con una “prueba de referencia” que defina el estado real de afectación del
individuo. Por ejemplo, la sensibilidad y especificidad de la prueba de detección rápida de antígenos
para diagnosticar faringitis por el estreptococo hemolítico β del grupo A se obtienen mediante la
comparación de sus resultados con los de la prueba de elección para este trastorno, que es el cultivo
de exudado faríngeo. La aplicación de la prueba de elección a los pacientes con prueba positiva para
la demostración rápida de antígenos establece la especificidad. Cuando no se aplica la prueba de
elección después de la detección rápida negativa, puede haber sobreestimación de la sensibilidad, ya
que no se identifican los falsos negativos. Sin embargo, en muchas enfermedades (p. ej., pancreatitis)
no hay prueba de elección o su aplicación es muy difícil o costosa; en tales casos es difícil obtener
estimados de confianza a partir de la prueba de sensibilidad y especificidad.
La población de la cual derivan los valores también puede afectar la sensibilidad y especificidad; en
consecuencia, muchos procedimientos diagnósticos se valoran primero en personas con la forma grave
de la enfermedad y en grupos testigo jóvenes y sanos. En comparación con la población general,
McPhee-OLC43_3R.indd 6
22/4/10 19:19:09
Número de
individuos valorados
Sin
enfermedad
Enfermedad
A
B C
Resultados de la prueba
Fig. 43-3. Distribución hipotética de resultados en pruebas para individuos sanos y enfermos. La
posición del “punto límite” entre los resultados “normal” y “anormal” (o “negativo” y “positivo”)
determina la sensibilidad y especificidad de la prueba. Si A es el punto límite, la prueba tendría
sensibilidad de 100%, pero especificidad baja. Si el punto límite es C, la prueba tendría una
especificidad de 100%, pero sensibilidad baja. En muchas pruebas, el punto límite se determina por
el intervalo de referencia, es decir, el intervalo de resultados que esté a menos de dos desviaciones
estándar del resultado promedio para individuos sanos (punto B). En algunas situaciones, el límite se
altera para incrementar la sensibilidad o especificidad.
este grupo de estudio presenta más resultados positivos verdaderos (porque los individuos sufren
enfermedad más avanzada) y más resultados negativos reales (porque el grupo testigo es sano); por
lo tanto, la sensibilidad y especificidad de la prueba son más altas de lo que se espera en la población
general, dado que en ésta hay un espectro más amplio de salud y enfermedad. Los médicos deben
estar conscientes de este sesgo de espectro al extrapolar los resultados publicados de las pruebas
a su práctica particular. Otros sesgos, entre ellos la composición del espectro, el reclutamiento de
población y el estándar de referencia inexistente o inadecuado, así como el sesgo de verificación, se
explican en las referencias.
Es importante recordar que la sensibilidad y especificidad informadas de la prueba dependen del
nivel de análisis (umbral) utilizado para distinguir un resultado normal de otro anormal. Si se reduce
el umbral, la sensibilidad aumenta a expensas de una menor especificidad; si se incrementa, la
sensibilidad disminuye al tiempo que aumenta la especificidad (fig. 43-3).
La figura 43-4 muestra la forma en que pueden calcularse la sensibilidad y la especificidad con los
resultados de la prueba en pacientes clasificados en forma previa como enfermos o no enfermos, con
base en la prueba de referencia.
Puede compararse el desempeño de dos pruebas diferentes mediante la diagramación de las curvas
de eficacia diagnóstica (ROC) en diversos valores límite de los intervalos de referencia. Las curvas
resultantes, que se obtienen al diagramar la sensibilidad (1-especificidad) para cada prueba, muestran
a menudo cuál es la mejor técnica; la curva ROC de la prueba superior queda siempre arriba y a la
izquierda de la curva de una prueba inferior. En general, la mejor técnica tiene un área mayor bajo
la curva ROC. Por ejemplo, la ilustración de la figura 43-5 muestra las curvas ROC para el antígeno
prostático específico (PSA) y la fosfatasa ácida prostática (PAP) en el diagnóstico del cáncer prostático.
La prueba de PSA es superior porque tiene mayor sensibilidad y especificidad para todos los valores
límite.
Es importante señalar que, para un análisis determinado, la curva ROC también hace posible identificar
el umbral que reduce al mínimo los resultados falsos positivos y falsos negativos y que se ubica
en el punto más cercano al área superior izquierda de la curva. Sin embargo, este umbral clínico
óptimo depende de la anomalía a identificar y la importancia relativa de los resultados falsos positivos
respecto de los falsos negativos.
Akobeng AK. Understanding diagnostic tests 3: Receiver operating characteristic curves. Acta Paediatr.
2007 May;96(5):644–7. [PMID: 17376185]
Christenson RH et al. Committee on Evidence Based Laboratory Medicine of the International
Federation for Clinical Chemistry Laboratory Medicine. Evidence-based laboratory medicine - a guide for
critical evaluation of in vitro laboratory testing. Ann Clin Biochem. 2007 Mar:44(Pt 2):111–30. [PMID:
17362577]
Hicks DG et al. HER2+ breast cancer: review of biologic relevance and optimal use of diagnostic tools.
Am J Clin Pathol. 2008 Feb; 129(2):263–73. [PMID: 18208807]
McPhee-OLC43_3R.indd 7
22/4/10 19:19:09
Prueba
Enfermedad
Presente
Ausente
Positiva
TP
FP
Negativa
FN
TN
Sensibilidad =
Especificidad =
TP = (Sensibilidad)(Probabilidad anterior a la prueba)
FP = (1 – Especificidad)(1 – Probabilidad anterior a la prueba)
FN = (1 – Sensibilidad)(Probabilidad anterior a la prueba)
TN = (Especificidad)(1 – Probabilidad anterior a la prueba)
Número de pacientes enfermos con prueba positiva
TP
=
Número de pacientes enfermos
TP + FN
Número de pacientes no enfermos con prueba negativa
Número de pacientes no enfermos
Probabilidad posterior
a la prueba después = Probabilidad de enfermedad si la prueba es positiva =
de prueba positiva
=
TN
TN + FP
TP
TP + FP
(Sensibilidad)(Probabilidad anterior a la prueba)
=
(Sensibilidad)(Probabilidad anterior a la prueba) +
(1 – Especificidad)(1 – Probabilidad anterior a la prueba)
Fig. 43-4. Cálculo de sensibilidad, especificidad y probabilidad de enfermedad después de una prueba
positiva (probabilidad posterior a la prueba). TP, positivo verdadero; FP, positivo falso; FN, negativo
falso; TN, negativo verdadero.
1
.9
.8
1
2
4
0.2
6
Sensibilidad
.7
.6
10
0.3
.5
0.4
.4
20
.3
0.6
0.8
1.2
.2
PSA μg/L
PAP U/L
.1
0
.1
.2
.3
.4
.5
.6
.7
.8
1 – Especificidad
Fig. 43-5. Curvas de eficacia diagnóstica (ROC) para el antígeno prostático específico (PSA) y la
fosfatasa ácida prostática (PAP) en el diagnóstico de cáncer prostático. Para todos los valores límite,
el PSA tiene mayor sensibilidad y especificidad; por lo tanto, es una mejor prueba con base en estas
características de eficacia. (Modificada y reproducida con autorización de Nicoll D et al. Routine acid
phosphatase testing for screening and monitoring prostate cancer no longer justified. Clin Chem. 1993
Dec;39(12):2540-1.)
McPhee-OLC43_3R.indd 8
22/4/10 19:19:09
USO DE LAS PRUEBAS EN EL DIAGNÓSTICO
Y EL TRATAMIENTO
El valor de un estudio en determinada situación clínica depende no sólo de sus características
(p. ej., sensibilidad y especificidad), sino también de la probabilidad de que el paciente padezca la
afección antes de conocer el resultado (probabilidad anterior a la prueba). Los resultados de una
prueba útil modifican en forma sustancial la probabilidad de que el individuo padezca la anomalía
(probabilidad posterior a la prueba). La figura 43-4 muestra la forma en que puede calcularse
la probabilidad posterior a la prueba a partir de la sensibilidad y especificidad conocidas y de la
probabilidad calculada del trastorno anterior a la prueba (o prevalencia de la enfermedad).
La probabilidad anterior a la prueba, o prevalencia de una enfermedad, repercute en grado notable
en la probabilidad de que exista tal trastorno después de la prueba. Como se demuestra en el
cuadro 43-4, cuando se emplea una prueba con sensibilidad y especificidad de 90%, la probabilidad
posterior a la prueba puede variar de 8 a 99%, de acuerdo con la probabilidad de enfermedad
anterior a la prueba. Además, conforme decrece la probabilidad anterior a la prueba, más probable
es que un resultado positivo sea falso.
A manera de ejemplo, un médico desea calcular la probabilidad posterior a la prueba de cáncer
prostático mediante el procedimiento de PSA y un valor límite de 4 μg/L. A partir de los datos
mostrados en la figura 43-5, la sensibilidad es de 90% y la especificidad de 60%. El médico
determina la probabilidad anterior a la prueba de una enfermedad particular respecto de toda la
evidencia y luego calcula la probabilidad posterior a la prueba mediante el procedimiento que se
muestra en la figura 43-4. La probabilidad anterior a la prueba de que un varón de 50 años de
edad, por lo demás sano, tenga cáncer prostático, es igual a la prevalencia del cáncer prostático
en ese grupo de edad (probabilidad = 10%), y la probabilidad posterior a la prueba después de
ésta (cuando el resultado es positivo) es sólo de 20%; esto significa que, aunque la prueba sea
positiva, todavía hay una probabilidad de 80% de que el sujeto no tenga cáncer prostático (fig.
43-6A). Si el médico encuentra un ganglio prostático durante la exploración rectal, la probabilidad
anterior a la prueba de cáncer prostático se incrementa 50% y la probabilidad posterior a la prueba
(si se recurre a la misma técnica) es de 69% (fig. 43-6B). Por último, si el médico prevé que
la probabilidad anterior a la prueba es de 98% con base en un ganglio prostático, dolor óseo y
lesiones líticas en las radiografías de la columna, la probabilidad posterior a la prueba con PSA es
de 99% (fig. 43-6C). Este ejemplo ilustra que la probabilidad anterior a la prueba tiene un efecto
profundo en la probabilidad posterior a la prueba y que las pruebas suministran más información
cuando el diagnóstico es muy incierto (probabilidad anterior a la prueba cercana a 50%) en
comparación con un diagnóstico improbable o casi seguro.
Ezzie ME et al. Laboratory testing in the intensive care unit. Crit Care Clin. 2007 Jul;23(3):435–65.
[PMID: 17900480]
Hargett CW et al. Clinical probability and D-dimer testing: how should we use them in clinical
practice. Semin Respir Crit Care Med. 2008 Feb;29(1):15–24. [PMID: 18302083]
Scott IA et al. Cautionary tales in the clinical interpretation of studies of diagnostic tests. Intern Med
J. 2008 Feb;38(2):120–9. [PMID: 17645501]
Van Randen A et al. Acute appendicitis: meta-analysis of diagnostic performance of CT and graded
compression US related to prevalence of disease. Radiology. 2008 Oct;249(1):97–106. [PMID:
18682583]
Cuadro 43-4. Influencia de la probabilidad anterior a la prueba sobre la probabilidad
de enfermedad posterior a la prueba cuando se utiliza una técnica
con sensibilidad de 90% y especificidad de 90%.
McPhee-OLC43_3R.indd 9
Probabilidad anterior
a la prueba
Probabilidad posterior
a la prueba
0.01
0.08
0.50
0.90
0.99
0.999
22/4/10 19:19:10
A
Probabilidad
anterior a la
prueba
Probabilidad
posterior a la
prueba
Prueba
positiva
0
.1
.2
1
.5
Probabilidad de enfermedad
Probabilidad
anterior a la
prueba
B
Probabilidad
posterior a la
prueba
Prueba
positiva
1
.5
.69
Probabilidad de enfermedad
0
Probabilidad Probabilidad
anterior a la posterior a la
prueba
prueba
C
.5
Probabilidad de enfermedad
0
.98 1
.99
Fig. 43-6. Efecto de la probabilidad anterior a la prueba y de la sensibilidad y especificidad de ésta en
la probabilidad de enfermedad posterior a la prueba. (Véase la explicación en el texto.)
PROBABILIDAD DE MOMIOS
Otra forma de calcular la probabilidad de enfermedad posterior a la prueba consiste en recurrir a la
probabilidad de momios. Se combinan la sensibilidad y la especificidad en una entidad llamada índice
de probabilidad (LR):
LR =
Probabilidad del resultado en personas enfermas
Probabilidad del resultado en personas no enfermas
Cuando los resultados se dividen en dos, toda prueba tiene dos índices de probabilidad, uno
correspondiente a un resultado positivo (LR+) y otro a uno negativo (LR–):
LR+
=
Probabilidad de que la prueba sea positiva
en personas enfermas
Probabilidad de que la prueba sea positiva
en personas no enfermas
=
McPhee-OLC43_3R.indd 10
Sensibilidad
1 – Especificidad
22/4/10 19:19:10
Cuadro 43-5. Índices de probabilidad de la ferritina sérica en el diagnóstico
de la anemia ferropénica.
Ferritina sérica (μg/L)
LR para anemia ferropénica
≥100
0.08
45-99
0.54
35-44
1.83
25-34
2.54
15-24
8.83
≤15
51.85
Datos tomados de Guyatt G et al. Laboratory diagnosis of iron deficiency anemia. J Gen Intern Med.
1992 Mar-Apr;7(2):145-53.
LR– =
Probabilidad de que la prueba sea negativa
en personas enfermas
Probabilidad de que la prueba sea negativa
en personas no enfermas
=
1 – Sensibilidad
Especificidad
Para las mediciones continuas pueden definirse múltiples índices de probabilidad que correspondan a
los intervalos de resultados. (Véase un ejemplo en el cuadro 43-5).
Se pueden encontrar listas de índices de probabilidad en algunos libros de texto, artículos de revistas
y programas computacionales (véase el cuadro 43-6, que incluye valores de muestra). Los índices
de probabilidad pueden calcular en forma rápida la utilidad de una prueba diagnóstica prevista en
una situación particular. El método más sencillo para calcular la probabilidad posterior a la prueba,
a partir de la probabilidad anterior a la prueba y los índices de probabilidad, consiste en emplear un
nomograma (fig. 43-7). El médico une con una línea recta los puntos que representan la probabilidad
anterior a la prueba y el índice de probabilidad, y encuentra la probabilidad posterior a la prueba en el
punto en que la línea recta cruza esta última.
Una manera más formal de calcular la probabilidad posterior a la prueba consiste en usar el índice de
probabilidad como sigue:
Momios antes de la prueba × índice de probabilidad = momios después de la prueba
Para utilizar esta fórmula, las probabilidades deben convertirse en momios; en tal caso, los momios
de presentar una enfermedad se expresan como la probabilidad de tener la enfermedad dividida entre
Cuadro 43-6. Ejemplos de índices de probabilidad (LR).
Enfermedad
Prueba
LR+
LR-
Absceso
Tomografía computarizada
de abdomen
9.5
0.06
Coronariopatía
Electrocardiograma de esfuerzo
(depresión de 1 mm)
3.5
0.45
Cáncer de pulmón
Radiografía torácica
15
0.42
Hipertrofia ventricular izquierda
Ecocardiografía
18.4
0.08
Infarto miocárdico
Troponina I
24
0.01
Cáncer de próstata
Valoración rectal digital
21.3
0.37
Datos tomados de http://www.med.unc.edu/medicine/edursrc/Irmain.htm
McPhee-OLC43_3R.indd 11
22/4/10 19:19:10
99
.1
.2
95
.5
1
1000
500
90
2
200
100
50
80
70
10
20
10
5
50
40
20
2
1
5
Fig. 43-7. Nomograma para establecer la probabilidad
posterior a la prueba a partir de la probabilidad anterior a
la prueba y los índices de probabilidad. Para cuantificar la
probabilidad posterior a la prueba se coloca una línea recta
entre la probabilidad anterior y el índice de probabilidad para
la prueba específica. La probabilidad posterior es el punto en
que la línea recta cruza esta última. (Adaptada y reproducida
con autorización de Fagan TJ. Nomogram for Bayes theorem.
[Letter.] N Engl J Med. 1975 Jul 31;293(5):257.)
%
60
30
30
.5
40
.2
.1
.05
50
60
80
.02
.01
.005
90
.002
.001
70
95
20
%
10
5
2
1
.5
.2
99
Probabilidad
anterior a la
prueba
Índice de
probabilidad
.1
Probabilidad
posterior a la
prueba
la probabilidad de no tenerla. Por ejemplo, una probabilidad de 0.75 es lo mismo que momios de 3:1
(fig. 43-8).
Para calcular el beneficio de una prueba diagnóstica, el médico cuantifica primero los momios de la
enfermedad anteriores a la prueba, a partir de toda la información clínica disponible, y a continuación
multiplica los momios antes de la prueba por los índices positivo y negativo de probabilidad. Los
resultados son los momios posteriores a la prueba, o los momios de que el paciente tenga la
enfermedad si la prueba es positiva o negativa. Para obtener la probabilidad posterior a la prueba, los
momios se convierten en una probabilidad (fig. 43-8).
Por ejemplo, si el clínico cree que el enfermo tiene una probabilidad de 60% de sufrir un infarto
miocárdico (momios antes de la prueba, 3:2), y la prueba de troponina I es positiva (LR+ = 24), los
momios posteriores a la prueba de padecer un infarto miocárdico son los siguientes:
3
2
× 24 =
((36/1) + 1
36/1
=
72
2
36
37
o 36:1 momios
)
= 97% probabilidad
Si la prueba de troponina I es negativa (LR– = 0.01), los momios posteriores a la prueba de tener un
infarto miocárdico son los siguientes:
McPhee-OLC43_3R.indd 12
22/4/10 19:19:10
Momios =
Probabilidad
1 – Probabilidad
Ejemplo: si la probabilidad es 0.75, entonces
Momios =
Fig. 43-8. Fórmulas para convertir
probabilidades a momios y viceversa.
Probabilidad =
0.75
1 – 0.75
=
0.75
0.25
=
3
1
= 3:1
Momios
Momios + 1
Ejemplo: si los momios = 3:1, entonces
Probabilidad =
3
2
× 0.01 =
( (0.03/2) + 1
0.03/2
=
0.03
2
3/1
(3/1) + 1
=
3
3+1
= 0.75
momios
0.015
0.015 + 1
)
= 1.5% probabilidad
Pruebas en secuencia
Hasta el momento se ha descrito el efecto de una sola prueba en la probabilidad de enfermedad; sin
embargo, en la mayor parte de los estudios diagnósticos, los médicos obtienen información clínica
de manera secuencial. Por ejemplo, para calcular los momios posteriores a la prueba después de
tres pruebas, el médico podría cuantificar los momios anteriores a la prueba y usar el índice de
probabilidad adecuado para cada prueba:
Momios anteriores a la prueba × LR1 × LR2 × LR3 = Momios posteriores a la prueba
Sin embargo, cuando se utiliza este método, el clínico debe estar consciente de una presuposición
importante: las pruebas o hallazgos elegidos deben ser condicionalmente independientes.
Por ejemplo, cuando hay daño celular hepático, las enzimas aminotransferasa de aspartato (AST)
y aminotransferasa de alanina (ALT) se liberan por el mismo proceso, razón por la cual no son
condicionalmente independientes. Si se usan pruebas condicionalmente dependientes de este método
secuencial, se obtiene una probabilidad posterior a la prueba inexacta.
Christenson RH et al. Committee on Evidence Based Laboratory Medicine of the International
Federation for Clinical Chemistry Laboratory Medicine. Evidence-based laboratory medicine – a guide
for critical evaluation of in vitro laboratory testing. Ann Clin Biochem. 2007 Mar;44(Pt 2):111–30.
[PMID: 17362577]
Elamin MB et al. Accuracy of diagnostic tests for Cushing’s syndrome: a systemic review and metaanalysis. J Clin Endocrinol Metab. 2008 May;93(5):1553–62. [PMID: 18334594]
Petersen PH et al. ‘Likelihood-ratio’ and ‘odds’ applied to monitoring of patients as a supplement to
‘reference change value’ (RCV). Clin Chem Lab Med. 2008;46(2):157–64. [PMID: 18076354]
Método del umbral para tomar decisiones
Un aspecto clave para tomar decisiones médicas es la selección del umbral terapéutico, es decir,
la probabilidad de enfermedad en la que está indicado el tratamiento. El umbral de tratamiento se
determina por las consecuencias relativas de acciones diferentes: tratar cuando la enfermedad está
presente; no tratar cuando está ausente; tratar cuando en realidad está ausente; o no hacerlo cuando
está presente. La figura 43-9 muestra una posible forma de reconocer un umbral terapéutico mediante
la consideración del valor (utilidad) de los cuatro posibles resultados.
McPhee-OLC43_3R.indd 13
22/4/10 19:19:11
A
Utilidad
No
trat
ar
Tratar
C
B
D
Umbral de
tratamiento
0
Probabilidad de enfermedad (%)
Fig. 43-9. Umbral de “tratar/no tratar”. A: el paciente
no tiene la enfermedad y no recibe tratamiento (la
mayor utilidad). B: el paciente no tiene la enfermedad
y recibe tratamiento (menor utilidad que A). C: el
paciente tiene la enfermedad y recibe tratamiento
(menor utilidad que A). D: el paciente tiene la
enfermedad y no recibe tratamiento (menor utilidad
que C).
100
El uso de una prueba diagnóstica está indicado cuando su resultado podría modificar la probabilidad de
enfermedad en el umbral de tratamiento. Por ejemplo, un médico podría optar por la antibioticoterapia
si la probabilidad de faringitis estreptocócica en un sujeto con irritación faríngea es mayor de 25%
(fig. 43-10A). Si después de revisar los datos del interrogatorio y la exploración física, el médico
considera que la probabilidad anterior a la prueba de faringitis estreptocócica es de 15%, una prueba
diagnóstica como el cultivo faríngeo (LR+ = 7) sólo sería útil si el resultado positivo incrementara la
probabilidad posterior a la prueba a más de 25%. El empleo del nomograma mostrado en la figura
43-7 indica que la probabilidad posterior a la prueba sería de 55% (fig. 43-10B); por lo tanto,
estaría justificado solicitar la prueba, ya que afectaría el tratamiento del paciente. Por otro lado, si
el interrogatorio y la exploración física señalan que la probabilidad anterior a la prueba de faringitis
estreptocócica es de 60%, el cultivo faríngeo (LR– = 0.33) sólo estaría indicado si un resultado negativo
redujera la probabilidad posterior a la prueba a menos de 25%. Si se emplea el mismo nomograma,
la probabilidad posterior a la prueba después de un resultado negativo sería de 33% (fig. 43-10C). En
consecuencia, no estaría justificado realizar un cultivo faríngeo, ya que no influye en el tratamiento.
Este método para tomar decisiones se describe en la bibliografía clínica.
Análisis de decisiones
Hasta este punto, el análisis de las pruebas diagnósticas se ha enfocado en las características de
la prueba y los métodos para usarlas en el cálculo de probabilidad de enfermedad para distintas
situaciones clínicas. Aunque son útiles, estos métodos son limitados porque no incorporan los múltiples
resultados que pueden ocurrir en la clínica ni los valores que los individuos y médicos dan a tales
resultados. Para incorporar los resultados y los valores a las características de las pruebas puede
emplearse el análisis de decisiones.
La idea esencial del análisis de decisiones consiste en modelar las opciones de una decisión médica,
conceder probabilidades a las acciones alternativas, asignar valores (utilidades) a los diversos
resultados y luego precisar qué decisión aporta el mayor valor esperado (utilidad esperada). Para
completar un análisis de decisión, el médico podría actuar de la siguiente manera: 1) trazar un
árbol de decisiones que muestre los elementos de la decisión médica; 2) asignar probabilidades a
las diversas ramas; 3) asignar valores (utilidades) a los resultados; 4) establecer el valor esperado
(utilidad esperada) (el producto de probabilidad y el valor [utilidad]) de cada rama, y 5) tomar la
decisión con el mayor valor esperado (utilidad esperada).
La figura 43-11 muestra un árbol de decisión en el que se determina si se administra tratamiento sin
pruebas, si se realiza una prueba y después se trata con base en sus resultados, o si no se solicitan
pruebas ni se prescribe tratamiento. El médico comienza el análisis con la elaboración de un árbol
de decisiones que muestre los elementos importantes de la determinación. Una vez trazado el árbol,
el médico asigna probabilidades a todas las ramas. En este caso, todas las probabilidades de rama
pueden calcularse a partir de: 1) la probabilidad de enfermedad antes de la prueba (probabilidad
anterior a la prueba); 2) la probabilidad de un resultado positivo si existe la enfermedad (sensibilidad),
y 3) la probabilidad de un resultado negativo en caso de ausencia de la enfermedad (especificidad).
A continuación, el médico concede un valor (utilidad) a cada resultado.
Después de calcular el valor esperado (utilidad esperada) de cada rama del árbol de decisión mediante
la multiplicación del valor (utilidad) del resultado por la probabilidad de éste, el médico puede
identificar la alternativa con el mayor valor esperado (utilidad esperada).
McPhee-OLC43_3R.indd 14
22/4/10 19:19:11
Umbral tratar/
no tratar
A
Tratar
No tratar
0
.5
1
Probabilidad de enfermedad
Probabilidad
anterior a la
prueba
B
Probabilidad
posterior a la
prueba
Prueba
positiva
Tratar
No tratar
0
.5
1
Probabilidad de enfermedad
Probabilidad
anterior a la
prueba
Probabilidad
posterior a la
prueba
C
Prueba
positiva
Tratar
No tratar
0
.5
1
Probabilidad de enfermedad
Fig. 43-10. Método del umbral aplicado a la solicitud de pruebas. Si la prueba prevista no cambia el
tratamiento del paciente, no debe solicitarse. (Véase la explicación en el texto.)
Aunque requiere tiempo, el análisis de decisión ayuda a estructurar los problemas clínicos complejos
y tomar decisiones clínicas difíciles. La decisión de solicitar pruebas para establecer un diagnóstico
específico, instituir directamente el tratamiento específico sin realizar pruebas o tan sólo observar al
paciente sin realizar pruebas depende de la interrelación entre: 1) la probabilidad relativa de cada uno
de los diversos diagnósticos diferenciales, 2) la gravedad y la posibilidad de tratar los diagnósticos
posibles, 3) la eficacia, los efectos adversos y la facilidad de administrar los diversos tratamientos y 4)
la posibilidad de que los estudios diagnósticos permitan distinguir entre el paciente enfermo y el sano.
Los umbrales de probabilidad de enfermedad a los que deben o no someterse a prueba los pacientes
son variables. Los análisis son más útiles en los casos con una probabilidad intermedia de que exista
la enfermedad, en los cuales es más probable que el resultado del análisis modifique las decisiones
clínicas.
Inadomi JM. Decision analysis and economic modelling: a primer. Eur J Gastroenterol Hepatol.
2004;16(6):535–42. [PMID: 15167154]
Scott IA et al. Cautionary tales in the clinical interpretation of studies of diagnostic tests. Intern Med J.
2008 Feb;38(2):120–9. [PMID: 17645501]
McPhee-OLC43_3R.indd 15
22/4/10 19:19:11
Resultados
Enfermedad
Tratar, enfermedad +, sin prueba
Sin enfermedad
Tratar, enfermedad –, sin prueba
Prueba +
Tratar, enfermedad +, con prueba
Prueba –
No tratar, enfermedad +, con prueba
Prueba +
Tratar, enfermedad –, con prueba
Prueba –
No tratar, enfermedad –, con prueba
Tratar
Enfermedad
Prueba
Sin enfermedad
Enfermedad
No tratar, enfermedad +, sin prueba
No tratar
Sin enfermedad
No tratar, enfermedad –, sin prueba
Fig. 43-11. Árbol genérico para tomar decisiones clínicas en el que las opciones son: 1) tratar al
paciente de manera empírica; 2) realizar la prueba y luego tratar sólo si el resultado es positivo,
o 3) prescindir del tratamiento. El nodo cuadrado se conoce como nodo de decisión y los nodos
circulares se denominan nodos de oportunidad. p, probabilidad de enfermedad antes de la prueba;
Sens, sensibilidad; Spec, especificidad.
Medicina basada en evidencias
La medicina basada en evidencias es la atención de pacientes que utiliza la mejor evidencia disponible
para guiar las decisiones clínicas. Se basa en la identificación de evidencia con lógica metodológica,
la valoración crítica de las investigaciones y la difusión de resúmenes precisos y útiles de evidencia
para informar las decisiones médicas. Para resumir la evidencia que se difundirá pueden emplearse
revisiones sistemáticas, al igual que sinopsis de la investigación vigente basada en evidencias.
Las revisiones sistemáticas utilizan a menudo el metaanálisis, que consiste en el uso de técnicas
estadísticas para combinar evidencias de diferentes estudios, a fin de obtener un cálculo más preciso
del efecto de una intervención o la exactitud de una prueba.
Los lineamientos para la práctica clínica son afirmaciones que se desarrollan en forma sistemática,
cuya finalidad es ayudar a los médicos a tomar decisiones sobre la atención a la salud. En la
actualidad se emplean de manera extensa en la medicina los algoritmos clínicos y las normas
prácticas, diseñados por diversas asociaciones profesionales o expertos independientes. Las pruebas
diagnósticas forman parte integral de estos algoritmos y normas. Su utilidad y validez dependen de la
calidad de la evidencia que delineó las recomendaciones, su actualización constante, y su aceptación y
aplicación correcta por parte de los clínicos. Aunque algunos médicos están preocupados por el efecto
de los lineamientos en la autonomía profesional y las decisiones individuales, muchas organizaciones
buscan que dichos lineamientos para la práctica se cumplan, como una medida de calidad de la
atención.
Debido a que las decisiones de tratamiento no siempre han incluido el mejor conocimiento médico
y los valores del paciente, hay interés creciente en la toma compartida de decisiones. Se trata de
un proceso en el que los médicos proporcionan información de la salud basada en evidencias a los
pacientes, entran en contacto con sus valores y colaboran con ellos para alcanzar una decisión mutua
aceptable. Se ha demostrado que en muchos casos los auxiliares para tomar decisiones (herramientas
que facilitan la toma compartida de decisiones) mejoran este proceso y sus resultados. A este
respecto, la medicina basada en evidencias se utiliza para complementar, no sustituir, los criterios
médicos en cada paciente.
McPhee-OLC43_3R.indd 16
22/4/10 19:19:12
La tecnología informática ofrece al médico datos de laboratorio, imagenología, sistemas de vigilancia
fisiológica y muchas otras fuentes. Cada vez se utiliza más el apoyo informático para tomar decisiones
clínicas con el fin de diseñar, implementar y depurar protocolos informáticos para procesos específicos
de la atención derivados de las normas prácticas basadas en evidencias. Es importante que el médico
utilice la tecnología moderna para ofrecer la mejor atención en su consultorio.
Chung KC et al. A practical guide to meta-analysis. J Hand Surg [Am]. 2006 Dec;31(10):1671–8.
[PMID: 17145390]
MacKinnon RJ. Evidence based medicine methods (part 1): the basics. Paediatr Anaesth. 2007
Oct;17(10):918–23. [PMID: 17767626]
O’Connor AM et al. Do patient decision aids meet effectiveness criteria of the international patient
decision aid standards collaboration? A systematic review and meta-analysis. Med Decis Making. 2007
Sep–Oct;27(5):554–74. [PMID: 17873255]
Sucher JF et al. Computerized clinical decision support: a technology to implement and validate
evidence based guidelines. J Trauma. 2008 Feb;64(2):520–37. [PMID: 18301226]
McPhee-OLC43_3R.indd 17
22/4/10 19:19:12