Download Calidad de vida, resultados funcionales y satisfacción, en la
Document related concepts
no text concepts found
Transcript
© de la presente edición, GENERALITAT VALENCIANA © María José Navarro Collado, Salvador Peiró, José Pérez Moltó, Antonio Hernández Royo Prohibida la reproducción total o parcial de la presente publicación por cualquier procedimiento mecánico o electrónico, incluyendo fotocopia, sin la autorización expresa de la Generalitat Valenciana. Edita: Conselleria de Sanidad Subsecretaria per a l’Agència Valenciana de la Salut ISBN: 84-482-3533-9 Depósito legal: V-2424-2003 Imprime: Industrias Gráficas ECIR, S. A. - Teléfono 96 132 36 25 Pol. Ind. Fuente del Jarro - 46988 Paterna (Valencia) Calidad de vida, resultados funcionales y satisfacción, en la rehabilitación tras artroplastia de rodilla María José Navarro Collado Salvador Peiró José Pérez Moltó Antonio Hernández Royo 2003 PRESENTACIÓN El entorno actual de la atención sanitaria ha favorecido el desarrollo de la investigación de resultados de calidad de vida relacionada con la salud y la rápida difusión de muchos de sus elementos a la práctica habitual. Con el incremento de la esperanza de vida, las patologías degenerativas han ido adquiriendo protagonismo en la consulta diaria y los avances terapéuticos, tienen, cada vez mas, el objetivo de paliar las consecuencias del envejecimiento y mejorar la calidad de vida de las personas. La artroplastia total de rodilla, tratamiento definitivo de la gonartrosis avanzada y de las enfermedades reumáticas inflamatorias, es un claro ejemplo de esta situación, ya que su objetivo básico es reducir la incapacidad funcional derivada del dolor y la limitación de movilidad, mejorando la calidad de vida de los afectados. Para conocer la contribución de la artroplastia a la mejora de la salud de las personas con patologías degenerativas o inflamatorias de la rodilla se ha utilizado tradicionalmente la valoración anatómo-funcional, pero esta es insuficiente ya que, al contemplar únicamente aquellos aspectos que pueden ser objetivados por un agente externo, no tiene en cuenta otros factores que conviven y repercuten en el proceso de enfermar -como los aspectos psíquicos, sociales y familiares y el impacto global de la enfermedad en la vida del paciente- y que sólo son valorables a partir de las percepciones subjetivas de los propios pacientes. Abordar estos aspectos requiere el uso de instrumentos capaces de cuantificar tales dimensiones, valorando la calidad de vida relacionada con la salud, concepto que define el impacto de la enfermedad –y su tratamiento- sobre todos los aspectos de la vida del paciente, esto es, un concepto subjetivo y multidimensional que incorpora componentes de función física (capacidad para las actividades de la vida diaria y para el esfuerzo), función psicológica (afectiva y cognitiva), interacción y función social, sensaciones somáticas, limitaciones y auto-percepción de salud. 7 Diversos trabajos en los últimos años han valorado la calidad de vida de los pacientes intervenidos de artroplastia de rodilla. Se trata de trabajos desde la perspectiva de la cirugía ortopédica que utilizan diversas escalas para valorar la calidad de vida antes de la intervención y tras periodos variables de seguimiento y que, en conjunto, han demostrado la efectividad de esta intervención para mejorar la calidad de vida de los pacientes sometidos a ella. Sin embargo, no existían trabajos que realizaran esta valoración desde el punto de vista de la rehabilitación, esto es, una vez que el paciente ha sido intervenido y accede a esta modalidad de tratamiento. Maria José Navarro y colaboradores, en una muestra de pacientes tratados en las unidades de Rehabilitación del Área de Salud 9, analizan los resultados funcionales, de calidad de vida y la satisfacción con la atención recibida. En conjunto se produjo una importante mejora -objetiva y subjetiva- en los 3 meses siguientes al inicio del tratamiento rehabilitador tras la artroplastia de rodilla, tanto en estado funcional como en calidad de vida. Igualmente los pacientes mostraron una amplia satisfacción con la atención recibida, especialmente cuando ésta se realizó en el ámbito extrahospitalario. Los autores señalan la existencia de un subgrupo de pacientes de peor pronóstico en los que tal vez fuera de interés desarrollar tratamientos mas intensivos. Este trabajo muestra el interés de ampliar nuestro conocimiento sobre el impacto de los tratamientos en la calidad de vida de los pacientes, pero también en la satisfacción con la asistencia. Y aquí hay que hacer notar que las políticas de desarrollo de unidades de rehabilitación extrahospitalarias, mas cercanas a los pacientes y con mayores facilidades de programación de citas, incrementan la satisfacción de los pacientes. Estas unidades se crearon precisamente con esta finalidad, y es bueno saber que están cumpliendo con su objetivo. Mª Rosa Roca Catelló Directora General para la Prestación Asistencial 8 ÍNDICE INTRODUCCIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Los resultados de la atención de salud . . . . . . . . . . . . . . . . . . . . . . . . . Aspectos clinimétricos de los instrumentos de medición . . . . . . . . . . . . Medidas de resultado funcional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . La medición de la calidad de vida relacionada con la salud . . . . . . . . . . Aplicaciones de la calidad de vida relacionada con la salud . . . . . . . . . Dimensiones de la calidad de vida . . . . . . . . . . . . . . . . . . . . . . . . . . . . Instrumentos de medición de calidad de vida . . . . . . . . . . . . . . . . . . . . Selección de instrumentos de medición de calidad de vida . . . . . . . . . . La medición de la calidad de vida en la artroplastia de rodilla . . . . . . . La medida de la satisfacción de los pacientes. . . . . . . . . . . . . . . . . . . . Aproximaciones a la medición de la satisfacción de los pacientes . . . . . Elementos a tener en cuenta en las encuestas de satisfacción . . . . . . . . Instrumentos de medición de satisfacción en rehabilitación . . . . . . . . . Objetivos e hipótesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 11 17 22 28 29 30 34 37 39 42 44 47 50 52 MATERIA Y MÉTODO . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Diseño . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Entorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Pacientes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Medidas de resultado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Otras variables y definiciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Instrumentos de Medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Desarrollo del estudio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Aspectos éticos, confidencialidad y autorizaciones . . . . . . . . . . . . . . . . Análisis estadístico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 55 55 56 57 57 58 59 60 60 RESULTADOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Características de los pacientes al inicio de la rehabilitación . . . . . . . . . Resultados funcionales, de calidad de vida y satisfacción a los 3 meses y ganancia respecto al período basal . . . . . . . . . . . . . . . . Factores asociados al resultado funcional . . . . . . . . . . . . . . . . . . . . . . . 63 63 66 71 9 Factores asociados a los resultados de calidad de vida . . . . . . . . . . . . . 77 Factores asociados a la satisfacción . . . . . . . . . . . . . . . . . . . . . . . . . . . 82 DISCUSIÓN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Comparación con otros estudios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Factores asociados a mejores o peores resultados . . . . . . . . . . . . . . . . . Limitaciones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . Implicaciones prácticas para los servicios de rehabilitación . . . . . . . . . 89 89 95 99 101 BIBLIOGRAFÍA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103 Anexo 1. Características clinimétricas de los principales instrumentos de valoración de la función, calidad de vida y satisfacción utilizados en la artroplastia de rodilla . . . . . . . . . . . . . 133 10 Introducción Los resultados de la atención de salud Tradicionalmente, la investigación médica ha tenido como objetivo principal incrementar la supervivencia de las poblaciones y buscar remedios terapéuticos a las enfermedades –especialmente las infecciosas– que azotaban a la humanidad. En las últimas décadas, y al menos en los países desarrollados, se han producido importantes cambios que actualmente configuran una situación caracterizada por: • Los cambios en los patrones de salud/enfermedad, en parte asociados a una mayor longevidad, con un incremento sin precedentes en el número de personas que viven con alguna patología crónica y que requieren (y demandan) la máxima conservación de su calidad de vida, incluso mientras viven con esta enfermedad. • El crecimiento del gasto sanitario en un marco de creciente competitividad internacional, y la conciencia de que los recursos no son ilimitados, con su correlato de necesidad de decidir la asignación de recursos escasos entre aquellas intervenciones que produzcan un mayor bienestar a las poblaciones. 11 • Los rápidos y extensos avances tecnológicos en medicina. • El desarrollo de una cultura basada en la autonomía individual, en la que el derecho a decidir sobre uno mismo es una consideración fundamental, y en la que tienen una importancia creciente los resultados subjetivos –valorados por el propio usuario- y la propia satisfacción de los pacientes con la atención recibida. Las patologías que afectan a las articulaciones, fundamentalmente las de carácter degenerativo y en menor grado las de etiología inflamatoria, son el ejemplo paradigmático de esta nueva situación: • La prevalencia de la artrosis en la población española se ha estimado en el 43%, siendo del 29,4% en los hombres y 52,3% en las mujeres [Martín P et al, 1992]. Otro estudio en población española, realizado en área rural y mayores de 10 años, con una muestra de 827 individuos, encontró una prevalencia de artrosis del 26,1% [Paulino et al, 1982], mientras que en Asturias, y sobre 702 personas mayores de 18 años, fueron diagnosticadas de artrosis el 23,8%: 29,7% mujeres y el 16,2% varones [Ballina et al, 1993]. Por debajo de 65 años las mujeres presentaron una mayor prevalencia, por encima de esta edad la prevalencia de la artrosis se situó en el 80% en ambos sexos. La incidencia de la artrosis de rodilla, en un seguimiento a 12 años de 258 personas mayores de 45 años, fue de un 24% para las mujeres y un 10% para los hombres [Badía Llach X, 1999]. • El dolor y la limitación funcional causados por estas patologías es responsable de invalidez y limitaciones graves en la autonomía de las personas, que es mas evidente en las articulaciones de carga como la cadera y la rodilla; • La búsqueda de terapias efectivas frente al deterioro articular irreversible se ha traducido en importantes avances tecnológicos, especialmente visibles en el desarrollo de prótesis articulares cada vez mas eficaces y funcionales, y cuya indicación permanece constante en las últimas décadas: dolor incapacitante, alteración funcional y evidencia radiológica de artrosis o artritis. • La extensión del tipo de pacientes susceptibles de indicación, junto a los elevados costes unitarios de estos tratamientos, supone la asignación de importantes recursos para el tratamiento de estas patologías. En el caso de la artroplastia de rodilla, el número total de prótesis sigue aumentando y se estima que en España se realizan aproximadamente 25.000 artroplastias cada año [Cuxart et al, 1998]. 12 Los orígenes de la artroplastia de rodilla se remontan a Verneuil [1860] que, con resultados desalentadores, intentó la interposición de tejidos blandos para la reconstrucción de la superficie articular. Campell [1940] introdujo las hemi-artroplastias, que pronto dejaron de utilizarse por la inestabilidad –ya en el postoperatorio y también a largo plazo– y el desgaste con hundimiento de la prótesis. En la década de los 60 se inicia la era moderna de la artroplastia por reemplazo articular al desarrollar Charnley una artroplastia de reemplazo total de la cadera, cementada, con tallo de acero inoxidable para la cabeza femoral, que se articulaba con un implante acetabular de polietileno de alta densidad, cuyo diseño, materiales y técnica de fijación siguen vigentes. Usando estos mismos conceptos Gunston [1971] desarrolló en una artroplastia total de rodilla aunque, partiendo del concepto de prótesis unicompartimental, procedió al reemplazo simultáneo del cóndilo por un componente metálico guiado sobre unas acanaladuras en un platillo tibial de polietileno. Las piezas se anclaban sobre los cóndilos femorales y los platillos tibiales de forma independiente mediante cemento óseo. Con este diseño se consiguió una prótesis de baja fricción y la primera prótesis de deslizamiento sin charnela. Ante la complejidad de la técnica de colocación, el deterioro a medio plazo por aflojamiento de los implantes y la limitación del arco articular de la prótesis de Gunston, los nuevos modelos de prótesis -siendo importante la desarrollada por Freeman et al [1973]- se orientaron hacia un diseño bicompartimental con dos elementos, uno tibial y otro femoral. Walker y Hayek [1972] fueron los pioneros en el desarrollo de diseños protésicos anatómicos, origen de las prótesis actuales. Estos diseños pretenden imitar la configuración anatómica de la rodilla humana para permitir un arco de movimiento, estabilidad y capacidad de carga similares a las anatómicas en las actividades de la vida diaria [Nissan, 1981]. Paralelamente, el grupo del Hospital for Special Surgery desarrolló la prótesis total condilar con eliminación de ambos ligamentos cruzados [Insall et al, 1976] cuyos resultados, analizados tras más de 15 años de experiencia, la han convertido en el patrón-oro de la prótesis total de rodilla. A pesar de que sigue investigando para mejorar el diseño de la sustitución protésica de rodilla, se han alcanzado resultados clínicos, funcionales y de supervivencia de implante equiparables a los obtenidos en la prótesis total de cadera. Esto ha sido posible gracias a una lenta evolución de conceptos, técnicas y diseño a lo largo de 30 años de investigación en este campo [Harris, 1990]. Estos progresos han determinado la mejora de las técnicas 13 quirúrgicas y, en particular, la obtención de prótesis mejor diseñadas, más funcionales y mas fuertes y duraderas. Los modelos de última generación permiten 6 grados de libertad (3 de traslación y 3 de rotación) conservando, siempre que sea posible, el ligamento cruzado posterior que permite más rodadura posterior cuando se flexiona la rodilla y refuerza los ligamentos colaterales, aunque en algunos casos como en corrección de deformidades, simplificación de la técnica y otros, se opta por su sacrificio. Si los avances tecnológicos han renovado en la última década el interés por los resultados de la atención médica, fue Donabedian [1966], hace más de tres décadas, quien conceptualizó los ejercicios de medición-evaluación en atención sanitaria en la tríada estructura, proceso, y resultado. Los procesos se refieren a aquello que los proveedores de servicios (médicos, hospitales, centros de salud, etc.) hacen a y para los pacientes y, en sentido inverso, como los pacientes buscan la atención médica y responden a las pautas terapéuticas recomendadas. El impacto de estos procesos sobre la salud de los pacientes es denominado resultados o desenlaces (outcomes). Los resultados fueron definidos por este autor como los “cambios, favorables o no, en el estado de salud actual o potencial de personas, grupos o comunidades que pueden ser atribuidos a la atención sanitaria previa o actual” [Donabedian A, 1988]. Atendiendo al sentido de estos cambios, los resultados pueden considerarse favorables (reflejando una mejora en una o más de las dimensiones del estado de salud) o adversos (representando un deterioro). En esta definición genérica, el estado de salud denota tanto los atributos físicos, como psicológicos, sociales o actitudinales de los pacientes. Esto plantea el problema de la atribución de los resultados, que Donabedian [1982; 1985; 1986] explicó del siguiente modo: “la presencia de un lazo causal válido entre un proceso específico y un resultado significa que sólo es posible alcanzar cierto resultado bajo condiciones específicas. No quiere decir que el resultado observado en una situación dada ha sido producido, en ese caso, por el proceso citado”. Dado que diferentes dimensiones del estado de salud pueden ser afectadas por el proceso de cuidados y dado que estos resultados también pueden interrelacionarse, es necesario distinguir [Donabedian A, 1992] entre resultados finales (end points) y resultados intermedios (surrogate endpoints). Los resultados finales son aquellos que tienen relevancia clínica para los pacientes y son los que realmente se desea conseguir con las intervenciones sanitarias: la reducción de la mortalidad es el clásico ejemplo de resultado final, pero también lo es la mejora en el estado funcional o en la cali14 dad de vida. La investigación epidemiológica clásica y los ensayos clínicos a menudo miden resultados intermedios (por ejemplo, control de la presión arterial) como evidencia de éxito en el tratamiento o en el proceso de cuidados, aunque lo que se busca realmente es alterar el resultado final, a veces meses o años después de la intervención. En la tabla 1 se muestran los resultados mas empleados en atención de salud con algunos ejemplos –no exhaustivos– de indicadores. Tabla 1. Resultados de la atención de salud Supervivencia o mortalidad Mortalidad intrahospitalaria. Mortalidad durante la estancia en UCI. Mortalidad a los n días del episodio/ingreso/alta/intervención. Supervivencia a los n años del diagnóstico. Otros sucesos adversos Reingresos en determinados periodos o causas especificas. Infecciones nosocomiales. Enfermedades yatrogénicas. Reacciones adversas a fármacos. Complicaciones post-quirúrgicas. Reintervenciones Fracasos de intervención y recidivas Estabilidad de los sistemas fisiológicos Normalización/mejora de signos clínicos: pulso, temperatura,… Normalización/mejora de parámetros bioquímicos Normalización mejora de otros parámetros Funcionamiento psicosocial Estado cognitivo Ansiedad Estrés,… Estado funcional Capacidad para el esfuerzo Capacidad para las actividades de la vida diaria Capacidades específicas: visuales, movilidad, ... Normalización/mejora en pruebas funcionales Calidad de vida relacionada con la salud Medición de utilidades Índices de estado de salud Perfiles de salud Instrumentos diagnóstico-específicos de calidad de vida Satisfacción Encuestas de satisfacción • La mortalidad, uno de los resultados más utilizados por su rotundidad y fácil disponibilidad. Suele emplearse en diferentes ventanas temporales (durante el episodio de hospitalización o en plazos prefijados desde el ingreso o intervención, típicamente a los 30 días), en servicios con alta mortalidad, o como supervivencia en periodos largos desde el diagnóstico, usual en 15 oncología. Sin embargo, y por las características de la especialidad, su uso en Rehabilitación es escaso (aunque en algunas condiciones –singularmente en la rehabilitación cardiaca o respiratoria- puede ser importante). • Las complicaciones y otros sucesos adversos como los reingresos, las infecciones nosocomiales y algunas complicaciones específicas (de herida quirúrgica, recidivas, fracasos de intervención), son cada vez mas empleadas junto a -o en lugar de- la mortalidad, tanto por su mayor frecuencia (mayor poder estadístico), como por una presumible mayor relación con problemas de calidad en la atención susceptibles de corrección. • La estabilidad o mejoría de los sistemas fisiológicos es empleada típicamente en las unidades de cuidados intensivos donde muchas de estas variables son críticas en la valoración de resultados inmediatos (normalización de iones, gases, frecuencia cardiaca, etc.), pero también como medidas intermedias de resultado en muchas patologías crónicas (disminución de la presión arterial en mmHg, reducción de los niveles hemáticos de lípidos, etc). • El estado o la capacidad funcional (muy empleado en especialidades como la cardiología o neumología, con clasificaciones históricas -como la de insuficiencia cardiaca de la New York Heart Association utilizada desde 1972- y pruebas funcionales objetivas de amplio uso como las respiratorias, de esfuerzo y otras), así como el funcionamiento psico-social se han convertido en piezas clave para medir resultados importantes para los pacientes. En Rehabilitación la comprensión de la enfermedad reside precisamente en como un proceso patológico puede desembocar en limitaciones que tienen como consecuencia una restricción de la capacidad funcional; por este motivo, la medida de resultado mas utilizada en los Servicios de Rehabilitación es la del estado funcional, concepto que aparece aproximadamente hace 50 años con objeto de evaluar el nivel en el que un individuo es capaz de realizar las actividades habituales sin limitaciones físicas [Bowling, 1992]. Supone un componente de la salud que trata de medir -por alguien externo al paciente y con criterios objetivables- los efectos de la enfermedad sobre la vida del individuo, antes que la enfermedad en sí misma, plasmando los resultados obtenidos en escalas de valoración funcional específicas de las patologías a valorar. Estos instrumentos de medida permiten expresar los resultados clínicos de un modo uniforme, objetivo y medible, pudiendo cuantificar la repercusión o consecuencias de la enfermedad y documentar sus variaciones de forma clara y reproducible. 16 • La medición de la calidad de vida relacionada con la salud es un esfuerzo para medir de forma comprensiva los resultados importantes para los pacientes. La asociación del término calidad de vida con los cuidados de salud se inicia hacia la mitad de la década de los setenta [Spitzer WO et al, 1981; Spitzer WO, 1987] y su presencia en la literatura médica fue incrementándose paulatinamente hasta finales de la década de los 80, en que se inicia un crecimiento casi exponencial de las publicaciones científicas que utilizan la medición de la calidad de vida como resultado de la atención sanitaria. Este crecimiento ha continuado y una reciente revisión [Peris A, 1996] de los artículos sobre calidad de vida registrados en la base de datos Medline durante 1984-95 revelaba como la producción científica en este campo pasó de menos de 500 publicaciones/año en 1984, a más de 1800 publicaciones/año en 1995. • Finalmente, la satisfacción de los pacientes, acompañando a las transformaciones sociales y el cambio del papel de los usuarios de los servicios de salud (desde paciente a cliente), se ha ido convirtiendo en un resultado importante, para cuya medición se han desarrollado numerosos marcos conceptuales y encuestas específicas. Aspectos clinimétricos de los instrumentos de medición Los estudios sobre resultados acogen una amplia variedad de formas. Existen investigaciones con fines comparativos entre individuos y/o grupos. Otras intentan describir la capacidad funcional o la calidad de vida en un determinado momento y sus variaciones en el tiempo. También se realizan estudios para valorar la repercusión que tienen las intervenciones clínicas o la influencia de diferentes sistemas sanitarios sobre la salud. Unas veces los fines son descriptivos y otras tienen un carácter predictivo que permita determinar potenciales demandas. Y, finalmente, también la investigación teórica puede utilizar la medidas de función o de CV para comprobar y desarrollar teorías sobre la enfermedad o el comportamiento, identificando determinantes psicosociales de la calidad de vida. Para satisfacer a esta variedad de objetivos, un instrumento de medida debería cumplir fundamentalmente tres requisitos [Guyatt et al, 1993; Kirshner, Guyatt, 1985; Wilkin et al, 1992]: discriminar, predecir y evaluar, aspectos complementarios que otorgan un importante poder al instrumento en todas sus potenciales aplicaciones. Las claves clinimétricas para el desarrollo y selección de una buena medida vendrán determinadas por su fiabilidad, validez y sensibilidad a los cambios en el estado del paciente [Patrick, Erickson, 1993]. 17 En la tabla 2 se resumen las definiciones y formas de examen de estas propiedades y en el Anexo 1 se resumen estas propiedades para los instrumentos más utilizados en la valoración de la prótesis de rodilla. Fiabilidad.- La fiabilidad es un término genérico que se refiere a la estabilidad de las medidas repetidas sobre un mismo objeto. Generalmente, se consideran tres tipos de fiabilidad en la valoración de un instrumento de medida que se prueban a partir de la consistencia en el tiempo (fiabilidad test-retest), la consistencia entre diferentes observadores (fiabilidad entre observadores) y la consistencia interna de los ítem del instrumento [Wilkin et al, 1992]. La fiabilidad test-retest se examina al aplicar la medida en la misma población y bajo las mismas condiciones pero en diferentes periodos de tiempo. La correlación entre resultados valora la fiabilidad en términos de estabilidad de la medida. La fiabilidad entre observadores examina la consistencia entre diferentes observadores que aplican un mismo instrumento. Es importante para cualquier medida que necesita de los juicios u observaciones de la persona que la administra y, básicamente, trata de medir el nivel de acuerdo entre los diferentes entrevistadores. Por último, la consistencia interna es probada mediante un test estadístico que mide la correlación que presentan los ítem individuales con otros y con la totalidad del instrumento. Proporciona una estimación de la homogeneidad. Los métodos más utilizados en los estudios de calidad de vida son el coeficiente alfa de Cronbach y el método de las dos mitades que divide los ítem en grupos apareados y correlaciona los resultados obtenidos. Estas pruebas son útiles para medidas unidimensionales, en la que todos los ítem incluidos pretenden evaluar la misma dimensión. Las medidas multidimensionales en su conjunto no podrían obtener una alta consistencia interna, dado que cada grupo de ítem se refiere a un dominio distinto. En estos casos es aconsejable realizar pruebas de consistencia interna para cada una de las dimensiones que conforman el instrumento de medida. Aunque se acepta que todas las medidas incluyen algún tipo de error aleatorio, reduciendo con ello su fiabilidad, las medidas de aspectos psicosociales y referidas a la salud son más proclives a estos errores que otras medidas más tangibles. La importancia de la cuestión es determinar el nivel de error aceptable. Según la propuesta de Ware [1987], aceptada por otros autores [Patrick, Erickson, 1993] para los instrumentos que evalúan el estado de salud y la calidad de vida se requiere una fiabilidad superior a 0,90 cuando la comparación es intraindividual. Para comparaciones intergrupos la fiabilidad entre 0,50 y 0,70 se estima aceptable. 18 Validez.- Un instrumento es válido cuando mide lo que se propone medir y no otra cosa. La validez es, sin duda, la propiedad esencial de cualquier instrumento de medida y su evaluación es imprescindible [Guyatt, Jaeschke, 1990]. Existen varias formas de validez y muchas aproximaciones empíricas para medirla. Las más comunes son: la validez de contenido, de criterio y de constructo. La validez de contenido intenta valorar la importancia que tienen los componentes de la medida dentro del dominio que intenta medir, y mostrar si los ítem cubren la totalidad de esos componentes de un modo representativo [Wilkin et al, 1992]. En la práctica puede fundamentarse a partir de una valoración por expertos para generar y seleccionar ítem sobre un tema, incluyendo en el instrumento aquellos que han obtenido una mayor comunalidad. Otras veces la validez de contenido se prueba por las referencias existentes en la literatura sobre el objeto de la medida, mostrando que los ítem cubren todos los aspectos que han sido considerados previamente importantes. La validez de criterio responde a la cuestión de si la medida produce resultados que correlacionan bien con los obtenidos usando otra medida simultáneamente (validez concurrente), o si pronostica bien otro resultado de interés (validez predictiva). El problema es que la ausencia de un “patrón oro” con el que comparar el nuevo instrumento dificulta este proceso de validación, de ahí que algunos autores se refieran a ella como validación “referida al criterio” [Wilkin et al, 1992]. Cuando las medidas se diseñan con el propósito específico de predecir determinadas situaciones y/o conductas, la capacidad del instrumento para garantizar dicha predicción constituye el principal objetivo. La validez de constructo responde a la pregunta de si los resultados obtenidos confirman el patrón esperado de relaciones o el constructo teórico bajo el que fue diseñado el instrumento. Generalmente y en sustitución de ese “patrón oro” inexistente, los investigadores fundamentan el significado de una medida particular sobre un conjunto de evidencias empíricas. Para ello, se establecen comparaciones con otras medidas y/o predicciones relacionadas entre diferentes grupos de sujetos. Por ejemplo, una medida de capacidad funcional puede probarse frente a una medida de actividades de la vida diaria, esperando obtener entre ellas una correlación positiva. En este caso, se evidenciaría la validez convergente del nuevo instrumento. Por el contrario, demostrar que una medida no correlaciona con otras variables presupuestamente no relacionadas, proporcionaría evidencia de la vali19 dez divergente. Asimismo, la validez de constructo también puede ser probada usando la técnica del análisis factorial. En general, la aproximación más común para evaluar la validez de constructo es aplicar el instrumento a grupos en los que se conocen las diferencias en base al concepto que esta siendo probado. Por ejemplo, los pacientes que sufren enfermedades crónicas pueden compararse con una muestra de la población general, o bien los jóvenes con los ancianos. En estos casos la elección de los grupos es muy importante para evitar los sesgos de otras variables sobre la del estudio. Sensibilidad.- La sensibilidad (responsiveness) se refiere a la capacidad del instrumento para detectar cambios clínicos de interés en el estado del paciente. En el ámbito clínico constituye una de las principales propiedades del instrumento, dado que el objetivo de muchos estudios es monitorizar la evolución del paciente para detectar los cambios sobre el tiempo, bien sea con fines predictivos, comparativos o intervencionistas. Se trata, sin embargo, de uno de los aspectos mas abandonados en el desarrollo de instrumentos de medida de calidad de vida, en parte por las dificultades técnicas en su medición. La sensibilidad esta estrechamente asociada a la validez, y algunos autores se refieren a ambas como validez discriminante. Para que un instrumento sea sensible se requiere el cumplimiento de dos requisitos: a) que el instrumento sea fiable, y b) que tenga capacidad para registrar cambios en un sentido positivo (mejora) y negativo (empeoramiento). Las medidas con poder discriminativo suelen reunir un limitado número de categorías de respuesta (por ejemplo si/no), con lo que minimizan el problema de dispersión entre diferentes categorías de respuesta. Por el contrario, una medida sensible a pequeños cambios en el tiempo sobre los mismos individuos, requerirá una amplia gradación en las categorías de respuesta. Hay que señalar que el uso clínico del instrumento requiere además la disponibilidad de valores de referencia de normalidad (normative data), usualmente valores poblacionales para personas de los mismos grupos de edad y sexo, y el conocimiento de la llamada diferencia mínima relevante (Minimally important difference), esto es, el valor mínimo de cambio en la escala que refleja un cambio clínico de interés. 20 21 Comparación del conocimiento clínico con la lógica y variables incluidas en el instrumento y valoración de la dirección y peso de cada variable con respecto al resultado de interés. Acceso a la lógica y variables del sistema; juicios de expertos y/o revisión de la literatura Correlación con factores de riesgo o resultado aceptados; con valoraciones realizadas por un panel clínico o con otros instrumentos. Correlación con un estándar. Comparación de los resultados observados con los predichos. Necesidad de un marco conceptual sólido que relacione la medida de resultado con problemas de calidad Análisis de los resultados en pacientes que mejorar y empeoran su estado. Si se repite la medición en el tiempo ¿Los resultados son los mismos? Si se repite la medición por diferentes personas ¿Los resultados son los mismos? ¿Los ítem que miden conceptos semejantes muestran una alta correlación interna? ¿Los valores de las mediciones recogen el constructo que se pretende medir? ¿El instrumento parece medir lo que quiere medir? ¿A quienes lo usen les parecerá valido y aceptable? ¿El instrumento contiene todos los conceptos relevantes? ¿Son importantes los conceptos omitidos? ¿Los resultados obtenidos con el instrumento correlacionan bien con los de otros instrumentos similares? ¿Los resultados obtenidos con el instrumento correlacionan bien con un patrón-oro? Si el instrumento se emplea con fines predictivos, ¿predice bien el resultado de interés? Si los resultados se van a utilizar para evaluar la calidad de la atención ¿se ha establecido previamente que las variaciones en los resultados pueden ser atribuidas a variaciones en la calidad de la asistencia? ¿Si cambia el estado clínico del paciente, cambiará el valor dela medición en el sentido adecuado? Consistencia entre mediciones efectuadas por el mismo observador. Consistencia entre mediciones efectuadas por observadores diferentes. Consistencia entre ítem o elementos que miden la misma característica general. Grado en que un instrumento mide lo que se pretende medir. Grado en que instrumento tiene sentido intuitivamente. Grado en que un instrumento cubre los elementos del constructo que se mide. Grado en que los resultados de un instrumento confirman el patrón esperado de relaciones o el constructo teórico bajo el que fue diseñado. Grado en que los resultados de un instrumento correlacionan con un patrón-oro. Grado en que un instrumento predice los resultados de interés. Grado en que pueden atribuirse los resultados obtenidos a los procesos de cuidados desarrollados. Capacidad para detectar cambios clínicos de interés en el estado del paciente Fiabilidad intraobservador Intrarater reliability Fiabilidad entre observadores Inter-rater reliablity Consistencia interna Internal consistency Validez Validity Apariencia de Validez Face Validity Validez de contenido Content validity Validez de constructo Construct Validity Validez de criterio Criterion Validity Validez predictiva Predictive Validity Validez de atribución Attributional Validity Sensibilidad Responsiveness Coeficiente alfa de Cronbach; Prueba de las dos mitades. Estadístico Kappa y pruebas de correlación Estadístico Kappa y pruebas de correlación Si los procesos son repetidos siguiendo las mismas normas y criterios, ¿Los resultados son los mismos? Reproducibilidad de las mediciones. Indica el grado de acuerdo entre mediciones repetidas. Fiabilidad Reliability Examen Preguntas Concepto Definición Tabla 2. Propiedades clinimétricas de los instrumentos de medida Medidas de resultado funcional El estado funcional es conceptualizado usualmente como la “capacidad para procurarse los propios cuidados y desarrollar las actividades físicas” y su restauración es el objetivo principal de la rehabilitación. La especialidad tuvo serias dificultades para expresar los resultados obtenidos de un modo objetivo y uniforme hasta que surgieron las escalas de valoración funcional en la década de los años 50, encontrando su máximo desarrollo en los 80. El objetivo básico de estas escalas es permitir una valoración inicial de la funcionalidad tras la identificación de la patología, hacer el seguimiento del proceso, valorar los resultados una vez finalizado el proceso, comparar resultados con otros profesionales que han utilizado la misma intervención terapéutica o comparar diferentes terapias ante un mismo problema y, en resumen, proporcionar una base para la comunicación científica y para evidenciar de forma objetiva la eficacia de los tratamientos. Las escalas de valoración funcional contemplan aquellos aspectos objetivables por un agente externo y, por tanto, excluyen los aspectos subjetivos y van a requerir siempre un evaluador. Las actividades de la vida diaria (AVD) fueron el primer parámetro funcional de la rehabilitación médica ampliamente aceptado y reconocido, siendo una categoría del Index Medicus desde 1968. Constituye un fenómeno unitario válido, si bien, el concepto surgió a partir del desarrollo general de escalas y no de una estructura teórica. Su validez se apoya en que se crearon en respuesta a unas necesidades clínicas. Las AVD se definen como aquellas funciones físicas básicas, diarias y rutinarias, necesarias para vivir. En ellas se incluyen las actividades de cuidado personal tales como el vestido, baño, aseo personal, uso del retrete, transferencias, alimentación, continencia, movilidad en interiores [Bruett et al, 1968; Donaldson et al, 1973; Barer et al, 1990]. Aunque existe acuerdo general en lo que constituye el núcleo central de las AVD, existen variaciones en las actividades incluidas en diferentes escalas y algunas excluyen la continencia [Schoening et al, 1965] o la movilidad [Katz et al, 1963]. Entre las escalas más utilizadas y conocidas de valoración de las AVD básicas (AbVD), se encuentran el Index of Independence in Activities of Daily Living [Katz et al,1963], The Barthel Index [Mahoney, Barthel, 1965] y The Kenny Self-Care Evaluation [Schoening et al, 1965; Schoening, Iversen, 1968]. Estas 3 escalas cumplen los requisitos señalados por Donalson [1973] para las escalas de AVD que permiten una evaluación objetiva y facilitan la 22 comunicación entre los profesionales (disponer de un sistema de puntuación, emplearse en revisiones o trabajos de investigación y ser aplicables a la población general de rehabilitación). Con el paso del tiempo estas 3 escalas han seguido estando entre las más utilizadas y varios estudios han confirmado su validez y han profundizado en sus propiedades [Granger et al, 1989; Branch et al, 1984; Gresham et al, 1980; Iversen et al, 1973]. Una de las limitaciones de las AbVD es su escasa sensibilidad para detectar pequeños cambios clínicos. Para abordar este problema se desarrollaron las escalas de AVD instrumentales (AiVD), que incluyen actividades más complejas y difíciles de categorizar y clasificar [Barer et al, 1990; Lawton, Brody, 1969; Lawton, 1971]. En ellas se incluyen actividades más complejas que las que se necesitan para el cuidado personal, ampliando a actividades que valoran la capacidad del sujeto para vivir independiente en su casa y en la comunidad, incluyendo aspectos como la preparación de la comida, el cuidado del hogar, el lavado de ropa, la capacidad para usar el teléfono, el uso del transporte público, la responsabilidad con el uso de la medicación y el manejo del dinero, así como el cuidado de niños y la movilidad fuera del hogar. Para las AiVD existe menos consenso que para las AbVD debido a que su ejecución puede estar influida por la motivación, factores sociales, culturales y barreras arquitectónicas. Entre las escalas de valoración de AiVD más utilizadas se encuentran The PULSES Profile [Moskwitz et al, 1957] y The Physical Self-Maintenance Scale [Lawton, Brody, 1969]. Con frecuencia la capacidad para realizar las AVD se ha usado como sinónimo de función o rendimiento físico. Sin embargo las AVD son sólo una parte, aunque básica y fundamental de la función física global que, en general, es necesario lograr superar para poder participar en otros niveles más complejos de actividades personales y sociales [Katz et al, 1963]. Función es un término más amplio que en el contexto de la salud abarca 4 dimensiones del individuo: la física, mental, emocional y social [Jette, 1984]. Dentro de este contexto se han elaborado escalas de valoración funcional globales o mixtas que incluyen aspectos de la función física, de la comunicación, cognitivos, sociales y psicosociales. Entre las escalas más conocidas y utilizadas se encuentran The Functional Status Index [Jette, Denniston, 1978] y The Functional Independence Measure [Hamilton et al, 1987], ambas comentadas en el Anexo 1. Intentar conseguir instrumentos que aproximen una valoración de la globalidad de la función es lógico y deseable, pero su desarrollo es difícil, ya que 23 los distintos componentes no se pueden tratar ni medir por igual. Es relativamente fácil, ponerse de acuerdo en la definición de las actividades de autocuidado y movilidad, pero existe menos consenso en considerar la definición y medida de los componentes sociales, psicosociales y cognitivos en el contexto de la Rehabilitación [Labi y Gresham 1984]. Además, las escalas de valoración globales incluyen muchos aspectos sobre los que no es posible la intervención médica, por lo que gran parte de la información que proporcionan es de escasa utilidad práctica. Por ello se han ido desarrollando escalas de valoración funcional más especificas para patologías concretas. En la actualidad es posible encontrar una amplia lista de instrumentos diseñados para este fin y, en la práctica, no existen patologías relevantes en la especialidad de rehabilitación a las que no sean valorables mediante alguna escala. El avance tecnológico de la cirugía ha contribuido también al desarrollo de escalas de valoración funcional especificas de la técnica quirúrgica, que valoran de una forma fiable los resultados obtenidos tras la intervención. Este es el caso de las artroplastias, y más concretamente la artroplastia de rodilla, que en los últimos años ha visto el desarrollo de multitud de escalas de valoración elaboradas con criterios muy diversos. Las primeras escalas de valoración de rodilla fueron conceptualmente similares a los métodos de evaluación de cadera, como el Larson [1963] o el Hip Rating Systems de Harris [1969]. Algunos métodos de puntuación numérica fueron diseñados para comparar la rodilla protésica con el normal funcionamiento de rodilla. El desarrollo de métodos de valoración de artroplastia de rodilla ha sufrido muchas dificultades por la discrepancia entre los cirujanos ortopédicos sobre las variables que deben ser valoradas y cuales deben ser puntuadas [Drake et al, 1994]. Gartland [1988] sugirió que los estudios clínicos debían estar más orientados a los resultados en términos de salud que al procedimiento o técnica quirúrgica. La falta de acuerdo ha dado lugar a una variedad de instrumentos y una confusión en cual es el más apropiado que, en parte, se debe a las diversas perspectivas implicadas, ya que la capacidad para poder comparar a través de estudios sobre PTR puede servir: a) a los médicos y los pacientes que necesitan comparar riesgos y beneficios de la artroplastia con otras opciones quirúrgicas y no quirúrgicas; b) el procedimiento es utilizado en un grupo heterogéneo de pacientes, y médicos y pacientes necesitan conocer el impacto de la intervención sobre las características clínicas de los pacientes; y c) la prótesis de rodilla no solo involucra a la investigación clínica sino a la tecnológica, el diseño de nuevas prótesis o de nuevas técnicas quirúrgicas necesita de sistemas de valoración que puedan compararlas con las ya existentes. 24 Kettlekamp y Thomson [1975] establecieron los criterios de un sistema uniforme de valoración: medición de las características más importantes de la rodilla; evitar la asignación arbitraria de valores en la puntuación; ofrecer una puntuación total derivada de los resultados clínicos medidos por la escala; y usar variables clínicas simples que puedan ser fácilmente cuantificables. Pese a ello, los investigadores no se han puesto de acuerdo en el diseño y utilización de una escala de valoración única, encontrando en la literatura una gran variedad de escalas; en algunas de ellas las variables son expresadas -en algunos casos por separado y en otros conjuntamente- en términos descriptivos como excelente, bueno, regular, malo o satisfactorio, insatisfactorio, y la valoración final puede efectuarse en términos similares (sistemas descriptivos). Alternativamente cada variable puede ser medida en un sistema numérico de puntuación y expresada bien por separado o bien agregadas como una suma total. Las variables medidas en la mayoría de las escalas incluyen síntomas (casi siempre dolor), signos físicos (preferentemente movilidad y estabilidad) y/o diversos parámetros funcionales. En general, el dolor es el síntoma clave, ya que este suele ser el motivo de la intervención, pero hay una amplia variación entre ellas, en el grado de importancia. Se suele medir mediante escalas descriptivas ordinales del tipo “intenso”, “moderado”, “ligero”, “nulo”. Las escalas analógicas visuales, más precisas ya que pueden recoger cambios mínimos, no se hallan sin embargo entre las escalas más empleadas en la prótesis de rodilla. La movilidad es el signo exploratorio que recogen casi todas las escalas. La estabilidad también suele tener una consideración elevada, aunque en menor cuantía. La actividad funcional se evalúa estimando la habilidad del paciente para realizar las tareas habituales que exigen demandas sobre la rodilla. Aunque no existe unanimidad en las variables escogidas para valorar la función, casi siempre se recoge distancia o tiempo de marcha, subir y bajar escaleras, capacidad para incorporarse de una silla y el empleo de ayudas de marcha. Una puntuación simple, aunque luego se traduzca a un resultado descriptivo, puede resultar engañosa ya que cuanto mayor número de parámetros se valoren en la escala, más fácil es obtener puntuaciones similares en rodillas distintas. Además las diferentes variables no tienen igual relevancia para los pacientes y por otro lado una movilidad completa sería inútil si el dolor impide el apoyo. Ante estas limitaciones y la diversidad de criterios en la elaboración de escalas, no todas han sido aceptadas ni aplicadas en los trabajos de investigación. Asumiendo estas limitaciones, en el Anexo 1 se realiza una descrip25 ción de los sistemas de valoración de resultados funcionales en PTR más referenciados en la bibliografía en los últimos 30 años, entre los que se encuentra la escala del Hospital for Special Surgery (HSS) que ha sido la más utilizada siguiendo a muy poca distancia la escala desarrollada por la Sociedad Americana de Rodilla, denominada The Knee Society Score (KSS), que se ha incorporado con mucha fuerza en los trabajos de investigación de los últimos 10 años, encontrando en la actualidad un número semejante trabajos que utilizan el KSS y HSS. Estos datos son semejantes a los encontrados por Drake et al [1994] en un estudio sobre sistemas de valoración utilizados en artroplastia de rodilla entre los años 1972 y 1992. Según estos autores el sistema de valoración más utilizado es el HSS con un 66% de los trabajos, seguido del KSS con un 7%; el número de enfermos que participaron en los trabajos revisados fue de 10.436 y 2.384 respectivamente. Si este estudio ampliara su ventana temporal hasta 1999, el número de estudios que utiliza el KSS estaría incrementado, ya que este último es de más reciente incorporación. Estos datos contrastan con los de Martín et al [2000], que situaba el Western Ontario and MacMaster Universities Osteoarthritis Index (WOMAC) como la escala más utilizada para prótesis total de cadera y de rodilla, discrepancia explicable por los diferentes periodos y estrategias de búsqueda (artroplastia de rodilla y cadera, selección ajustada a criterios preestablecidos de discapacidad de los pacientes y orientación hacia medidas de calidad de vida). Otras escalas utilizadas, aunque en menor medida, son la de la British Orthopaedic Association (BOA), y el diagrama del London Hospital and Lund University (diagrama de VENN). En la tabla 3 se muestran los trabajos más relevantes que han utilizado escalas de valoración funcional como medida de resultados de artroplastia de rodilla y que analizaban factores asociados al resultado final de la escala de valoración. La búsqueda fue realizada en Medline (años 1970-1999) con los descriptores “knee and society and systems”, “scoring and knee and arthroplasty”, “rating and knee and arthroplasty”, “knee and scoring and protheses”. 26 27 Cohorte prospectiva; n = 47. Cohorte prospectiva; n = 73. Transversal comunitario n = 1193. Cohorte prospectiva n = 379. Sharma L et al, 1996. Van Essen GJ et al, 1998. Hawker G et al, 1998. Smith BE et al, 1992. Heck DA et al, 1998. n = 109. Cohorte prospectiva n = 83 Cohorte prospectiva n = 72. Cohorte prospectiva n = 291. Lizaur A et al, 1997. Norman-Taylor FH et al 1996. n = 276. König A et al, 1997. Fortin PR et al, 1999. Tipo de estudio Meta-análisis de 130 estudios; n = 9879. Autores Callahan CM et al, 1994. 2 años. 2 años. 23,6 meses. 6 meses. 3 meses. 3 meses. 4,1 años (media). Seguimiento . HSS. SF-36; WOMAC BOA; Rosser Index Matrix. KSS. KSS. SF-36; WOMAC. KSS modificado; WOMAC. SF-36; Dinamómetro de isocinéticos Cibex. SF-36; KSS. Escala global de valoración de rodilla. Instrumentos En un periodo de dos años los pacientes obesos no se asocia a peores resultados con respecto a los no obesos. La mayor mejoría funcional SF36 se asoció a instituciones que realizaban 50 o más PTR por año. La mejor puntuación en salud mental se asocio a personas mayores, se había estabilizado del lig. cruzado posterior y tenían peor función preoperatoria. Menor nº de complicaciones se asoció a rodilla con más severa disfunción preoperatoria, con menos comorbilidad, cirujanos jóvenes con experiencia y PTR unilateral. El genero y la obesidad no fueron factores predictores de calidad de vida , pero la edad y la artroplastia fueron factores significativos sobre calidad de vida. Los factores predictores sobre el rango de movimiento post-artroplastia fue el rango de flexión preoperatorio y el peso corporal. Los factores predictores de los resultados de rodilla y función del KSS son el genero, la edad y la obesidad. Los pacientes con reducida función física y dolor intenso preoperatorio no alcanzaron la misma mejoría que los que tenían unas mejores condiciones preoperatoria. Malos resultados en dolor y función física se asociaron a cirugía previa en rodilla prostetizada; La obesidad, la edad y el sexo no se asociaron a peores resultados. Mejoría significativa de ambas puntuaciones del KSS; mejoría significativa en 6 de las 8 dimensiones del SF-36; Puntuaciones por debajo de la norma del SF-36 en algunas dimensiones del resultado final. Las variables psicosociales son los factores que más predicen el resultado final seguido de la función física previa. El 89,3% de los pacientes obtuvieron resultados excelentes o buenos. El tipo de prótesis y la patología previa de rodilla fueron factores predictivos de los resultados. Resultados Tabla 3. Trabajos más relevantes que utilizan escalas de valoración Tratamiento Prótesis total de rodilla. Prótesis total de rodilla y Prótesis total de cadera. Prótesis total de rodilla. Prótesis total de rodilla. Prótesis total de rodilla. Prótesis total de rodilla y Prótesis total de cadera. Prótesis total de rodilla. Prótesis total de Rodilla. Prótesis total de Rodilla. Prótesis total de Rodilla. La medición de la calidad de vida relacionada con la salud Si el concepto de estado funcional se centraba en el grado en el que un individuo es capaz de realizar las actividades habituales sin limitaciones físicas valorado por alguien externo al paciente y con criterios objetivables [Bowling A, 1992], desde otras perspectivas se intentaba ampliar la valoración incorporando una serie de componentes entre los que destacaba la percepción subjetiva -del paciente- del impacto de la enfermedad sobre su vida [Holmes et al, 1987; Spitzer, 1987; Wiklund et al, 1991], aspecto que requería un enfoque multidimensional, mas allá de la función, y requería valorar la relación con los cuidados de salud [Fletcher et al, 1987]. Este último aspecto es trascendente porque en muchos contextos el término calidad de vida era excesivamente abstracto, y las aproximaciones útiles en el contexto de la atención médica se concentran en la experiencia vital de las personas relacionada con la salud y la asistencia sanitaria (aspecto que es descrito con mucha mayor exactitud por el término calidad de vida relacionada con la salud (CVRS; health related quality of life –HRQoL– en la literatura anglosajona). La calidad de vida relacionada con la salud es, pues, un concepto diferente al de calidad de vida en general, que se refiere a los aspectos de calidad de vida y función, sobre los que el estado de salud tiene un mayor impacto. Se trata, en todo caso, de un concepto no unitario y difícilmente abordable desde una perspectiva unidimensional, que varía con el enfoque que se aplica a la medición. El concepto de calidad de vida en las ciencias de la salud, surgió a partir de discusiones conceptuales intentando definir, en términos científicamente analizables y operativizables, los efectos funcionales de una determinada enfermedad y/o de su tratamiento. El concepto de calidad de vida, desde esta perspectiva, era frecuentemente utilizado indistintamente del concepto de salud y del de estado funcional, lo que producía una importante confusión a la hora de su conceptualización y operativización, confusión incrementada porque los pioneros en este campo de investigación provenían de diversas disciplinas (filosofía, psicometría, economía y sociología, además de la propia medicina) que utilizaban diferentes terminologías y por que inicialmente, y a falta de auténticos instrumentos de medición de calidad de vida, muchos autores utilizaron los instrumentos de medición de estado funcional –en especial los índices de actividades de la vida diaria- bajo la etiqueta de calidad de vida. La calidad de vida ha sido definida de múltiples formas y, de hecho, tiene significados diferentes para personas diferentes, tratándose de un concepto com28 plejo y amplio, que incluye no sólo la percepción personal de bienestar, sino multitud de factores físicos, mentales y sociales. Estas diversas formas de definir la CV se mueven desde las más vagas (“lo que cada individuo define que es”, “la capacidad para llevar una vida normal”) a otras mas conceptuales y enfocadas a enfatizar el cumplimiento de los objetivos personales, como la definición de la Organización Mundial de la Salud (The individuals’ perceptions of their position in life, in the context of the cultural and value systems in which they live and in relation to their goals, expectations, standards and concerns) o las de autores ya clásicos como Spitzer [1987] o Wiklund [1987] que enfatizaban la capacidad de las personas para desempeñar adecuadamente y con autosatisfacción su papel en las áreas familiar, laboral y social. Aplicaciones de la calidad de vida relacionada con la salud La medición de la CVRS puede ser útil en diversas formas (tabla 4). Por ejemplo, los instrumentos de medición de CVRS han demostrado una importante superioridad sobre las medidas reumatológicas convencionales para la predicción de resultados a largo plazo (morbilidad y mortalidad) en la artritis reumatoide [Wolfe, Cathey, 1991; Leigh, Fries, 1991]. También pueden ser utilizadas para identificar grupos de pacientes que requieren una especial atención, para cribaje de problemas psicosociales, para monitorizar la recuperación de los pacientes, especialmente en enfermedades crónicas o para ayudar a la elección de tratamientos. Diversos trabajos han mostrado que los juicios de médicos y pacientes sobre calidad de vida discrepan ostensiblemente y que la medición sistemática de CVRS puede mejorar las valoraciones médicas [Slevin et al, 1988; Pearlman, Uhlmann, 1988]. Aunque se ha señalado que, pese a que los clínicos encuentran útil e informativa la información sobre calidad de vida, esta no altera substancialmente las decisiones clínicas, ni los resultados a corto plazo [Rubenstein et al, 1989; Kazis et al, 1990]. Esta discordancia es atribuida a que parte de los datos sobre calidad de vida son inadecuados para la toma de decisiones médicas y, sobre todo, a la no disponibilidad en tiempo de esta información por los clínicos [Fitzpatrick et al, 1992]. Tabla 4. Aplicaciones de las medidas de calidad de vida relacionada con la salud Detección y monitorización de problemas psicosociales en pacientes individuales. Encuestas poblacionales de problemas de salud percibidos. Audit médico. Medición de resultados (efectividad) de la asistencia sanitaria. Medición de resultados (eficacia) en ensayos clínicos. Medida de resultado (eficiencia) en evaluación económica: análisis coste-utilidad. 29 Los instrumentos de medición de CVRS han sido también utilizados en encuestas poblacionales de salud, ya que pueden identificar aspectos subjetivos de los problemas de salud no detectables por las medidas epidemiológicas convencionales [Hunt et al, 1985], aunque todavía no es obvio en que medida esta información será útil para mejorar la salud de la población [Frankel, 1991]. En investigación en servicios de salud, sin embargo, la CV se ha convertido en una importante medida de resultado [Ware et al, 1987] y se ha señalado la importancia de su incorporación al audit médico [Frater, Costain, 1992]. Aunque sobre este aspecto existen diversas experiencias positivas que han permitido integrar las valoraciones rutinarias de calidad de vida en una forma sencilla y accesible a los clínicos [Bardsley, Coles, 1992; Wasson et al, 1992; Lanski et al, 1992], aun faltan esfuerzos importantes respecto a como integrar esta información en las rutinas médicas y quirúrgicas y sobre como distribuir esta información de una forma inteligible en el escaso tiempo de que suelen disponer los clínicos [Fitzpatrick et al, 1992]. Los ensayos clínicos han sido, hasta la fecha, la aplicación más difundida y aceptada de las medidas de calidad de vida. Aquí, la medición de la CVRS proporciona una valiosísima información sobre la eficacia de las intervenciones, aunque no exenta de dificultades metodológicas y de interpretación [Aaronson, 1989; Cox et al, 1992; Fletcher et al, 1987; 1992]. La evaluación económica es, por contra, la más controvertida de las aplicaciones de las medidas de calidad de vida. Aquí, la CVRS -junto a la supervivencia, en forma de años de vida ajustados por calidad (Quality Adjusted Life Year, QALY)- se convierte en la unidad de beneficio de las alternativas a evaluar y tiene fuertes implicaciones en la distribución de recursos. Dimensiones de la calidad de vida Aunque el concepto de calidad de vida es inherentemente subjetivo y su definición puede variar en distintos contextos, su consideración como un concepto multidimensional obliga a identificar las dimensiones que lo integran. Probablemente, los mayores problemas en la medición de la CVRS radican en qué medir, qué peso otorgar a cada componente y como limitar la valoración -dentro del concepto de CVRS- a los dominios que se encuentran afectados por la salud [Aaronson, 1991]. Las grandes dimensiones de la CVRS venían ya propuestas en la clásica definición de salud de la Organización Mundial de la Salud (OMS), referidas a las dimensiones física, mental y social [Shipper y Levitt, 1985], pero 30 estos términos tan genéricos requieren su operativización en distintas subdimensiones. Las primeras medidas de calidad de vida -por su proximidad, cuando no confusión, con las medidas de estado de salud y capacidad funcional, y desde una orientación estrictamente clínica- enfatizaron los componentes relacionados con la funcionalidad física. Evolutivamente, sin embargo, se observa una tendencia a incluir un mayor número de dimensiones pertenecientes a la vida psicológica y social, y a definir con una mayor especificación los dominios que conforman cada una de las principales dimensiones, perfilando con mayor detalle cada una de las sub-áreas que componen la calidad de vida. En los trabajos actuales existe un considerable consenso para incluir -como mínimo- dimensiones que recojan la experiencia biológica (funcional y de la enfermedad), psicológica, interpersonal, social y económica [Fletcher et al, 1987; Wenger et al, 1984; Wenger, 1989]. Incluso, algunos instrumentos, como el Schedule for the Evaluation of Individual Quality of Life, permiten a los pacientes especificar las dimensiones que mayor impacto tienen en su CV, metodología que maximiza la relevancia individual de las mediciones, aunque no sin problemas, especialmente cuando se desea comprar los resultados con otros grupos de individuos. Las dimensiones de mayor interés podrían describirse como: Función física.- Similar al concepto de capacidad funcional, resulta la dimensión mas cercana a los medidas clínicas tradicionalmente usadas en medicina. Se refiere a la energía, fuerza, y capacidad para llevar una actividad normal. Presentan una buena correlación con las estimaciones médicas sobre la función y bienestar que tiene el paciente [Shipper et al, 1984]. La función física contempla fundamentalmente dos dominios: 1) La capacidad para las actividades de la vida diaria, como las restricciones del movimiento corporal (andar, inclinarse, subir/bajar escaleras), limitaciones en la movilidad (permanencia en cama), o interferencia con las actividades de autocuidado (bañarse, vestirse, o comer); y 2) La capacidad para el esfuerzo, o energía o actividad positiva, se refiere a la ejecución de actividades vigorosas o a la realización de esfuerzos sin manifestar excesiva fatiga, y está siendo cada vez más utilizado en la evaluación de la calidad de vida [Patrick, Bergner, 1990]. Función psicológica.- La función psicológica se refiere a indicadores cognitivos y afectivos. Para los últimos, se utilizan los dominios del bienestar subjetivo tales como felicidad, satisfacción con la vida y afecto positivo, mientras que los indicadores cognitivos se dirigen a aspectos relacionados 31 con el pensamiento, la atención, confusión o deterioro para pensar y concentrarse. Ambos componentes, afectivo y cognitivo, participan en los juicios que se hacen sobre la propia calidad de vida, y están significativamente influidos por el proceso de la enfermedad y el tratamiento [Lazarus, 1982; Hyland et al, 1994]. La función afectiva, referida al distrés psicológico, ha producido el desarrollo de numerosas escalas orientadas sobre todo a la evaluación de la depresión y ansiedad. A partir de los estudios realizados se desprende lo que parece ser un patrón natural derivado del estado emocional que acompaña al diagnóstico y a la incertidumbre sobre el tratamiento y el pronóstico [Lasry et al, 1987; Morris, Sherwood, 1987; Walker, Rosser, 1993]. La función cognitiva es también considerada un importante componente del bienestar psicológico, ya que la memoria y la capacidad para llevar a cabo tareas intelectuales tienen una gran importancia para las personas, y su pérdida o deterioro produce un gran distrés psicológico. Existen numerosas escalas para evaluar el funcionamiento intelectual, y de ellas se obtienen los ítem sobre el curso del pensamiento, la atención y la concentración para incluirlos en las medidas de calidad de vida [Bergner et al, 1976; Chambers 1988], aunque en muchos casos relacionados con otros componentes psicosociales [Bergner et al, 1981; Charlton et al, 1983]. Interacción y función social.- Se refiere a la capacidad para llevar a cabo las interacciones personales que forman el núcleo de la vida social. Estas interacciones están tradicionalmente estructuradas en una forma jerárquica: familia, amigos, compañeros y comunidad. Constituyen un parámetro muy estimado en la evaluación de la calidad de vida al proporcionar un importante apoyo psicosocial al individuo, y al influir sobre el restablecimiento de la enfermedad y la supervivencia [Kasl, 1983]. La función social es entendida como componente y determinante de la calidad de vida de la persona. Incluye las limitaciones en los roles sociales habituales, integración social, contacto social e intimidad. Las limitaciones en los roles habituales son evaluadas en relación a la actividad mas importante de la persona, incluyendo el trabajo y las tareas domésticas. Sensaciones somáticas, limitaciones y alteraciones.- Reúne las características de orden fisiológico derivadas de la enfermedad y/o tratamiento. En general se consideran los síntomas o molestias referenciadas por el paciente, las sensaciones displacenteras que pueden disminuir la calidad de vida de un individuo, como el dolor, náuseas y disnea entre otros. También se incluyen los signos obtenidos de la exploración clínica, los resultados o medidas fisiológicas provenientes de pruebas diagnósticas, y el diagnósti32 co y estado funcional de la enfermedad. Resultan el dominio de carácter más objetivo, y suelen ser fundamentales en los instrumentos de calidad de vida diseñados para enfermedades específicas. Percepciones de salud.- Basadas fundamentalmente en autoinformes de percepciones generales de salud, incluyen las evaluaciones que el individuo hace de los efectos que tiene su salud sobre otros aspectos de la vida. Por otra parte, la salud percibida puede también ser un indicador del valor que tienen los cuidados médicos en el restablecimiento del paciente, y puede utilizarse como predictor de la mortalidad [Mossey, Saphiro, 1982]. En esta dimensión se incluye también la -satisfacción con la salud- derivada de las actividades, relaciones y estados de ánimo con los que los pacientes se comportan, toman decisiones, se comunican con los profesionales, siguen el tratamiento prescrito y aceptan lo inevitable. Pese a la importancia de la conceptualización de las dimensiones incluidas en cada instrumento de medición, en la actualidad sigue sin existir uniformidad en la cantidad, significados, e importancia con la que contribuyen en la calidad de vida. Por otra parte, la influencia de valores socioculturales en la calidad de vida percibida, tal como han indicado repetidamente los antropólogos [Kleinman et al, 1978] corrobora la necesidad de utilizar componentes acordes al contexto a evaluar. En la tabla 5 se muestran algunos de los instrumentos de medición de la calidad de vida más conocidos, con detalle de las dimensiones que analizan. Tabla 5. Dimensiones valoradas por instrumentos seleccionados de medición de calidad de vida Dimensión Física Psicológica Dominio AVD y esfuerzo Síntomas psíquicos Nivel vida Familia Rol social Ocio creatividad Trabajo Bienestar autopercid. SI SI SI SI SI --- --------SI SI SI ----------- ----SI SI ----- SI SI SI SI SI --- SI --SI ------- SI --SI SI SI --- SI SI SI SI --SI Sickness Impact Profile Nottingham Health Profile MOS Short Form 36 QoL Index Quality of Well-Being Scale General Health Questionn. Interacción y función social Autopercep La mayor parte de los expertos en CV están de acuerdo en la multiplicidad de dimensiones de la CV, y en que el constructo CV es multidimensional, pero hay menos acuerdo sobre el papel que deberían jugar las preferencias y percepciones subjetivas en la medición de CV. Jenkins [1992] señaló que debería evitarse la confusión entre las medidas subjetivas, como las expectativas y los deseos personales, con los indicadores más objetivos de CV. 33 Esta posición es discutida por otros expertos, que argumentan que el sistema de creencias personal es un todo único e íntimamente vinculado en sus partes. Otros autores han optado por sustituir el término “subjetivo” por “evaluativo”. Las medidas objetivas se referirían a aquellos ítem que identifican experiencias observables en la vida de las personas y las medidas evaluativas serían aquellas que intentan medir la valoración realizada por el propio individuo del impacto de la enfermedad en sus funciones físicas, sociales, emocionales o de satisfacción. Instrumentos de medición de calidad de vida Los instrumentos de medida de la CVRS pueden clasificarse según diferentes criterios como el tipo de población a la que se dirige, los dominios y/o conceptos que cubren, el sistema de puntuación bajo el que refleja el nivel individual y/o global de los componentes y algún otro. No obstante, para diferenciar el conjunto de medidas que incluyen diversos aspectos relacionados con la calidad de vida, el criterio más utilizado es el que se refiere a su aplicación general (a diferentes poblaciones) frente a la específica (enfermedades concretas), conocida comúnmente como instrumentos genéricos e instrumentos específicos. El propósito de los instrumentos genéricos es ser aplicables a una gran variedad de poblaciones. Se dividen en dos clases: perfiles e índices o medidas de utilidad. Los perfiles de salud miden diferentes aspectos de la calidad de vida con un sistema de puntuación común, que puede corresponder a un número reducido de ítem (los que conforman una dimensión), o bien permiten obtener una puntuación global a partir de la suma de valores alcanzados en cada dimensión. Aunque cada perfil trata de reunir todos los aspectos relevantes de la calidad de vida, la importancia y en consecuencia el número de ítem en cada dominio es bastante diferente. Así, existen instrumentos que exploran las dimensiones físicas, emocionales y sociales de modo equitativo [Chambers, 1988], mientras otros cargan sobre algún dominio un número mayor de ítem, enfatizando con ello su valoración [Padilla et al, 1983; Shipper et al, 1984; Bergner et al, 1981; Priestman et al, 1976; Selby, 1985; Stewart et al, 1988; Guyatt et al, 1987]. Como principales ventajas, los perfiles aportan estudios de fiabilidad y validez bien establecidos, con frecuencia dirigidos a distintas poblaciones. Para propósitos discriminativos, se puede examinar y determinar el área de disfunción que afecta a un individuo o grupo. La identificación de estas áreas permite, a su vez, guiar la elaboración de instrumentos específicos y orien34 tar la intervención clínica hacia las áreas que produzcan un mayor impacto en la calidad de vida. Cuando se aplican con propósitos evaluativos también permiten determinar los efectos de la intervención sobre diferentes aspectos de la calidad de vida sin necesidad de aplicar múltiples instrumentos. Por otra parte, dada su amplia aplicabilidad, facilitan la realización de estudios comparativos en distintas poblaciones. Por último, aquellos que proporcionan una puntuación global, pueden utilizarse en los análisis de coste-beneficio sobre las intervenciones clínicas. Entre las desventajas, la más común es que pueden focalizar su atención hacia ciertos aspectos de la calidad de vida que no sean los que más interesan al objetivo de un determinado estudio, perdiendo sensibilidad cuando se aplican a poblaciones con enfermedades específicas [Deyo, Centor, 1986]. Los índices son medidas derivadas de la teoría económica de la utilidad. La calidad de vida es medida de modo holístico con un simple número que representa el valor en un continuo, generalmente de 0 (muerte o peor situación posible) a 1 (salud completa). Para su aplicación en estudios clínicos, existen dos aproximaciones fundamentales. La primera pregunta al paciente sobre sus funciones y, en base a sus respuestas, lo clasifica en una determinada categoría que esta asociada a un beneficio o utilidad previamente establecido en otros grupos. Este enfoque caracteriza a los instrumentos conocidos como Escalas de la Calidad del Bienestar [Kaplan et al, 1982]. La segunda aproximación es la que recoge en un simple número todos los valores obtenidos en los diferentes aspectos de la calidad de vida [Torrance, 1987]. La mayor ventaja de estas medidas es su adecuación a los análisis coste-utilidad. En ellos, se relaciona el coste de una intervención con los años de vida ajustados por calidad (Quality Adjusted Life Year, QALY) que puede proporcionar, ofreciendo una base en la que fundamentar la distribución de recursos para los programas de salud. De ahí su importancia y el interés que tienen para los administradores y gestores de cuidados de salud. Estas medidas también tienen sus limitaciones. El beneficio puede variar en función de como fueron obtenidas, y se cuestiona la validez que tiene una simple medida agregada [Guyatt, Jaeschke, 1990]. Por otra parte, este tipo de medidas no permiten que el investigador determine que aspectos de la calidad de vida son responsables de los cambios en el beneficio. Por último, pueden ofrecer menor sensibilidad que los perfiles para detectar los pequeños cambios clínicos, pero importantes en la calidad de vida del individuo. Otra alternativa en la medida de la calidad de vida es focalizar sobre aspectos que se consideren relevantes para un determinado problema de salud y aumen35 tar la sensibilidad del instrumento sobre esa enfermedad en concreto. Este es el objetivo de los instrumentos específicos que pueden partir de una relación previamente establecida, o bien centrarse en los problemas que refiere el individuo [Guyatt et al, 1993]. La especificidad de un instrumento puede referirse a un tipo de enfermedad (dirigido a patologías oncológicas, cardiacas o respiratorias), pero también puede orientarse a una determinada población (como los diseñados para evaluar la calidad de vida de los ancianos que presentan una gran variedad de problemas), a una función en especial (cuestionarios que examinan la función emocional o sexual), o bien ser específicos de una condición o problema común para diferentes enfermedades (por ejemplo, el dolor). De todas estas aproximaciones, la que ha motivado un mayor desarrollo de instrumentos es la dirigida a medidas específicas de enfermedad. Los ítem de los instrumentos pueden construirse para reflejar un -simple estado- (¿se siente cansado?: mucho, algo, nada), o una -transición- (¿cómo se encuentra de cansado?: mejor, igual, peor). Con fines discriminativos se suele determinar la extensión de un síntoma primario -por ejemplo, la disnea- en relación con la magnitud de una alteración fisiológica como la capacidad funcional [Guyatt et al, 1987]. Con fines evaluativos se puede establecer el impacto de una intervención sobre un área de disfunción y ayudar así a evidenciar el efecto de dicha intervención. Los instrumentos específicos han proporcionado una considerable utilidad en estudios clínicos [Aaronson et al, 1988; Guyatt et al, 1987; Wilson et al, 1991; Wiklund et al, 1992]. Sus mayores desventajas son la imposibilidad de utilizarlos en distintas condiciones para los que fueron diseñados, por lo que en algunas ocasiones se aplican junto a otro genérico. Entre las medidas específicas cabe incluir un numeroso grupo de instrumentos desarrollados con el propósito de evaluar específicamente una enfermedad y/o sus alternativas de tratamiento, y cuyo objetivo es reunir con mayor detalle y precisión los requerimientos de una enfermedad concreta, y ajustarse así a las características particulares tanto de su evolución como de sus alternativas de tratamiento, que es donde pueden resultar insuficientes los instrumentos genéricos. En la práctica, sin embargo, se observa una mayor utilización de las medidas globales aunque se trate de evaluar la calidad de vida en enfermedades particulares, y en escasas ocasiones puede acompañarse de otro cuestionario específico de la enfermedad a estudiar. Las medidas específicas se dirigen fundamentalmente a enfermedades crónicas y se focalizan a los síntomas estrechamente relacionados con la patología y/o tratamiento específico, y sus consecuencias sobre otras dimensiones de la calidad de vida. Tienen como objetivo primordial evaluar el estado del pacien36 te en base a los cambios producidos por la evolución de la enfermedad y/o tratamiento,así como ayudar al pronóstico. En la actualidad es posible encontrar una amplia lista de instrumentos diseñados para este fin [Berzon et al, 1995], pero la mayoría de ellos, bien por su limitación a una determinada patología, bien por sus escasas propiedades psicométricas, han sido aplicados en un reducido número de estudios. Selección de instrumentos de medición de calidad de vida En la aplicación de medidas de la calidad de vida, también existen unas consideraciones de tipo práctico a tener en cuenta para su adecuada selección y/o desarrollo. La elección de una medida de calidad de vida relacionada con la salud depende, sobre todo, del propósito del estudio [Deyo, Centor, 1986]. Las medidas genéricas pueden ser particularmente útiles en los estudios que intentan describir el rango de discapacidad de una población general o de un grupo de pacientes valorando un amplio espectro de componentes de la calidad de vida. En aquellas situaciones que ya se conoce la relevancia del problema, las medidas genéricas pueden proporcionar una información complementaria sobre los efectos que tiene el tratamiento en la calidad de vida y ayudar a detectar experiencias adversas que no han sido consideradas previamente. Por otra parte, cuando se pretende estudiar la eficacia de un nuevo tratamiento, las medidas específicas resultan más eficaces por su mayor sensibilidad. Si bien es cierto que también puede utilizarse una batería de diferentes medidas específicas para distintos aspectos, este enfoque presenta dificultades en la interpretación cuando se realizan comparaciones múltiples con sistemas de puntuación distintos. Igualmente, hay que tener en cuenta la aceptabilidad, entendida como la facilidad con la que un instrumento puede ser utilizado, y que comprende: a) la longitud del instrumento, y el impacto que tiene sobre otras medidas empleadas en el estudio, b) el coste que supone su administración y evaluación en términos de recursos necesarios (entrevistadores, colección de datos, análisis, etc.), c) el alcance que ha tenido en experiencias previas (por ejemplo, si ha sido aplicado en el mismo tipo de situación clínica), d) los problemas de aplicación, como la tasa de respuesta obtenida, la prevalencia de “missings”, los problemas de comprensión a los ítem, etc. que puedan afectar al estudio, 37 e) la carga para el entrevistado, en base al tiempo, al distres psicológico que puede suponer su cumplimentación o, como sucede en los pacientes críticos, a la propia capacidad de respuesta del paciente. La duración puede variar en función de la extensión y complejidad del cuestionario, y de las características personales del sujeto, tales como la edad, el nivel de estudios y el estado de salud. Los ancianos y los que toman medicación que les afecta a la memoria o cognición requieren más tiempo [Patrick, Erickson, 1993]. Los cuestionarios de calidad de vida relacionada con la salud pueden ser administrados a través de las siguientes formas: a) observación directa, b) entrevista personal, c) entrevista telefónica, d) autoadministrado, y e) a través de personas delegadas. Salvo algunas medidas de capacidad funcional diseñadas para obtener la información mediante la observación directa, en general los instrumentos de medida de calidad de vida se desarrollan para poder ser autoadministrados y/o administrados mediante entrevista. Con la observación directa un observador entrenado es capaz de obtener información de un paciente. La forma más común es a través de una lista de actividades de la vida diaria [Katz, Akpom, 1976; Mahoney, Barthel, 1965]. Fundamentalmente se usa para restricciones de actividad y autocuidados, pero es limitada para otros componentes de la calidad de vida que precisan de la autopercepción. La entrevista personal puede utilizarse para administrar cuestionarios estructurados, respuestas abiertas o la combinación de ambas. Se requiere entrenamiento del entrevistador en función de la complejidad del cuestionario. Aunque resulta más caro, obtiene mayor compromiso en la cumplimentación del cuestionario, y reduce el número de respuestas ausentes (missings) y errores. La entrevista telefónica es más barata que la entrevista personal, pero disminuye la tasa de respuesta y cuando éstas se presentan en una escala con diferentes alternativas, el dictado telefónico puede resultar confuso para el entrevistado. La autoadministración incluye el envío por correo. Es el método más económico de coleccionar datos, pero tiende a introducir muchos “missing” en las respuesta y a disminuir la tasa de las mismas. Es desaconsejable en sujetos con limitaciones cognitivas, culturales o de lenguaje, pero sin embargo es más fiable en cuestiones íntimas, dada la mayor facilidad de expresarlas en privado que frente a un entrevistador. Un método intermedio entre la entrevista personal y la autoadministración podría ser utilizar este último bajo supervisión. En algunas ocasiones, y en algún tipo de pacientes, pueden utilizarse personas delegadas para responder por el enfermo, que son en su mayoría los 38 familiares más próximos. En general, los estudios demuestran que la correspondencia entre las respuestas del paciente y la de los delegados varían en función del dominio a evaluar. Cuando se trata de dimensiones observables, tales como el funcionamiento físico y cognitivo, se obtienen altas correlaciones entre las respuestas de las personas delegadas y las del enfermo, aunque para limitaciones funcionales, los allegados tienden a considerar al paciente más incapacitado, es decir, sobrestiman la disfunción del paciente en relación a lo que él cree [Guyatt et al, 1993]. La medición de la calidad de vida en la artroplastia de rodilla Entre los instrumentos genéricos más utilizados para medir la calidad de vida tras artroplastia de rodilla se encuentra el Medical Outcomes Study ShortForm General Health Survey (MOS-SF 36) que es el más citado en la bibliografía, y el Nottingham Health Profile (NHP, Perfil de salud de Nottingham), algo menos utilizado que el anterior. Otros instrumentos utilizados en artroplastia de rodilla –aunque de forma mínima - son el Sickness Impact Profile (SIP, perfil de impacto de la enfermedad) y el McMASTER Health Index Questionnaire (MHIQ, Índice de salud McMaster). En el Anexo 1 se describen las principales características de estos instrumentos. El cuestionario MOS SF-36 dispone de valores poblacionales de referencia para España [Alonso J et al. 1998], que sirven para situar las puntuaciones de la población que se desea estudiar, con respecto a los valores normales en sus mismos tramos de edad y sexo. En la tabla 6 se muestran los valores de referencia de hombres y mujeres en el tramo de edad en el que se encuentran la mayoría de los pacientes intervenidos de artroplastia de rodilla, y que se utilizarán como parametros de referencia en este estudio. Este grupo de edad incluye a más del 75% de los pacientes intervenidos en cualquier estudio de la literatura revisada, salvo que hayan seleccionado alguna patología en concreto que varíe este rango de edad. Tabla 6. Valores poblacionales del MOS-SF 36 para los hombres y mujeres españoles entre 65 y 74 años SF-36 Varones Función Física Rol Funcional Rol Emocional Dolor Vitalidad Rol Social Salud Mental Salud General Md 80,0 100,0 100,0 100,0 65,0 100,0 80,0 60,0 P25 50,0 75,0 100,0 61,0 45,0 75,0 64,0 40,0 P75 90,0 100,0 100,0 100,0 80,0 100,0 92,0 77,0 SF-36 Mujeres Función Física Rol Funcional Rol Emocional Dolor Vitalidad Rol Social Salud Mental Salud General Md 65,0 100,0 100,0 61,0 50,0 92,4 68,0 45,0 P25 40,0 0,0 33,3 41,0 40,0 62,5 48,0 30,0 P75 85,0 100,0 100,0 100,0 70,0 100,0 80,0 67,0 39 Para identificar los trabajos que han utilizado índices de calidad de vida como medida de resultados en la artroplastia de rodilla y que analizaran factores asociados a los resultados de calidad de vida se realizó una búsqueda en Medline entre los años 1970-1999 usando los descriptores “knee and arthroplaty and quality of life”, “knee and arthroplaty and MOS–SF-36” y “knee and prostheses and quality of life”. Como puede verse (tabla 7), la mayoría de los trabajos utilizan además de medidas de calidad de vida alguna escala de valoración funcional. 40 41 Tipo de estudio Cohorte prospectiva n = 47 Cohorte prospectiva n = 73 Cohorte prospectiva N = 114 Cohorte prospectiva n = 243 Cohorte prospectiva n = 151 Cohorte observacional. n = 379 Estudio prospectivo n = 72 Cohorte prospectiva n = 291 Estudio Prospectivo n = 276 PTC n = 176 PTR Autores Sharma L et al 1996. Van Essen GJ et al, 1998. McGuigan F et al 1995. Ritter M et al, 1995. March LM et al, 1999. Fortin PR et al. 1999. Norman-Taylor FH, et al 1996. Heck DA et al, 1998. Rissanen P et al, 1996. 2 años 2 años 6 meses 12 meses 2 años 2 años 3 meses 3 meses Seguimiento NHP BOA Rosser Index Matrix SF-36 WOMAC SF-36 WOMAC SF-36 SF-36 SF-36 SF-36; Dinamómetro de Cibex SF-36 KSS Instrumentos Peores resultados preoperatorios mayor ganancia; Menor ganancia de CV a mayor edad en PTR, este factor no afecta en PTC; En PTC mejores resultados con mayor nivel educacional, este factor no afecta a las PTR La mayor mejoría funcional SF36 se asoció a instituciones que realizaban 50 o más PTR por año; la mejor puntuación en salud mental cuando se había estabilizado del lig. cruzado posterior y tenían peor función preoperatoria. Menor nº de complicaciones se asoció a rodilla con más severa disfunción preoperatoria, con menos comorbilidad, cirujanos jóvenes con experiencia y PTR unilateral. El genero y la obesidad no fueron factores predictores de calidad de vida , pero la edad y la artroplastia fueron factores significativos sobre calidad de vida. Los pacientes con reducida función física y dolor intenso preoperatorio no alcanzaron la misma mejoría que los que tenían unas mejores condiciones preoperatoria. Los pacientes de 65-74 años mejoraron significativamente en todas las dimensiones del SF-36 a excepción de salud general, siendo mayor a los 12 meses de seguimiento que la norma poblacional. La media de función física, rol funcional, dolor fueron significativamente más bajas que la norma. Mejorías significativas entre el preoperatorio y postoperatorio en todas las dimensiones del SF-36 excepto en salud general tanto en artroplastia de rodilla y de cadera especialmente en función y dolor. La puntuación preoperatoria, la edad y el sexo no se asocian a los resultados postoperatorios; los resultados de grupo no pueden ser usados para predecir resultados individuales; los hombres obtenían mejores resultados que las mujeres en 5 dimensiones del SF-36. Mejoría significativa de ambas puntuaciones del KSS; mejoría significativa en 6 de las 8 dimensiones del SF-36; Puntuaciones por debajo de la norma del SF-36 en algunas dimensiones del resultado final. Las variables psicosociales y la función física previa son los factores que mejor predicen el resultado final. Resultados Tabla 7. Trabajos más relevantes que utilizan índices de calidad de vida Tratamiento Prótesis total de rodilla. Prótesis total de cadera Prótesis total de Rodilla Prótesis total de rodilla. Prótesis total de cadera. Prótesis total de rodilla. Prótesis total de cadera. Prótesis total de rodilla. Prótesis total de cadera. Prótesis total de rodilla. Prótesis total de cadera. Prótesis total de rodilla Prótesis total de cadera. Prótesis total de Rodilla. Prótesis total de Rodilla. La medida de la satisfacción de los pacientes Durante los últimos 30 años, las empresas de bienes y servicios han estimulado la incorporación de las valoraciones de tales bienes y servicios por los “consumidores”, en parte por la adopción de las teorías de mejora de calidad de Deming [1982] y Juran [1964] que tenían como elemento central el recibir algún tipo de feed-back de los consumidores para identificar deficiencias y guiar los diseños de mejora. Este papel central se debe a que la satisfacción con el servicio ofrecido (o con el proveedor del servicio) captura un tipo de información –la valoración personal de los usuarios en relación con sus preferencias y expectativas- que no puede obtenerse mediante la observación externa y, por tanto, más allá de la información que pudiera obtener el proveedor utilizando instrumentos objetivos. En este nuevo clima cultural, las encuestas de satisfacción fueron pasando, en el entorno empresarial, desde una consideración de herramientas de marketing a ser medidas relevantes de la calidad de los servicios, y es con esta última intención que llegaron a los servicios de atención sanitaria, de la mano de Hulka [Hulka et al, 1970; 1971; 1975; 1982], Ware [Ware JE et al, 1973; Snyder MK, Ware JE, 1974; 1975; Doyle BJ, Ware JE, 1977] y Parasuraman [Parasuraman A et al, 1985; 1988; 1993; Berry LL et al, 1988; Zeithaml V et al, 1993]. Desde los trabajos iniciales de estos autores, tanto los sociólogos como los investigadores en servicios de salud han desarrollado diversas teorías y modelos para definir los “puntos de vista” de los pacientes sobre la atención que reciben [Linder-Pelz S, 1982; Calnam M, 1988; Donabedian A, 1988; Fitzpatrick R, 1991; Vuori H, 1991; Carr-Hill RA, 1992; Williams B, 1994], sin que todavía exista una definición aceptada y una clara conceptualización de la “satisfacción” de los pacientes [Ibern P, 1992]. Por ejemplo, LinderPelz [1982] definía la satisfacción de los pacientes como “las evaluaciones positivas de los individuos sobre las distintas dimensiones de la atención sanitaria” mientras que otros autores han criticado el énfasis en los aspectos positivos, señalando que las organizaciones sanitarias necesitan, sobre todo, saber lo que funciona “mal” antes que lo que funciona bien [Carr-Hill RA, 1992; Cleary PD, McNeil B, 1988; Cleary PD et al, 1991]. Una revisión de la literatura centrada en la satisfacción con la atención hospitalaria que incluía 112 publicaciones [Rubin HR, 1990], identificó una taxonomía de componentes en relación con la experiencia de los pacientes (tabla 8) cuya inclusión era extraordinariamente diferente entre los diferentes instrumentos. 42 Tabla 8. Taxonomía de las experiencias hospitalarias de los pacientes a partir de una revisión de la literatura Admisión Cuidados Duración Información Enfermería Médicos Comunicación Otros Hostelería Comodidades Comida Alta Información Aviso Planificación Proceso: Asistencia actividades básicas Disponibilidad y rapidez Comunicación Actitud y comportamiento Cuidados físicos Habilidades técnicas Comunicación Actitud y comportamiento Habilidades clínicas Habilidades personales Interacción y apoyo Volumen Disponibilidad Régimen de visitas y tratamiento Programación del servicio Organización del servicio, supervisión, clima, normas, … Actividades Amenidades: televisión, teléfono,… Cuartos de baño: limpieza, privacidad, acceso, Ruido, tranquilidad Limpieza Privacidad Comodidad de la cama Servicio Cantidad Régimen dietético del seguimiento Organización y duración Fuente: Rubín HR, 1990. Esta revisión mostraba, además, una enorme variabilidad en las formas de describir como estas experiencias eran valoradas en los diferentes estudios (excelente o pobre, satisfactoria o insatisfactoria, agradable o desagradable, disponibilidad o no a volver o recomendar el servicio, etc.), las tasas de respuesta, el coste y aceptabilidad para los posibles usuarios de las encuestas, la fiabilidad (recogida en un solo trabajo de los 112 revisados), las formas de evaluar la validez utilizadas –con grandes insuficiencias- y los posibles sesgos (no respuesta, forma de administración, tiempo desde el alta, formato de las respuestas, sesgo de contexto, respuestas por familiares). Esta situación de discrepancias en la definición y conceptualización de la satisfacción de los pacientes, junto a una gran difusión de las encuestas for43 mando parte de estrategias de marketing o mediáticas (las encuestas de satisfacción no son sólo un instrumento de investigación, sino que están completamente incorporadas a la gestión rutinaria de muchos centros y organizaciones sanitarias), ha propiciado la existencia de cientos –tal vez milesde instrumentos de medida de la satisfacción diferentes, cuya elección se basa más en la casualidad, la moda o aspectos coyunturales, que en el conocimiento de sus propiedades clinimétricas o la asunción de algún modelo conceptual definido. Estos aspectos son trascendentes, porque de ellos depende la utilidad de la medida de la satisfacción para la mejora de la calidad o como indicador de resultado (outcome) de la atención sanitaria. Junto a estos problemas, hay otras razones por las cuales los médicos evitan realizar estudios sobre las opiniones de los pacientes. Una creencia de que tales datos son débiles, en el sentido de que son subjetivos, mal considerados e influenciables. Ésta no es una buena razón e implica premisas falsas. Los estudios sobre las opiniones y las valoraciones de los pacientes dependen inevitablemente de una recogida de datos subjetiva. No obstante, los instrumentos para recoger tales datos deben ser evaluados con el mismo criterio que las técnicas de medición en medicina y cirugía, como son el juicio clínico o la evidencia radiológica. En este caso se muestran tan fiables como los instrumentos convencionales [Feinstein, 1977]. La preocupación de que los comentarios de los pacientes se basen en impresiones superficiales tienen un fundamento real. En algunas investigaciones, a causa de lo que los psicólogos llaman “efectos halo”, los pacientes permiten que los juicios de valor sobre la asistencia o sobre su calidad técnica se vean influidos por consideraciones muy diversas, en especial por sus percepciones de simpatía y el trato de los profesionales sanitarios [Ben Sira, 1980]. Sin embargo, muchos otros estudios han encontrado que los pacientes son capaces de enjuiciar claramente los distintos aspectos; por ejemplo, el valor del tratamiento comparado con la habilidad interpersonal del médico. El problema de los efectos halo pueden derivar más bien de una falta de precisión de los instrumentos de medición que las limitaciones del encuestado [Fitzpatrick R, Hopkins A, 1983]. Aproximaciones a la medición de la satisfacción de los pacientes Hulka conceptualizó su aproximación a la medición de la satisfacción de los pacientes como una medida de resultado, fundamentalmente dirigida a comprender las actitudes hacia el sistema sanitario en diferentes segmentos de población [Hulka et al, 1970; 1982]. En este sentido, Hulka valora44 ba que la satisfacción de los pacientes debía valorarse como un resultado per se de la atención sanitaria que, adicionalmente, influiría en la utilización y conducta de los pacientes (adherencia a los tratamientos, fundamentalmente). Ware, sin embargo, considera la satisfacción como una evaluación personal –subjetiva- de los servicios sanitarios y de los proveedores. Ware, aunque reconoce que un nivel determinado de satisfacción aporta información desde el punto de vista de las preferencias del paciente, enlazando de este modo con la perspectiva del marketing, no transforma la definición y medida de la satisfacción en un análisis de gaps, sino en una aproximación a la calidad de los procesos de un sistema sanitario concreto. Desde el campo del marketing de servicios se ha analizado las diferencias (gaps) entre el servicio recibido y el servicio esperado, tanto por parte de los médicos como del usuario. Estos estudios buscan, fundamentalmente, la identificación de estos gaps para adaptar los servicios a las expectativas de los “clientes”, en general, en tres 3 áreas: expectativas del usuario frente a experiencias del usuario; expectativas del usuario frente a percepciones profesionales de las expectativas del usuario, y experiencias del usuario frente a percepciones profesionales de las experiencias del usuario. En atención sanitaria, el desarrollo más importante de esta perspectiva es el SERVQUAL [Parasuraman et al, 1985] que mide la calidad de los servicios como diferencias entre las expectativas y las percepciones de los pacientes. Estas diferentes conceptualizaciones en los 3 modelos básicos de medida de la satisfacción en la atención sanitaria, explican, en buena parte, las diferentes dimensiones que integrarían la satisfacción para sus respectivos autores (tabla 9). Para Hulka estas dimensiones serían: a) competencia profesional, b) habilidades interpersonales y c) coste y comodidad [Zysanski et al, 1974]. Ware, que desarrolla un modelo mas apropiado a organizaciones sanitarias, conceptualiza los componentes como [Ware et al, 1983]: a) calidad técnica, b) eficacia y resultados, c) continuidad, d) actuación interpersonal, e) accesibilidad/comodidad, f) financiación y costes, g) entorno físico y disponibilidad; en Ware es relevante la inclusión de aspectos como la continuidad de la atención, diversas formas de accesibilidad, la inclusión de la eficacia de las actuaciones y la consideración de la competencia técnica como una característica de la organización y no sólo de los profesionales. Finalmente, Parasuraman [Parasuraman et al 1988, 1991, 1994; Babakus E, Mangold WG, 1992] busca diferencias entre las expectativas 45 y las percepciones en: a) aspectos tangibles, que incluirían aspectos de estructura, equipos y la apariencia del personal, b) fiabilidad, entendida como la capacidad para prestar los servicios de forma precisa, c) confianza, incluyendo la cortesía, d) empatía y atención individualizada, y e) sensibilidad a las diferentes situaciones y cambios de situación de los mismos pacientes. Tabla 9. Componentes de la satisfacción en los modelos de Hulka, Ware y Parasuraman Hulka Ware Parasuraman competencia profesional, habilidades personales Coste y comodidad calidad técnica actuación interpersonal accesibilidad/comodidad, financiación y costes, entorno físico y disponibilidad continuidad eficacia/resultados Aspectos tangibles fiabilidad confianza Empatía Sensibilidad a las diferentes situaciones Nótese que pese a estas diferencias de conceptualización los resultados de los diferentes instrumentos pueden –y, en teoría, deben- correlacionar bien en la medida global de satisfacción (por ejemplo, una comparación entre los cuestionarios de Hulka y Ware [Roberts, Tugwel, 1987] mostraba que los dos eran fiables, válidos, fáciles de aplicar y administrar y obtenían resultados comparables en la satisfacción total); sin embargo, es posible que su utilidad para guiar cambios en la organización o para adaptarse a las expectativas de los pacientes sea muy diferente (en el ejemplo anterior, el cuestionario de Ware ofrecía más información que el de Hulka al analizar mas dimensiones de forma diferenciada). Hay que adelantar ahora que, aunque la difusión y aplicación real de los 3 modelos ha sido diferente, los tres continúan actualmente en uso. La encuesta original de Hulka –desfasada en diversos aspectos- se emplea poco, pero existen numerosas adaptaciones de la misma, especialmente en atención primaria y, adicionalmente, es la base de la mayor parte de las encuestas usualmente utilizadas en los hospitales. El trabajo de Ware y su equipo ha tenido una amplia difusión y aplicación en el sistema sanitario 46 americano. La aplicación desarrollada por encargo del Group Health Association of America (GHAA), entidad que agrupa las Health Maintenance Organisations (HMOs), dio lugar al Consumer Satisfaction Survey, un instrumento bien estudiado que pretende medir la de los usuarios con los Planes de Asistencia Sanitaria con el fin de que los financiadores de los servicios –básicamente las empresas que aseguran a sus trabajadores- puedan establecer una comparación entre ellos. Este cuestionario es objeto de actualización periódica y mejora frecuente, hecho que muestra una amplia difusión y que no ha permanecido sólo a nivel de investigación. El SERVQUAL, por su parte, es posiblemente la escala de medición de calidad más conocida y usada en Estados Unidos y, aunque SERVQUAL no es solo un instrumento de medida de satisfacción, en atención sanitaria se ha centrado en este aspecto y en el de calidad percibida [Murfin et al, 1995; Bowers et al, 1994; McAlexander et al, 1994; Headley, Miller, 1993; Mowen et al, 1993; Babakus, Mangold, 1992]. En España existen adaptaciones de la misma [Mira JJ et al, 1997; 1998] que son utilizadas por numerosos hospitales, aunque posiblemente todavía predominan las basadas en el modelo de Hulka. Elementos a tener en cuenta en las encuestas de satisfacción Variabilidad.- Una característica de los instrumentos de medida de la satisfacción de los pacientes es que los resultados tienden a estar sesgados positivamente. En efecto, aproximadamente el 80-85% de los encuestados elegirá una respuesta u opinión positiva. Una explicación a esto es el efecto de la “deseabilidad social”, en el que los encuestados encuentran muy difícil expresar críticas sobre la asistencia sanitaria [Fitzpatrick R, Hopkins A, 1983]. Por esta razón, los instrumentos desarrollados más rigurosamente han tenido que superar un número de ciclos de prueba de los ítem en los cuales se eliminan las preguntas que producían menor variabilidad [Baker, 1990]. Dimensiones de la satisfacción del paciente.- Los primeros instrumentos planteaban una o un número limitado de preguntas para obtener una puntuación única global que nos decía si el paciente estaba o no satisfecho con la asistencia sanitaria recibida. Los resultados de estas preguntas son poco informativos a causa de su generalidad. Hoy en día es evidente que tales enfoques conducen a error porque los pacientes se crean unos puntos de vista complejos y multidimensionales de los diferentes aspectos de la asistencia sanitaria en general o de una experiencia determinada. A un nivel 47 básico los pacientes tendrán opiniones diversas en relación con el contenido médico o técnico de su asistencia, los aspectos interpersonales y las comodidades. Surgen dimensiones más especificas y claras de las opiniones dependiendo de un servicio en particular. Se puede tomar un ejemplo de la medicina general. Baker [1990] pidió a una muestra de pacientes de médicos generales que completaran un cuestionario que constaba de 18 preguntas acerca de su última consulta. Surgieron cuatro dimensiones diferentes; los pacientes tenían opiniones claras respecto a la satisfacción general, la calidad profesional de la asistencia, la profundidad de la relación y el tiempo percibido. La identificación de dimensiones en las opiniones de los pacientes se obtiene a través de métodos estadísticos como el análisis factorial. Métodos: cuestionarios versus entrevistas.- Existe gran cantidad de métodos alternativos para valorar la satisfacción del paciente, pero los más conocidos siguen siendo los cuestionarios autoadministrados de formato fijo. Sus principales ventajas son el bajo coste y la simplicidad para procesarlos. No comportan el sesgo potencial introducido por un administrador y proporcionan datos estandarizados. Su principal desventaja es que los contenidos y el orden están fijados por el diseñador, por lo que es menos flexible que una entrevista. Se pueden hacer mas flexibles incluyendo preguntas abiertas sobre temas de una importancia o sensibilidad particulares, aunque también hay que considerar el tiempo y el esfuerzo adicionales que conllevaría el procesamiento de dichos resultados. La entrevista cuando la realiza personal entrenado, suele ser más efectiva en la obtención de material complejo o sensible. El entrevistador establece una relación con el entrevistado y le estimula a completar la tarea. El entrevistador aclara las preguntas y da a conocer a los encuestados la importancia de los distintos ítem. Este enfoque es casi invariablemente más caro debido a que son necesarios entrevistadores entrenados. Hay varios tipos de entrevistas. Por un lado, están las completamente estructuradas, que, se parecen más a cuestionarios autoadministrados de formato fijo. Se han desarrollado variantes menos estructuradas para facilitar la expresión de las opiniones de los pacientes. La técnica del incidente crítico estimula a los entrevistados a hacer una narración libre sobre sus experiencias en torno a un determinado tratamiento o visita hospitalaria. El objetivo primordial es extraer comentarios tanto positivos como negativos acerca de la experiencia. Una variante de esta técnica es la entrevista estandarizada sin un esquema [Fitzpatrick R, Hopkins A, 1983] en la cual el entrevistador tiene obje48 tivos en términos de datos que quiere obtener de la entrevista, pero no esta obligado a seguir un esquema fijo de preguntas. Este método implica normalmente la grabación magnetofónica porque tanto el tono como el contenido de las entrevistas son importantes. Formas alternativas de las preguntas.- La forma de cuestionario más simple es el tomado de un cuestionario de asistencia primaria australiano usado para la inspección [Stevens, Duglas, 1986]. Se ofrecen al individuo respuestas alternativas sí/no. Este formato se ha ido modificando progresivamente porque no permite los matices de opinión que con frecuencia encontramos en las opiniones de los pacientes. Las variantes más usuales de los cuestionarios de formato fijo son las tomadas del cuestionario de satisfacción del paciente CASPE [CASPE Research 1991], que utiliza las respuestas: muy satisfecho/ satisfecho/ insatisfecho/ muy insatisfecho y el utilizado en el estudio de satisfacción del paciente con el médico de cabecera en Saettle [Cherkin et al, 1988] en el que se utilizaba la terminologia para las respuestas de: totalmente de acuerdo/ de acuerdo/ no estoy seguro/ en desacuerdo/ totalmente en desacuerdo. También hay que señalar que el contenido de las preguntas puede influir en los resultados. Según el análisis comprehensivo de Hall y Dornan [1988] fue que los cuestionarios que soliciten las opiniones de los encuestados sobre la asistencia sanitaria en términos generales, más que en la relación a la experiencia personal de uso producían mayor variabilidad. Esto sería una observación estimulante a la vista de las afirmaciones hechas sobre la falta generalizada de variabilidad en este campo. Sin embargo, cuando se pide a los encuestados que den sus opiniones sobre la asistencia sanitaria en general, los resultados no sirven en realidad de mucha ayuda, porque no es fácil relacionar las opiniones expresadas en general con las experiencias particulares de servicios de asistencia sanitaria específicos. Escalas.- Está ampliamente aceptado en la literatura psicométrica que un cierto número de preguntas diferentes que miden aspectos superpuestos de un único constructo subyacente tenderá a conseguir una medición más fiable que una sola pregunta, sobre todo debido al error intrínseco de medición que supone un único ítem [Oppenheim 1966]. Por esta razón, se utilizan con más frecuencia instrumentos de medición de la satisfacción de los pacientes que incluyen escalas para evaluar las dimensiones claves de sus opiniones. Esto es especialmente apropiado cuando el objeto o el tema acerca del cual se solicitan opiniones se considera más complejo o más embarazoso. Así, es fácil entender la opinión de los pacientes sobre la limpieza 49 de una sala de espera con preguntas simples y directas e incluso única. En el campo de la auditoría clínica, donde lo importante es la opinión de los pacientes con respecto al tratamiento médico, las mediciones se consideran muy importantes y las escalas son más apropiadas. Para conseguir este objetivo es necesario utilizar más de una pregunta para valorar el aspecto asistencial del que se esta interesado. El desarrollo de una escala requiere más tiempo que la elaboración de una única pregunta, porque los ítem de una escala deben ser adecuadamente correlacionados entre sí (fiabilidad interna). Esto solo se consigue mediante intento sucesivos de eliminación de preguntas mediocres en las pruebas piloto y por medio del análisis estadístico. Las puntuaciones de la escala se obtienen normalmente sumando las puntuaciones obtenidas en cada uno de los ítem que integran la escala. Diseño.- Hay principios básicos a tener en cuenta en el diseño de un instrumento para medir la satisfacción del paciente [Fitzpatrick R, 1991], en primer lugar la importancia de las pruebas piloto. Permite identificar el objetivo, los limites y la importancia de los problemas desde la perspectiva del paciente. Además permite la medición de las propiedades de los ítem y el grado de aceptación del instrumento general que estamos examinando. Para realizar un estudio debe haber independencia entre los investigadores y los administradores de los presupuestos en sanidad. La confidencialidad de los datos tiene que estar asegurada. Las opiniones de los pacientes son más auténticas en el territorio neutral del hogar que cundo se expresa en el centro asistencial. Los principios de muestreo son fundamentales para evitar sesgos internos debidos a la omisión de subgrupos significativos. La tasa de respuesta es importante por razones similares. Instrumentos de medición de satisfacción en rehabilitación En Rehabilitación no son frecuentes los trabajos de medición de satisfacción. En una revisión realizada en la base bibliográfica Medline con los descriptores satisfaction y rehabilitation [Keith R, 1998], se encontraron muy pocos trabajos de investigación sobre satisfacción en los servicios de rehabilitación y, en su mayor parte, con muestras muy insuficiente. La mayor parte de estudios tiene su punto de partida en instrumentos diseñados para atención primaria sin contemplar aspectos tan importantes y diferenciales como la restauración de la función en un periodo prolongado de tiempo. La rehabilitación requiere un equipo interdisciplinar de profesionales que 50 inciden sobre el paciente y que aumenta la complejidad de los servicios aspecto que conlleva una dificultad adicional para la elaboración de instrumentos de medida de satisfacción, porque tienen que identificar fuentes de insatisfacción sobre una organización con individualidades terapéuticas que los pacientes tienen dificultad en identificar; a esto se añade la vinculación de los servicios de rehabilitación a otros servicios y su dependencia de otros proveedores, como puede ser el transporte sanitario, aportando una mayor dificultad para establecer los límites de las prestaciones propias del servicio, y la necesidad de incluir muchas preguntas especificas y bien estructuradas para abarcar toda la complejidad de la organización que se tiene que valorar. Los trabajos realizados en los últimos años sobre satisfacción en los servicios de rehabilitación ofrecen, como es usual, niveles de satisfacción muy altos y algunos de ellos relacionan la satisfacción con los resultados clínicos [Anderson JG et al, 1996; Hazaard RG et al, 1994] y otros con los servicios prestados o ambos [Hall J et al, 1990; Davis D, Hobbs G, 1989; Roush SE, 1995; Winter PL, Keith RA, 1988; Elliot-Burke TL, Pothast L, 1997; Wilson KG et al, 1995; Heinemann AW et al, 1997]. Lo que indica que deben desarrollarse nuevas estrategias de investigación. Simon y Patrick [1997] afirmaron que las respuestas de satisfacción del consumidor son el resultado de procesos cognitivos de encuentro con el servicio. Para entender esta experiencia subjetiva es necesario utilizar técnicas cualitativas para comprender las conexiones entre esas experiencias y las respuestas de satisfacción. En las búsquedas bibliográficas realizadas en la base Medline (1993-1997, similar a la de Keith ya citada) y en el Índice Médico Español (1993-1997, combinando los descriptores “satisfacción del usuario” y “rehabilitación”, solo se halló un trabajo español sobre el tema [García-Alsina, Goncharov, 1997], aunque no contenía encuestas, no habiéndose desarrollado en nuestro país hasta 1997 ningún cuestionario que contemplara aspectos inherentes al servicio de rehabilitación como es el área de consultas externas, común al resto de servicios sanitarios, y el área de tratamiento fisioterápico, área especifica de los servicios de rehabilitación que va ha incidir de forma decisiva en la satisfacción percibida y en el resultado final del proceso rehabilitador. La encuesta desarrollada se adapta a las necesidades de un servicio de rehabilitación, aunque no incluye preguntas sobre áreas tan importantes como terapia ocupacional, logopedia, prótesis y órtesis, por no disponer de estas unidades de tratamiento en el servicio dónde se realizo la validación de la encuesta [Navarro MJ et al, 1998]. 51 Objetivos e hipótesis El objetivo general de este trabajo es describir la capacidad funcional y la CVRS de los pacientes que acceden a tratamiento rehabilitador tras ser intervenidos de artroplastia total de rodilla, así como los resultados a los 3 meses en capacidad funcional, calidad de vida y satisfacción con el tratamiento, e identificar los factores asociados a mejores o peores resultado, al final del citado lapso de tiempo. Los objetivos concretos incluyen: • La descripción de las características sociodemográficas, clínicas, funcionales y de calidad de vida de los pacientes que acuden a tratamiento rehabilitador tras artroplastia de rodilla y analizar la asociaciones entre las características de los pacientes y la situación funcional y de calidad de vida al inicio de la rehabilitación. • Describir los resultados funcionales y de calidad de vida a los 3 meses de tratamiento rehabilitador y analizar las diferencias con la situación inicial. • Analizar las asociaciones existentes entre las características basales de los pacientes, incluyendo su situación funcional y la valoración inicial de calidad de vida, y los resultados finales de función y calidad de vida, así como con las ganancias entre el periodo basal y los 3 meses. • Valorar la satisfacción de los pacientes con el tratamiento rehabilitador recibido, y analizar las asociaciones entre factores basales y resultados finales obtenidos, con la satisfacción percibida. • Analizar las asociaciones entre las medidas funcionales y de calidad de vida. Se trata de un estudio con importantes componentes descriptivos y exploratorios cuyo interés radica en ser –en nuestro conocimiento- el primero que analiza conjuntamente resultados de función, calidad de vida y satisfacción, en rehabilitación tras artoplastia de rodilla. Respecto a los aspectos no descriptivos del estudio se habían formulado las siguientes hipótesis previas: 1 Los resultados funcionales y de calidad de vida mejoran en los 3 meses de tratamiento rehabilitador respecto a la valoración al inicio. Estas mejoras deberían ser especialmente ostensibles, además de en las escalas de función, en las dimensiones de función física, rol fun52 cional, rol social y dolor de los instrumentos de medición de calidad de vida, por ser las áreas más afectadas por la intervención previa y el tratamiento rehabilitador. 2 Los resultados funcionales y de calidad de vida se asociarán negativamente a determinadas características de los pacientes (mayor edad, sexo mujer, diagnóstico de artritis reumatoide y prótesis derecha) y positivamente a la mejor función y calidad de vida previas. Para el resto de características de los pacientes analizadas no se formularon hipótesis previas. 3 No existirán diferencias en ninguno de los resultados entre los pacientes tratados en el hospital y los tratados en las unidades de rehabilitación extrahospitalarias. 4 Las medidas funcionales y de calidad de vida mostrarán una importante correlación, en especial en aquellas áreas mas relacionadas con la rodilla (función física y rol funcional, dolor y rol social). 5 La satisfacción con la atención recibida se asociará a mejores resultados funcionales y de calidad de vida. 53 Material y métodos Diseño Cohorte prospectiva de 196 paciente que en los días siguientes a una intervención de prótesis total de rodilla acudieron a consultas externas de rehabilitación, en los que se valoró la función y la calidad de vida en la primera visita y a los 3 meses de seguimiento; tras recibir el alta médica se valoró también la satisfacción con la atención recibida. Entorno El estudio se realizó en el Servicio de Rehabilitación del Área de Salud 9 de Valencia, un Área fundamentalmente urbana que cuenta con un centro de rehabilitación hospitalario y –en el momento del estudio- seis unidades básicas de rehabilitación (UBR) extra-hospitalarias. Tanto el hospital como las UBR están dotados de recursos materiales similares, con una sala polivalente de cinesiterapia y boxes de electroterapia, que dispone de termoterapia superficial y profunda, electroterapia de baja y de mediana frecuencia, corrientes galvánicas, ultrasonidos y crioterapia. El hospital dispone, además, de una sala con hidroterapia. La cobertura asis55 tencial del área corresponde a una población censal cercana a los 320.000 habitantes. Pacientes Se incluyeron todos los pacientes que entre enero de 1997 y marzo de 1999 fueron atendidos en primera visita en cualquiera de los centros que integran el servicio de rehabilitación del Área tras haber sido intervenidos de prótesis total de rodilla. La mayoría de los pacientes fueron intervenidos por el Servicio de Traumatología del Hospital Dr. Peset, pero en algunos casos provenían de centros concertados. La casi totalidad de los pacientes habían recibido una prótesis bicondilea por deslizamiento no constreñida, con conservación del ligamento cruzado posterior y no cementada; en unos pocos casos con rodilla muy afectada –básicamente en pacientes afectos de artritis reumatoide- el ligamento cruzado había sido sacrificado utilizando prótesis constreñida y/o prótesis cementada; en la inmensa mayoria no se protetizó la rotula realizándose una espongiolización de la misma. La primera visita se realizó entre los 10 y 20 días desde la intervención, aunque la mayor parte de los pacientes habían recibido tratamiento rehabilitador en el post-operatorio inmediato durante el periodo de hospitalización. El tratamiento del post-operatorio inmediato (usualmente en los primeros 8 días tras la intervención) consistió en cinesiterapia en cama y sedestación, para conseguir el recorrido articular, incluyendo la movilización pasiva continua dentro de las primeras 48 horas, isométricos, elevación y potenciación contra gravedad del miembro intervenido, transferencias y -a partir de las 48 horas del postoperatorio- reeducación de la marcha. Durante este periodo se aplicó crioterapia después de la sesión de cinesiterapia. Al alta el paciente recibía información oral y escrita –un folleto informativo- con las normas generales, ejercicios que debía realizar y consejos de marcha. De los 196 pacientes que iniciaron el estudio se produjeron 11 (5,6%) pérdidas en las mediciones de resultados funcionales y de calidad de vida por no acudir a la visita -a los 3 meses de seguimiento- en la que se administró la segunda valoración. De estas pérdidas, 4 se debieron a problemas de salud de familiares próximos, 1 sufrió un recambio de prótesis, y 6 no fueron localizados. En el caso de la encuesta de satisfacción, administrada telefónicamente entre 1 y 3 meses tras el alta de rehabilitación, las perdidas incluyeron 16 pacientes adicionales por imposibilidad de localización telefónica, quedando 169 casos para este análisis, con unas perdidas del 56 8,6% sobre los 185 que finalizaron el estudio y del 13,8% sobre el total de pacientes que iniciaron el estudio. Medidas de resultado Las medidas de resultado utilizadas fueron: 1) la valoración funcional de la articulación medida mediante la escala KSS, 2) la calidad de vida relacionada con la salud valorada mediante el cuestionario SF-36, y 3) la satisfacción de los pacientes con la atención recibida de los pacientes valorada con un cuestionario de desarrollo propio. Las valoraciones funcionales y de calidad de vida se midieron en 2 ocasiones -en la primera visita y a los 3 meses del seguimiento- disponiéndose, por tanto, de los resultados de ganancia funcional y calidad de vida en este periodo. La satisfacción con la atención se midió entre 1 y 3 meses después de la finalización del tratamiento rehabilitador. Otras variables y definiciones Se utilizaron las siguientes variables y definiciones: • Edad, agrupada en menores de 65 años, de 65 a 74 años, y de 75 o más años. • Sexo. • Nivel de estudios, agrupado en pacientes sin estudios o con estudios primarios, y pacientes con estudios equivalentes a bachiller o superiores. • Situación laboral, agrupada en activos, amas de casa mayores de 65 años o jubiladas, jubilados por edad, y jubilado por invalidez. • Estado civil, agrupado en soltero o separado, casados, y viudos. • Residencia, agrupada en propia y en casa de familiares, o pacientes institucionalizados. • Utilización o no de algún servicio de apoyo social (declarado por el paciente). • Disponer o no de ayudas sociales (declarado por el paciente). • Centro de tratamiento (hospital o UBR). • Diagnóstico que motivó la intervención. • Comorbilidad declarada, indagándose específicamente por la presencia de coronariopatías, insuficiencia cardiaca, enfermedad vascular periféri57 ca, enfermedad pulmonar crónica, enfermedades reumáticas, enfermedad ulcerosa péptica, hepatopatía, diabetes, insuficiencia renal crónica, neoplasias, síndrome de inmunodeficiencia humana, artroplastias previas, deficiencias audiovisuales y depresión. • Lateralidad de la prótesis: izquierda, derecha o bilateral (en este último caso, para la valoración funcional se utilizó la medición de la rodilla con peor función); • Indicación o no de tratamiento fisioterápico (en caso afirmativo se anotó el número de sesiones). • Trasporte utilizado (propio, taxi y ambulancia). • Calidad de vida utilizando el índice QL de Spitzer, que fue valorada dos veces al inicio de la rehabilitación (con un cuestionario referido a la situación 2 meses antes de la intervención y otro referido a la situación al inicio del la rehabilitación) y una tercera vez a los 3 meses de seguimiento. Instrumentos de Medida Knee Society Score (KSS).- Para la valoración funcional de la prótesis total de rodilla se empleó la escala Knee Society Score (anexo 1), que diferencia tres grupos de pacientes: prótesis unilateral o bilateral (contralateral protetizada con éxito), prótesis unilateral con rodilla contralateral sintomática, y afectación poliarticular u otra enfermedad asociada, permitiendo clasificar por grupos homogéneos cada uno de los pacientes. Cuenta con 2 subescalas, denominadas rodilla (KSSR) y función (KSSF), tomando cada una de ellas una valoración máxima de 100 puntos. La KSSR esta integrada por el sumatorio de 3 dimensiones: dolor (0-50 puntos), rango de movimiento (025 puntos), estabilidad (0-25 puntos), mientras la KSSF esta integrada por el sumatorio de 2 dimensiones: marcha (0-50 puntos) y escaleras (0-50 puntos). Existen deducciones para ambas subescalas, que pueden llegar a reducir hasta 50 puntos para la KSSR y 20 para la KSSF. Aunque en la escala original no esta contemplada una clasificación cualitativa de los resultados, algunos trabajos posteriores la han utilizado con valores similares a los del HSS. Así hay algunos autores que clasifican los resultados de las dos subescalas en excelente (90-100), buenos ( 80-89), regulares ( 70-79) y malos por debajo de 70 [König et al, 1997, Serna et al, 1994], mientras otros [Gill et al, 1991; 1997] utilizan la clasificación con valores más bajos: excelente (100-85), bueno( 70-84), regular (60-69) y malo por debajo de 60, tambien con un criterio similar al utilizado en la escala HSS. 58 Medical Outcomes Study Short-Form 36 (MOS-SF36).- Para valorar la CVRS se utilizó la versión española, previamente validada [Alonso et al 1995], del cuestionario Medical Outcomes Study Short-Form 36 (MOSSF36), que incluye 8 dimensiones: salud general, función física, rol funcional, rol emocional, rol social, dolor, vitalidad y salud mental. Cada dimensión puede tomar valores entre 0 y 100 siendo esta última la mejor puntuación. El MOS-SF36 no permite agrupar las puntuaciones de las diferentes dimensiones en una puntuación global de calidad de vida (anexo 1). QL de Spitzer.- El cuestionario QL de Spitzer incluye 5 dimensiones: actividad, actividades de la vida diaria, salud, apoyo, actitud. Cada dimensión toma valores entre 0 y 2 siendo el mejor valor el 0 y el peor el 2. Con la suma total de los valores de cada dimensión, se obtiene la puntuación final del cuestionario pudiendo obtener valores entre 0 y 10 siendo esta última la peor puntuación (anexo 1). Cuestionario de Satisfacción.- Para la valoración de la satisfacción se utilizó un cuestionario específico, previamente validado [Navarro MJ et al, 1998], en el que se contemplaban aspectos de accesibilidad, confortabilidad, higiene, trato del personal del servicio, así como el interés y profesionalidad del médico y del fisioterapeuta. El cuestionario esta integrado por 20 preguntas, de las cuales 18 que toman valores categóricos entre 1 y 4, la pregunta 19 responde a valores 1 ó 4 y la 20 es una variable continua que toma valores entre 1 y 10. Desarrollo del estudio Se incorporaron al estudio todos los pacientes intervenidos de artroplastia de rodilla entre enero de 1997 y marzo de 1999 procedentes del Hospital Dr. Peset y hospitales concertados que acudieron en primera visita a las consultas externas del Servicio de rehabilitación del Área, en cualquiera de los Centros que lo integran y en un periodo comprendido entre 10 y 20 días después de la intervención. En el primer contacto con el enfermo se le informaba del estudio y se solicitaba el consentimiento para su inclusión. En esta primera visita se recogieron los datos sociodemográficos y clínicos, así como la valoración funcional inicial con el KSS y se administraban los cuestionarios de calidad de vida (QL Spitzer y SF-36) referidos al momento actual y el Spitzer además referido a los 2 meses previos a la intervención. A todos los enfermos se les indicó el tratamiento protocolizado por el Servicio para la artroplas59 tia de rodilla que en su mayoría ejecutaron en el centro correspondiente; en algunos casos con mejor estado los pacientes siguieron tratamiento en su domicilio. A los 3 meses de la primera valoración se efectuó la segunda entrevista en la que se realizó la segunda valoración de la escala KSS y se administraron los cuestionarios QL de Spitzer y SF-36. Al mismo tiempo que se recogían datos sobre los tratamientos efectuados, transporte utilizado y otros conceptos que vienen detallados en el impreso de censo de procesos rehabilitadores diseñado por Grupos de Asesores Técnicos (GAT) de la Conselleria de Sanitat de la Comunidad Valenciana [Hernandez et al, 1995]. El proceso del estudio se recogía en un manual de procedimientos donde se detallaba la secuencia temporal, formas de administración y otros detalles del desarrollo del estudio. En un periodo comprendido entre 1 y 3 meses tras el alta se administró telefónicamente el cuestionario de satisfacción. La encuesta de satisfacción se administró por personal que no había tenido en ningún momento contacto con el enfermo y se intentaron hasta 10 llamadas en diferentes horarios antes de considerar el paciente como “pérdida”. Aspectos éticos, confidencialidad y autorizaciones Todos los pacientes formalizaron el consentimiento informado previamente a su incorporación al estudio que, de otro lado, no implicaba la realización o exclusión de tratamientos, pruebas u otras intervenciones más allá de las valoraciones funcionales y cumplimentación de cuestionarios. Aunque el estudio requería la identificación de los pacientes, el equipo investigador adoptó las medidas oportunas para evitar el acceso de terceros a esta información, incluyendo la desidentificación en las bases de datos construidas para el análisis. El KSS y el QL index son instrumentos de dominio público; para la utilización del MOS-SF36 se dispuso de la correspondiente autorización del Health Institute de los New England Medical Hospitals. Análisis estadístico Se realizó, en primer lugar, un análisis descriptivo de las características de los pacientes atendidos. A continuación se describieron las puntuaciones obtenidas mediante la escala de valoración KSS, del MOS-SF36 y Spitzer, así como las puntuaciones obtenidas en el cuestionario de satisfacción. 60 Para las medidas evolutivas, se analizó la presencia de diferencias significativas entre las diferentes administraciones para cada una de las respectivas subescalas y dimensiones de la escala de valoración y de los cuestionarios de calidad de vida. Dado el no cumplimiento del supuesto de normalidad de la mayor parte de las variables, se utilizaron para este análisis pruebas no paramétricas (prueba de rangos de Wilcoxon). A continuación se realizó un análisis bivariable para valorar la posible existencia de asociaciones entre las características básales de los pacientes con las puntuaciones iniciales y a los 3 meses de seguimiento en el KSS, el MOS-SF36 y la puntuación final del cuestionario de satisfacción. Se utilizaron también pruebas no paramétricas (prueba de Kruskal-Wallis) y se analizaron las correlaciones (coeficiente de Spearman) existentes entre los valores básales y finales de todas las dimensiones de ambos instrumentos. Tambien se analizó la asociación entre caracteristicas básales, la puntuación final del cuestionario de satisfacción y las dimensiones de satisfacción halladas en el estudio de validación previo [Navarro MJ et al, 1998]. Se utilizaron también pruebas no paramétricas (prueba de Kruskal-Wallis) y se analizaron las correlaciones existentes entre los valores básales, finales y la ganancia en todas las dimensiones de ambos instrumentos y con la puntuación del cuestionario de satisfacción. Todos los análisis se realizaron con el programa estadístico STATA® (Stata Corporation, College Station, Texas 77840, USA) en la Escuela Valenciana de Estudios para la Salud, institución que dispone de la correspondiente licencia de uso de este software. 61 º Resultados Características de los pacientes al inicio de la rehabilitación Las características sociodemográficas, clínicas y de morbilidad de los pacientes se presentan en las tablas 10 y 11. La edad media fue 69,1 años (IC95%: 67,9-70,2), con un 21% inferior a 65 años y un 19% superior a 75 años. El 74% fueron mujeres y el 90% declararon no tener estudios o sólo primarios. Respecto a la situación laboral, el 51% eran amas de casa mayores de 65 años, el 27% jubilados por edad, el 9% jubilados por invalidez y sólo el 13% estaban en activo. La mayoría de los pacientes estaban casados (62%), vivían en su propio domicilio (95%) y consideraban que tenían apoyo social (97%). El 94% (n=184) habían recibido una prótesis unilateral, 92 (47%) derecha y 92 (47%) izquierda, mientras que los 12 (6%) restantes recibieron una prótesis bilateral en el mismo acto quirúrgico. El diagnóstico mas frecuente fue la gonartrosis (96%), correspondiendo el resto de casos (4%) a artritis reumatoide. El 68% fueron atendidos en el hospital y el 32% restante en alguna de las UBR del Área de Salud. 63 Tabla 10. Características sociodemográficas y clínicas n Edad Hasta 65 años De 66 a 75 años Superior a 75 años Sexo Mujeres Hombres Estudios Primarios Bachiller y Universitarios Actividad Activos Laboral Jubilados por edad Jubilados por invalidez Amas de casa jubiladas Estado Soltero/Separado/divorciado Civil Casado Viudo Vive Domicilio propio Familiares Apoyo Si Social No Ayudas No Sociales Si Diagnostico Gonartrosis Artritis Reumatoide Lado Derecha Izquierda Bilateral Centro Hospital Asistencial Unidades Básicas Rehab. Total 42 116 38 145 51 177 19 25 54 17 100 16 122 58 187 9 190 6 194 2 189 7 92 92 12 133 63 196 % 21,43 59,18 19,39 73,98 26,02 90,31 9,69 12,76 27,55 8,67 51,02 8,16 62,24 29,59 95,41 4,59 96,94 3,06 98,98 1,02 96,43 3,57 46,94 46,94 6,12 67,86 32,14 100,00 IC95% 15,90 51,95 14,10 67,24 20,02 85,27 5,93 8,04 21,24 4,69 43,96 4,73 55,05 23,30 92,45 1,63 94,50 0,62 97,56 0,39 92,78 1,44 39,79 39,79 3,20 60,82 25,66 27,84 66,13 25,62 79,97 32,75 94,06 14,72 17,46 33,86 12,64 58,08 12,91 69,05 36,51 98,36 7,54 99,37 5,49 100,00 2,43 98,55 7,21 54,18 54,18 10,45 74,33 39,17 IC95%: Intervalo de confianza del 95%. Tabla 11. Características clínicas (cont.). Comorbilidad Comorbilidad Insuficiencia Cardiaca Enf. Vascular periférica Infarto miocardio previo Enf. Pulmonar Crónica Enf. Ulcerosa péptica Enf. Hepática leve Enf. Hepática grave Diabetes leve/moderada Diabetes complicada Insuf. Renal crónica Neoplasia Metástasis Accidente Vásculo Cerebral Hemiplejia déficit auditivo/visual Depresión Demencia Sd. Inmunodefic. humana Artroplastias previas Otras Enf. Reumáticas Comorbilidad global Sin comorbilidad 1 comorbilidad 2 ó mas comorbilidad Total IC95%: Intervalo de confianza del 95%. 64 n % 14 29 2 6 13 4 1 20 3 5 7 0 4 0 22 13 0 0 37 13 7,14 14,80 1,02 3,06 6,63 2,04 0,51 10,20 1,53 2,55 3,57 0,00 2,04 0,00 11,22 6,63 0,00 0,00 18,88 6,63 3,95 10,13 0,12 1,13 3,57 0,55 0,01 6,34 0,31 0,83 0,01 0,00 0,55 0,00 7,16 3,57 0,00 0,00 13,65 3,57 IC95% 11,69 20,55 3,63 6,54 11,07 5,14 2,80 15,31 4,40 5,85 7,21 1,86 5,14 1,86 16,50 11,07 1,86 1,86 25,06 11,07 72 70 54 196 36,73 35,71 27,55 100,00 29,97 29,01 21,42 43,89 42,85 34,36 La comorbilidad más frecuente fue la presencia de otras artroplastias (19%), seguida la enfermedad vascular periférica (15%) y la afectación sensorial moderada (11%). En conjunto, un 63% de los pacientes tenían alguna patología concomitante (tabla 11). Respecto a la valoración funcional al inicio de la rehabilitación, los valores medios del KSS fueron de 41,40 en la subescala KSSR, y 17,11 en la KSSF, con medianas de 40 y 20 respectivamente (Tabla 12). Tabla 12. Puntuación en la escala KSS al inicio de la rehabilitación KSS inicial Rodilla Función x DE Md P25 P75 41,40 17,11 19,58 22,50 40,0 20,0 27,0 –5,0 55,0 35,0 KSS: Knee Society Score; DE: Desviación típica; Md: Mediana; P25: percentil 25; P75: percentil 75. Respecto a la calidad de vida, las puntuaciones en el cuestionario QL de Spitzer, valorado en los 2 meses previos a la intervención y en la primera visita en rehabilitación tras la intervención (desde 0 –mejor estado posiblea 10 –peor estado posible) fueron 1,65 y 2,95, con medianas de 1 y 3, respectivamente (Tabla 13). Por dimensiones (desde 0 –mejor estado posiblea 2 –peor estado posible- para cada dimensión) la actividad fue la dimensión más afectada, con puntuaciones de 0,77 y 1,54 (medianas 1 y 2) en los 2 meses previos e inmediatamente tras la intervención, respectivamente; las dimensiones de actividades de la vida diaria (medias: 0,15 y 0,68; medianas: 0 y 1), salud (medias: 0,41 y 0,34; mediana: 0 en ambos casos); apoyo (media: 0,03 y 0,02; mediana 0, ambos casos) y actitud (media: 0,29 y 0,35; mediana 0, ambos casos) estaban menos afectadas. Tabla 13. Valores del QL SPITZER en los 2 meses previos y en el momento de la primera visita QL SPITZER 2 MESES PREVIOS QL SPITZER EN LA PRIMERA VISITA Actividad AVD Salud Apoyo Actitud Total Actividad AVD Salud Apoyo Actitud Total x 0,77 0,15 0,41 0,03 0,29 1,65 1,54 0,68 0,34 0,02 0,35 2,95 DE 0,71 0,36 0,57 0,20 0,45 1,52 0,54 0,46 0,51 0,15 0,50 1,38 Md 1,0 0,0 0,0 0,0 0,0 1,0 2,0 1,0 0,0 0,0 0,0 3,0 P25 0,0 0,0 0,0 0,0 0,0 0,0 1,0 0,0 0,0 0,0 0,0 2,0 P75 1,0 0,0 1,0 0,0 1,0 3,0 2,0 1,0 1,0 0,0 1,0 4,0 AVD: Actividades de la vida diaria; DE: Desviación típica; Md: Mediana; P25: percentil 25; P75: percentil 75. 65 Las puntuaciones medias en las 8 dimensiones del cuestionario SF-36 en la visita inicial a rehabilitación (Tabla 14), valoradas en un rango desde 0 –peor estado posible- a 100 –mejor estado posible, se mostraron muy deterioradas para la función física (15,51; mediana 10) y el rol funcional (5,10; mediana 0), y mas conservadas para el rol emocional (79,42; mediana 100), dolor (47,13; mediana 42), vitalidad (54,03; mediana 55), Rol social (64,66, mediana 62,50), salud mental (62,48; mediana 64) y salud general (68,19; mediana 72). Tabla 14. Valores al inicio de la escala SF-36 x SF-36 Inicial Función Física Rol Funcional Rol Emocional Dolor Vitalidad Rol Social Salud Mental Salud General 15,51 5,10 79,42 47,13 54,03 64,66 62,48 68,19 DE Md P25 P75 16,39 10,0 0,0 20,0 16,77 0,0 0,0 0,0 39,09 100,0 100,0 100,0 23,14 42,0 31,0 62,0 18,28 55,0 40,0 65,0 20,41 62,5 50,0 75,0 21,86 64,0 48,0 80,0 19,11 72,0 55,0 82,0 DE: Desviación típica; Md: Mediana; P25: percentil 25; P75: percentil 75. Resultados funcionales, de calidad de vida y satisfacción a los 3 meses y ganancia respecto al periodo basal La puntuación media en las subescalas KSSR y KSSF a los 3 meses de seguimiento fue de 68,2 y 60,4 (mediana: 72 y 60), con una ganancia media de 26,82 y 43,32 (mediana 24 y 40) respectivamente, siendo las diferencias entre la valoración inicial y final estadísticamente significativas en la prueba de rangos de Wilcoxon (Tabla 15). En el gráfico 1 se aprecia más visualmente esta mejoría. Tabla 15. Puntuación en la escala KSS a los 3 meses de seguimiento y ganancia entre la puntuación inicial y final KSS a los 3 meses Diferencia KSS final-inicial Rodilla Función Rodilla* Función* x DE Md P25 P75 68,29 60,40 26,82 43,32 19,13 21,12 21,15 23,90 72,0 60,0 24,0 40,0 57,0 45,0 13,0 25,0 83,0 75,0 42,0 60,0 n = 185 *p<0,001 en la prueba de rangos de Wilcoxon; DE: desviación estándar; Md: mediana; P25: percentil 25; P75: percentil 75. KSS: Knee Society Score. 66 Gráfico 1. Evolución de las puntuaciones KSS Tabla 16. Valores del QL SPITZER a los 3 meses de seguimiento y diferencias entre la valoración previa e inicial y ambas con respecto a la valoración final QL SPIZER A LOS 3 MESES DIFERENCIA ENTRE QL SPITZER PREVIO E INICIAL DIFERENCIA ENTRE QL SPITZER PREVIO Y FINAL DIFERENCIA ENTRE QL SPITZER AL INICIO Y FINAL Actividad AVD Salud Apoyo Actitud Total Actividad* AVD* Salud Apoyo Actitud Total* Actividad* AVD Salud* Apoyo Actitud* Total* Actividad* AVD* Salud* Apoyo Actitud** Total* x DE Md P25 P75 0,56 0,11 0,20 0,01 0,12 1,02 0,77 0,53 –0,07 –0,01 0,06 1,30 –0,18 –0,01 –0,21 –0,01 –0,14 –0,56 –0,97 –0,57 –0,15 0,00 –0,22 –1,92 0,63 0,33 0,42 0,12 0,33 1,21 0,81 0,52 0,58 0,16 0,50 1,66 0,85 0,43 0,59 0,19 0,47 1,55 0,74 0,54 0,53 0,14 0,50 1,50 0,0 0,0 0,0 0,0 0,0 1,0 1,0 1,0 0,0 0,0 0,0 1,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 –1,0 0,0 0,0 0,0 –2,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 –1,0 0,0 –1,0 0,0 0,0 –2,0 –2,0 –1,0 0,0 0,0 0,0 -3,0 1,0 0,0 0,0 0,0 0,0 2,0 1,0 1,0 0,0 0,0 0,0 2,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 1,0 N = 185 excepto diferencias entre QL previo e inicial (n = 196). *p<0,001 en la prueba de rangos de Wilcoxon; DE: desviación estándar; Md: mediana; P25: percentil 25; P75: percentil 75. 67 Los valores medios (y medianas) obtenidos en la valoración final mediante el cuestionario QL de Spitzer en sus diferentes dimensiones (tabla 16) fueron: actividad 0,56 (Md=0); AVD 0,11 (Md=0); salud 0,20 (Md=0); apoyo 0,01 (Md=0); actitud 0,12 (Md=0). La valoración global del QL de Spitzer a los 3 meses fue 1,02 (Md=1). Al valorar las ganancias entre las diferentes administraciones del QL de Spitzer, existió un empeoramiento estadísticamente significativo entre la valoración previa y la de la primera visita en las dimensiones actividad y AVD, así como en la puntuación global. Se encontraron mejorías estadísticamente significativas entre la valoración previa y final en las dimensiones de actividad, salud, actitud y global; y entre la valoración en la primera visita y final en las dimensiones actividad, AVD, salud, actitud y puntuación global (con una diferencia mediana de –2 puntos). En el gráfico 2 se aprecia esta evolución. Gráfico 2. Evolución de las puntuaciones en el QL de Spitzer 68 Respecto a la CVRS (tabla 17), las medias en las puntuaciones a los 3 meses del seguimiento en las diferentes dimensiones del MOS-SF36 fueron: función física 57,1 (mediana 60); rol funcional 50,2 (mediana 50); rol emocional 84,5 (mediana 100); dolor 68,4 (mediana 74); vitalidad 60,6 (mediana 60); Rol social 91,1 (mediana 100); salud mental 69,2 (mediana 76); salud general 69 (mediana 72). Se hallaron mejorías estadísticamente significativas entre la administración inicial y a los 3 meses del seguimiento en 6 de las 8 dimensiones que integran el cuestionario: Función física con una ganancia media de 41,6 (mediana 45); rol funcional con ganancia media de 45,4 (mediana 50); dolor con una ganancia media de 21 (mediana 20); vitalidad con una ganancia media de 6,1 (mediana 5); Rol social con una ganancia media de 26 (mediana 25); y salud mental con una ganancia media de 6,4 (mediana 4). En el caso de vitalidad y la salud mental las mejorías, aun significativas, fueron de tan sólo 5 y 4 puntos. El rol emocional y la salud general no experimentaron cambios significativos. Tabla 17. Resultados finales del SF-36 y diferencias entre las puntuaciones al inicio y a los 3 meses de seguimiento x SF-36 Final SF-36 Final-previo Función Física Rol Funcional Rol Emocional Dolor Vitalidad Rol Social Salud Mental Salud General Función Física* Rol Funcional* Rol Emocional Dolor* Vitalidad* Rol Social* Salud Mental* Salud General 57,10 50,27 84,50 68,47 60,59 91,08 69,16 69,04 41,56 45,40 4,86 21,03 6,13 26,01 6,37 0,47 Md P25 P75 22,15 60,0 42,02 50,0 34,22 100,0 24,71 74,0 15,80 60,0 17,28 100,0 22,04 76,0 18,83 72,0 21,75 45,0 42,65 50,0 39,85 0,0 24,47 20,0 16,07 5,0 22,30 25,0 17,99 4,0 13,93 0,0 DE 40,0 0,0 100,0 52,0 50,0 87,5 56,0 60,0 25,0 0,0 0,0 0,0 –5,0 12,5 –4,0 –5,0 75,0 100,0 100,0 84,0 75,0 100,0 88,0 82,0 55,0 100,0 0,0 39,0 15,0 37,5 20,0 7,0 n = 185 *p<0,001 en la prueba de rangos de Wilcoxon; DE: desviación estándar; Md: mediana; P25: percentil 25; P75: percentil 75. En el gráfico 3 se aprecia esta evolución, siendo especialmente llamativos los cambios en las dimensiones función física, rol funcional y dolor (las mas afectadas inicialmente), y los cambios a mejoría en otras dimensiones con menor afectación inicial, excepto la salud general que prácticamente no experimenta cambios. 69 Gráfico 3. Evolución de las puntuaciones en el SF-36 Salud Mental Salud General 70 Con respecto a la encuesta de satisfacción (Tabla 18) las preguntas referentes al tratamiento fisioterápico (3, 5, 8, 10, 14, 15) no fueron contestadas por los enfermos que no habían sido remitidos a fisioterapia y también existieron pérdidas en alguna otra pregunta que no fue respondida por algún pacientes, por lo que el tamaño muestral es discretamente variable según los diversos ítem. Todas las puntuaciones de las primeras 19 preguntas obtuvieron valores medios por encima de 3 (sobre 4 puntos) y medianas de 3 o 4, a excepción de la pregunta 4, sobre tiempo de desplazamiento, con puntuación de 2,89 y mediana de 3. Para el resto, las preguntas sobre esperas (6 a 8) y el trato del personal auxiliar obtienen las puntuaciones mas bajas. La pregunta 20, que recoge una valoración global de satisfacción en una escala de 0 a 10, obtuvo una puntuación media de 9,15 (mediana 10). Tabla 18. Resultados de la encuesta de satisfacción Pregunta 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Información general Información del médico Información del fisioterapeuta Tiempo de desplazamientos Accesibilidad Espera hasta la 1ª consulta Espera en la sala de espera Espera hasta el tratamiento fisioterápico Número de visitas médicas Número de sesiones fisioterápicas Formación profesional del médico Trato del médico Interés del médico Trato del fisioterapeuta Interés del fisioterapeuta Trato del personal auxiliar Ambiente en el servicio Limpieza e higiene Elección de centro Satisfacción global n x DE Md P25 P75 164 167 128 159 125 165 167 126 167 123 169 169 168 127 125 164 166 167 164 162 3,43 3,62 3,57 2,89 3.68 3,18 3,11 3,27 3,75 3,43 3,47 3,62 3,48 3,51 3,46 3,21 3,43 3,63 3,89 9,15 0,53 0,52 0,56 0,85 0,54 0,68 0,71 0,71 0,69 0,96 0,60 0,56 0,55 0,66 0,58 0,74 0,62 0,50 0,56 1,14 3,0 4,0 4,0 3,0 4,0 3,0 3,0 3,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 3,0 4,0 4,0 4,0 10,0 3,0 3,0 3,0 2,0 3,0 3,0 3,0 3,0 4,0 2,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 4,0 8,0 4,0 4,0 4,0 3,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 4,0 10,0 n = 185 *p<0,001 en la prueba de rangos de Wilcoxon; DE: desviación estándar; Md: mediana; P25: percentil 25; P75: percentil 75. Factores asociados al resultado funcional En el análisis bivariable para identificar factores asociados a la valoración inicial del KSS (Tabla 19), el sexo (mujeres), el nivel educativo (primarios o inferior), la indicación de tratamiento fisioterápico (frente a tratamiento en domicilio) y el uso de ambulancias se mostraron asociados a peor valoración en el KSSF; el desplazamiento por medios propios se asoció a mejores valoraciones en el KSSR. No se hallaron otras asociaciones estadísticamente significativas. 71 Tabla 19. Características de los pacientes y valores iniciales (mediana) de función n Edad Sexo Nivel de Estudios Actividad Estado Civil Apoyo Social Ayuda Social Domicilio Diagnóstico Lateralidad Comorbilid. Centro Fisioterapia Transporte Hasta 65 años De 65 a 74 años Superior a 74 años Mujeres Hombres Primarios Bachiller/Universt. Activos Jubilado por edad Jubilado por invalidez Jubilado ama de casa Soltero/separado Casado Viudo Si No Si No Propio Otros Gonartrosis Artritis Reumatoide Derecha Izquierda Bilaterales Sin Comorbilidad Con Comorbilidad Hospital Unidad Básica Rehab. Sin fisioterapia Con fisioterapia Propio Taxi Ambulancia 42 116 38 145 51 177 19 25 54 17 100 16 122 58 190 6 2 194 187 9 189 7 92 92 12 72 124 133 63 57 128 112 8 56 KSSR 38,0 40,0 42,0 39,0 42,0 40,0 42,0 40,0 42,0 38,0 40,0 39,0 38,5 44,0 40,0 32,5 29,0 40,0 40,0 39,0 40,0 49,0 39,5 40,0 41,0 38,0 41,0 40,0 38,0 51,0 37,0 42,0* 34,0 36,5 KSSF 20,0 20,0 7,5 20,0* 30,0 20,0* 30,0 20,0 25,0 5,0 20,0 20,0 20,0 17,5 20,0 5,0 10,0 20,0 20,0 20,0 20,0 30,0 20,0 20,0 –5,0 20,0 20,0 20,0 20,0 30,0* 10,0 25,0* 5,0 0,0 *p<0,05 en la prueba de Kruskal Wallis; KSS: Knee Society Score. Respecto a las asociaciones con la valoración a los 3 meses en la escala funcional KSS (Tabla 20), las mujeres mostraron peores puntuaciones que los hombres en ambas subescalas, aunque mas llamativas en el caso de la 72 KSSF, la asociación con el nivel de estudios existente en la valoración inicial no fue significativa a los 3 meses; los jubilados por edad mostraron mejores puntuaciones en ambas subescalas y los casados en el KSSF. Tabla 20. Características de los pacientes y valores finales (mediana) de función n Edad Sexo Nivel de Estudios Actividad Estado Civil Apoyo Social Ayuda Social Domicilio Diagnóstico Lateralidad Comorbilid. Centro Fisioterapia Transporte Hasta 65 años De 65 a 74 años Superior a 74 años Mujeres Hombres Primarios Bachiller/Universt. Activos Jubilado por edad Jubilado por invalidez Jubilado ama de casa Soltero/separado Casado Viudo Si No Si No Propio Otros Gonartrosis Artritis Reumatoide Derecha Izquierda Bilaterales Sin Comorbilidad Con Comorbilidad Hospital Unidad Básica Rehab. Sin fisioterapia Con fisioterapia Propio Taxi Ambulancia 40 109 36 137 48 166 19 25 50 16 94 14 115 56 181 4 2 183 177 8 179 6 90 84 11 69 116 124 61 56 128 112 8 56 KSSR 73,0 71,0 76,5 70,0* 78,0 71,5 78,0 71,0* 78,5 72,0 69,0 72,0 71,0 73,5 72,0 79,5 75,5 72,0 71,0 82,0 72,0 84,0 70,5 73,0 72,0 70,0 73,0 73,0 68,0 82,5* 67,0 73,5* 54,0 68,5 KSSF 50,7 65,0 55,0 55,0* 70,0 60,0 75,0 55,0* 70,0 60,0 55,0 55,0* 65,0 50,0 60,0 42,5 67,5 60,0 60,0 57,5 60,0 60,0 57,5 57,5 80,0 60,0 60,0 60,0 60,0 65,0* 55,0 65,0* 45,0 47,5 *p<0,05 en la prueba de Kruskal Wallis; KSS: Knee Society Score. 73 También se asociaron a la valoración KSS, la realización de fisioterapia (los pacientes que fueron a fisioterapia presentaban peor función) y el tipo de transporte (los pacientes que usaban transporte sanitario tenían peor función). No se detectaron asociaciones significativas respecto a grupos de edad, apoyo social, ayuda social, residencia, diagnóstico, lateralidad, comorbilidad o centro de tratamiento. Respecto a los factores asociados a la ganancia funcional -diferencia entre la valoración inicial y final del KSS- (Tabla 21), sólo se identificó la asociación entre prótesis bilateral y mayor ganancia en la subescala de función. Tabla 21. Características de los pacientes y ganancia (mediana) de función n Edad Hasta 65 años 40 De 65 a 74 años 109 Superior a 74 años 36 Sexo Mujeres 137 Hombres 48 Nivel de Primarios 166 Estudios Bachiller/Universt. 19 Actividad Activos 25 Jubilado por edad 50 Jubilado por invalidez 16 Jubilado ama de casa 94 Estado Soltero/separado 14 Civil Casado 115 Viudo 56 Apoyo Si 181 Social No 4 Ayuda Si 2 Social No 183 Domicilio Propio 177 Otros 8 Diagnóstico Gonartrosis 179 Artritis Reumatoide 6 Lateralidad Derecha 90 Izquierda 84 Bilaterales 11 Comorbilid. Sin Comorbilidad 69 Con Comorbilidad 116 Centro Hospital 124 Unidad Básica Rehab. 61 Fisioterapia Sin fisioterapia 56 Con fisioterapia 128 Transporte Propio 112 Taxi 8 Ambulancia 56 *p<0,05 en la prueba de Kruskal Wallis; KSS: Knee Society Score. 74 KSSR 24,0 25,0 16,0 23,0 26,5 23,5 28,0 20,0 28,0 30,5 21,0 17,5 27,0 19,0 23,0 48,0 46,5 23,0 24,0 25,0 24,0 28,5 23,5 24,0 23,0 25,0 22,0 23,5 25,0 21,5 25,0 22,5 15,0 26,0 KSSF 42,5 40,0 42,5 40,0 45,0 42,5 35,0 45,0 45,0 52,5 40,0 42,5 45,0 40,0 40,0 45,0 57,5 40,0 40,0 50,0 40,0 30,0 40,0* 40,0 70,0 40,0 45,0 45,0 40,0 40,0 45,0 45,0 40,0 42,5 Con respecto a la asociación entre las puntuaciones funcionales y de calidad de vida al inicio de la rehabilitación, con las puntuaciones finales del KSS (tabla 22). Las mejores puntuaciones previas en el KSSR se asociaron a mejores puntuaciones en ambas subescalas a los 3 meses, pero las mejores puntuaciones en el KSSF inicial sólo se asociaron a mejoras en esta misma subescala. Respecto al QL de Spitzer, las AVD en la medición previa y la salud en la inicial se asociaron a ganancias en el KSSF, mientras la puntuación total inicial se asoció a mejoras en el KSSR. Finalmente, las mejores puntuaciones iniciales en la dimensión función física del SF-36 se asociaron a mejores puntuaciones finales en el KSSF. Tabla 22. Asociación entre características de función y calidad de vida al inicio de la rehabilitación y resultados de función a los 3 meses KSS QL Spitzer previo QL Spitzer inicio SF 36 inicio KSS Rodilla KSS Función Actividad AVD Salud Apoyo Actitud Punt. Total Actividad A.V.D. Salud Apoyo Actitud Punt. Total Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud Mental KSSR KSSF 0,364* 0,106 0,144 –0,006 –0,115 0,031 –0,030 0,141 –0,136 –0,084 –0,130 0,042 –0,044 –0,176* 0,026 0,047 0,020 0,021 0,121 –0,034 0,002 0,048 0,171* 0,370* 0,109 –0,182* –0,126 0,079 –0,077 –0,044 –0,083 –0,095 –0,153* –0,002 –0,110 –0,110 0,004 0,257* –0,072 –0,092 –0,026 0,019 0,085 0,002 KSS: Knee Society Score; AVD: actividades de la vida diaria; QL: Quality of Life; SF36: Short Form 36. *p<0,05 Finalmente, se identificaron las asociaciones existentes entre la valoración inicial de las propias subescalas rodilla y función del KSS con respecto a las ganancias obtenidas en el KSS y el SF-36 (Tabla 23). Los valores iniciales de la subescala rodilla se asociaron a ganancias en esta misma subescala de rodilla KSS (peor valor inicial, mayor ganancia) y a ganancia en salud general (mayor valor inicial, mayor ganancia). Los valores iniciales en la subescala de función se asociaron a ganancias en esa misma subescala (peor valor inicial, mayor ganancia) y a ganancia de la función física y rol funcional (mejores resultados iniciales, mayor ganancia). 75 Tabla 23. Asociación entre los valores iniciales de función (KSS) y las ganancias obtenidas en función (KSS) y calidad de vida (SF–36) Salud general Func. Rol Rol Dolor Vita– física Func. Emoc. Lidad Rol Social Salud Mental KSS Rodilla 0,189* KSS Función 0,056 0,139 0,141 –0,076 0,106 –0,028 0,191* 0,190* –0,001 0,094 –0,116 –0,004 –0,208 –0,064 0,102 KSSR KSSF –0,594* –0,004 0,065 –0,648* *p<0,05 Factores asociados a los resultados de calidad de vida Respecto a los factores asociados con la calidad de vida valorada al inicio de la rehabilitación con el SF36 (Tabla 24), la edad, el estado civil y la ayuda social no se asociaron a diferencias en las puntuaciones en ninguna de las dimensiones. Ser mujer se asoció a peores puntuaciones en todas las dimensiones salvo función física, rol emocional y rol funcional, en las que no se hallaron diferencias con los hombres. Los pacientes sin estudios-primarios tuvieron una peor puntuación en la dimensión función física, pero sin diferencias en el resto. Respecto a la actividad, los jubilados por edad mostraron una mejor puntuación en la dimensión salud mental y rol social. La falta de apoyo social se asoció a peores puntuaciones en las dimensiones salud general y salud mental, mientras que la residencia en lugares diferentes al propio domicilio también se asoció a peores puntuaciones de salud general. El diagnóstico de artritis reumatoide se asoció a peores puntuaciones en salud general y dolor, mientras que la bilateralidad se asoció a peores puntuaciones en la función física. Por su parte, la presencia de comobilidad se asoció a peores puntuaciones en la dimensión salud general. La indicación de tratamiento fisioterápico se asoció peores resultados en función física, mientras que el desplazamiento en taxi se asoció a mejores resultados en salud general y vitalidad, mientras que el desplazamiento en vehículo propio se asoció a valores más altos en salud mental, rol social y función física. Respecto a la puntuación a los 3 meses de la primera valoración (tabla 25), los menores de 65 años mostraron peores puntuaciones en las dimensiones función física, rol funcional, vitalidad y salud mental, seguidos por los mayores de 74 años (aunque no en vitalidad ni salud mental, donde los mas mayores mostraron las mejores puntuaciones). El ser mujer se asoció a peores puntuaciones en todas las dimensiones excepto en rol funcional y rol emocional. No se hallaron diferencias por nivel de estudios en ninguna de las dimensiones. Respecto a la actividad laboral, los activos mostraron peores pun76 tuaciones en función física, dolor y vitalidad. El estado civil sólo se asoció a diferencias en la dimensión salud mental, con peores puntuaciones para los viudos. No se hallaron diferencias en función del apoyo social (significativamente diferente en la valoración inicial para salud general y mental), ayuda social, residencia (diferente en la valoración inicial para salud general) ni centro de tratamiento. Tabla 24. Características de los pacientes y valores iniciales (mediana) de calidad de vida n Edad Sexo Nivel de Estudios Actividad Estado Civil Apoyo Social Ayuda Domicilio Diagnóstico Lateralidad Comorbilid. Centro Fisioterapia Transporte Hasta 65 años De 65 a 74 años Superior a 74 años Mujeres Hombres Primarios Bachiller/Universt. Activos Jubilado por edad Jubilado invalidez Jubilado ama de casa Soltero/separado Casado Viudo Si No Si No Propio Otros Gonartrosis Artritis Reumatoide Derecha Izquierda Bilaterales Sin Comorbilidad Con Comorbilidad Hospital UBR Sin Fisioterapia Con Fisioterapia Propio Taxi Ambulancia 42 116 38 145 51 177 19 25 54 17 100 16 122 58 190 6 194 2 187 9 189 7 92 92 12 72 124 133 57 128 112 8 56 Salud general Func. física 66,0 72,0 71,0 70,0* 77,0 72,0 72,0 65,0 73,5 72,0 72,0 58,5 72,0 72,0 72,0* 52,5 72,0 61,0 72,0* 50,0 72,0* 45,0 68,5 73,5 71,0 77,0* 70,0 72,0 75,0 72,0 72,0 74,5* 76,0 67,0 15,0 10,0 10,0 10,0 20,0 10,0* 25,0 5,0 20,0 10,0 10,0 15,0 10,0 15,0 10,0 17,5 10,0 22,0 10,0 10,0 10,0 5,0 10,0* 15,0 0,0 10,0 10,0 10,0 15,0 15,0* 10,0 15,0* 2,5 5,0 Rol Rol Func. Emoc. 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 66,6 100,0 50,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 Dolor Vita– Lidad Rol Social Salud Mental 41,0 41,5 51,0 41,0* 54,0 42,0 41,0 41,0 51,5 42,0 41,0 41,0 43,0 46,5 42,0 56,0 42,0 31,0 44,0 22,0 44,0* 22,0 42,0 46,5 41,0 51,0 41,5 51,0 42,0 51,0 41,5 51,0 42,5 41,0 55,0 60,0 55,0 55,0* 60,0 55,0 60,0 55,0 60,0 40,0 55,0 40,0 55,0 55,0 55,0 40,0 55,0 32,5 55,0 50,0 55,0 45,0 55,0 55,0 57,5 55,0 55,0 55,0 55,0 60,0 55,0 60,0* 62,5 50,0 62,5 62,5 62,5 62,5* 75,0 62,5 75,0 62,5* 75,0 62,5 62,5 68,5 62,5 62,5 62,5 56,2 62,5 62,5 62,5 62,5 62,5 62,5 62,5 62,5 62,5 62,5 62,5 62,5 62,5 75,0 62,5 62,5* 62,5 50,0 60,0 68,0 66,0 60,0* 72,0 64,0 72,0 60,0* 72,0 56,0 64,0 58,0 66,0 60,0 64,0 28,0 64,0 70,0 64,0* 48,0 64,0 72,0 64,0 64,0 74,0 64,0 64,0 60,0 68,0 72,0 60,0 68,0* 58,0 56,0 *p<0,05 en la prueba de Kruskal Wallis; KSS: Knee Society Score. 77 Los pacientes con artritis reumatoide presentaron peores puntuaciones en salud general, función física, rol funcional, dolor y vitalidad. Respecto a la lateralidad, los pacientes con prótesis izquierda tenían mejores puntuaciones en salud general, al igual que los pacientes sin comorbilidad. Los pacientes que acudieron a fisioterapia presentaban peores resultados en 5 de las 8 dimensiones (salud general, función física, rol funcional, dolor y salud mental), resultado muy similar al de los que utilizaron transporte sanitario, aunque en este caso también presentaron peores puntuaciones en vitalidad. Tabla 25. Características de los pacientes y valores finales (mediana) de calidad de vida Edad Hasta 65 años De 65 a 74 años Superior a 74 años Sexo Mujeres Hombres Nivel de Primarios Estudios Bachiller/Universt. Actividad Activos Jubilado edad Jubilado invalidez Jubilado ama de casa Estado Soltero/separado Civil Casado Viudo Apoyo Si Social No Ayuda Si Social No Domicilio Propio Otros Diagnóstico Gonartrosis Artritis Reumatoide Lateralidad Derecha Izquierda Bilaterales Comorbilid. Sin comorbilidad Con comorbilidad Centro Hospital UBR Fisioterapia Sin fisioterapia Con fisioterapia Transporte Propio Taxi Ambulancia n 40 109 36 137 48 166 19 25 50 16 94 14 115 56 181 4 194 2 177 8 179 6 90 84 11 69 116 133 63 56 128 112 8 56 Salud general 67,0 77,0 72,0 72,0* 77,0 72,0 72,0 65,0 77,0 72,0 72,0 67,0 72,0 74,5 72,0 72,0 72,0 64,5 72,0 63,5 72,0* 42,0 71,0* 77,0 72,0 77,0* 72,0 72,0 72,0 77,0* 72,0 77,0* 73,5 67,0 Func. física 50,0* 65,0 50,0 55,0* 70,0 60,0 65,0 50,0* 65,0 70,0 55,0 50,0 60,0 55,0 60,0 40,0 60,0 65,0 60,0 60,0 60,0* 17,5 55,0 60,0 60,0 55,0 60,0 60,0 50,0 70,0* 55,0 65,0* 52,5 45,0 Rol Func. 25,0* 75,0 37,5 50,0 50,0 50,0 75,0 0,0 75,0 25,0 50,0 87,5 50,0 25,0 50,0 0,0 50,0 50,0 50,0 37,5 50,0* 0,0 37,5 62,5 25,0 50,0 50,0 50,0 50,0 75,0* 37,5 75,0* 50,0 25,0 Rol Emoc. 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 50,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 Dolor 67,0 74,0 74,0 72,0* 84,0 73,0 74,0 61,0* 84,0 73,0 72,0 67,0 74,0 72,0 74,0 92,0 74,0 74,0 74,0 63,0 74,0* 26,5 72,0 74,0 84,0 74,0 72,0 74,0 72,0 84,0* 72,0 74,0* 67,0 62,0 Vita– Lidad 52,5* 60,0 67,5 60,0* 70,0 60,0 55,0 55,0* 70,0 57,5 60,0 65,0 65,0 60,0 60,0 55,0 60,0 55,0 60,0 57,5 65,0* 45,0 60,0 62,5 70,0 60,0 60,0 62,5 60,0 65,0 60,0 65,0* 70,0 55,0 Rol Social 100,0 100,0 100,0 100,0* 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 81,2 100,0 81,2 100,0 93,7 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 Salud Mental 64,0* 76,0 78,0 68,0* 80,0 74,0 76,0 68,0* 86,0 68,0 72,0 70,0* 76,0 64,0 76,0 30,0 76,0 48,0 72,0 80,0 76,0 64,0 72,0 72,0 84,0 76,0 74,0 72,0 76,0 80,0* 72,0 76,0* 80,0 62,0 *p<0,05 en la prueba de Kruskal Wallis; KSS: Knee Society Score. En relación a los factores asociados a la ganancia entre la valoración inicial y final en el cuestionario SF-36 (tabla 26), los pacientes de 65 a 74 años expe78 rimentaron una mayor ganancia que el resto en la dimensión rol funcional, al igual que los hombres y los pacientes sin estudios/primarios –respecto a las mujeres y pacientes con estudios medios/superiores- en la dimensión función física. No se hallaron diferencias significativas en ganancias en ninguna dimensión según actividad laboral, estado civil, apoyo social, ayuda social o comorbilidad. Los pacientes con residencia en lugares diferentes a su domicilio experimentaron una discreta mayor ganancia que los que vivían en su domicilio en la dimensión salud general. Por diagnóstico, las artrosis tuvieron mayor ganancia que las artritis en rol funcional y dolor, mientras que los pacientes con prótesis bilateral experimentaron la mayor ganancia en función física. Los pacientes que asistieron a fisioterapia tuvieron menores ganancias que el resto de pacientes en salud general, función física y rol funcional. Tabla 26. Características de los pacientes y ganancia (mediana) de calidad de vida Edad Hasta 65 años De 65 a 74 años Superior a 74 años Sexo Mujeres Hombres Nivel de Primarios Estudios Bachiller/Universt. Actividad Activos Jubilado por edad Jubilado invalidez Jubilado ama de casa Estado Soltero/separado Civil Casado Viudo Apoyo Si Social No Ayuda Si Social No Domicilio Propio Otros Diagnóstico Gonartrosis Artritis Reumatoide Lateralidad Derecha Izquierda Bilaterales Comorbilid Sin Comorbilidad Con Comorbilidad Fisioterapia Sin fisioterapia Con fisioterapia Transporte Propio Taxi Ambulancia *p<0,05 en la prueba de Kruskal Wallis; n 40 109 36 137 48 166 19 25 50 16 94 14 115 56 181 4 2 183 177 8 179 6 90 84 11 69 116 56 128 112 8 56 Salud general 0,0 0,0 1,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 6,0 3,5 0,0 0,0* 5,0 0,0 0,0 0,0 0,0 7,0 0,0 0,0 1,0* 0,0 0,0 –7,5 0,0 Func. física 40,0 45,0 40,0 40,0* 55,0 45,0* 30,0 45,0 50,0 55,0 40,0 30,0 45,0 40,0 45,0 30,0 42,5 45,0 45,0 50,0 45,0 10,0 42,5* 42,5 60,0 45,0 45,0 45,0* 40,0 45,0 37,5 40,0 Rol Func. 12,5* 50,0 25,0 25,0 50,0 50,0 25,0 0,0 75,0 25,0 25,0 50,0 50,0 25,0 50,0 0,0 50,0 50,0 50,0 0,0 50,0* 0,0 25,0 50,0 25,0 50,0 37,5 75,0* 25,0 50,0 25,0 12,5 Rol Emoc. 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 0,0 Dolor 11,0 20,0 23,0 18,0 23,0 19,5 26,0 11,0 23,0 21,0 18,5 15,0 21,0 12,0 19,0 25,0 43,0 19,0 20,0 15,0 20,0* 0,0 14,0 22,0 33,0 20,0 19,0 23,0 17,5 21,5 16,0 12,0 Vita– Lidad 2,5 5,0 10,0 5,0 10,0 5,0 0,0 5,0 10,0 12,5 0,0 10,0 5,0 7,5 5,0 2,5 22,5 5,0 5,0 5,0 5,0 –5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 5,0 Rol Social 31,5 25,0 25,0 25,0 25,0 25,0 25,0 37,5 25,0 37,5 25,0 25,0 37,5 25,0 25,0 18,7 18,7 25,0 25,0 25,0 25,0 12,5 25,0 25,0 37,5 25,0 25,0 25,0 25,0 25,0 50,0 37,5 Salud Mental 8,0 4,0 4,0 4,0 8,0 4,0 4,0 8,0 4,0 14,0 4,0 4,0 4,0 4,0 4,0 6,0 -22,0 4,0 4,0 2,0 4,0 8,0 0,0 4,0 12,0 8,0 4,0 6,0 4,0 4,0 16,0 4,0 79 En la tabla 27 se muestra la asociación entre las puntuaciones funcionales y de calidad de vida al inicio de la rehabilitación, con las puntuaciones finales del SF-36. Las mejores puntuaciones previas en el KSSR se asociaron a mejores puntuaciones finales en función física, dolor y vitalidad, mientras que el KSSF sólo se asoció a mejor función física. La medición previa del QL de Spitzer muestra diferentes asociaciones con la medición final del SF-36: entre salud y las dimensiones salud general, dolor, vitalidad y rol social; apoyo con función física y rol social; actitud con rol funcional, rol emocional y salud mental, y la puntuación total con el rol funcional y la vitalidad. En el caso del QL inicial, las asociaciones fueron: actividad con rol emocional (inversa), salud con función física, dolor y vitalidad, y actitud con salud general, rol emocional y salud mental. Tabla 27. Asociación entre características de función y calidad de vida al inicio de la rehabilitación y resultados de calidad de vida (SF–36) a los 3 meses KSS Rodilla KSS Función Actividad A.V.D. Salud Apoyo Actitud Punt. Total Actividad A.V.D. Salud Apoyo Actitud Punt. Total Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud Mental Salud general 0,075 0,005 –0,017 –0,124 –0,173* 0,049 –0,107 –0,062 –0,051 –0,073 –0,139 0,088 –0,158* –0,113 0,670* –0,003 –0,047 –0,098 0,006 –0,005 0,007 0,083 Func. física 0,199* 0,307* –0,063 –0,098 –0,089 –0,164* –0,021 –0,079 –0,108 –0,049 –0,193* –0,019 –0,070 –0,037 0,051 0,298* –0,061 0,156* 0,079 0,105 0,103 –0,055 Rol Func. 0,141 0,057 –0,071 0,017 –0,140 –0,009 –0,180* –0,201* –0,088 0,034 –0,128 –0,010 –0,117 –0,001 0,087 0,136 0,054 0,165* 0,095 –0,092 –0,088 0,117 Rol Emoc. 0,109 –0,104 0,043 –0,077 –0,039 0,019 –0,203* –0,133 0,142* –0,006 –0,042 0,129 –0,202* 0,072 –0,086 0,015 –0,052 0,355* 0,000 0,020 –0,116 0,173* Dolor 0,243* 0,045 0,039 0,043 –0,306* –0,107 0,008 0,118 –0,137 0,077 –0,200* 0,081 –0,114 –0,100 0,195* –0,005 –0,069 0,150* 0,443* 0,002 0,053 0,027 Vita– Lidad 0,189* –0,082 –0,072 –0,050 –0,231* –0,091 –0,106 –0,195* –0,027 0,055 –0,202* –0,053 –0,055 0,052 0,111 –0,072 –0,090 –0,078 0,133 0,420* 0,112 0,079 Rol Social 0,056 0,026 0,053 0,022 –0,196* –0,161* –0,059 –0,070 0,061 –0,001 –0,111 –0,103 –0,111 –0,004 0,104 –0,100 –0,003 0,016 0,098 0,085 0,231* 0,099 Salud Mental 0,126 0,018 0,104 –0,131 –0,104 0,011 –0,335* –0,108 0,033 0,027 –0,131 0,036 –0,340* 0,010 0,106 0,002 –0,178* 0,113 –0,071 0,156* 0,052 0,489* AVD: Actividades vida diaria. *p<0,05 En el caso del SF36, la administración previa tiende a correlacionar con la posterior. Así, la salud general se asoció a esta dimensión y al dolor; la función física previa con la posterior; el rol funcional con la salud mental; el 80 rol emocional con la función física, rol funcional, rol emocional y dolor; el dolor con el dolor a los 3 meses; la vitalidad con esta dimensión y la salud mental; el rol social con el rol social posterior y la salud mental con el rol emocional y la propia salud mental posterior. También se identificaron las asociaciones existentes entre la valoración inicial de las dimensiones del SF-36 con la ganancia obtenida en las subescalas del KSS y las dimensiones del SF-36 (Tabla 28). Los valores iniciales de salud general se asociaron a ganancias en salud general y rol emocional (peores valores iniciales, mayor ganancia), rol funcional y dolor (mejores valores iniciales, mayor ganancia); los valores de función física se asociaron a función física, rol social y la subescala función del KSS (peores valores iniciales, mayor ganancia) y a rol funcional (mejores valores iniciales, mayor ganancia); el rol funcional se asoció a ganancias en esta misma dimensión (peor valor inicial, mayor ganancia); el rol emocional se asoció a ganancia de rol funcional y KSSF(mayor valor inicial, mayor ganancia) y a rol emocional (peor valor inicial, mayor ganancia); el dolor se asoció a ganancias en rol funcional (mejor valor inicial, mayor ganancia) y dolor (peor valor inicial, mayor ganancia); la vitalidad se asoció a ganancias en función física (mayor valor inicial, mayor ganancia) y vitalidad (peor valor inicial, mayor ganancia); el rol social se asoció a ganancias en la misma dimensión (peor resultado inicial, mayor ganancia) y, finalmente, la salud mental se asoció a ganancia de rol funcional (mejor valor inicial, mayor ganancia), salud mental y vitalidad (peor valor inicial, mayor ganancia). Tabla 28. Asociación entre los valores iniciales del SF-36 y las ganancias obtenidas en función (KSS) y calidad de vida (SF-36) Salud general Salud General Func. Física Rol. Func. Rol Emoc. Dolor Vitalidad Rol Social Salud Mental Func. física Rol Func. Rol Dolor Emoc. Vita– Rol Salud KSSK Lidad Social Mental –0,424* 0,022 0,176* –0,163* 0,223* –0,031 0,041 0,056 0,026 –0,367* 0,311* –0,037 0,104 –0,113 –0,282* 0,026 0,015 0,028 –0,181* –0,035 0,113 –0,054 –0,092 –0,132 0,145 0,075 0,221* –0,607* –0,117 –0,116 0,002 0,145 0,098 0,147 0,227* –0,033 –0,460* 0,006 0,018 –0,056 0,029 0,163* 0,143 0,005 0,056 –0,607* –0,080 0,053 0,079 0,069 0,022 –0,129 0,088 0,056 –0,672* 0,005 0,062 0,034 0,254* 0,016 0,064 –0,190* –0,102 –0,418* –0,009 0,008 –0,022 –0,038 –0,016 –0,096 0,047 –0,023 KSSF –0,032 –0,158* –0,063 0,149* –0,055 0,009 –0,007 0,082 *p<0,05 81 Finalmente, respecto a la relación del SF-36 a los 3 meses, con la medición funcional y el QL de Spitzer en el mismo momento (Tabla 29), el mejor KSSR se asoció a mejores puntuaciones en las dimensiones de función física y dolor, mientras el KSSF se asoció a la función física y salud mental. Respecto al QL, la actividad se asoció al rol funcional y dolor; la capacidad para las AVD, a función física y dolor; la salud a salud general; el apoyo a salud general (inversamente), función física, dolor (inversamente), vitalidad y rol social; la actitud a rol emocional y salud mental; y la mejor puntuación global del QL se asoció a mejores puntuaciones en función física, rol funcional y dolor del MOS-SF 36. Tabla 29. Asociación entre características de función y calidad de vida final y resultados de calidad (SF-36) a los 3 meses Salud general Func. física Rol Func. Rol Emoc. Dolor KSS Rodilla KSS Función –0.010 –0.102 0.196* 0.097 0.608* 0.034 –0.051 –0.068 0.417* –0.138 0.132 –0.137 Actividad A.V.D. Salud Apoyo Actitud Punt. Total –0.047 0.002 –0.259* 0.145* 0.013 –0.114 –0.121 –0.151* –0.136 –0.149* 0.073 –0.174* –0.483* –0.101 0.033 –0.006 –0.048 –0.314* –0.020 –0.020 –0.117 0.066 –0.208* –0.129 –0.266* –0.210* –0.130 0.255* –0.090 –0.264* Vita– Rol Salud Lidad Social Mental 0.023 0.098 –0.005 –0.256* 0.078 0.035 0.101 0.050 0.044 0.234* 0.117 0.000 –0.117 –0.104 –0.105 –0.038 –0.024 0.015 0.007 –0.099 –0.318* –0.127 *p<0,05 Factores asociados a la satisfacción Con respecto a los factores asociados a la satisfacción, sólo se identificó la residencia (menos satisfechos los que vivían en domicilios diferentes al propio), el centro de tratamiento (mayor satisfacción en las UBR que en el hospital) y la fisioterapia (Tabla 30). Las características de los pacientes que se asociaron a los factores extraídos del análisis factorial de la encuesta de satisfacción [Navarro et al, 1998], fueron la edad que se asoció a la satisfacción con la fisioterapia y con el médico (menos satisfechos los mayores de 74 años), el sexo que se asoció a satisfacción con la fisioterapia (más satisfechas las mujeres), la lateralidad, asociada a satisfacción con el médico (menos satisfecho los intervenidos de la rodilla derecha) y el centro de tratamiento, que se aso82 ció a satisfacción con el entorno y la espera (más satisfechos los de UBR) (Tabla 31). Tabla 30. Características de los pacientes y satisfacción (medianas) n Edad Sexo Nivel de Estudios Actividad Estado Civil Apoyo Social Ayuda Social Domicilio Diagnóstico Lateralidad Comorbilid. Centro Fisioterapia Transporte Hasta 65 años De 66 a 75 años Superior a 75 años Mujeres Hombres Primarios Bachiller/Universt. Activos Jubilado por edad Jubilado por invalidez Jubilado ama de casa Soltero/separado Casado Viudo Si No Si No Propio Otros Gonartrosis Artritis Reumatoide Derecha Izquierda Bilaterales Sin Comorbilidad Con Comorbilidad Hospital UBR Sin fisioterapia Con fisioterapia Propio Taxi Ambulancia 37 97 35 124 45 146 16 23 46 14 79 13 102 47 159 3 2 160 156 6 157 5 77 75 10 62 107 108 54 49 112 99 8 48 Item 1-19 3,5 3,6 3,4 3,5 3,4 3,5 3,5 3,6 3,5 3,4 3,5 3,6 3,5 3,5 3,5 3,2 3,5 3,2 3,5* 3,2 3,5 3,3 3,4 3,6 3,5 3,6 3,5 3,4* 3,6 3,4* 3,6 3,4 3,4 3,6 Item 20 10,0 10,0 9,0 10,0 9,0 10,0 9,5 10,0 9,5 9,0 10,0 10,0 9,0 10,0 10,0 8,0 8,5 10,0 10,0 8,5 10,0 9,0 10,0 10,0 9,5 10,0 10,0 9,5 10,0 9,0 10,0 10,0 10,0 10,0 *p<0,05 en la prueba de Kruskal Wallis. La correlación existente entre las valoraciones iniciales del KSS, QL Spitzer y dimensiones del SF-36 con la satisfacción se muestra en la tabla 32. La puntuación global de satisfacción (ítem 20), no mostró asociación con el estado funcional o la calidad de vida del paciente al inicio de la rehabilitación. Sin embargo, la puntuación media de los item 1 a 19 se asoció a algunas dimensiones del QL de Spitzer previo e inicial (salud, actitud y total) y del SF-36 inicial (Salud General y Salud mental). 83 Tabla 31. Características de los pacientes y factorial de satisfacción Edad Sexo Nivel de Estudios Actividad Estado Civil Apoyo Social Ayuda Social Domicilio Diagnóstico Lateralidad Comorbilid Centro Fisioterapia Transporte n Hasta 65 años 40 De 65 a 74 años 109 Superior a 74 años 36 Mujeres 137 Hombres 48 Primarios 166 Bachiller/Universt. 19 Activos 25 Jubilado por edad 50 Jubilado invalidez 16 Jubilado ama de casa 94 Soltero/separado 14 Casado 115 Viudo 56 Si 181 No 4 Si 2 No 183 Propio 177 Otros 8 Gonartrosis 179 Artritis Reumatoide 6 Derecha 90 Izquierda 84 Bilaterales 11 Sin Comorbilidad 69 Con Comorbilidad 116 Hospital 108 UBR 54 Sin fisioterapia 56 Con fisioterapia 128 Propio 112 Taxi 8 Ambulancia 56 Factor Factor Fisiot. Médico 3,5* 3,7* 3,5 3,7 3,3 3,3 3,5* 3,7 3,5 3,7 3,5 3,7 3,5 3,7 3,7 4,0 3,5 3,7 3,5 3,7 3,5 3,7 3,7 3,7 3,5 3,7 3,5 3,7 3,5 3,7 3,5 3,2 2,3 3,3 3,5 3,7 3,5 3,7 3,2 3,3 3,5 3,7 3,8 3,7 3,5 3,3* 3,5 3,7 3,5 3,7 3,5 3,7 3,5 3,7 3,5 3,7 3,7 3,7 3,3 3,7 3,5 3,7 3,5 3,7 3,7 3,8 3,5 3,7 Factor Durac. 4,0 4,0 3,7 4,0 3,7 4,0 4,0 4,0 3,7 3,3 4,0 4,0 3,7 4,0 4,0 2,8 3,3 4,0 4,0 3,0 4,0 3,3 3,7 4,0 4,0 4,0 3,7 3,7 4,0 3,7 4,0 3,7 4,0 4,0 Factor Entor 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,5 3,4 3,5 3,7 3,5 3,5 3,5 4,0 3,5 3,5 3,5 3,2 3,5 3,2 3,5 3,5 3,7 3,5 3,5 3,5* 3,7 3,4 3,5 3,5 3,2 3,7 Factor Espera 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 3,5 3,0 3,0 3,0 3,5 3,0 3,0 3,0 3,0 3,0 3,2 3,0 3,0 3,0 3,0 3,0 3,0* 3,0 3,0 3,0 3,0 3,0 3,0 Factor Recep 4,0 3,0 3,0 3,0 4,0 3,0 3,0 4,0 3,0 4,0 3,0 3,0 3,0 4,0 3,0 4,0 3,5 3,0 3,0 3,0 3,0 3,0 3,0 3,5 4,0 3,0 3,0 3,0 3,0 3,0 3,0 3,0 4,0 4,0 La n tiene pérdidas porque algunos pacientes no contestaban todas las preguntas. *p<0,05. En el análisis realizado entre los valores iniciales del KSS, QL Spitzer y SF-36, respecto a los factores extraídos del análisis factorial de la encuesta de satisfacción (Tabla 33), se encontraron asociaciones entre la subescala funcional del KSS y la satisfacción con la fisioterapia (a peor puntuación inicial de KSS mayor satisfacción con la fisioterapia) y con el médico (mejor puntuación KSS mayor satisfacción con los aspectos relacionados con el médico). La actividad, la actitud y la puntuación del QL de Spitzer previo se asociaron al factor fisioterapia (mejor puntuación, mayor satisfacción), mientras que la dimensión apoyo se asoció a la satisfacción con la duración del tratamiento. También se asoció la puntuación 84 final al factor recepción (peor puntuación previa, mayor satisfacción con la recepción e información general recibida). Tabla 32. Asociación entre características de función y calidad de vida al inicio de la rehabilitación y satisfacción KSS inicio QL Spitzer previo QL Spitzer inicio SF 36 inicio KSS Rodilla KSS Función Actividad AVD Salud Apoyo Actitud Punt. Total Actividad A.V.D. Salud Apoyo Actitud Punt. Total Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud Mental Items 1-19 –0.002 -0.013 –0.126 –0.022 –0.154* –0.106 –0.151* –0.184* –0.049 –0.110 –0.168* –0.108 –0.262* –0.232* 0.169* 0.049 0.069 0.119 0.054 0.139 –0.038 0.170* Item 20 0.027 0.049 0.023 –0.047 0.032 0.017 –0.054 –0.000 0.087 0.034 0.030 0.127 0.035 0.083 0.128 0.009 –0.055 0.063 0.060 –0.035 0.141 –0.072 KSS: Knee Society Score; AVD: actividades de la vida diaria; QL: Quality of Life; SF36: Short Form 36. La salud inicial se asoció al factor recepción (peor salud, mayor satisfacción), el apoyo se asoció al factor duración del tratamiento (mejor puntuación, mayor duración del tratamiento) y la actitud se asoció al factor fisioterapia y médico (mejor puntuación, mayor satisfacción) y a los factores entorno y recepción (peor puntuación, mayor satisfacción). Con respecto al SF-36, salud general y rol social se asociaron al factor espera (mejor puntuación, mayor satisfacción), y finalmente la salud mental se asoció a recepción (peor puntuación , mayor satisfacción). Respecto a la relación entre satisfacción y resultados finales, la puntuación media de los ítem 1 a 19 sólo mostró asociación con la dimensión salud del QL de Spitzer, aunque en sentido paradójico (mayor satisfacción a peor salud). La puntuación global de satisfacción, sin embargo, se asoció a mejor resultado en el KSSF, dimensión salud del QL de Spitzer y dimensiones de salud general y salud mental del SF-36 (Tabla 34). 85 Tabla 33. Asociaciones entre características de función y calidad de vida al inicio de la rehabilitación y factorial de satisfacción KSS inicio QL previo QL inicio SF 36 inicio KSS Rodilla KSS Función Actividad AVD Salud Apoyo Actitud Punt. Total Actividad A.V.D. Salud Apoyo Actitud Punt. Total Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud mental Factor Fisiot. Factor Médico Factor Durac. Factor Entor Factor Espera Factor Recep –0,160 –0,218* –0,395* –0,117 –0,168 –0,074 –0,278* –0,386* –0,018 0,071 0,016 –0,034 –0,210* –0,051 –0,027 –0,162 –0,083 0,069 –0,115 0,114 –0,046 0,119 0,055 0,232* 0,077 0,064 0,060 0,120 –0,076 0,057 0,002 0,024 –0,143 0,142 –0,209* –0,109 0,056 0,078 0,080 0,109 0,065 –0,054 –0,059 0,085 –0,022 0,069 0,041 0,087 –0,045 –0,287* 0,047 0,038 0,038 –0,045 –0,071 –0,235* –0,048 –0,062 0,125 0,029 –0,118 –0,053 0,109 0,075 –0,024 –0,086 –0,087 –0,175 0,041 –0,018 –0,175 0,085 0,117 –0,024 0,132 0,037 0,023 0,046 0,234* 0,158 –0,017 –0,104 0,059 –0,014 0,129 –0,015 0,099 –0,110 0,118 0,075 0,025 –0,096 –0,053 0,003 0,044 –0,021 0,023 –0,146 –0,054 –0,158 –0,023 –0,081 0,225* 0,076 0,035 0,019 –0,045 0,028 0,246* 0,089 –0,071 –0,045 0,130 0,158 0,184 –0,067 0,168 0,239* –0,068 0,064 0,213* 0,068 0,261* 0,132 –0,007 0,070 –0,114 –0,138 –0,072 –0,158 –0,035 –0,205* Tabla 34. Asociación entre características de función y calidad de vida al final de la rehabilitación y satisfacción Items 1-19 Item 20 KSS final KSS Rodilla KSS Función –0.032 –0.111 0.083 0.190* QL Spitzer final Actividad A.V.D. Salud Apoyo Actitud Punt. Total –0.119 –0.007 0.157* –0.006 –0.015 –0.012 –0.099 0.118 –0.220* –0.135 –0.133 –0.141 SF 36 final Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud Mental 0.115 –0.019 0.051 0.079 0.058 0.042 0.077 0.016 0.186* 0.146 0.097 0.020 0.144 0.126 0.063 0.170* *KSS: Knee Society Score; AVD: actividades de la vida diaria; QL: Quality of Life; SF36: Short Form 36. 86 Las asociaciones encontradas con respecto a los valores finales del KSS, QL Spitzer y SF-36 y los factores derivados del análisis factorial de satisfacción (Tabla 35), muestran asociación entre la dimensión actitud del QL Spitzer y la satisfacción con la recepción (peor puntuación de actitud, mayor satisfacción). Con respecto al SF-36, la dimensión salud general se asoció a satisfacción con los factores duración del tratamiento y espera (mejor puntuación, mayor satisfacción en estos dos factores), mientras que la dimensión función física se asoció a la satisfacción con el factor recepción (mejor puntuación, mayor satisfacción). Tabla 35. Asociación entre características de función y calidad de vida al final de la rehabilitación y factorial de satisfacción Factor Fisiot. Factor Médico Factor Durac. Factor Entor Factor Espera Factor Recep KSS final KSS Rodilla KSS Función –0,1062 –0,1418 0,0021 0,0934 –0,0838 –0,0155 –0,0180 –0,0759 –0,0592 0,0498 0,0871 –0,0113 QL final Actividad AVD Salud Apoyo Actitud Punt. Total –0,1333 0,0744 0,1951 –0,1429 –0,0460 –0,0022 –0,0569 –0,0154 –0,1769 –0,0573 0,0109 –0,1105 –0,0958 –0,0695 –0,1529 0,0698 0,0265 –0,1174 0,0995 0,0987 –0,0077 –0,0565 –0,0866 0,0483 –0,0250 0,0571 –0,0047 0,0365 0,0291 0,0139 –0,0593 –0,0375 0,0530 0,1732 0,2519* 0,0731 SF 36 final Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud mental –0,0388 –0,0498 0,0730 0,1534 0,0191 0,1187 0,0330 0,1482 –0,0032 0,0294 –0,0099 0,0480 –0,0931 –0,0871 –0,0209 –0,0081 0,2356* 0,0513 0,1784 –0,0384 0,1492 0,1767 0,1000 0,0139 –0,0768 –0,1093 –0,1326 –0,0015 0,0891 0,0069 0,0339 –0,0735 0,2688* 0,1094 –0,0189 –0,0232 –0,0580 0,0972 0,0537 0,0352 0,0080 0,2059* –0,0413 –0,1481 0,0639 –0,1353 –0,0811 –0,1728 Cuando se analizaron los factores que se asociaron a las ganancias de cada uno de los parámetros de medida utilizados (Tabla 36), únicamente se encontró asociación entre la dimensión rol funcional del SF-36 y el factor duración del tratamiento (mayor ganancia, mayor satisfacción). 87 Tabla 36. Asociación entre ganancia de función y calidad de vida y factorial de satisfacción Factor Fisiot. Factor Médico Factor Durac. –0,0567 –0,0767 Ganancia KSS KSS Rodilla KSS Función 0,0553 0,0882 –0,0504 –0,1422 Ganancia SF 36 Salud General Función Física Rol funcional Rol Emocional Dolor Vitalidad Rol social Salud mental –0,0145 0,0847 0,1072 0,0675 0,1239 –0,0133 0,0690 0,0389 –0,0803 –0,0349 –0,0418 –0,0643 –0,1515 –0,0219 0,0385 –0,1041 88 0,1531 0,0254 0,2261* 0,0178 0,0435 0,0814 0,1026 0,1114 Factor Entor Factor Espera Factor Recep 0,0667 –0,1669 0,1012 –0,0291 0,1484 0,0323 –0,0796 –0,0205 –0,1582 0,0123 –0,0356 0,0230 0,0086 0,0381 0,0600 0,0213 0,0435 0,1432 –0,0333 0,0033 –0,0385 0,0046 –0,0141 0,1303 0,0591 0,0458 –0,1904 –0,0320 –0,0591 0,0308 Discusión Comparación con otros estudios Los pacientes revisados son una muestra típica de la población de pacientes intervenidos de artroplastia de rodilla, muy similares a los de otros estudios publicados [Liang MH et al, 1990; Callahan CM et al, 1994; Serna F et al, 1994; Ritter MA et al; 1995; Voss F et al, 1995; Mcguigan FX et al, 1995; Lavernia CJ et al, 1997; Mañez I et al, 1997; Hawker G et al; 1998; Van Essen GJ et al, 1998; March LM 1999; Pagés et al, 2001]. Las características esenciales son la mayor proporción de mujeres (74%), edad entre 65-75 años, diagnóstico principal de gonartrosis y una presencia importante de comorbilidad, fundamentalmente artroplastias previas, insuficiencia vascular periférica, déficit auditivo o visual y diabetes leve/moderada. Los resultados obtenidos, a rasgos generales, muestran importantes cambios entre la situación tras la intervención y a los 3 meses del tratamiento rehabilitador, caracterizados por: • Una importante mejoría en la escala KSS (sobre todo en la subescala de función). 89 • Una importante mejoría en el QL de Spitzer, tanto entre la valoración previa y final (a expensas de las dimensiones actividad, salud y actitud) y entre la valoración inicial y final (a expensas de las dimensiones actividad, AVD, salud y actitud). • Una importante mejoría en las dimensiones de función física, rol funcional del SF-36, más moderada en las dimensiones de dolor y Rol social y, menor, en las de vitalidad y salud mental. • Una importante satisfacción con la atención recibida, que es algo menor con los desplazamientos, las esperas y el trato del personal auxiliar. En todo caso, casi la totalidad de los pacientes dicen que volverían a repetir la rehabilitación en el mismo centro si pudieran elegir. En cuanto a los factores asociados a los resultados (tabla 37), la idea básica es que a mejor estado inicial los resultados finales son mejores, aunque la ganancia es menor; esto es, los pacientes en peor estado tienden a ganar mayor función y calidad de vida, pero no llegan a alcanzar la situación final de los pacientes que salían de un mejor estado inicial. Las asociaciones de peores resultados con algunos factores concretos (fisioterapia o transporte) parecen relacionarse con una selección de pacientes en mejor estado, que son los que obvian la fisioterapia o usan sus propios medios de transporte. Cabe destacar, no obstante la mayor satisfacción de los atendidos en UBR y los que acudieron a tratamiento fisioterápico. La mayor parte de estos resultados tienen una fuerte lógica clínica y son consistentes con la literatura existente desde la perspectiva de la cirugía ortopédica. Con respecto a la ganancia funcional tras artroplastia, todos los estudios hallados la abordan desde el punto de vista quirúrgico, situando la primera valoración funcional en un momento temporal previo a la intervención, y la post-quirúrgica con periodos más o menos prolongados de seguimiento. Todos los trabajos –desde hace mas de una década- ofrecen contundentes resultados sobre la mejora del dolor y la función tras artroplastia de la rodilla [Nielsen S et al, 1985; Hvid I et al, 1987; Ranawat CS et al, 1989; Stern SH et al, 1990; Gill GS 1991; Armstrong RA, Whiteside LA, 1991; Krackow KA et al, 1991; Stern SH et al, 1992; Kristensen O et al, 1992; Rinonapoli E et al, 1992; Nafei A. et al 1993; Sisto DJ et al, 1993; Zicat B. et al 1993, Boublik M et al, 1993;Ranawat CS et al, 1994; Voss F et al, 1995; König A et al 1997; Elke R et al, 1995; Colizza WA. et al, 1995; Kreibich DN et al, 1996; Gill GS et al, 1997; Bellemans J et al, 1997; Diduch DR et al, 1997; Hawker G et al, 1998; Van Essen GJ et al, 1998; Lu H et al, 1999; Bernard AA, Zrinzo LU, 1999; Li PL et al, 1999; Martín 90 SD et al, 1999]. Estos resultados son consistentes con las valoraciones de este estudio, aunque el momento temporal de la primera valoración es obviamente diferente desde el punto de vista de la rehabilitación. Tabla 37. Características de los pacientes al inicio de la rehabilitación asociadas a mejor estado final KSSR Edad Sexo Estudios Actividad Est. civil Apoyo Soc. Ayuda Soc. Domicilio Diagnóstico Lateralidad Comorbilidad Centro Fisioterapia Transporte KSSR previo KSSF previo QLTOTAL SF36SALUD GEN SF36FUNC. FIS SF36ROL FUNC SF36ROL EMOC. SF36DOLOR SF36VITALIDAD SF36ROL SOCIAL SF36S. MENTAL KSSF SF36FFI ns ns ▲s ▲s ▲s ns ▼ ns ns ns ns ns ns ns ns ▼ ▲ ▲ ns ▲ ns ns ns ns ns ns ns ns ns ▼ ▲ ns ▼ ns ns ns ns ns ns ns ns ns ns ns ▼AR ns ns ns ▼ ▲ ▲ ▲ ▼ ▲ ▲ ▲ ns ns ns ns ▲ ▲ ns ns ns ns ns ns ns SF36RFUN SF3636 SF36RSO SAT1-19 ns ns ns ns ns ns ns ns ns ▼AR ns ns ns ▲_ ▲_ ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ns ▼ ▲ ns ns ns ns ns ns ▲ ▲ ns ns ns ns ns ns ns ns ▼ ns ns ns ns ▼AR ns ns ns ▼ ▲ ▲ ns ns ▲ ns ns ▲ ▲ ns ns ns ns ns ns ns ns ns ns ▲ ns ns ns ▲UBR ▲ ns ns ns ▲ ▲ ▲ ns ns ns ns ns ns ns ▲ ns: factor no significativo estadísticamente; ▲: Factor asociado a mejores resultados; ▼: factor asociado a peores resultados; : Factor asociado no linealmente; : trabajadores en activo; : amas de casa jubiladas; :hombres; : Casados; AR: Artritis reumatoide; UBR: unidad básica de rehabilitación; : vehiculo propio. En la mayoría de los estudios reseñados -a excepción de dos [Van Essen et al, 1998; Heck D et al, 1998] con resultados muy similares en ambas subescalas a los obtenidos en este estudio- los resultados en las subescalas de rodilla y función del KSS son más elevados, aunque en esta última subescala las diferencias son menos acusadas. Esto puede ser debido a que -salvo los dos estudios citados, que valoran los resultados entre 3 y 6 meses- la mayor parte de los trabajos utilizan periodos de seguimiento más prolongados y la mejoría tiende a continuar –aunque en menor medida [Martín SD et al, 1999], a lo largo del primer año tras la intervención, para estabilizarse a los dos años de seguimiento [König A et al, 1997]. Adicionalmente, los resultados de la subescala de rodilla son muy dependientes del diseño de la prótesis y del 91 rango de movimiento preoperatorio [Insall J et al, 1989] factores que están predeterminados cuando el paciente accede a rehabilitación. Son muchos los trabajos que consideran el MOS SF-36 como un instrumento adecuado para el seguimiento de las artroplastias de rodilla [Hawker G, Bombardier C, 1995; Kopjar B, 1996; Kiebzak GM et al 1997; Kosinski M et al, 1999; Martín CM et al, 2000], tanto como único instrumento de medida de resultados [Ritter M et al, 1995; McGuigan F et al, 1995; March LM et al, 1999; Arslanian C, Bond M, 1999] como asociado a otros instrumentos más específicos para la valoración de la artroplastia [Sharma L et al, 1996; Heck DA et al, 1998; Fortin PR et al, 1999; Van Essen GJ et al, 1998]. Todos coinciden en la importante mejoría de la mayor parte de las dimensiones del MOS SF-36 y, fundamentalmente, de las dimensiones de función física, rol funcional y dolor [Mc Guigan FX et al, 1995; Ritter MA et al, 1995; Sharma L et al 1996; Williams JI et al, 1997; March LM et al 1999; Fortin PR et al, 1999; Arslanian C, Bond M, 1999;], obviamente las mas relacionadas con la artroplastia y la rehabilitación posterior. La dimensión salud general no ha mostrado diferencias significativas en ningún estudio analizado, y las dimensiones rol social, salud mental, vitalidad y rol emocional son mas inconsistentes, aunque han mostrado mejorías significativas en diversos trabajos [Mc Guigan FX et al, 1995; Ritter MA et al, 1995; Van Essen GJ et al, 1998; Arslanian C, Bond M 1999]. Estas mejorías, coincidiendo con los resultados de este estudio, son observadas a corto plazo tras la intervención de artroplastia de rodilla [Ritter MA et al, 1995; Van Essen GJ et al, 1998; Arslanian C, Bond M, 1999]. El MOS SF-36 es considerado como un una medida de calidad de vida relacionada con la salud válida, fiable y sensible para una amplia población [Ware J et al, 1992; McHorney CA et al, 1994] y son muchos autores los que lo consideran el instrumento de elección para los intervenidos de artroplastia de rodilla [Kreibich DN et al, 1996; Brazier JE et al, 1999; Kiebzak GM et al, 1997; Kopjar B, 1996; Kosinski M et al, 1999]. No obstante, algunos trabajos aconsejan la asociación de dos instrumentos de medida, uno especifico de la patología estudiada –como el KSS- y otro genérico que valore dimensiones más amplias relacionadas con la salud [Kantz ME et al, 1992; Bombardier C et al, 1995]. La asociación del MOS SF-36 como instrumento genérico, ha permitido conocer los cambios favorables de salud percibida por el enfermo, que se han producido tras la intervención y que no hubieran sido detectados con la sola aplicación de un instrumento especifico, que únicamente valorara aquellos aspectos objetivos valorados por 92 un observador externo. Con esta asociación se obtiene más información sobre el proceso de recuperación. Respecto a la comparación de estos resultados con los valores poblacionales de calidad de vida, medida por el SF-36 [Alonso J et al, 1998], en las dimensiones relevantes en la patología estudiada (función física, rol funcional y dolor) las puntuaciones medianas de los pacientes pasan de estar muy por debajo de las correspondientes al grupo poblacional de mujeres entre 65 y 74 años (grupo más próximo a las características de la muestra estudiada), a situarse en valores similares a los poblacionales en la valoración a los 3 meses. Esto mismo sucede con la dimensión rol social, mientras que las dimensiones rol emocional, salud mental, vitalidad se situaban ya en la valoración inicial en los márgenes de los valores poblacionales. La dimensión salud general obtuvo mayores valores en el grupo de intervenidos que en la población de referencia, tal vez por la existencia de procesos de selección quirúrgica de pacientes en buen estado general. Estos valores no coinciden con los obtenidos por Van Essen et al [1998] en la población Australiana, que después de la intervención quedan por debajo de los valores normales de población general, aunque el propio autor advierte que los resultados provienen de una muestra sesgada de pacientes con artroplastia de rodilla. March LM et al [1999] encontraron también valores por debajo de la norma poblacional, aunque sólo en las dimensiones función física, dolor y rol funcional. Hay que notar que los valores poblacionales de Australia y los de nuestro país son diferentes. Con respecto al QL Spitzer, instrumento de medición de calidad de vida de amplio uso en patologías que afectan mas extensamente la calidad de vida, no se había utilizado hasta la fecha en artroplastia de rodilla, no habiéndose encontrado ningún trabajo en esta patología que permita comprar resultados. La incorporación en este estudio del QL Spitzer se decidió por su fácil administración y el ofrecer una puntuación global, de forma que permitía obtener una información adicional (especialmente respecto al periodo previo a la intervención) con poco esfuerzo y sin agotar a los pacientes que ya eran objeto de diversas mediciones (KSS, SF-36, encuesta de satisfacción). Pese a que se tenía la presunción de que el QL de Spitzer no sería sensible en la patología analizada, los resultados muestran una importante mejoría entre las valoraciones previa e inicial con respecto al resultado a los tres meses de seguimiento, siendo –pese a la sencillez del instrumento- sensible a los cambios que se producen en los periodos valorados, sobre todo en aquellas puntuaciones más vinculadas a la patología estudiada 93 como la actividad. Obviamente, el QL no ofrece el volumen de información de otros instrumentos mas complejos, pero podría ser una alternativa útil en la práctica –dada su extremada sencillez de administración- si nuevos estudios comprueban su capacidad para diferenciar diversas situaciones en esta patología. La encuesta de satisfacción permitió conocer el grado de satisfacción con los servicios recibidos en el Servicio de Rehabilitación, habiendo sido valorados aspectos como el trato y cualificación profesional del personal, esperas y tiempo de desplazamiento, siendo este último aspecto de gran importancia en Rehabilitación por la asiduidad con que se realiza el tratamiento fisioterápico y la dependencia de algunos enfermos de desplazamiento con ambulancias o trasportes públicos, que conllevan tiempos de espera prolongados. Precisamente en este punto se obtuvo una puntuación inferior a los otros aspectos valorados y, por tanto, marca un área donde incidir para intentar mejorar la coordinación de los transportes con los horarios de atención y de tratamiento, e incluso insistir en que el tratamiento se realice en el lugar más cercano al domicilio y obviar los medios de transporte. Otro aspecto que interesaba valorar es la preferencia del enfermo ser atendido en el mismo u otro centro, porque indirectamente informa de descontento con la atención recibida. La contestación mayoritaria muestra una clara preferencia por repetir tratamiento en el mismo centro. El elevado nivel de satisfacción coincide con la mayoría de los trabajos que investigan sobre la satisfacción de los pacientes con la atención recibida en los servicios de rehabilitación (y en otras áreas de atención). En un trabajo realizado sobre satisfacción en Rehabilitación [Davis D, Hobbs G, 1989] en el que utilizaban una escala de 4 posibilidades de respuesta, obtenía una puntuación media de 3,43 en accesibilidad, 3,65 en ambiente físico y 3,83 para aspectos del cuidado, reflejando un alto grado de satisfacción. Estos resultados son similares a los obtenidos en el presente estudio, aunque el cuestionario utilizado sea distinto. Uno de los problemas inherentes en estas encuestas es el alto nivel de satisfacción que ofrecen como resultado, algo habitual de este tipo de encuestas y que plantea el problema de su sensibilidad para detectar diferentes niveles de satisfacción [Fitzpatrick JE et al, 1991], ya que, en la práctica, la mayor parte de las respuestas se mueven en un rango muy estrecho en la zona de satisfacción con los cuidados. Este problema, probablemente la principal limitación de la encuesta, puede dificultar la identificación de problemas y sugiere la necesidad de contrastar este tipo de encuestas, con otros 94 instrumentos relacionados con la satisfacción (reclamaciones, falta de asistencia a las visitas y tratamientos concertados, utilización de otros servicios y similares). Factores asociados a mejores o peores resultados La asociación entre valores finales del KSS y sexo (mejores resultados en hombres) es consistente con la literatura [Walsh M et al, 1998; Katz B et al, 1994; Smith B et al, 1992] y tiene lógica en la medida que tenían mejores resultados iniciales, aunque en algún estudio no se ha hallado esta asociación [Hawker G et al, 1998]. No se han hallado precedentes respecto a la asociación con la situación laboral (mejor en los jubilados por edad) y estado civil (mejor los casados), aunque posiblemente venga mediada por el sexo (los jubilados por edad y los casados tenían una mayor proporción de hombres, ya que se utilizó otro grupo con las jubiladas “amas de casa” y la proporción de mujeres era mayor entre la viudas). Los resultados finales del KSS no se asociaron la edad, aspecto con resultados inconsistentes en la literatura. Así, mientras que algunos autores coinciden con estos resultados [Gill G et al, 1997; Hawker G et al, 1998; Horton RM, Rankin EA, 1996], otros divergen [Brinker MR et al, 1997; Heck D et al, 1998; König A et al, 1997]. Esto mismo ocurre con el diagnostico y la comorbilidad, en las que no se encontró asociación coincidiendo con algunos trabajos [Voss F et al, 1995; Horton RM, Rankin EA, 1996], mientras que esta asociación si se produce en otros estudios [Callahan CM et al, 1994; Horton RM, Rankin EA., 1996; Brinker MR et al, 1997]. Hay que señalar, no obstante, que en el caso del diagnóstico se dispuso de muy poco poder para detectar diferencias dado el bajo número de casos de artritis reumatoide. La asociación entre mejores resultados y tratamiento en domicilio o pacientes que habían utilizado transporte propio tiene una fácil explicación, ya que los pacientes que tenían una mayor independencia y eran más colaboradores en la primera visita, fueron instruidos para realizar el tratamiento en domicilio; del mismo modo, eran los pacientes en mejor estado los que acuden con menor asiduidad al servicio, y ante no necesitar desplazarse con frecuencia al centro de rehabilitación optaban por hacerlo por sus propios medios. La ganancia funcional en la escala de valoración del KSS sólo se asoció a la valoración en la subescalas de función y rodilla, y a la lateralidad (más ganancia para las PTR bilaterales); esto último probablemente porque parten de una valoración inicial muy baja y las posibilidades de ganancia son 95 más altas, opinión que comparten otros autores [Fortin P et al, 1999; Rissenan P et al, 1996]. Al analizar las correlaciones entre los valores iniciales del KSS y del MOS SF-36, y los resultados del KSS al final del seguimiento, se observó la existencia de una fuerte asociación entre los valores previos de las subescalas rodilla y función, con los resultados finales de las correspondientes subescalas, aspecto coincidente con los resultados de otros trabajos [Lizaur A et al, 1997; König A et al, 1997; Fortin PR et al, 1999; Anouchi YS et al, 1996]; también se encontró correlación entre el valor final de la subescala de función del KSS y la valoración inicial de la dimensión función física del MOS SF-36, asociación esperable ya que son dimensiones que valoran la situación funcional. De hecho, algunos autores las consideran igual de especificas para la valoración de la artroplastia de rodilla [Kanz ME et al, 1992]. Respecto a los resultados iniciales del MOS SF-36, los hombres mostraron mejores resultados en salud general, dolor vitalidad, rol social y salud mental; tener estudios de bachiller y/o universitarios se asoció a mejores resultados en función física, asociación en la misma línea que los resultados obtenidos en la escala de valoración KSS. Los jubilados por edad se asociaron a mejores resultados en rol social y salud mental; los que tenían apoyo social se asociaron a mejor puntuación en salud mental y salud general; vivir en domicilio propio y no tener comorbilidad se asoció a mejor valoración en salud general y el diagnostico gonartrosis se asoció a mejores resultados en dolor y salud general que el de artritis reumatoide. Las prótesis bilaterales tenían peor puntuación en función física. La mayoría de estas variables tienen una fuerte lógica clínica aunque lo importante es conocer si estas asociaciones guardan relación con las de los resultados finales. Respecto al resultado final del MOS SF-36, la mayoría de los factores asociados mantienen una fuerte lógica clínica y son consistentes con la literatura existente desde la perspectiva de la cirugía ortopédica [Mc Guigan F et al 1995; Kirwan JR et al, 1994; Kristensen O et al, 1992] . Así, la artritis reumatoide, patología que afecta de forma más destructiva a diversas articulaciones y al estado general, obtuvo peores resultados en todas las dimensiones del SF-36 en que el tratamiento rehabilitador influye directamente (función física, rol funcional y el dolor), aunque estos datos deben ser valorados con precaución por la escasez de pacientes con artritis reumatoide en la muestra. Las artroplastias izquierdas tuvieron mejor puntua96 ción en salud general, resultado difícilmente interpretable y que probablemente se trata de una asociación espúrea. Los hombres se asociaron a mejores resultados en salud general, función física, dolor vitalidad, rol social y salud mental coincidiendo con la asociación encontrada en los valores iniciales y con la literatura [Mc Guigan F et al, 1995; Walsh M et al, 1998], aunque otros autores no encuentran esta asociación [Norman-Taylor FH et al, 1996]. La edad se asoció a mejores resultados en función física y rol funcional en aquellos pacientes comprendidos entre 65 y 74 años y los mayores de 74 años se asociaron a mejores resultados en vitalidad y salud mental, probablemente porque en el grupo de menores de 65 años se encuentran los enfermos con artritis reumatoide y gonartrosis precoces que afectan de forma más generalizada a otras articulaciones; además, los más mayores suelen tener mayor percepción de vitalidad y salud mental por estar más acorde con sus necesidades y expectativas los resultados obtenidos tras la prótesis. En todo caso, se trata de un factor discutido en la literatura que algunos trabajos identifican como factor predictor de resultados sobre las dimensiones de función [Mc Guigan F et al, 1995; Norman-Taylor FH et al, 1996; Heck D et al, 1998] y otros no [Hawker G et al, 1998]. La presencia de comorbilidad se asoció a peores resultados en salud general, resultado coherente y coincidente con algunos trabajos [March LM et al, 1999; McGuigan F et al, 1995; Kwoh CK et al, 1993], aunque otros discrepan con estos resultados [Ritter MA et al, 1995]. Los pacientes que habían realizado el tratamiento en su propio domicilio y se habían desplazado por sus propios medios tenían mejores resultados en salud general, función física, rol funcional y dolor, asociación derivada del sesgo de selección ya señalado al comentar los resultados del KSS. Las amas de casa mostraron peor puntuación en ambas subescalas del KSS y los trabajadores en activo en función física y dolor, vitalidad. La asociación entre “casados” y mejor puntuación en salud mental no ha sido descrita previamente en prótesis de rodilla, pero si en un estudio de artroplastia de cadera con resultados coincidentes con los del presente estudio [Clearly PD et al, 1993]. Respecto a la ganancia en las dimensiones del MOS SF-36, parte de los factores coinciden con los obtenidos en los resultados finales. Así, la edad entre 65 y 74 años se asoció a mayor ganancia en rol funcional y los hombres a mayor ganancia en función física. Este último resultado es coherente con los resultados finales, aunque no se encuentra reflejado en la literatura ya que son muy escasos los estudios que valoran la ganancia, analizando la mayoría de ellos resultados finales tras el seguimiento. La gonartro97 sis se asoció a mayor ganancia en rol funcional y dolor frente a la artritis reumatoide, esto tiene bastante lógica clínica ya que la artritis reumatoide es una enfermedad inflamatoria que afecta a otras articulaciones y al estado general, y la artroplastia solo mejora la sintomatología de la rodilla operada sin cambiar la situación de dolor y de función del resto de articulaciones afectas. Las prótesis bilaterales se asociaron a mayor ganancia funcional, aspecto fácilmente explicable ya que su punto de partida era muy inferior al de las prótesis unilaterales. Existe una fuerte correlación entre todas las puntuaciones iniciales de las dimensiones del MOS SF-36 y las obtenidas a los 3 meses de seguimiento a excepción del rol funcional. Los trabajos que abordan este aspecto lo hacen desde la perspectiva quirúrgica, haciendo una primera valoración en el preoperatorio y la siguiente en el postoperatorio, así hay autores que no encuentran ninguna correlación [McGuigan F et al, 1995] y otros que sí que la mantienen [Fortin PR et al, 1999; Anouchi YS et al, 1996]. Se encontraron correlaciones más débiles entre otras dimensiones del SF-36; así el rol emocional inicial correlacionó con los valores finales de función física, rol funcional y dolor, resultados coincidentes con los obtenidos por Sharma L et al [1996], que afirmaba que las variables psicosociales tienen una fuerte predicción sobre los resultados funcionales de la PTR. Esta afirmación es compartida por otros autores [König A et al, 1997; Kantz ME et al, 1992; Summers MN et al, 1998; Heck D et al, 1998] que aconsejan introducir herramientas que contemplen estas variables para la valoración de la PTR. También se encontró una fuerte correlación entre el resultado final de la dimensión función física y la valoración inicial de la subescala función del KSS; este resultado ya se ha obtenido anteriormente pero en sentido contrario [entre valores iniciales del MOS SF-36 y finales del KSS) y como se ha argumentado las variables que valoran estos dos conceptos son similares. Con respecto a la valoración inicial de la subescala de rodilla del KSS correlacionó débilmente con el resultado final de función física, vitalidad y más fuertemente con dolor, esto también tiene una lógica clínica ya que el dolor se recoge dentro de la subescala de rodilla del KSS, además del rango de movimiento que influye sobre la función. Respecto a los factores asociados a la encuesta de satisfacción, y en relación con las características sociodemográficas, se obtuvo una asociación de mayor satisfacción para aquellos que vivían en su propio domicilio, que fueron atendidos en las UBR y que habían recibido tratamiento fisioterápico; 98 estos resultados tienen su explicación que las UBR se encuentran ubicadas en los Centros de Salud, dónde reciben atención sanitaria cercana a su domicilio, y se trata de centros que les son familiares, sin problemas de desplazamiento, e incluso pueden coincidir con personas conocidas de su barrio, quitando la hostilidad que los centros sanitarios inspiran al usuario. El recibir tratamiento fisioterápico siempre despierta más satisfacción que su ausencia, siempre condicionado a la sensación de interés y de cuidado de un profesional por su enfermedad y a pesar de que los mejores resultados se unen como se ha podido comprobar a la ausencia de tratamiento fisioterápico, coincidiendo con Keith [1998] la satisfacción puede ser alta, a pesar de una mínima ganancia funcional. La asociación vinculada a vivir en su propio domicilio tiene poco valor por el escaso número de casos existente, en aquellos que viven en otros domicilios. Otros autores no encontraron relación entre satisfacción y variables sociodemográficas [Hall JA et al, 1990]. Cuando se analiza la satisfacción con respecto a los valores clínicos y de calidad de vida iniciales se encuentra una asociación vinculada a salud general y salud mental del MOS SF-36 y a salud, actitud y puntuación total del QL de Spitzer, lo que indica que los enfermos que partían con una mejor percepción de salud física y mental estuvieron más satisfechos. Cuando se analiza la satisfacción con respecto a las puntuaciones obtenidas al final del proceso se sigue vinculando a salud general y salud mental del MOS SF36 y sin embargo solo se asocia a actitud del QL Spitzer, incorporándose la subescala función del KSS a la asociación. Las asociaciones encontradas se mantienen en línea con las reseñadas en la escasa literatura sobre el tema [Hazard RG et al, 1994; Heineman AW et al, 1997]. Limitaciones Entre las limitaciones del estudio hay que señalar, en primer lugar, las vinculadas al diseño observacional, que no permite valorar el papel de la rehabilitación en la ganancia en funcionalidad y calidad de vida. Este aspecto se valoró como un posible objetivo, ya que no se hallaron ensayos clínicos al respecto en la búsqueda realizada y podría argüirse la existencia de incertidumbre respecto a la efectividad de la rehabilitación. No obstante se consideró éticamente inaceptable aleatorizar un grupo de pacientes a no recibir tratamiento rehabilitador. En este sentido, los resultados obtenidos por los pacientes deben verse como el producto global de la atención recibida, incluyendo –fundamentalmente- la intervención quirúrgica, el tratamiento rehabilitador y, posiblemente, otros aspectos como el apoyo familiar. 99 En segundo lugar, hay que reseñar la falta de poder estadístico en los análisis con múltiples variables distribuidas en varias categorías no balanceadas, con la posibilidad de que existan asociaciones que no hayan podido ser detectadas como estadísticamente significativas por falta de casos en tales categorías. En sentido contrario, la realización de numerosas pruebas estadísticas sin correcciones para pruebas múltiples –tipo Bonferroni o similares- puede haber ocasionado la identificación como significativas de asociaciones meramente espúreas. Se valoró la posibilidad de utilizar la prueba de Bonferroni para corregir este último problema, pero su uso implicaba nuevas limitaciones [Perneger TV, 1998] no menos importantes que los problemas que solventaba; entre ellas: 1) la asunción de que los grupos deben ser homogéneos en todas las variables, 2) el hecho de que los resultados de cada prueba estadística deben ser interpretados en función del conjunto de pruebas, y 3) el incremento del error tipo II (rechazar la presencia de diferencias cuando realmente existen) que no es menos importante que el incremento del error tipo I (aceptar la presencia de diferencias cuando no existen). Continuando con las limitaciones, hay que señalar que el índice de masa corporal no se consideró en el trabajo. Aunque diversos estudios han concluido que este factor no parece tener repercusión –al menos a corto plazosobre los resultados funcionales de la artroplastia [Hawker G et al, 1998; Horton MR, Rankin EA, 1996; Mont MA et al, 1996; Griffin FM et al, 1998; Smith BE et al, 1992] , ni sobre la calidad de vida [Norman-Taylor FH et al, 1996], en algún caso [Hawker G et al, 1998; Braeken AM et al, 1997] se ha señalado una asociación entre bajo índice de masa corporal y mejores resultados funcionales o por el contrario peores resultados con un índice de masa corporal elevado. Hay que reseñar también entre las limitaciones el relativamente corto periodo de seguimiento, 3 meses, elegido por coincidir con la duración usual del tratamiento rehabilitador en estos pacientes, pero que deja abierta la posibilidad de mejoras mas importantes, como ya se ha comentado, en los resultados a largo plazo. En cuanto a la elección de escalas de medida, se optó por el KSS porque, al estar subdividido en subescalas de rodilla y función, reduce el impacto que pueden ejercer otras patologías sobreañadidas en el resultado final, problema frecuente en otras escalas que ven penalizados sus resultados por el simple envejecimiento de los pacientes, a pesar del éxito de la intervención [Insall JN et al, 1989; Insall JN, 1993; García F, Florez MT, 1995]. Además, 100 el KSS es la escala de valoración funcional utilizada en la mayoría de los trabajos más recientes, lo que permitía la comparación de resultados con otros autores. Respecto al MOS-SF36, su elección obedeció a la disponibilidad tanto de una versión validada en castellano [Alonso J et al, 1995] y de valores de referencia en la población de nuestro entorno [Alonso J et al, 1998], como a su amplia utilización, que permitía la comparación con estudios realizados en otros países, y su buena capacidad discriminativa para detectar variaciones del estado de salud [Ware JE, Sherbourne CD, 1992; McHorney CA et al, 1994]; de hecho, muchos autores lo consideran como el instrumento de elección para aquellos intervenidos de artroplastia de rodilla [Kreibich DN et al, 1996; Brazier JE et al, 1999; Kiebzak GM et al, 1997; Kopjar B, 1996; Kosinski M et al, 1999]. Entre los inconvenientes del MOS-SF36 cabe citar, no obstante, el no disponer de una puntuación global de estado de salud y la posibilidad de ser menos sensible que otros instrumentos específicos. Esta última limitación se compensó con la utilización de ambos instrumentos (KSS y SF36) para ofrecer un espectro más amplio y objetivo de los cambios que se producen tras una intervención de artroplastia total de rodilla [Kantz ME et al, 1992; Bombardier C et al, 1995]. Respecto al QL de Spitzer, se trata de un instrumento de medición secundario que se presumía poco sensible y que cuyo valor esencial era su extremada sencillez de administración. Los resultados a este respecto muestran una mayor sensibilidad que la inicialmente presumible; no obstante dada la ausencia de trabajos de comparación y de estudios sobre sus propiedades clinimétricas en este tipo de pacientes, tales resultados deben ser vistos con cautela. Finalmente, la encuesta de satisfacción tiene todas las limitaciones típicas de este tipo de encuestas, que no vienen tanto del estudio de sus propiedades, como de las dificultades para evitar los sesgos de respuesta positiva y obtener información útil para la mejora de calidad. Implicaciones prácticas para los servicios de rehabilitación En conjunto, los resultados de este estudio muestran una importante mejora -objetiva y subjetiva- en los 3 meses siguientes a la intervención de artroplastia de rodilla, tanto en estado funcional como en calidad de vida. Igualmente, muestran una amplia satisfacción con la atención recibida. El peor estado funcional y la peor calidad de vida al inicio de la rehabilita101 ción, el diagnóstico de artritis reumatoide, el sexo mujer se asociaron a peor pronóstico en cuanto al resultado funcional y/o la calidad de vida, mientras que los jubilados por edad (respecto a los activos y jubilados por invalidez) muestran mejor pronóstico. En cuanto a la satisfacción, lo mas destacable es la menor puntuación relacionada con la distancia al centro, los aspectos de espera y el trato del personal auxiliar, así como el mayor grado de satisfacción en la rehabilitación extrahospitalaria. El interés del estudio, en cuanto a sus aplicaciones prácticas, y más allá de describir la mejora de los pacientes intervenidos, se centraba en identificar factores de buen o mal pronóstico desde la perspectiva de la rehabilitación que pudieran ser útiles para sugerir intervenciones de mejora. Respecto a los resultados clínicos y funcionales, la práctica totalidad de los factores asociados a peor pronóstico son factores pre-establecidos no susceptibles de modificación por la rehabilitación; sin embargo, tal vez cambios en la terapia, como un tratamiento más intenso en algunos subgrupos de pacientes, un mayor apoyo psicológico u otros pudieran ser de interés para mejorar los resultados de los pacientes. Esto implica básicamente que deberían realizarse estudios de intervención en los subgrupos de peor pronóstico definidos por los factores previamente señalados. Desde el punto de vista de la satisfacción, cabe destacar la necesidad de continuar el desarrollo de las UBR, mas cercanas a los pacientes, y reducir las esperas en los diversos aspectos de las consultas. La programación de citas puede ser muy importante en este aspecto. 102 Bibliografía Aaronson N. Quality of life assessment in clinical trials. Controlled Clin Trial 1989; 10(4 Suppl):195-208. Aaronson NK, Acquadro C, Alonso J, Apolone G, Bucquet D, Bullinger M, et al. International quality of life assessment (IQOLA) project. Qual Life Res 1992; 1:349-351. Aaronson NK, Bullinger M, Ahmezdzai S. A modular approach to Qualityof-life assessment in cancer clinical trials. Recent Results Cancer Res 1988; 111: 231-249. Aaronson NK. Methodological Issues in Assessing the Quality of Life of Cancer Patients. Cancer 1991; 3: 844-850. Aichroth P, Freeman MAR, Smillie IS Souter WA. A knee function assessment chart. J Bone Joint Surg (Br) 1978; 60: 308-309. Alonso J, Antó J, Moreno C. Spanish Version of the Nottingham Health Profile: Translation and Preliminary Validity. Am J Public Health 1990; 6: 704-708. 103 Alonso J, Antó J. La versió espanyola del perfil de salut de Nottingham: una escala de mesura de la salut percebuda. Salut Catalunya 1990; 4: 105-110. Alonso J, Prieto L, Antó JM. La versión española del SF-36 health survey (Cuestionario de Salud SF-36: un instrumento para la medida de resultados clínicos). Med Clin (Barc) 1995; 104: 771-776. Alonso J, Prieto L, Ferrer M, Vilagut G, Broquetas JM, Roca J, et al Testing the measurement properties of the Spanish version of the SF-36 Health Survey among male patients with Chronic Obstructive Pulmonary Disease. J Clin Epidemiol 1998; 51: 1087-1094. Alonso J, Regidor E, Barrio G, Prieto L, Rodríguez C, de la Fuente L. Valores poblacionales de referencia de la versión española del cuestionario de salud SF-36. Med Clin (Barc) 1998; 111: 410-416. Anderson J, Sullivan F, Usherwood TP. The Med Outcomes Study Instrument (MOSI) Use of a new health status measure in Britain. Fam Pract 1990; 7: 205-218. Anderson JG, Wixson RL, Tsai D, Stulberg SD, Chang RW. Functional outcome and patient satisfaction in total knee patients over the age of 75. J Arthroplasty 1996; 11: 831-840. Anderson RT, Aaronson NK, Bullinger M, McBee WL. A review of the progress towards developing healt-related quality of life instruments for international clinical studies and outcomes research. PharmacoEconomics 1996; 10: 336-355. Anouchi YS, McShane M, Kelly F Jr, Elting J, Stiehl J. Range of motion in total knee replacement. Clin Orthop 1996; 331: 87-92. Armstrong RA, Whiteside LA. Results of cementless total knee arthroplasty in an older rheumatoid arthritis population. J Arthroplasty 1991; 6: 357-362. Arslanian C, Bond M. Computer assisted outcomes research in orthopedics: total joint replacement. J Med Syst 1999; 23: 239-247. Aubriot JH, Deburge A, Kenesi C, Schramm P. La prothèse GUEPAR. Acta Orthop Belg 1973; 39: 257-279. Babakus E, Boller G. An Empirical Assessment of the SERVQUAL Scale. J Business Res 1992; 24: 253-268. Babakus E, Mangold WG. Adapting the SERVQUAL scale to hospital services: an empirical investigation. Health Serv Res 1992; 26: 767-786. 104 Badia X, Alonso J. Reliability of the Spanish version of the Sickness Impact Profile. Qual Life Res 1994; 3: 65-68. Badia X, Salmero M, Alonso J. La medida de la salud. Guia de las escalas de medición en español (2ª Ed). Barcelona: Edimac, 1999 Badia-Llach X. The European viewpoint: Epidemiology and Economic Consequences of Ostearthritis. En: Reginsner JY, Peltier JP, MartelPelletier J, Henrotin Y, eds. Osteoarthritis, Clinical and Experimental Aspects. Berlin: Spriger Verlag 1999: 20-52. Baker R. Development of the questionaire to assess patients´satisfaction with consultations in general practice. Br J Gen Pract 1990; 40: 487-490. Ballina FJ, Martin P, Paredes B, Hernandez R, Cueto A. Epidemiología de las enfermedades reumáticas en el pricipado de Asturias. Aten Primaria 1993; 11: 219-224. Bardsley M, Coles J. Practical experiences in auditing patient outcomes. Qual Healh Care 1992; 1: 124-130. Barer D, Nouri F. Measurement of activities of daily living. Clin Rehabil 1990;3:179-187. Barret DS, Biswas SP, MacKenney RP. The Oxford knee replacement. A review from an independent centre. J Bone Joint Surg (Br) 1990; 72: 779783. Batlle-Gualda E, Esteve-Vives J, Piera MC, Hargreaves R, Cutts J. Traducción y adaptación al español del cuestionario WOMAC especifico para artrosis de rodilla y cadera. Rev Esp Reumatol 1999; 26: 38-45. Bechel DL, Myers WA, Smith DG. Does patient-centered care pay off? Jt Comm J Qual Improv 2000; 26:400-9 Bellamy N, Buchanan WW, Goldsmith CH, Campbell J, Duke E. Signal measurament strategies: are they feasible and do they offer any advantage in outcome measurement in osteoarthritis. Arthritis Rheum 1990; 33: 739-745 Bellamy N, Buchanan WW, Goldsmith CH Campbell J, Sitt LW. Validation study of WOMAC: a health status instrument for measuring clinically-important patient relevant outcomes to antirheumatic drug theraphy in patients with osteoarthritis of the hip or knee. J Rheumatol 1988; 15: 1833-1840. Bellamy N, Buchanan WW, Goldsmith, CH Campbell J, Sitt LW. Validation study of WOMAC: a health status instrument for measuring clinically105 important patient relevant outcomes following total hip or knee arthroplasty in a osteoarthritis. J Orthp Rheumatol 1988; 1: 95-108. Bellamy N, Buchanan WW. A preliminary evaluation of the dimensionality and clinical importance of pain and disability in osteoarthritis of the hip and knee. Clin Rheumatol 1986; 5:231-241. Bellamy N, Buchanan WW. Outcome measurement in osteoarthritis clinical trials: the case for standardisation. Clin Rheumatol 1984; 3: 193-303. Bellamy N, Goldsmith CH , Buchanan WW , Campbell J, Duke E. Prior score availability: observations using the WOMAC osteoarthritis index (letter). Br J Rheumatol 1991; 30: 150-151. Bellamy N, Kean WF, Buchanan WW, Gerecz-Simon E, Campbell J. Double blind randomized controlled trial of sodium meclofenamato (meclomen) and diclofenac sodium (voltaren): post validation reapplication of the WOMAC osteoarthritis index. J Rheumatol 1992; 19: 153-159. Bellamy N, Wells G, Campbell J. Relationship between severity and clinical importance of symptoms in ostteoarthritis.Clin Rheumatol 1991;10:138-143. Bellamy N. WOMAC osteoarthritis index. A user´s guide. London, Ontario. Bellemans J, Victor J, Westhovens R, Dequeker J, Fabry G. Total knee arthroplasty in the young rheumatoid patient. Acta Orthop Beig 1997; 63: 189193. Ben Sira Z. Affective and instrumental components in the physician-patient relationship. J Hlth Soc Behav 1980; 21: 170-180. Bergner M, Bobbit RA, Carter WB, Gilson BS. The Sickness Impact Profile: development and final revision of a health status measure. Med Care 1981; 19: 787-805. Bergner M, Bobbit RA, Kressel A, Pollard WE, Gilson BS, Morris JR. The Sickness Impact Profile: conceptual formulation and methodological for the development of a health status measure. Int J Health Ser 1976; 6: 393-415. Bergner M, Bobbitt RA, Pollard WE. The sickness impact profile: validation of a health status measure. Med Care 1976;14:57-67. Bergner M. Development, testing and use of the sickness impact profile. In: Walker SR, Rosser RM, eds. Quality of life: assessment and application. Lancaster, UK: MTP Press, 1988;79-94. 106 Bernard AA, Zrinzo LU. Joint replacement. The final solution? Adv Exp Med Biol 1999; 455: 451-461. Berry LL, Parasuraman A, Zeithaml VA. The Service Quality Puzzle. Business Horizons 1988; 31: 35-43 Berzon RA, Donnelly MA, Simpson RL, Simeon GP, Tilson HH. Quality of life bibliography and indexes: 1994 update. Quality Life Res 1995; 4: 547-569. Berzon RA, Simeon GP, Simpson RL, Donnelly MA, Tilson HH. Quality of life bibliography and indexes: 1993 update. Quality Life Res 1994; 3: 53-74. Berzon RA, Simeon GP, Simpson RL, Tilson HH. Quality of life bibliography and indexes: 1992 update. J Clin Res Drug Devel 1993; 7: 203-242. Bilbao I, Gastaminza AM, Garcia JA. Calidad de vida de los pacientes domiciliarios crónicos y sus cuidadores en atención primaria. Aten Primaria 1992; 10: 946-947. Bolivar I. Determinantes poblacionales de la satisfaccion con el medico de atención primaria. Gac Sanit 1999; 13:371-83 Bombardier C, Melfi CA, Paul J, Green R, Hawker G, Wright J, et al. Comparison of a generic and disease specific measure of pain and phisical finction after knee replacement surgery. Med Care 1995; 33 (4 Suppl): 131-144. Boublik M, Tsahakis PJ, Scott RD. Cementless total knee arthroplasty in juvenile onset rheumatoid arthritis. Clin Orthop 1993; 286: 88-93. Bowers MR, Swan JE, Koehler WF. What Attributes Determine Quality and Satisfaction with Health Care Delivery?. Health Care Manag Rev 1994; 19:49-55. Bowling A. Measuring disease. Buckingham, UK: Open University Press, 1995. Bowling A. Measuring Health. A review of quality of life measurement scales. Philadelphia: Open University Press, 1992. Bowling A. Measuring health. A review of quality of life measurement scales. Milton Keynes, UK: Open University Press, 1991. Braeken AM, Lochhaas-Gerlach JA, Gollish JD, Myles JD, Mackenzie TA. Determinants of 6-12 month postoperative status and pain after elective total hip replacement. Int J Qual Health Care 1997; 9: 413-418. 107 Branch LG, Katz S, Kneipmann K, Papsidero JA. A prospective study of functional status among community elders. Am J Public Health 1984;74. 266-268. Brazier JE, Harper R, Jones NMB, O´Cathain A, Thomas KJ, Unsherwood T et al. Validating the SF-36 Health Survey Questionare: new outcomes measure for primary care. BMJ 1992; 305: 160-164. Brazier JE, Harper R, Munro J, Walters SJ, Snaith ML. Generic and condition-specific measures for people with osteoarthritis of the knee. Rheumatology 1999; 38: 870-877. Brinker MR, Lund PJ, Barrack RL. Demographic biases of scoring instruments for the results of total knee arthroplasty. J Bone Joint Surg Am 1997; 79: 858-865. Brooks WB, Jordan JS, Divine GW, Smith KS, Neelson FA. The impact of psychologic factors on measurement of functional status. Med Care 1990; 28: 793-804. Brown TJ, Churchill GA J, Peter JP. Improving the Measurement of Service. Qual J Retail 1993; 69: 127-139. Bruett TL, Overs RP. A critical review of 12 ADL scales. Phys Ther 1968;49:857-862. Bulpitt CJ. Quality of life as an outcome measure. Postgrad Med J 1997;73:613-16. CAHPS. Fact Sheet. 1997. http://www.ahcpr.gov/qual/cahpfact.htm. CAHPS. Overview. 1996. http://www.ahcpr.gov/qual/cahps/dept1.html. Callahan CM, Drake BG, Heck DA, Dittus RS. Patients outcomes following tricompartmental total knee replacement. A Meta-analysis. JAMA 1994; 271:1349-1357. Calnan M. Towards a conceptual framework of lay evaluation of health care. Soc Sci Med 1988; 27:927-33. Cambell WC. Interposition of vitallium plates in arthroplasties of the knee: Preliminary report. Am J Surg 1974; 47:639. Carr-Hill RA. The measurement of patient satisfaction. J Public Health Med 1992; 14:236-49. CASPE Research. CASPE Patient Satisfaction Proyect: Report for Department of Health. London: King Edward Hospital´s Fund, 1991. 108 Chambers LW. The McMaster Health Index Questionnaire: an update. En: Walker SR, Rosser RM, eds. Quality of Life: assessment and applications. Lancaster: MTP, 1988: 113-131. Charlson ME, Pompei P, Ales KL, MacKenzie R. A new method of classifyging prognostic comorbidity in longitudinal studies: development and validation. J Chron Dis 1987; 40:373-383. Charlton JR, Patrick DL, Peach H. Use of multivariate measures of disability in health surveys. J Epidemiol Commun Health 1983; 37: 296-304 Chassin MR.Costs and outcomes of medical intensive care. Med Care 1982 ;20 :165-179 Chassin MR, Kossecoff J, Park REJ, Fink A, Solomon DH. Variations in the use medical and surgical services by the medicare population. N Engl J Med 1986; 314: 285-290. Cherkin D, Hart G, Rosenblatt R. Patient satisfaction with family physicians and general internists: is there a difference? J Fam Pract 1988; 26: 543-551. Chung KC, Hamill JB, Kim HM, Walters MR, Wilkins EG. Predictors of patient satisfaction in an outpatient plastic surgery clinic. Ann Plast Surg 1999; 42:56-60 Cleary PD, Edgman-Levitan S, Roberts M, Moloney TW, Delbanco TL. Patients evaluate their hospital care: a national survey. Health Affairs 1991; 10: 254-267. Cleary PD, Edgman-Levitan S, Walker JD, Gerteis M, Delbanco TL. Using patient reports to improve medical care: a preliminary report from 10 hospitals. Qual Manag Health Care 1993;2:31-8 Cleary PD, McNeil B. Patient satisfaction as an indicator of quality of care. Inquiry 1988; 7: 25-36. Colizza WA, Insall JN, Scuderi GR. The posterior stabilized total knee prosthesis. Assessment of polyethylene damage and osteolysis after a ten year minimun follow-up. J Bone Joint Surg Am 1995; 77: 1713-1720. Counte MA. An examination of the convergent validity of three measures of patient satisfaction in an outpatient treatment center. J Chronic Dis 1979;32:583-8. Cox D, Fitzpatrick R, Fletcher A, Gore S, Spiegelhalter D, Jones D. Quality of life assessments: can we keep it simple? J Royal Stat Soc 1992; 155: 353-362. 109 Cronin JJ, Taylor SA. Measuring Service Quality: A Reexamination and Extension. J Marketing 1992; 56: 55-68. Cronin JJ, Taylor SA. SERVPERF Versus SERVQUAL: Reconciling Performance-Based Perceptions-Minus Expectations Measurement of Service Quality. J Marketing 1994; 58: 125-31 Cuxart A, Pagés E, Iborra J. Tratamiento rehabilitador de la gonartrosis. Sesión trimestral del servicio de Rehabilitación. Hospital de traumatologia y rehabilitación. Vall d´Hebron Hospitals. Barcelona (comunicación); 1998. Davis D, Hobbs G. Measuring outpatient satisfaction with rehabilitation services. Q Rev Bull 1989; 15: 192-197. Davies AR, Ware JE. Measuring health perceptions in the health insurance Experiment. California: Rand Corporation, 1981. Delgado Sánchez A, López Fernández LA, Luna del Castillo JD La satisfacción de los usuarios con los dos modelos de asistencia primaria vigentes en Andalucía. Gac Sanit 1993; 7: 32-40. Deming WE. Quality, productivity and competitive position. Cambridge, MA: Massachusetts Institute of Technology, 1982. Dempster M, Bradley J, Wallace E. Measuring quality of life in cardiac rehabilitation: comparing the Short Form 36 and the Nottingham Health Profile. Coronary Health Care 1997;1:211-17. Deyo RA, Centor RM. Assessing the responsiveness of functional scales to clinical change: An analogy to diagnostic test performance. J Chronic Dis 1986; 39: 897-906. Deyo RA, Cherkin DC, Ciol MA. Adapting a clinical comorbidity index for use with ICD-9-CM administrative databases. J Clin Epidemiol 1992; 45:613-619. Deyo RA, Inui TS, Leininger JD, Overman SS. Measuring functional outcomes in chronic disease: a comparison of traditional scales and a self administered health status questionnaire in patients with rheumatoid arthritis. Med Care 1983; 21: 180-192. Diduch DR, Insall J, Scott N, Scuderi GR, Font-Rodriguez D. Total knee replacement in young, active patients. J Bone Joint Surg Am 1997; 79: 575-582 Dodds TA, Martin DP, Stolov WC, Deyo RA. A validation of the Functional Independence Measurement and its performarce among rehabilitation inpatiens. Arch Phys Med rehabil 1993; 74: 531-536. 110 Donabedian A. The Methods and Findings of Quality Assessment and Monitoring: An Illustrated Analysis. Ann Arbor, MI: Health Administration Press, 1985. Donabedian A. Criteria and standards for quality assessment and monitoring. QRB Qual Rev Bull 1986; 12:99-108. Donabedian A. Evaluating the quality of medical care. Milbank Mem Fund Q 1966; 44:166-206. Donabedian A. Explorations in quality assessment and monitoring: the criteria and standars of quality (Vol II). Ann Arbor, MI: Health Administration Press, 1982. Donabedian A. Explorations in quality assessment and monitoring: the methods and findings of quality assessment and monitoring. An illustrated analysis. Ann Arbor, Mi: Health Administration Press, 1985. Donabedian A. The quality of care. How can it be assessed? JAMA 1988; 260:1743-1748. Donabedian A. The role of outcomes in quality assessment and assurance. QRB Qual Rev Bull 1992; 18:356-360. Donaldson SW, Wagner CC, Gresham GE. A unified ADL form. Arch Phys Rehabil 1973;54:175-180. Doyle BJ, Ware JE. Physician conduct and other factors that affect consumer satisfaction with medical care. J Med Educ 1977; 52:793-801 Drake BG, Callahan CM, Dittus RS, Wright JG. Global rating systems used in assessing knee arthroplasty outcomes. J Arthroplasty 1994; 9: 409-417. Edwars ER, Chan KH, Miller JE. An analysis of five scoring scales (abstract). J Bone Joint Surg (Br) 1989; 71:346. Elke R, Meier G, Wamke K, Morscher E. Outcome analysis of total knee replacements in patients with rheumatoid arthritis versus osteoarthritis. Arch Orthop trauma Surg 1995; 114: 330-334. Elliot-Burke TL, Pothas L. Measuring patient satisfaction in an outpatient orthopedic setting, part 1: key drivers and results. J Rehabil Outcomes Meas 1997; 1: 18-25. Ellwood PM. A Technology of Patient Experience. N Eng J Med 1988, 318:1549-1556. England SP, Stern SH, Insall JN, Windsor RE. Total knee arthroplasty in diabetes mellitus. Clin Orthop 1990; 260: 130-134. 111 Epstein AM. The outcomes Movement -Will it get us where we want to go?. N Eng J Med 1990; 323:266-270. Etter JF, Perneger TV. Validating a Satisfaction Questionnaire Using Multiple Approaches: A Case Study. Soc Sci Med 1997; 45: 879-885. Feinstein A. Clinical biostatistics, XLI. Hard science, soft data and the challenges of choosing clinical variables in research. Clin Pharmacol Ther 1977; 22: 485-498. Ferrans CE, Powers MJ. Quality of life index: development and psychometric properties. Adv Nurs Sci 1985;8:15-24. Fitzpatrick R, Fletcher A, Gore S, Jones D, Spiegelhalter D, Cox D. Quality of life measures in health care. I: Applications and issues in assessment. BMJ 1992; 305: 1074-1077. Fitzpatrick R, Hopkins A. Problems in the conceptual framework of patient satisfaction research: an empirical exploration. Soc Health Illness 1983; 5: 297-312. Fitzpatrick R. Surveys of patient satisfaction: II—Designing a questionnaire and conducting a survey. BMJ 1991; 302:1129-1132. Fitzpatrick R. Surveys of patients satisfaction: I—Important general considerations. BMJ 1991; 302:887-889. Fletcher A, Gore S, Jones D, Fitzpatrick R, Spigelhalter D, Cox D. Quality of life measures in health care. II: Design, analysis, and interpretation. BMJ 1992; 305: 1145-1148. Fletcher A, Hunt B, Bulpitt C. Evaluation of Quality of life in clinical trials of cardiovascular disease. J Chronic Dis 1987; 40: 459-463. Fortin PR, Clarke AE, Joseph L, Liang MH, Tanzer M, Ferland D et al. Outcomes of total hip and knee replacement: preoperative functional status predicts outcomes at six moths after surgery. Arthritis Rheum 1999; 42: 1722-1728. Frankel S. The epidemiology of indications. J Epidemiol Community Health 1991; 45: 257-259. Frater A, Costain D. Any better? Outcome measures in medical audit. BMJ 1992; 304: 519-520. Freeman MAR, Swanson SAV, Todd RC. Total replacement of the knee using the Freeman-Swanson knee prothesis. Clin Orthop 1973; 94: 153-170. 112 Freund D, Lave J, Clancy C, Hawker G, Hasselblad V, Keller R et al. Patient Outcomes Research Teams: Contribution to outcomes and effectiveness research. Annu Rev Public Health 1999; 20: 337-359. Gagliano KB, Hathcote J. Customer Expectations and Perceptions of Service Quality in Retail Apparel. J Serv Marketing 1994; 8: 60-69. García F, Florez MT. Escalas de valoración funcional en la gonartrosis. Rehabilitación (Madr) 1996; 30: 215-219. García F, Florez MT. Sistemas de valoración de resultados tras prótesis de rodilla. Rehabilitación (Madr) 1995; 29: 304-314. García JA. El índice de calidad de vida ¿ validado?. Med Clin (Barc) 1995; 105:319. García-Alsina Goncharov J. Politica de calidad en los sevicios de Rehabilitación. Rehabilitación (Madr) 1997; 31: 13-16. Gartland JJ. Orthopaedic clinical research: deficiencies in experimental design and determinations of outcome. J Bone Joint Surg 1988; 70: 309. Gill GS, Chan KC, Mills DM. 5 to 18-year follow-up study of cemented total knee arthroplasty for patients 55 years old or younger. J Arthroplasty 1997; 12: 49-54. Gill GS, Mills DM. Long-term follow-up evaluation of 1000 consecutive cemented total knee arthroplasties. Clin Orthop 1991; 273: 66-76. Gill TM, Feinstein AR. A critical appraisal of the quality of quality-of-life measurements. JAMA 1994; 272: 619-626. Goldberg HI, Cummings MA, Steinberg EP, Ricci EM, Shannon T, Soumerai SB, et al. Deliberations on the Dissemination of PORT Products: Translating research findings into improved patient outcomes. Med Care 1994; 32: JS90-JS103. Goodfellow JW, Kersaw CJ, Benson MK, O´Connor JJ. The Oxford knee for unicompartimental osteoarthritis. The first 103 cases. J Bone Joint Surg (Br) 1988; 70: 692-701. Gooding TD, Newcomb L, Mertens K. Patient-centered measurement at an academic medical center. Jt Comm J Qual Improv 1999; 25:343-51 Granger CV, Cotter AC, Hamilton BB, Fielder RC, Hens MM. Functional Assessment scales: A study of persons with multiple sclerosis. Arch Phys Med Rehabil 1990; 71: 870-875. 113 Granger CV, Cotter AC, Hamilton BB, Fielder RC. Functional Assessment scales: A study of persons after stroke. Arch Phys Med Rehabil 1993; 74: 133-138. Granger CV, Hamilton BB, Gresham GE, Kramer AA. The stroke rehabilitation outcome study: part II. Relative merits of the total Barthel Index score and four items subcore in predicting patients outcomes. Arch Phys Med rehabil 1989;70:100-103. Gresham GE, Phillips TF, Labi ML. ADL status in stroke. Relative merits of three standart indexes. Arch Phys Med Rehabil 1980;61: 355-358. Griffin FM, Scuderi GR, Insall JN, Colizza W. Total knee arthroplasty in patients who are obese with 10 years follow-up. Clin Orthop 1998; 356 : 28-33. Griffiths G, Bellamy N, Kean EF, Campbell J, Gerecz-Simon E. A study of the time from dependency of responses to the WOMAC osteoarthritis index (letter). Inflamopharmology 1993; 2: 85-87. Gill GS, Mills DM. Long-term follow-up evaluation of 1000 consecutive cemented total knee arthroplasties. Clin Orthop 1991; 273: 66-76. Gunston FH. Polycentric knee arthroplaty. Prosthetic simulation of normal knee movement. J Bone Joint Surg 1971 ; 538: 272-277. Gutierrez T, Latour J, Lopez V, Bonastre J, Giner JS, Rodriguez M et al. Efecto de los factores sociales sobre la calidad de vida de los supervivientes de un infarto de miocardio. Med Clin (Barc) 1994; 103:766-769. Gutierrez T, Latour J. Contestación: el índice de Spitzer ¿validado?. Med Clin (Barc) 1995; 105:319. Guyatt G, Feeny DH, Patrick DL. Measuring Health-related Quality of Life. Ann Int Med 1993; 118: 622-629. Guyatt GH, Bermanl LB, Townsend M, Pugsley SO, Chambers LW. A measure of Quality of life for clinical trials in chronic lung disease. Thorax 1987; 42: 773-778. Guyatt GH, Jaeschke R. Measurements in Clinical Trials: Choosing the Appropiate Approach. En: Spilker B, ed. Quality of Life Assessments in Clinical Trials. New York: Raven Press, 1990: 37-46. Guyatt GH, Thompson PJ, Berman LB, Sullivan MJ, Townsend M, Jones NL, et al. How should be measure function in patients with chronic heart and lung disease? J Chron Dis 1985; 38:517-524. 114 Guyatt GH, Townsend M, Berman LB, Pugsley SO. Quality of life in patients with chronic airflow limitation. Br J Dis Chest 1987; 81: 45-54. Hall JA, Dornan MC. What patients like about their medical care and how often they are asked: A meta-analysis of the satisfaction literature. Soc Sci Med 1988; 27: 935-9. Hall JA, Feldstein M, Fretwell D, Rowe JW, Epstein AM. Older patients’ health status and satisfaction with medical care in an HMO population. Med Care 1990; 28: 261-270. Hamilton BB, Granger CV, Sherwin FS. A uniform national data system for Rehabilitation outcomes: analysis and measurement. Baltimore: Paul H. Brookes, 1987:137-147. Harris R. Assessing the cardiac patient for rehabilitation. NY State J Med 1970; 70:511-515. Harris WH, Sledge CB. Total hip and knee replacement. N Engl J Med 1990; 12: 801-807. Harris WH. Traumatic arthritis of the hip after dislocation and acetabular fractures: Treatment by mold arthroplaty. J Bone Joint Surg 1969; 51: 737-755. Hawker G, Melfi C, Paul J, Green R, Bombardier C.Comparison of a generic (SF-36) and disease specific (WOMAC) instrument in the measurement of outcomes after replacement surgery. J Rheumatol 1995; 22: 1193-1196. Hawker G, Wright J, Coyte P, Paul J, Dittus R, Croxford R et al. Healthrelated quality of life after knee replacement. J Bone Joint Surg Am 1998; 80: 163-173. Haya R, Rubin HR, Ware JE, Nelson E C, Meterko M. The patient judgments of hospital quality (PJHQ) questionnaire. Med Care 1990; 28:S17-18. Hazard RG, Haugh LD, Green JA, Jones PL. Chronic low back pain: the relationship between patient satisfaction and pain impairment, and disability outcomes. Spine 1994; 19: 881-887. Headley DE, Miller S J. Measuring Service Quality and its Relationship to Future Consumer Behavior. J Health Care Marketing 1993; 13:32-41. Heck DA, Robinson RL, Partridge CM, Lubitz RM, Freund DA. Patient outcomes after knee replacement. Clin Orthop 1998; 356: 93-110. Heinemann AW, Bode R, Cichowski KC Kan E. Measuring patient satisfaction with medical rehabilitation. J Rehabil Outcomes Meas 1997; 1: 52-65. 115 Hernandez AM, Murria MD, Aybar MD, Garcia R, Moltó P, et al. Sistema de información de Rehabilitación. Síntesis 1994. Valencia: Generalitat Valenciana, 1995. Hilding MB, Backbro B, Ryd L. Quality of life knee arthroplasty. A randomized study of 3 designs in 42 patients, compared after 4 years. Acta Orthop Scand 1997; 68:156-160. Holmes S. Dickerson JWT. The Quality of life: design and evaluation of a self-assessment instrument for use with cancer patients. Inter J Nurs Stud 1987; 24: 15-24. Horton RM, Rakin EA. Total joint arthroplasty in a predominantly AfricanAmerican population, part one: Knee arthroplasty. J Natl Med Assoc 1996; 88: 153-157. Hulka BS, Kupper LL, Daly MB, Cassel JC, Schoen F. Correlates of Satisfaction and Dissatisfaction with Medical Care: A Community Perspective. Med Care 1975; 8:648-658. Hulka BS, Zyzanski SJ, Cassel JC, Thompson SJ. Satisfaction with medical care in a low income population. J Chron Dis 1971; 24:661-673. Hulka BS, Zyzanski SJ, Cassel JC, Thompson SJ. Scale for the Measurement of Attitudes toward Physicians and Primary Medical Care. Med Care 1970; 8:429- 435. Hulka BS, Zyzanski SJ. Validation of a patient satisfaction scale: theory, methods and practice. Med Care 1982; 20:649-653. Hunt SM, McEwen J, McKenna SP. Measuring health status: a new tool for clinicians and epidemiologists. J R Coll Gen Pract 1985; 35: 185188. Hunt SM, McKenna SP, McEwen J. A quantitative approach to perceived health status: a validation study. J Epidemiol Community Health 1980;34:281-286 Hunt SM, McKenna SP, Williams J. Reliability of a population survey tool for measuring perceived health problems: a study of patients with osteo arthrosis. J Epidemiol Community Health 1981; 35: 297-300. Hvid I, Kjaersgaad Andersen P, Wethelund JO, Sneppen O. Knee arthroplasty in rheumatoid arthritis. Four to six year follow-up study. J arthroplasty 1987; 2: 233-239. 116 Hyland ME, Bott J, Singh S, Kenyon AP. Domains, constructs and the development of the breathing problems questionnaire. Qual Life Res 1994; 3: 245-256. Ibern P. La medida de la satisfacción en los servicios sanitarios. Gac Sanit 1992;6:176-85. Insall JN, Dorr LD, Scott RD, Scott WN. Rationale of the Knee Society clinical rating system. Clin Orthop 1989; 248: 13-14. Insall JN, Ranawat CS, Aglieetti P, Shine J. A comparison of four models of total knee replacement. J Bone Joint Surg 1976; 58: 754-761. Insall JN, Ranawat CS, Scott WN, Walker P. Total condylar knee replacement: preliminary report. Clin Orthop 1976; 120: 149-154. Insall JN. Results of total knee arthroplasty. En Insall, Windsor RE, Scott WN, Kelly MA, Aglietty P. Surgery of the knee (2 ed). New York: Churchill Livinstone,1993: 975-982. Inversen IA, Silbererg NE, Stever RC, Schoening HA. The revised Kenny self-care evaluation. Minneapolis Sister Kenny Institute Rehabilitation, 1973. Jenkins CD. Assessment of outcomes of health intervention. Soc Sci Med 1992; 35: 367-375. Jenkinson C, Coulter A, Writh L. The Short Form 36 (SF-36) Health Survey Questionnaire: normative data for adults of working age. BMJ 1993; 14371440. Jenkinson C, Fitzpatrick R. Measurement of health status in patients with chronic illness: comparison of the Nottingham Health Profile and General Health Questionnaire. Fam Pract 1990; 7: 121-124. Jette AM. Conceps of health and methodological issues in functional assessment. En: Granger CV, Gresham GE, eds. Functional Assessment in Rehabilitation Medicine. Baltimore: Williams and Wilkins, 1984: 46-64. Jette AM. Denniston OL. Inter-observer reliability of a functional status assessment instrument. J Chronic Dis 1978;31: 573-580. Jette AM. Functional capacity evaluation: an empirical approach. Arch Phys Med Rehabil 1980;61: 85-89. Jette AM. The functional Status Index: Reliability and validity of self report functional disability measure. J Rheumatol 1987; 15: 15-19. 117 Jonsson GL. Compartmental arthroplasty for gonarthrosis. Acta Orthop Scand 1981; 52:1-110. Juran JM. Managerial breakthrough. New York: McGraw Hill, 1964. Kantz ME, Harris WJ, Levitsky K, Ware JE, Ross Davies A. Methods of assessing condition specific and generic functional status outcomes after total knee replacement. Med Care 1992; 30: 240-252. Kaplan RM, Bush JW. Health-related Quality of life measurement for evaluation research and policy analysis. Health Psychol 1982; 1: 61-80. Karnofsky DA, Abelmann WH, Craver LF, Burchenal JH. The use of nitrogen mustards in the palliative treatment of cancer. Cancer 1948; 1: 634-656. Kasl S. Social and psychological factors affecting the course of disease: an epidemiological perspective. En: Mechanic D. Handbook of health, health care and the health professions. New York: Free Press, 1983; 683-708. Katz JN, Wright EA, Guadagnoli E, Liang MH, Karlson EW, Cleary PD. Differences between men and women undergoing major orthopedic surgery for degenerative arthritis. Arthritis Rheum 1994; 37: 687-694. Katz S, Akpom CA. A measure of primary sociobiological functions. Int J Health Serv 1976; 6: 493-507. Katz S, Ford AB, Moskowitz RW, Jackson BA, Jaffe MW. Studies of illness in the aged. The Index of ADL: A standardised measure of biological and psychosocial function. JAMA 1963; 185: 914-919. Katz S. The Science of Quality of Life. J Chron Dis 1987; 40: 459-463. Kazis L, Callahan L, Meenan R, Pincus T. Health status reports in the care of patients with rheumatoid arthritis. J Clin Epidemiol 1990; 43: 1243-1253. Keith RA, Granger CV, Hamilton BB, Sherwin FS. The functional independence measure: A new tool for rehabilitation. En: Eisenberg MG, Gizesiak RC eds. Advances in Clinical Rehabilitation. New York: SpringerVerlag, 1987: 6-18 Keith RA. Patient Satisfaction Rehabilitation Services. Arch Phys Med Rehabil 1998; 79: 1122-1128. Kettelkamp DB, Thompson C. Development of a Knee scoring scale. Clin Orthop 1975; 107: 93-99. Kiebzak GM, Vain PA, Gregory AM, Mokris JG, Mauerhan DR. SF-36 general health status survey to determine patient satisfaction at short-term 118 follow-up after total hip and knee arthroplasty. J South Orthop Assoc 1997;6: 169-172. Kind P, Carr-Hill R. The Nottingham Health Profile: A useful tool for epidemiologists? Soc Sci Med 1987; 25: 905-910. Kind P. Development of health indices. En: Teeling-Smith G, ed. Measuring health: a practical approach. Chihester: Wiley, 1988: 23-43. Kirshner B, Guyatt G. A methodological framework for assessing health indices. J Chronic Dis 1985; 7: 27-36. Kirwan JR, Currey HL, Freeman MA, Snow S, Young PJ. Overall longterm impact of total hip and knee joint replacement surgery on patients with osteoarthritis and rheumatoid arthritis. Br J Rheumatol 1994; 33: 357-360. Kleinman A, Eisenberg L, Good B. Culture, illness and care: clinical lessons from anthropologic and cross-cultural research. Ann Intern Med 1978; 88: 252-258. König A, Scheidler M, Rader C, Eulert J. The need for dual rating system in total knee arthroplasty. Clin Orthop 1997; 345: 161-167. Kopjar B. The SF-36 health survey: a valid measure of changes in health status after injury. Inj Prev 1996; 2: 135-139. Kosinski M, Keller SD, Hatoum HT, Kong SX, Ware JE Jr. The SF-36 Health Survey as a generic outcome measure in clinical trials of patients with osteoarthritis and rheumatoid arthritis: tests of data qualy, scaling assumptions and score reliability. Med Care 1999; 37: MS10-22. Krackow KA, Jones MM, Teeny SM, Hungerford DS. Primary total knee arthroplasty in patients with fixed valgus deformity. Clin Orthop 1991; 273: 9-18. Kreibich DN, Vaz M., Boume RB, Rorabeck CH, Kim P, Hardie R et al. What is the best way of assessing outcomes after total knee replacement. Clin Orthop 1996; 331: 221-225. Kristensen O, Nafei A, Kjaersgaard Andersen P, Hvid I, Jensen J. Longterm results of total condylar knee arthroplasty in reumatoid arthritis. J Bone Joimt Surg Br 1992; 74: 803-806. Kwoh CK, Whitley DM, Azvadak KH, Venglish CM, Gibson KR. Predictors of functional improvement after total knee arthroplasty (abstract). Arthritis Rheum 1993; 36 Suppl : S98. 119 Labi MLC, Gresham GE. Some research applications of functional assessment instruments used in rehabilitation medicine. En: Granger CV and Gresham GE edes. Functional Assessment in Rehabilitation Medicine. Baltimore: Williams and Wilkins, 1984: 46-64 Lam SSK. Assessing the Validity of SERVQUAL: An Empirical Analysis in Hong Kong. Asia Pacific J Qual Management 1995; 4: 33-40. Lam SSK. Measuring Service Quality: An Empirical Analysis in Hong Kong. Int J Management 1995; 12(2): 182-188. Lam SSK. SERVQUAL: A Tool for Measuring Patient’s Opinions of Hospital Service Quality in Hong Kong. Total Qual Management 1997; 8: 145-152. Lancet, The. Surrogate measures in clinical trials (editorial). Lancet 1990; 335:261-262. Lansky D, Butler J, Waller F. Using health status measures in the hospital setting: from acute care to outcomes management. Med Care 1992; 30 Suppl: MS57-MS73. Larson CB. Rating Scale for hip disabilities. Clin Orthop 1963; 31: 85-93. Lasry JM, Margoles ERG, Poisson R. Depression and body image following mastectomy and lumpectomy. J Chronic Dis 1987; 40: 529-534. Lavernia CJ, Guzman JF, Gachupin-Garcia A. Cost effectiveness and quality of life in knee arthroplasty. Clin Orthop 1997; 345: 134-139. Lavie CJ, Milani RV. Effects of cardiac rehabilitation and exercise training on exercise capacity, coronary risk factors, behavioural characteristics and quality of life in women. Am J Cardiol 1995;75:340-3. Lawton MP, Brody EM. Assessment of elderly people: self-maintaining and instrumental activities of daily living. Gerontologist 1969;9: 179-186 Lawton MP. The functional assessment of elderly people. J Am Geriatr Soc 1971;14: 465-481. Lazarus RS. Thoughts on the relations between emotion and cognition. Am Psychol 1982; 36: 1019-1024. Leigh P, Fries J. Mortality predictors among 263 patients with rheumatoid arthritis. J Rheumatol 1991; 18: 1307-1312. Lesquene MG. Indices of severty and disease activity for osteoarthritis. Semin Arthritis Rheum 1991; 20: 48-54. 120 Li PL, Zamora J, Bentley G. The results at ten years of the Insall-Burstein II total knee replacement. Clinical, radiological and survivoship. J Bone Joint Surg Br 1999; 81: 647-653. Liang MH, Fossel AH, Larson MG. Comparisons of five health status instruments for orthopedic evaluation. Med Care 1990; 28: 632-642. Linder-Pelz S. Social psychological determinants of patient satisfaction: a test of five hypotheses. Soc Sci Med 1982; 16: 583-589. Linder-Pelz S. Toward a theory of patient satisfaction. Soc Sci Med 1982; 16: 577-582. Lingard EA. Validity and responsiveness of the Knee Society Clinical Rating System. San Francisco: American Academy of Orthopaedic Surgeons, 2001 Lizaur A, Marco L, Cebrian R. Preoperative factors influencing the range of movement after total knee arthroplasty for severe osteoarthritis. J Bone Joint Surg Br 1997; 79 626-629. Llosa S, Chandon JL, Orsingher C. An Empirical Study of SERVQUAL’s Dimensionality. Serv Industries J 1998; 18: 16-44. Lohr K. Applications of health status assessments measures in clinical practice. Med Care 1992; 30: MS1-MS14. Lu H, Mow CS, Lin J. Total knee arthroplasty in the presence of severe flexion contracture a report of 37 cases. J Arthroplasty 1999; 14: 775-780. Mahoney FI, Barthel DW. Functional evaluation: The Barthel Index. Maryland State Med J 1965; 14: 61-65. Mañez I, Girona G, Cuello E, Cervera J, Beseler R, Ashi S. Estudio retrospectivo de las complicaciones en 87 prótesis totales de rodilla. Rehabilitación (Madr) 1997; 31: 283-289. March LM, Cross MJ, Lapsley H, Brnabic AJ, Tribe KL, Bachmeier CJ, et al. Outcomes after hip or knee replacement surgery for osteoarthritis. A propective cohort study comparing patients quality of life before and after surgery with age-related populations norms. Med J Aust 1999; 171: 235-238. Marión J, Peiró S, Márquez S, Meneu R. Variaciones en la práctica médica: importancia, causas e implicaciones. Med Clin (Barc) 1998; 110: 382-390. Martin B, Cleary R. Assessing the outcomes of total knee replacement. J Eval Clin Practice 1999; 5: 47-55. 121 Martin CM, Roman-Smith HM, Hadorn DC. Literature review – Hip/Knee Joint Replacement. Edmonton, Alberta: Western Canada Waiting List Project, 2000. Martin P, Paredes B, Fernandez C. Los reumatismos en la Comunidad. Aten Primaria 1992; 10: 567-570. McAlexander JH, Kaldenberg DO, Koenig HF. Service Quality Measurement. J Health Care Marketing 1994; 14:34-40. McDowell I, Newell C. Measuring health: a guide to rating scales and questionnaires. New York: Oxford University Press, 1987. McEwen J. The Nottingham Health Profile. En: Walker SR, Rosser RM, eds. Quality of Life: assessment and applications. Lancaster: MTP, 1988: 95-111. McGuigan FX, Horzack WJ, Morianty L, Eng K, Rothman RH. Predicting quality of life outcomes following total joint arthroplasty. Limitations of the SF-36 Health Status Questionnaire. J Arthroplasty 1995; 10: 742-747. McHorney CA, Ware JE, Lu R, Sherbourne CD. The MOS 36-items short form health survey (SF-36): III. Tests of data quality, scaling assumptions, and reliability across divers patient groups. Med Care 1994; 32: 40-66. McHorney CA, Ware JE, Raczek AE. The MOS 36-items short form health survey ( SF-36): II Psychometric and Clinical test of Validity in Measuring Physical and Mental Health Constructs. Med Care 1993; 3: 247-263. Mcpherson K. Como deberia modificarse la politica sanitaria ante la evidencia de variaciones en la practica médica. Var Pract Med 1995; 7:9-17. Mels G, Boshoff C, Nel D. The Dimensions of Service Quality: The Original European Perspective Revisited. Serv Industries J 1997; 17: 173-189. Meterko M, Rubin HR. Patient judgments of hospital quality: A taxonomy. Med Care 1990; 28(9 suppl): S10-14. Ministerio de Sanidad y Consumo (Dirección General de Evaluación y Servicios). Investigación sobre calidad percibida por el usuario del INSALUD en Atención Primaria. Madrid: Ministerio de Sanidad y Consumo, 1992. Mira JJ, Aranaz J, Rodríguez-Marín J, Buil JA, Castell M, Vitaller J. SERVQHOS: un cuestionario para evaluar la calidad percibida de la asistencia hospitalaria. Med Prev 1998;4:12-8. Mira JJ, Buil JA, Rodríguez-Marín J, Aranaz J Calidad percibida del cuidado hospitalario. Gac Sanitaria 1997; 11: 176-189. 122 Mont MA, Mathur SK, Krackow KA, Loewy JW, Hungerford GS. Cementless total knee arthroplasty in obese patients. A comparison with a matched control group. J Arthroplasty 1996; 11: 153-156. Morehouse M. Nursing: a caring connection. Nurses are essential to healthy leadership teams. Mich Health Hosp 1997;33:36-7 Morris JN, Sherwood S. Quality of life of cancer patients at different stages in the disease trajectory. J Chronic Dis 1987; 40: 545-553. Morris JN, Suissa S, Sherwood S, Wright SM, Greer D. Last days: a study of the Quality of terminally ill cancer patients. J Chronic Dis 1986; 39: 47-62. Moskowitz E, Cann CB. Classification of disability in the chronically ill and aging. J Chronic Dis 1957;5: 342-346. Mossey J, Shapiro E. Self-rated health: a predictor of mortality among the elderly. Am J Public Health 1982; 72: 800-809. Mowen JC, Licata JW, McPhail J. Waiting in the emergency room: how to improve patient satisfaction. J Health Care Mark 1993: 2:26-33. Munin MC, Rudy TE, Glynn NW, Crosset LS, Rubash HE. Early inpatient rehabilitatión after elective hip and knee arthroplaty. JAMA 1998; 279: 847-852. Murfin DE, Schlegelmilch BB, Diamantopoulos A. Perceived Service Quality and Medical Outcome: An Interdisciplinary Review and Suggestions for Future Research. J Marketing Management 1995; 11:97-117. Nafei A, Kristensen O, Kjaersgaard Andersen P, Hvid I, Jensen J. Total condylar arthroplasty for gonarthrosis. A prospective 10 year study of 138 primary cases. Acta Orthop Scand 1993; 64: 421-427. Navarro MJ, Pérez de Lucia B, Trénor C, Ruíz L, Pérez A, Peiró S. Validación de un cuestionario para la medida de la satisfacción en rehabilitación. Rehabilitación (Madr) 1998; 32: 255-262. NCQA. NCQA Consumer Information Project: Focus Group Report Executive. Washington: National Committee for Quality Assurance, 1998. NCQA. Understanding and Enhancing Performance Measures. Washington: National Committee for Quality Assurance, 1997. Nelson EC, Ware JE, Batalden P. Pilot study methods: Design of study. Med Care 1990; 28: S15-17. 123 Nerenz DR, Repaski DP, Whithouse FW, Kahlonen DM. Ongoing assessment of health status in patients with diabetes mellitus. Med Care 1992; 30: 112-124. New York Heart Association. Diseases of the heart and blood vessels: Nomenclature and criteria for diagnoses. Boston: Little, Brown, 1964. Neyret P, Deroche P, Deschamps G, Dejour H. Protèse totale genou après ostéotomie tibiale de vagisation. Problémes techniques. Rev Chir Orthop 1992; 77:438-448. Nielsen S, Hvid I, Sneppen O. Total condylar knee arthroplasty. A report of 2 year follow-up on 247 cases. Aerch Orthop Trauma Surg 1985; 104: 227-232. Nissan M. The use of permutation approach in the solution joint biomechanics of the knee. Eng Med 1981; 10: 39-43. Norman-Taylor FH, Palmer CR, Villar RN. Quality of life improvement compared after hip and knee replacement. J Bone Joint Surg Br 1996 ; 78: 74-77. Oldridge N, Guyatt G, Jones N et al. Effects on quality of life with comprehensive rehabilitation after acute myocardial infarction. Am J Cardiol 1991; 67:1084-1089. Oppenheim A. Questionnaire Desing and Attitude Measurement. London 1966: Heinemann. Ott CR, Slvarajan ES, Newton KM, Almes MJ, Bruce RA, Bergner M et al. A controlled randomized study of early cardiac rehabilitation: the Sickness Impact Profile as an assessment tool. Heart Lung 1983; 12:162-170. Padilla G, Presant CA, Grant M, Metter G, Lipsett J, Heide F. Quality of life index for patients with cancer. Res Nurs Health 1983; 6: 117-126. Pagés E, Iborra J, Jou N, Moranta S, Ramón S, Cuxart A. Prótesis total de rodilla. Valoración funcional y satisfacción personal del paciente a los 5 años. Rehabilitación (Madr) 2001; 35: 3-8. Parasuraman A, Zeithaml V, Berry L. A conceptual model of service quality and its implications for future research. J Marketing 1985; 61: 41-50. Parasuraman A, Zeithaml VA, Berry LL. Alternative Scales for Measuring Service Quality: a Comparative Assessment Based on Psychometric and Diagnostic Criteria. J Retailing 1993; 70:201-230. 124 Parasuraman A, Zeithaml VA, Berry LL. Reassessment of Expectations as a Comparison Standard in Measuring Service Quality: Implications for Further Research. J Marketing 1994; 58:111-124. Parasuraman A, Zeithaml VA, Berry LL. Refinement and Reassessment of the SERVQUAL Scale. J Retailing 1991; 67: 420-450. Parasuraman A, Zeithaml VA, Berry LL. SERVQUAL: a Multi Item Scale for Measuring Consumer Perception of Service Quality. J Retailing 1988; 64:12-40. Patrick DL, Bergner M. Measurement of health status in the 1990s. Annu Rev Public Health 1990; 11: 1651-1683. Patrick DL, Bush JW, Chen MM. Toward an operational definition of health. J Health Soc Behav 1973; 14: 6-21. Patrick DL, Erickson P. Assessing health-related Quality of life for clinical decision-making. En: Walker SR, Rosser RM, eds. Quality of life Assessment: Key Issues in the 1990s. London: Kluwer, 1993: 11-63. Paulino J, Pinedo A, Wong C, Crespo D. Estudio general de las enfermedades reumáticas en una población determinada con fines epidemiológicos. Rev Esp Reumatol 1982; 9: 1-8. Pearlman R, Uhlmann R. Patient and physician perception of patient quality of life across chronic diseases. J Gerontol 1988; 43: 25-30. Peduzzi P, Hultgren H, Thomsen J, Detre K. Ten-year effect of medical and surgical therapy on quality of life: Veterans Administration Cooperative Study of Coronary Artery Surgery. Am J Cardiol 1987; 59:1017-1023. Peris A. Instrumento de medida de la calidad de vida en pacientes: elaboración y aplicación (tesis). Valencia: Universidad de Valencia, 1996 Perneger T.V. What’s wrong with Bonferroni adjustments. BMJ 1998; 316: 1236-1238. Peter J, Churchill G, Brown T. Caution in the Use of Difference Scores in Consumer Research. Journal of Consumer Research 1993; 19: 655-62. Pitt LF, Watson RT, Bruce KC. Service Quality: A Measure of Information Systems Effectiveness. MIS Quarterly 1995;19: 173-187. Priestman TJ, Baum M. Evaluation of Quality of life in patients receiving treatment for advanced breast cancer. Lancet 1976; 1: 899-901. 125 Ranawat CS, Flynn WF Jr, Deshmukh RG. Impact of modern technique on long-term results of total condylar knee arthroplasty. Clin Orthop 1994; 309: 131-135. Ranawat CS, Padgelt DE, Ohashi Y. Total knee arthroplasty for patients younger than 55 years. Clin Orthop 1989; 248: 27-33. Ranawat CS, Shine JJ. Duo condylar total knee arthroplasty. Clin Orthop 1973; 94: 185-195. Rinonapoli E, Mancini GB, Azzara A, Aglietti P. Long-term results and survivorship analysis of 89 total condylar knee prostheses. J Arthroplasty 1992; 7: 241-246. Rissanen P, Aro S, Sintonen H, Slatis P, Paavolainen P. Quality of life and functional ability in hip and knee replacements: a prospective study. Qual Life Res 1996; 5: 56-64. Ritter MA, Albohm MJ, Keating EM, Faris PM, Meding JB. Comparative outcomes of total joint arthroplasty. J Arthroplasty 1995; 10: 737-741. Roberts JG, Tugwell P. Comparison of questionnaires determining patient satisfaction with medical care. Health Serv Res 1987;22:637-54 Roush SE. The satisfaction of patients with multiple sclerosis regarding services received from physical and occupational therapists. Int J Rehabil Health 1995; 1: 155-166 Rubenstein L, Calkins D, Young R, Cleary PD, Fink A, Kosecoff J et al. Improving patient function: a randomised trial of functional disability screening: Ann Intern Med 1989; 111: 836-842. Rubin HR, Gandek B, Rogers WH, Kosinski M, McHorney CA, Ware JE. Patients’ ratings of outpatient visits in different practices settings. JAMA 1993; 37: 835-840. Rubin HR, Ware JE, Nelson EC, Meterko M. The patient judgment of hospital quality (PJHQ): Questionnaire. Med Care 1990; 28: S17-18 Rubin HR. Patient evaluations of hospital care: A review of the literature. Med Care 1990; 28(suppl): S3- 9. Safran DG, Kosinski M, Taira DA, Tarlov AR, Rogers WH, Lieberman N, et al.The Primary Care Assessment Survey: Tests of data quality and measurement performance. Med Care 1998; 36:728-739 126 Schoening HA, Anderegg L, Bergstrom D, Fonda M, Steinke N, Ulrich P. Numerical scoring of self-care status of patients. Arch Phys Med Rehabil 1965; 46: 689-697. Schoening HA, Iversen IA. Numerical scoring of self-care status. A study of the Kenny self-care evaluation. Phys Med Rehabil 1968; 49: 221-229. Selby P. Measurement of the Quality of life after cancer treatment. Br J Hosp Med 1985; 29: 266-277. Serna F, Mont MA, Krackow KA, Hungerford DS. Total knee arthroplasty in diabetic patients. Comparison to a matched control group. J Arthroplasty 1994; 9:375-379. Sharma L, Sinacore J, Daugherty C, Kuesis DT, Stulberg SD, Lewis M et al. Prognostic factors for functional outcome of total knee replacement: a prospective study. Biol Sci Med Sci 1996; 51: M152-157. Sharon W. Quality of life assessment: recent trends in surgery. Can J Surgery 1996; 39: 368-372. Shipper H, Clinch J, Mcmurrary A, Levitt M. Measuring the Quality of life of cancer patients. The Functional Living Index-Cancer: Development and validation. J Clin Oncol 1984; 2: 472-483. Shipper H, Levitt M. Measuring Quality of Life: Risks and Benefits. Cancer Treat Rep 1985; 10: 1115-1125. Simon SE, Patrick A. Understanding and assessing consumer satisfaction in rehabilitation. J Rehabil Outcomes Meas 1997; 1: 1-14. Sisto DJ, Blazina ME, Heskiaoff D, Hirs LC. Unicompartment arthroplasty for osteoarthrosis of the knee. Clin Orthop 1993; 286: 149-153. Slevin M, Plant H, Lynch D, Drinkwater J, Gregory GW. Who should measure quality of life, the doctor or the patient? Br J Cancer 1988; 57: 109112. Smith BE, Askew MJ, Gradisar IA, Gradisar JS, Lew MM. The effect patient weight on the functional outcome of total knee arthroplasty. Clin Orthop 1992; 276: 237-244. Snyder MK, Ware JE. A Study of Twenty-two Hypothesized Dimensions of Patient Attitudes Regarding Medical Care (Technical Report No. MHC 74-10). Carbondale, IL: Southern Illinois University School of Medicine, 1974. 127 Spilker B, Molinek FR, Johnston KA, Simpson RL, Tilson HH. Quality of life bibliography and indexes. Med Care 1990; 28: DS1-DS77. Spilker B, Simpson RL, Tilson HH. Quality of life bibliography and indexes: 1991 update. J Clin Res Pharmacoepidemiol 1992; 6: 205-266. Spilker B, White WSA, Simpson RL, Tilson HH. Quality of life bibliography and indexes: 1990 update. J Clin Res Pharmacoepidemiol 1992; 6: 87-156. Spitzer WO, Dobson AJ, Hall J, Chesterman E, Levi J, Shepherd R, et al. Measuring the Quality of life of cancer patients: a concise QL Index for use by physicians. J Chronic Dis 1981; 34: 585-597. Spitzer WO. State of science 1986. Quality of Life and functional status as target variables for research. J Chronic Dis 1987; 40: 465-471. Steiman MG, Going JE, Tassoni CJ, Granger CV, Williams SV. Classifying rehabilitation inpatients by expected functional gain. Med Care 1997; 35: 963-973. Stern SH, Insall JN. Total knee arthroplasty in obese patients. J Bone Joint Surgery 1990; 72: 1400-1404. Stern SH, Insall JN. Posterior Stabilized Prosthesis. J Bone Joint Surgery 1992; 74: 980-986. Steven I, Douglas R. A self contained method of evaluating patient dissatisfaction in general practice. Fam Practice 1986; 3: 14-19. Stewart AL, Greenfield S, Hays RD, Wells K, Rogers WH, Berry SD et al. Functional status and well-being of patients with chronic conditions. JAMA 1989; 262: 907-913. Stewart AL, Hays RD, Ware JE. The MOS short form general health survey. Med Care 1988; 26: 724-735. Summers MN, Haley WE, Reveille JD, Alarcon GS. Radiographic assessment and psychologic variables as predictors of pain and functional impairment in osteoarthritis of knee or hip. Arthritis Rheum 1998; 31: 204-209. Torrance GW. Utility approach to measuring health-related Quality of Life. J Chronic Dis 1987; 6: 593-600. Triplett JL, Yau OHM, Neal C. Assessing the Reliability and Validity of SERVQUAL in a Longitudinal Study: The Experience of an Australian Organization. Asia Pacific J Marketing 1994; 6: 41-62. 128 Tullis DE, Guyatt GH. Quality of life in cystic fibrosis. Pharmacoeconomics 1995;8:23-33. Van Essen GJ, Chipchase LS, O’Connor D, Krishnan J. Primary total knee replacement: short-term outcomes in an Australian population. J Qual Clin Pract 1998; 18: 135-142. Vandamme R, Leunis J. Development of a Multiple Item Scale for Measuring Hospitality Service Quality. Int J Serv Industry Management 1993; 4(3): 30-49. VanDyke TP, Kappelman LA, Prybutok VR. Measuring Information Systems Service Quality: Concerns on the Use of the SERVQUAL Questionnaire. MIS Quart 1997; 21: 195-208. Verneuil A. De la création d´une fausse articulation par section ou resection partiele de l´os maxillare inferieur, comme moyen de rémedier a l´ankylose vraie ou fausse de la marchoire inferieure. Arch Gen Med 1860; 5: 174. Voss F, Sheinkop MB, Galante JO, Barden RM, Rosenberg AG. MillerGalante unicompartmental knee arthroplasty at 2 to 5 year follow-up evaluations. J Arthroplasty 1995; 10: 764-771. Vuori H. Patient satisfaction—does it matter? Qual Assur Health Care 1991; 3:183-9. Walker PS, Hajet JV. The load-bearing area in the knee joint. J Biomech 1972; 5: 581-589. Walker SR, Rosser R. Quality of Life Assessment: Key Issues in the 1990s. London: Kluwer Acad Publ, 1993. Walker SR, Rosser RM. Quality of life: assessment and application. Lancaster: MTP Press, 1988. Walsh M, Woodhouse LJ, Thomas SG, Finch E. Physical impairments and functional limitations: a comparison of individuals 1 year after total knee arthroplasty with control subjets. Phys Ther 1998; 78: 248-258. Ware JE, Hays RD. Methods for measuring patient satisfaction with specific medical encounters. Med Care 1988, 26: 393-402. Ware JE, Miller WG, Snyder MK. Comparison of factor analytic methods in the development of health-related indexes from questionnaire data. (Technical Report No. MHC 73-1). , Carbondale, IL: Southern Illinois University School of Medicine, 1973. 129 Ware JE, Sherbourne CD. The MOS 36-item Short-Form Health Survey (SF-36). Med Care 1992; 30: 473-483. Ware JE, Snow KK, Kosinski MK. SF-36 health survey manual and interpretation guide. Boston, MA: The Health Institute, New England Medical Center, 1993. Ware JE, Snyder MK, Wright R, Davies AR. Defining and Measuring Patient Satisfaction with Medical Care. Evaluation Program Planning 1983; 6:247-263. Ware JE, Snyder MK. Dimensions of patients’ attitudes regarding doctors and medical care services. Med Care 1975; 13: 669-683. Ware JE. Effects of Acquiescent Response Set on Patient Satisfaction ratings. Med Care 1978; 16(4): 327-331 Ware JE. Standards for validating health measures: definition and content. J Chronic Dis 1987; 40: 473-480. Wasson J, Keller A, Rubenstein L, Mays R, Nelson E, Johnson D. Benefits and obstacles of health status assessment in ambulatory settings: the clinician’s point of view. Med Care 1992; 30: MS42-MS49. Wells KB, Stewart AL, Hay R, Burnham A, Rodgers W, Daniels M. et al. The functioning and well-being of depressed patients: results from the Med Outcomes Study. JAMA 1989; 262: 914-919. Wenger NK, Mattson M, Furberg C, Elison J. Assesment of Quality of life in clinical trials of cardiovascular therapies. Am J Cardiol 1984; 54: 908913. Wenger NK. Quality of Life: Can It and Should It Be Assessed in Patients with Heart Failure? Cardiology 1989; 76: 391-398. Wennberg JE, Barnes BA, Zubkoff M. Professional uncertainty and the problem of supplier-induced demand. Soc Sci Med 1982; 16: 811-24. Wennberg JE, Gittelsohn A. Small area variations in health care delivery. A population-based health information system can guide planning and regulatory decision-making. Science 1973; 18:1102-1108. Wennberg JE, Gittelsohn AM. Variations in medical care among small areas. Sci Am 1982; 264:100-111. Wennberg JE. Dealing with medical practice variations: a proposal for action. Health Aff 1984; 3:6-32. 130 Wennberg JE. On the need for outcomes research and the prospects for the evaluative clinical sciences. In: Mooney G, Anderson TF, eds. The challenges of medical practice variations. London: McMillan, 1990: 158-173. Wiklund I, Gorkin K, Pawitan Y, Schron E, Schoenberger J, Jared L. Methods for assessing Quality of life in the Cardiac Arrhythmia Suppression Trial (CAST). Qual Life Res 1992; 1: 187-201. Wiklund I, Karlberg J. Evaluation of quality of life in clinical trials. Selecting quality of life measures. Contr Clin Trials 1991; 281-288. Wiklund I, Lindvall K, Swedberg K, Zupkis RV. Self-assessment of Quality of life in severe heart failure: An instrument for clinical use. Scand J Psychol 1987; 28: 220-225. Wilkin D, Hallam K, Doggett MA. Measures of Need and Outcome for Primary Health Care. New York: Oxford Univ Press, 1992. Wilkin D. Conceptual problems in dependency research. Soc Sci Med 1987; 79: 1-20. Williams B. Patient satisfaction: a valid concept?. Soc Sci Med 1994; 38: 509-516. Williams JL, Llewellyn TH, Arshinoff R, Young N, Naylor CD. The burden of waiting for hip and knee replacements in ontario. Ontario Hip and Knee Replacement Proyect Team. J Eval Clin Pract 1997;3: 59-68. Wilson A, Wiklund I, Lahti T, Wahl M. A summary index for the assessment of Quality of life in angina pectoris. J Clin Epidemiol 1991; 9: 981-988. Wilson KG, Crupi CD, Greene G, Gaulin-Jones B, Deboux E, Korol CT. Consumer satisfaction with a rehabilitation mibile outreach program. Arch Phys med Rehabil 1995; 76: 899-904. Winter PL, Keith RA. A model of outpatient satisfaction in rehabilitation. Rehabil Psychol 1988; 33: 131-142. Witvoët J, Peyrache MD, Nizard R. Unicompartmental Lotus knee prostheses in the treatment of single compartment arthritis. Results in 135 cases with an average follow-up of 4,6 years. Rev Clin Orthop 1993; 79: 565-576 Wolfe F, Cathey M. The assessment and prediction of functional disability in rheumatoid arthritis. J Rheumatol 1991; 18: 1298-1306. Young SL, Woodburg MG, Friday-Field K, Donovan T, Bellamy N, Haddad R Efficacy of interferencial current simulation alone for pain reduc131 tion in patients with osteoarthritis of the knee: a randomized placebo control clinical trial. Phys ther 1991; 71:52. Zeithaml V, Berry LA, Parasuraman A. Calidad total en la gestión de los servicios. Madrid: Díaz de Santos, 1993. Zicat B, Rorabech CH, Bourne RB, Devane PA, Nott L. Total knee arthroplasty in the octogenarian. J Arthroplasty 1993; 8: 395-400. Zyzanski SJ, Hulka BS, Cassel JC. Scale for the measurment of “satisfaction” with medical care: modifications in content, format, and scoring. Med Care 1974; 12:611-620. 132 Anexo 1 Características climétricas de los principales instrumentos de valoración de la función, calidad de vida y satisfacción utilizados en la artoplastia de rodilla Medidas de valoración funcional utilizadas en prótesis de rodilla La Functional Status Independence Measure (FIM) valora la discapacidad física y cognitiva en términos de carga de cuidado. Fue desarrollado en la década de los 80 por el Congreso Americano de Rehabilitación Médica y la Academia Americana de Medicina Física y Rehabilitación, dos instituciones que han venido trabajando en la creación de un sistema uniforme de recogida de datos (UDS) sobre la rehabilitación médica, en el que se incluye el FIM [Hamilton et al, 1987]. El FIM pretende ser un indicador de gravedad de la incapacidad, con utilidad clínica [Keith et al, 1987]. Está diseñado para la valoración de enfermos hospitalizados. La recogida de datos se realiza mediante evaluadores, 133 normalmente médicos, enfermeras o terapeutas, y necesita 30 minutos para su administración. El FIM valora 18 apartados que se pueden subdividir en 13 ítem motores (referentes a autocuidados, control de esfínteres, movilidad y deambulación), y en 5 ítem cognitivos (que incluyen la comunicación, interacción social, memoria y resolución de problemas). Cada una de estas 18 áreas es evaluada según una escala de 1 a 7 punto (1 dependencia completa, 2 necesita máxima ayuda, 3 ayuda moderada, 4 mínima ayuda, 5 supervisión, 6 independencia modificada y 7 independencia completa). La forma para valorar una actividad es, si precisa o no ayuda de otra persona o cuidador y, de requerirla, su cuantificación. El resultado global varía entre 18 y 126 puntos. El FIM es una escala observacional y valora lo que el paciente realmente hace, no lo que es capaz de hacer. Fiabilidad.- La correlación intraclase para pares de valores clínicos en 263 pacientes mostró un rango desde 0,93 (subescala de locomoción) a 0,96 (autocuidado y movilidad). El índice Kappa fue de 0,71. El coeficiente a de Cronbach fue 0,93 (al ingreso) y de 0,95 (al alta). Validez.- Granger [1990] examinó la validez predictiva del FIM en pacientes con esclerosis múltiple en el 7º día de evolución. Los ítem del FIM predijeron el tiempo requerido para proporcionar ayuda para las tareas de cuidado personal (r2= 0,77), y correlaciones para ítem de más severidad alcanzaron un r2 de 0,80. Un cambio en un punto en el FIM representó 3,38 minutos de cuidado por día. Análisis similares se realizaron en pacientes con AVC [Granger et al 1993]. En 11.102 pacientes, la mejoría de resultados entre la admisión y el alta predecía el destino de los pacientes [Dodds et al, 1993] y mostró buenas correlaciones con otras medidas, incluidas el índice de Barthel (0,84), el índice de Katz (0,68) y el índice de calidad de vida Spitzer (0,45). El FIM tiene una alta consistencia interna y una adecuada capacidad discriminativa para los pacientes en Rehabilitación. Es un buen indicador de cargas de cuidados, y ha demostrado cierta sensibilidad, aunque su capacidad de medida del cambio en el tiempo necesita de un adicional examen y comparación con escalas competentes [Dodds TA. et al 1993]. El FIM es una escala ampliamente utilizada tanto en adultos como en niños. El componente físico del FIM es comparable al mejor de los instrumentos de AVD. Las dimensiones de comunicación, cognitiva y social pueden tener baja sensibilidad. En general el FIM es un instrumento válido que puede ser usado como instrumento de valoración del paciente y como instrumento evaluativo. Aunque es una escala de valoración poco utilizada en artro134 plastia de rodilla, por valorar aspectos muy globales que no son específicos de esta patología, si que hay referencias bibliográficas de su utilización en esta patología en enfermos hospitalizados [Munim et al 1998, Steiman et al 1997]. The Buffalo General Hospital State posee los derechos de uso del FIM, aunque puede ser utilizado libremente. El Functional Status Index (FSI) fue diseñado Jette [1978, 1980] para aplicarlo en ancianos con artritis reumatoide y artrosis no hospitalizados. La versión original es una escala ordinal autoadministrada, que mide la realización de 3 dimensiones de función (dependencia, dolor y dificultad) en 45 AVD. Fiabilidad.- La fiabilidad test-retest es de 0,75 en el apartado de dependencia, 0,77 en el de dificultad y 0,69 en el de dolor. La fiabilidad interobservador es de 0,72, 0,75 y 0,78 en los tres apartados indicados [Jette, Deniston, 1978]. Validez.- Se considera una escala válida, con el inconveniente de no ser excesivamente sensible a los cambios de estado funcional. Se dispone en la actualidad de una versión más corta (18 ítem) que se puede realizar de modo autoadministrado en 20 minutos [Jette 1987], aunque su utilización en artroplastia de rodilla es muy escasa [Liang et al, 1990] La escala Hospital for Special Surgery (HSS), elaborada hace mas de 25 años [Ranawat, Shine, 1973], es el sistema de valoración de artroplastia de rodilla más utilizado [Callaham 1994]. La puntuación máxima alcanzada por esta escala alcanza es de 100 puntos, subdivididos en varias categorías: dolor (30 puntos), función (22 puntos), rango de movilidad (18 puntos), fuerza muscular (10 puntos), deformidad en flexión (10 puntos), estabilidad (10 puntos). Se restan puntos si se emplean ayudas para la marcha o si existe déficit de extensión o deformidad en varo-valgo. Ofrece también la posibilidad de una clasificación cualitativa, considerando resultado excelente la puntuación entre 85-100 puntos, buena entre 70 y 84, regular entre 60 y 69, y mala por debajo de 60 puntos. Esta clasificación que, utilizada en los primeros años cuando las expectativas de los resultados eran bajos, fue posteriormente elevada en cada categoría estableciéndose el resultado excelente (90-100), bueno (80-89), regular (70-79) y malo por debajo de 70 [Insall, 1993]. Presenta la desventaja de que la puntuación obtenida no separa la función de la rodilla de la función del paciente y, al incorporar parámetros funcionales, la puntuación tiende a deteriorarse a medida que el paciente envejece o presenta comorbilidad, aunque la rodi135 lla no cambie. Por convención una prótesis retirada puntúa 0, y esto tiene un efecto desproporcionado sobre la puntuación media acentuándose en muestra pequeñas, aunque con un análisis más cuidadoso estas rodillas no puntuarían tan bajo [England 1990]. La escala HSS obtiene resultados similares a la diseñada por el grupo francés GUEPART (Groupe pour l´Utilisation et l´Etude des Prosthèses Articulaires) [Neyret et al, 1992; Witvoët et al, 1993; Aubriot et al, 1973]. Edwards et al [1989] efectuaron un análisis comparativo de 5 escalas utilizadas para la valoración de la prótesis de rodilla en 108 rodillas intervenidas. Observaron una excelente correlación de la escala HSS con las escalas del Robert B. Brigham Hospital (RBBH), la de la BOA, la de Universidad de California (UCLA) y la de Hungerford, estableciendo medias similares con las dos primeras, y más bajas con la de UCLA y la de Hungerford. Jonsson [1981] comparó los sistemas HSS, y de la Universidad de Lund y del Hospital de Londres, siendo equivalentes para diferenciar los resultados buenos de los malos, pero casi la mitad de las consideradas fracasos por el sistema de la Lund puntuaron regular con el HSS, ya que esta última tiene una generosa definición de regular. El Knee Society System (KSS) es un sistema de valoración de prótesis rodilla desarrollado por la Sociedad Americana de Rodilla [Insall et al, 1989] para proporcionar una forma de evaluación más actual y rigurosa que los sistemas de valoración existentes hasta ese momento, incluido el HSS, e intentar conseguir una utilización más generalizada que permitiera comparaciones de resultados entre los diferentes grupos de trabajo. La Sociedad acordó por consenso valorar separadamente en dos subescalas la rodilla y la función general para no interferir entre ambas. Cada subescala tiene una puntuación máxima de 100 puntos. La subescala de rodilla evalúa: dolor (50 puntos), estabilidad (25 puntos) y rango de movilidad articular (25 puntos). Existen deducciones de puntos en el caso de mala alineación, contractura en flexión y déficit de extensión. De este modo se obtiene un máximo de 100 puntos cuando existe una buena alineación, sin dolor, 125º de recorrido articular y la inexistencia de inestabilidad, tanto antero-posterior como lateral. La subescala funcional considera la distancia caminada (50 puntos) y la capacidad para subir y bajar escaleras (50 puntos), con deducciones para las ayudas de la marcha. Al igual que la subescala de rodilla puede conseguir un máximo de 100 puntos cuando se camina una distancia ilimitada y se sube y baja escaleras sin ayuda. Previamente hay que encuadrar cada paciente en una categoría determinada, eligiendo entre las 136 tres posibilidades: prótesis unilateral o bilateral (contralateral protetizada con éxito), prótesis unilateral con rodilla contralateral sintomática, afectación poliarticular u otra enfermedad asociada. Penaliza de manera estándar cualquier rodilla que requiera revisión de sus componentes por infección o aflojamiento aséptico, otorgándole 50 puntos en la subescala de rodilla y 40 en la de función. Lingard [2001] demostró la sensiblidad y validez del KSS en 762 pacientes intervenidos de PTR, comparándola con el WOMAC y el SF-36 y demostrando que la subescala de rodilla del KSS era más sensible que las dimensiones de dolor y función del WOMAC y del SF-36. Kreibich et al [1996] valoraron la sensibilidad de varios instrumentos de valoración para PTR, encontrando el KSS y el WOMAC como los instrumentos más sensibles al cambio. El Western Ontario and McMaster Osteoarthritis Index (WOMAC) es un instrumento específico para la artrosis. Se desarrolló para poder disponer de un instrumento de medida estándar y válido internacionalmente para evaluar resultados en los ensayos clínicos de tratamientos de la artrosis. Es aplicable preferentemente a pacientes que sufren artrosis de rodilla y cadera. Fue diseñado a partir de una revisión de la literatura sobre las medidas clínicas incluidas en los ensayos clínicos en pacientes con artrosis por [Bellamy, Buchanan, 1984]. Se seleccionaron tres conceptos importantes para el paciente e independientes del observador: dolor, rigidez y capacidad funcional. Estas variables se refirieron a la rodilla y la cadera [Bellamy, Buchanan, 1986] ya que la artrosis afecta principalmente a estas dos articulaciones y la mayoría de los ensayos clínicos revisados se centraban en estas dos articulaciones. Es una escala multidimensional que contiene 24 ítem que cubren las 3 dimensiones: dolor (5 ítem), rigidez (2 ítem) y grado de dificultad para ciertas actividades físicas (17 ítem). Hay dos versiones disponibles del cuestionario, una que utiliza escalas analógicas visuales (WOMAC VA 3.0) de 100 mm que van desde “ningún dolor, ninguna rigidez y ninguna dificultad” a “máximo dolor, máxima rigidez y máxima dificultad” según la dimensión. La otra versión incluye 5 categorías de respuesta tipo Likert (WOMAC LK3.0) que representan diferentes intensidades “ninguno, poco, bastante, mucho, muchísimo”. Respecto a la referencia temporal, en la versión VA se pregunta respecto a las 48 horas previas y en la versión LK en la dimensión dolor se pregunta “últimamente”. En las dimensiones rigidez y capacidad funcional se pregunta si “actualmente” [Bellamy, 1995]. La versión española sigue este último modelo. Los 137 autores de la versión original realizaron un estudio sobre como influía la referencia temporal en las respuestas y hallaron que no había dependencia entre las respuestas de los pacientes y el marco temporal a que se hacía referencia siempre que fuera entre 24 horas y 14 días [Griffiths et al, 1993]. Respecto a la versión LK cada uno de los 3 aspectos evaluados se valora independientemente sin sumar las puntuaciones en un valor único total porque su importancia relativa debe ser aún determinada [Bellamy et al, 1988]. El recorrido de respuesta de cada ítem va desde 0 a 4 puntos. La puntuación de cada una de las dimensiones se establece como: dolor (0-20), rigidez (0-8) y capacidad funcional (0-68), siendo 0 la mejor puntuación y los valores máximos de cada dimensión la peor puntuación. La versión VA 3.0 se utiliza la regla y se calcula la distancia en milímetros desde el extremo de la izquierda hasta el punto marcado por el paciente. De la misma manera, la puntuación para cada dimensión se obtiene sumando los valores asignados a cada ítem. Entre los pacientes que no refieren dificultad con actividades físicas hay algunos capaces de realizarlas sin dificultad, mientras que otros son incapaces porque las evitan, sin tener dificultad [Bellamy, Buchanan, 1986]. El conocimiento del paciente de sus puntuaciones previas no influye en sus respuestas [Bellamy et al, 1991]. También se puede solicitar, en cada versión, que el enfermo identifique el ítem de cada dimensión en el que desea obtener mejoría [Bellamy et al, 1990], ya que no hay buena correlación entre la gravedad y la importancia subjetiva de los ítem [Bellamy et al, 1991]. La versión VA es ligeramente más sensible que la LK, aunque ambas son equiparables [Bellamy et al, 1988]. El WOMAC es un cuestionario autoadministrado que puede contestarse en menos de 5 minutos. La tasa de respuestas es del 97% y la fiabilidad test-retest es elevada [Bellamy, Buchanan, 1986]. Muestra una buena correlación con el índice funcional de Lesquene en la valoración del dolor, algo menor en la evaluación de la función física y aún más bajo en la rigidez, ya que uno mide la intensidad y otro la duración de ése síntoma [Lesquene MG, 1991]. La eficiencia relativa de ambos es similar [Bellamy et al, 1992], pero el WOMAC tiene un número de alternativas de respuesta mayor y es mas global. Este índice, cuya validez de contenido y de constructo están demostradas, ha sido usado como una medida clave de resultado de tratamiento farmacológico [Bellamy et al, 1988; Bellamy et al, 1992], con agentes físicos [Young et al, 1991] y se ha mostrado válido y fiable en la valoración de la PTR [Brazier et al, 1999; Williams et al, 1997; Bombardier et al, 1995; Kreibich et al, 1996; Hawker et al, 1995; Bellamy et al, 1988]. 138 Ha sido traducido y adaptado al castellano [Batlle-Gualda et al, 1999] siguiendo las recomendaciones internacionales para la adaptación transcultural. Actualmente se están evaluando las propiedades psicométricas de la versión española paralelamente a un ensayo clínico, por lo que todavía se carece de información al respecto. Para su verificación se ha diseñado un modelo similar al seguido en la versión original [Bellamy et al, 1988]. Los resultados preliminares -no publicados- indican que las propiedades psicométricas son buenas [Badia et al, comunicación personal]. El WOMAC es considerado como una escala de valoración por algunos autores [García, Florez, 1996; Anderson et al, 1996; Kreibich et al, 1996] mientras que otros lo incluyen dentro de las medidas de calidad de vida especificas de la enfermedad [Sharon, 1996; Brazier et al, 1999; Hawker et al, 1995; Badia et al, 1999]. La escala de la British Orthopaedic Association (BOA) fue elaborado por Airchroth [1978] y recoge información sobre el punto de vista del paciente, situación de la rodilla contralateral y del resto de articulaciones de las extremidades inferiores, síntomas, signos clínicos, función y si el factor limitante de la función corresponde o no a la rodilla. La evaluación de la marcha puede hacerse de acuerdo con la distancia o con el tiempo. La puntuación máxima es de 55 puntos. Si se convierte en porcentaje, se consideran resultados excelentes aquellos superiores al 90%, buenos entre el 80-89%, regulares entre el 70-79% y malos a las puntuaciones por debajo del 70%. Goodfellow et al [1988] no otorgan puntuaciones finales, comparando los resultados parámetro a parámetro mediante histogramas. Barret et al [1990] establecen cuatro grados de resultado basándose en este mismo sistema. Este sistema de valoración esta sujeto a diversos inconvenientes: no hay criterios para determinar la categoría a la que pertenece el paciente, los datos están sujetos a sesgos por parte del paciente (por ejemplo, el paciente puede dar un valor más alto en un intento de agradar al evaluador) y también están sujetos a sesgo de interpretación por el observador. Debido a estas limitaciones, este sistema de valoración no está incluido en la mayoría de los sistemas de evaluación Medidas de calidad de vida relacionada con la salud utilizadas en prótesis de rodilla El Medical Outcomes Study Short-Form General Health Survey fue desarrollado para su uso en el Medical Outcomes Study [Ware, Sherbourne, 1992]. Proporciona un perfil del estado de salud y es una de las escalas genéricas con mayor potencial de uso en la evaluación de los resultados clínicos. El 139 cuestionario es aplicable tanto a población general como a pacientes, en estudios descriptivos y de evaluación. El formato final era un instrumento genérico con 36 ítem que cubren 8 dimensiones del estado de salud. Su contenido se centra en el estado funcional y el bienestar emocional. El área del estado funcional está representada por las siguientes dimensiones: función física (10 ítem), rol funcional o limitaciones del rol por problemas físicos (4 ítem), rol social o función social (2 ítem), rol emocional o limitaciones del rol por problemas emocionales (3 ítem). El área del bienestar incluye las dimensiones : dolor (2 ítem), vitalidad (4 ítem), salud mental (5 ítem). Finalmente la evaluación general de la salud incluye la dimensión de la percepción de salud general (5 ítem), cambio de la salud en el tiempo (1 ítem que no forma parte de la puntuación final). Para cada dimensión los ítem se codifican, agregan y transforman en una escala que tiene un recorrido desde 0 (peor estado de salud para esa dimensión) hasta 100 (el mejor estado de salud) [Ware et al 1993]. El cuestionario puntúa como una escala adjetival: es decir cada opción de respuesta tiene una puntuación superior en una unidad a la anterior. Para la interpretación clínica de los resultados, es necesario comparar la puntuación obtenida con el subgrupo de la muestra normativa, representativo de la población a la que pertenecen los sujetos cuyas puntuaciones se pretende interpretar. El cuestionario no ha sido diseñado para generar un índice global, sino un índice por cada dimensión. Sin embargo, permite el cálculo de dos puntuaciones resumen mediante la combinación de las puntuaciones de cada dimensión, una es la suma del estado de salud física y otra el estado de salud mental. El cuestionario debe ser autoadministrado. Pero se ha mostrado aceptable la administración mediante entrevista personal. La consistencia interna no mostró diferencias entre los cuestionarios autoadministrados y los administrados mediante entrevista. El tiempo de respuesta está alrededor de los 5-15 minutos, El cuestionario ha confirmado su robustez psicométrica en diversos trabajos [McHorney et al, 1993; 1994; Ware et al, 1993; Nerenz et al, 1992; Brazier et al, 1992; Jekinson et al, 1993]. Sin embargo ha demostrado una baja consistencia interna y baja reproducibilidad en función social [Ware et al, 1993]. También ha demostrado ser un instrumento válido para el seguimiento de pacientes intervenidos de artroplastia de rodilla [Kiebzack et al, 1997]. La versión española del MOS SF-36 [Alonso et al, 1995] se mostró equivalente a la versión original. La fiabilidad de la versión española se obtuvo mediante un estudio de 9151 individuos de la población no institucionalizados de edad superior a 18 años 140 y residentes en el territorio español. La consistencia interna calculada mediante el coeficiente alfa de Cronbach ofreció valores que oscilaban entre 0,45 y 0,94 con una media de 0,78, situándose todos ellos por encima de 0,7 (valor mínimo recomendado). También se calculo el coeficiente a de Cronbach para una muestra de 321 hombres pacientes con EPOC, mostrando un alto nivel de consistencia interna (rango 0,77-0,92) para todas las dimensiones a excepción de función social que se situó en 0,55 [Alonso et al, 1998]. La evaluación de la reproducibilidad se realizó en 50 pacientes coronarios estables a los que se administró el SF-36 y dos semanas después cumplimentaron nuevamente el cuestionario, con un total de cumplimentación de 46 pacientes Los coeficientes de correlación entre ambas administraciones fluctuaron entre 0,51 para la dimensión rol funcional y 0,85, de la salud general, mientras que los coeficientes de correlación intraclase fluctuaron entre 0,58 y 0,99 [Alonso et al, 1995]. La validez también se calculó sobre la muestra de 321 pacientes de EPOC mediante muestreo por cuotas que pretendía recoger todo el rango de severidad clínica expresado por el FEV [Aaronson et al, 1992]. Los pacientes fueron evaluados clínicamente por un neumólogo. El SF-36 fue administrado junto a otros cuestionarios incluyendo una escala analógico-visual sobre la gravedad de la disnea. La asociación entre las puntuaciones del SF-36 y las medidas de función respiratoria confirmaron la validez de concepto de la adaptación: el nivel absoluto de correlación entre las puntuaciones del SF-36 con la disnea fue intermedio (rango 0,19-0,50), siendo mayor que el rango de correlaciones observado con el FEV (0-0,44), si bien estas últimas correlaciones fueron significativas para 6 de las 8 dimensiones [Alonso et al, 1998]. Se comprobó la validez de constructo del SF-36 mediante un análisis de componentes principales (CP) del que se extrajeron 2 CP que explicaron el 65,6% de la variabilidad total. La baja consistencia interna de la dimensión función social, así como la correlación moderada de sus puntuaciones en ambas administraciones coincide con resultados obtenidos en la versión original [Ware et al 1993]. Esto sugiere que los ítem de esta dimensión están poco relacionados entre sí y que, probablemente, informan de diversos aspectos independientes de la salud social. Este problema de la dimensión de Rol social se ha descrito en otros instrumentos genéricos de salud adaptados en España [Badia et al, 1994]. La versión española del SF-36 resulta conceptualmente equivalente a la original y cuya administración es fiable y comprensible. La total equivalencia al original no podrá ser totalmente establecida hasta que sean evalua141 das otras características psicométricas básicas, como son la validez y la sensibilidad a los cambios de salud. El método utilizado para la validación en nuestro país es estrictamente comparable al seguido por investigadores de otros 14 países, lo que lo adecua para la realización de estudios internacionales. Está diseñado para utilizar en adultos y ha sido probado en población general y en grupos de pacientes. Es particularmente adecuado para utilizar en situaciones clínicas que precisen un instrumento rápido. La mejor garantía de este instrumento la aporta el haber sido probado en un estudio tan amplio como el Rand Health Insurance Experiment. No obstante, como ocurre con otros instrumentos reducidos, se aconseja completar su administración con otro instrumento específico de la enfermedad objeto de estudio. La versión española tiene desde el año 1998 los valores poblacionales de referencia [Alonso et al, 1998], que fueron obtenidos a partir de las respuestas al instrumento de 9151 españoles mayores de 18 años. El estudio proporciona información sobre la distribución de las puntuaciones de las escalas del SF-36 según el género, así como también los percentiles de las puntuaciones según grupos de edad. Sirve de punto de referencia para la interpretabilidad clínica y permite comparar puntuaciones de pacientes con diferentes enfermedades , así como evaluar el impacto relativo sobre aspectos de salud. Al igual que la versión original americana, la versión española del cuestionario de salud SF-36 se distribuye de manera gratuita (junto a un manual de instrucciones de administración, de puntuación e interpretación) a través del Medical Outcomes Trust, una fundación sin ánimo de lucro cuyo objetivo es la evaluación y difusión de instrumentos de medida de los resultados clínicos. El NOTTINGHAM Health Profile fue desarrollado en Inglaterra por Hunt y colaboradores [1981]. Es un instrumento para la medida del distrés físico, psicológico y social asociado a problemas médicos, sociales y emocionales y del grado en que dicho sufrimiento afecta a la calidad de vida de los individuos. Sus autores aseguran que se ha mostrado apropiado para la evaluación de las intervenciones médicas y sociales en diseños prospectivos y retrospectivos, como medida de resultado para comparación entre grupos, como herramienta de encuesta para poblaciones seleccionadas, para el seguimiento a lo largo del tiempo de cambios en los pacientes con enfermedades crónicas, como complemento en la historia clínica, y para ensayos clínicos con grupos seleccionados de pacientes. El cuestionario es más adecuado para pacientes con cierto grado de afectación del 142 estado de salud, ya que el instrumento carece de ítem de salud positiva. Las cuestiones que incluye fueron desarrolladas a partir de 768 entrevistas en pacientes de diferentes enfermedades crónicas, lo que proporcionó las bases para la primera versión del NHP [McEwen, 1988]. Hunt [1985] desarrolló una versión diferente, más conocida y utilizada. Contiene dos partes que pueden ser utilizadas de modo independiente. La primera, que es la más comúnmente utilizada, incluye 38 cuestiones agrupadas en 6 dimensiones de salud: energía (3 ítem), dolor (8 ítem), reacciones emocionales (9 ítem), sueño (5 ítem), y aislamiento social (5 ítem). Los ítem representan diferentes estados de salud. Los individuos que contestan deben indicar para cada uno si son aplicables a su persona mediante respuesta si/no. La segunda parte consiste en 7 preguntas sobre la existencia de limitaciones a causa de la salud en 7 actividades de la vida diaria: trabajo, tareas domésticas, vida social, vida familiar, vida sexual, aficiones y tiempo libre. La puntuación de cada dimensión de la primera parte del cuestionario es muy sencilla: se asigna 0 cuando la respuesta es negativa, es decir cuando no se experimenta el problema, y 1 es el valor asignado cuando es afirmativa, y todas las respuestas son multiplicadas por un valor ponderal, quedando una puntuación que oscila entre 0 (la mejor situación posible) y 100 (la peor situación posible), pero hay que tener en cuenta que los posibles rangos de respuesta son limitados. Así, la sección referida a la energía, con tan sólo 3 cuestiones no puede alcanzar más de 8 puntos. Por tanto, desde el punto de vista de analizar e interpretar los datos del NHP, las valores en poblaciones relativamente sanas estarían muy sesgados, dado que la mayoría respondería con 0 en cada sección. De hecho, en un estudio realizado más de la mitad de los encuestados respondieron con 0 a todas las cuestiones [Kind et al, 1987]. De ahí que, algunos usuarios del NHP utilicen una distribución simple entre los valores, antes que calcular el peso de las puntuaciones que puede implicar un falso sentido de precisión. También se ha indicado obtener la puntuación media de cada categoría solo para lo que responden positivamente a las respuestas. Los autores no recomiendan la construcción de puntuaciones globales, y de hecho no han aportado ningún trabajo sobre la validez combinando las puntuaciones de diferentes secciones, por ello se obtiene 6 puntuaciones diferentes correspondientes a cada una de las dimensiones del cuestionario, que proporcionan un perfil de estado de salud percibida de los individuos. Las preguntas de la segunda parte del cuestionario pueden ser contestadas con una respuesta SI/NO y no adjudican pesos diferentes a los ítem, aunque sus autores exploraron dicha posibilidad, solo pueden analizarse de forma categórica. 143 Existe una versión española adaptada por Alonso y Antó [1990] obtenida a partir de un grupo de expertos de la lengua española, que si bien alcanza un nivel de acuerdo satisfactorio entre las traducciones, obligó también a recoger otras interpretaciones provenientes de trabajadores no entrenados y expresadas en lenguaje corriente. Una vez traducido al castellano, se realizó una traducción al catalán por 7 personas bilingües. La validez de estas versiones adaptadas fue probada en dos estudios, el primero a partir de las correlaciones obtenidas entre sus puntuaciones y otras medidas de autoinforme de salud, y el segundo en un grupo diferenciado entre no-usuarios y usuarios frecuentes de servicios de salud [Alonso et al, 1990]. Se han realizado estudios de fiabilidad test-retest, con un tiempo medio de 4 semanas, en pacientes con osteoartritis y enfermedad vascular periférica [Hunt et al 1981], obteniendo altas correlaciones. En la versión española se valoró la fiabilidad test-retest con un grupo de pacientes con enfermedad renal y con un grupo de ciegos adultos. Los coeficientes de correlación de Spearman entre ambas administraciones en ambos grupos fueron superiores a 0,6 para todas las dimensiones del NHP (0,69-0,85). La consistencia interna, en estos mismos grupos, mediante el alfa de Cronbach fue entre moderada y alta (rango del alfa de Cronbach = 0,58-0,85). Los estudios de validez se han realizado para la parte primera del cuestionario [McEwen 1988] en una variedad de poblaciones (enfermos crónicos, ancianos, embarazadas y otros). La validez de contenido se basa en el método de desarrollo, usando las proposiciones derivadas de una extensa muestra de pacientes. No obstante, no se clarifica el modo en que fueron agrupadas dentro de las categorías. Presentado como un buen instrumento para medir el estado de salud subjetivo, sus medidas se muestran sensibles para detectar las evoluciones satisfactorias de salud en pacientes que se recuperan de algún tipo de fracturas. A pesar de las pruebas de validez ofrecidas por sus autores, Kind y Carr-Hill [1987] critican el sistema de puntuación junto a la legitimidad del peso otorgado a los ítem, lo que en poblaciones generales no le permite ser ni un instrumento de “screening” ni tener propósitos evaluativos. No obstante, parece demostrar capacidad para identificar a las personas que sufren enfermedades crónicas y distinguir entre diferentes condiciones de las mismas [Hunt et al, 1985]. Las comparaciones entre enfermos con artritis reumatoide y migraña mostraron importantes diferencias [Jenkinson et al, 1990]. Aunque obviamente, este estudio se encuentra sesgado por el dolor, dado que la muestra de sujetos con migraña no aportaban más dolor del que suele sufrir la población gene144 ral. No obstante, en algunos estudios [Kind, Carr-Hill 1987] el NHP ha fallado para detectar cambios. En definitiva, sin una evaluación sistemática de su sensibilidad para cambios clínicos significativos, incluyendo las comparaciones con otros instrumentos, no es posible valorar la utilidad del NHP como medida para investigaciones clínicas. También ha sido demostrada su validez para artroplastias de rodilla [Hilding et al 1997; Martín Cleary, 1999]. En la versión española del NHP se han desarrollado estudios para establecer la validez “biológica” comparándola con la información clínica de pacientes coronarios [Permanyer-Miralda et al, 1991]. Se observo una asociación moderada, pero estadísticamente significativa entre los resultados de la prueba de esfuerzo y las puntuaciones de las dimensiones de energía (r=-0,51), dolor (r=-0,36), y movilidad física (r=-0,25). Un reciente proyecto (FIS96/0776) ha permitido analizar la fiabilidad y validez del NHP a través de una evaluación cuantitativa de la mayoría de los estudios de investigación que han incluido, a partir de 1986, al NHP como variable resultado. A partir de una base de datos que incluyó 45 estudios diferentes (n=9.419) y variables como: diseño, edad, sexo, nivel socioeconómico, localidad, problema de salud principal, comorbilidad etc. Los resultados confirmaron la adecuación de las propiedades métricas de la versión española del NHP. Fiabilidad y validez fueron evaluados en diferentes grupos poblacionales, obteniéndose resultados similares en todos ellos. Se observó un “efecto techo” moderado-alto. El cuestionario discriminó entre diferentes estados de salud autopercibida, en todos los grupos considerados. La sensibilidad al cambio fue demostrada en la versión española [Alonso et al 1990) en una serie de mujeres embarazadas. Mediante el análisis Rasch (basado en la teoría psicométrica de respuesta a los ítem), se identificó el mínimo número de ítem necesario para obtener una versión reducida del NHP versión española. Se obtuvo finalmente una versión corta con 22 ítem. Los resultados demostraron que esta versión resulta una alternativa adecuada en aquellas situaciones en las que se dispone de poco tiempo para la administración del cuestionario [Prieto et al, 1998]. Es adecuado para su uso a nivel individual o en grupos de personas mayores de 16 años. Los estudios también han demostrado su aplicabilidad a muestras de ancianos, de enfermos y a la población general. Si bien cuando se dirige a la población sana puede plantearse el problema de obtener muchos valores 0 de los ítem. Dado su amplio desarrollo y aplicación, se han establecido normas para usar en diferentes edades, sexo y grupos de 145 pacientes [McEwen, 1988], aunque a partir de un reducido número de sujetos. El NHP puede ser aplicado mediante entrevistador, autoadministrado y enviado por correo postal. El tiempo para su cumplimentación es de 8 minutos aproximadamente, y no reviste problemas de comprensión. Sin embargo, algunos encuestados tienen dificultad para responder con un rotundo si/no a las preguntas, y en definir el periodo temporal al que se refiere, dado que la frase ‘en este momento’ plantea dificultad para ser tratada literalmente, o por el contrario asignarle un periodo temporal reciente, pero más dilatado. Las ventajas que ofrece sobre el Sickness Impact Profile son su mayor brevedad y sensibilidad, lo que le confiere una considerable utilidad para la práctica e investigación clínica. Pero por otra parte, sus mayores debilidades son que no es una medida de salud como pretende ser, sino una medida de distrés producido por la enfermedad. Otro problema surgido de su método de desarrollo es el énfasis que ha concedido a la capacidad para discriminar entre grupos, a cuenta de obviar la sensibilidad a los cambios clínicos de un individuo a través del tiempo. Por último, las mayores críticas como ya han sido comentadas las ha recibido el sistema de pesos y puntuación de los ítem. El Spitzer Quality of Life Index fue diseñado por Spitzer et al [1981], que contrariamente a las medidas funcionales y de calidad de vida que existían hasta ese momento, pretendía ser simple, corto, fácil de administrar y de entender, que incluyera diferentes dimensiones relativas a la calidad de vida, que fuera cuantificable, y que proporcionara una medida válida, sensible a los cambios, y discriminativa entre grupos de pacientes. Hasta ese momento los instrumentos tenían demasiado número de ítem, necesitaban de personal entrenado, eran poco adecuadas para la práctica clínica y muchas veces no estaban adecuadamente validadas. Este Índice de calidad de vida incorpora 5 componentes: la “actividad física” que se realiza habitualmente, “autonomía” para las actividades de la vida diaria, “salud percibida”, “apoyo” que recibe de los demás, y “actitud” ante las propias limitaciones y perspectivas de futuro. Cada uno de los componentes tiene 3 alternativas de respuesta, puntuando entre 0 y 2 (siendo 0 la mejor situación posible, y 2 la peor), la suma total de los ítem toma valores entre 0 y 10. Existen 2 versiones españolas del Índice de Spitzer. La primera versión similar a la original fue realizada por Gutiérrez et al [1994], sobre una 146 muestra de pacientes cardiacos. La máxima puntuación corresponde a una situación de salud similar a la que el paciente disfrutaba antes de haber padecido el infarto y la mínima a una situación de invalidez total o inconsciencia. La segunda versión se corresponde con la versión modificada de Morris et al [1986] del índice de Spitzer [Bilbao et al, 1992; Gutiérrez et al, 1994]. La principal modificación de esta versión con respecto al instrumento original fue la inclusión de un sexto ítem de “ movilidad”. Por lo demás, se mantiene el tipo y número de opciones de respuestas. Validez.- La diferencia en las puntuaciones de calidad de vida medida con el Índice de Spitzer, entre un grupo de pacientes crónicos y sus cuidadores fue de 3,19 puntos (media de 5,93 y 9,12 sobre 10 respectivamente) [Bilbao et al 1992; Gutiérrez et al 1994; García, 1995]. Fiabilidad.- En el análisis de la consistencia interna se obtuvo un alfa de Cronbach de 0,63, valor aceptable aunque sería bueno realizar estudios posteriores dirigidos a mejorar la homogeneidad de la medida [Gutiérrez et al 1994]. Aún siendo uno de los primeros instrumentos de calidad de vida diseñados, cuya validez ha sido suficientemente probada en su contexto cultural y lengua original de [Spitzer et al, 1981; Morris et al, 1986], es evidente que en nuestro contexto requiere de más estudios que garanticen las mínimas propiedades psicométricas en este instrumento. En los estudios de artroplastia no se ha utilizado este índice como instrumento de medida de calidad de vida, posiblemente por disponer de instrumentos más válidos, fiables y sensibles al cambio en esta patología. El Knee injury and Osteoarthritis Outcome Score (KOOS) fue desarrollado para la valoración de la opinión de los pacientes a cerca de su rodilla y de los problemas asociados. Ha sido usado para la valoración de lesiones post-traumáticas, en osteocondritis, lesiones de ligamento cruzado anterior, lesiones meniscales y lesiones osteocondrales. Puede ser usado para valorar desde periodos cortos de tiempo a periodos largos. Puede valorar los cambios inducidos por el tratamiento semanalmente o periodos superiores a 2 años. Puede ser usado para valoración de grupos de pacientes y de forma individualizada. Consta de 5 subescalas que valoran: dolor, otros síntomas, función en actividades de la vida diaria, función en deportes y actividades recreativas y calidad de vida relacionada con la rodilla. Se toma como referencia la última semana cuando se realizan las preguntas. Las respuestas están estan147 darizadas con 5 opciones (tipo Likert) y las respuestas toman valores entre 0 y 4. La puntuación normalizada (100 indica ausencia de síntomas y 0 indica síntomas extremos) es calculada para cada subescala. El resultado puede ser trazado como un resultado perfil. El KOOS incluye al WOMAC Osteoarthritis Index [Bellamy 1995, Bellamy et al 1998], en su formato original (con autorización) y las puntuaciones del WOMAC son validas para sujetos mayores con osteoartritis de rodilla. El KOOS es autoadministrado, tiene un formato agradable y puede ser completado en 10 minutos. Ha sido usado en pacientes entre 14 y 78 años. La validez del constructo ha sido determinada en comparación con el MOS SF-36 [Ware et al, 1992,1993] siendo encontradas las correlaciones esperadas. Moderadas correlaciones se encontraron con la Lysholm knee scoring scale [Roos et al, 1998]. La reproducibilidad test-retest fue superior al 0,75. Las subescalas de actividades deportivas y recreativas y calidad de vida fueron más sensibles y discriminativas que las subescalas de WOMAC de dolor, rigidez y función cuando se estudiaban sujetos meniscectomizados hacía 21 años y con signos de osteoartritis confirmado radiológicamente (media de 57 años, 38-76) comparado con controles de la misma edad y sexo [Roos et al, 1999]. La sensibilidad del KOOS ha sido determinada por 2 estudios separados: mejoría significativa fue encontrada después de la reconstrucción del ligamento cruzado anterior, después de terapia física [Roos et al, 1998]; y tres meses después de meniscectomía parcial mediante artroscopia [Roos et al, 1998]. El KOOS ha sido usado en estudios de pacientes con lesión meniscal, lesión de ligamento cruzado y osteoartritis post-traumática [Roos et al, 1998; 1998; 1999] y se encuentra validado en tres versiones: inglés, danés y sueco. Instrumentos de medición de satisfacción El Patient Satisfaction with Medical Care Survey [Hulka BS et al 1970; 1971; 1975; Zyzanski SJ et al, 1974], más conocido como Hulka Questionnaire, es un cuestionario de satisfacción con la atención médica desarrollado para medir las dimensiones de competencia técnica y profesional del médico, cualidades personales y accesibilidad a los cuidados (incluido costes y comodidad) en la población general de pacientes que reciben atención médica. Puede ser autoadministrado o administrase por entrevista personal y contiene 42 ítem que miden 3 componentes: competencia profesional, habilidades personales y costes y comodidad. El Hulka 148 Questionnaire utiliza escalas evaluativas tipo likert desde -2 (completo desacuerdo, extremadamente desfavorable) a +2 (completamente de acuerdo; extremadamente favorable) para los ítem positivos y viceversa para los negativos. La puntuación total es la suma de las puntuaciones de los ítem dividida por el número de ítem completados y, por tanto, se mueve también en un rango desde –2 (insatisfacción) a +2 (satisfacción), interpretable como: -2 (completamente insatisfecho), -1 (insatisfecho), 0 (dudoso), 1 (satisfecho), 2 (completamente satisfecho). Los estudios de fiabilidad y validez muestran una elevada consistencia interna: 0,90 para la puntuación conjunta y algo menores para las dimensiones: 0,75 para la competencia profesional; 0,86 para las cualidades personales y 0,68 para la accesibilidad). Tiene interés señalar que los autores desarrollaron el Scale Product Scoring Method en el que un ítem expresando sentimientos positivos recibe igual peso que un ítem expresando sentimientos negativos y requiere que las preguntas sean clasificadas como positivas o negativas. El coeficiente obtenido mediante la técnica del Splithalf de las puntuaciones del Scale Product Scoring method fue siempre mayor que con las puntuaciones clásicas del Thurstonte Scale method. El cuestionario no evalúa áreas como la continuidad de la atención, las esperas o la calidad de la atención recibida, con posibles problemas de validez de contenido. Respecto a la validez de constructo, el Hulka Questionnaire mostró una alta correlación con otros 2 cuestionarios de medida de satisfacción [Counte MA, 1979] y las puntuaciones correlacionaron también con medidas de utilización y de calidad de los servicios. El cuestionario fue modificado por sus autores [Zyzanski SJ et al, 1974] y, aunque actualmente es poco utilizado (algunos ítem podrían considerarse desfasados), es uno de los primeros cuestionarios de medida de la satisfacción utilizados. Desde otro punto de vista, cabe señalar que las preguntas están escasamente adaptadas a los sistemas de cobertura universal. Pese a este último problema, el Ministerio de Sanidad y Consumo [1992] desarrolló una adaptación del cuestionario de Hulka -con variantes en el sistema de puntuación, y diseño orientado a conocer y cuantificar el grado de satisfacción del usuario de atención primaria que mostró un buen comportamiento clinimétrico y ha sido utilizado ocasionalmente en España, así como otras variantes o desarrollos a partir de las dimensiones de esta encuesta [Delgado A et al, 1993; Bolivar I, 1999]. El Patient Satisfaction Questionnaire (PSQ) fue desarrollado para evaluar la satisfacción general con la atención recibida, fundamentalmente con 149 la médica [Ware JE et al, 1975], utilizando técnicas de análisis factorial. Autoadministrado o por entrevista personal, incluye 43 ítem que evalúan componentes de costes, satisfacción con la atención y los proveedores, comprensividad, accesibilidad, disponibilidad, programación y puntualidad, comodidad, actitud de los médicos, comunicación y competencias y habilidades. El cuestionario emplea escalas ordinales con 5 categorías similares a una escala likert (desde 1, completamente de acuerdo, a 5 completamente desacuerdo) y la puntuación global puede oscilar entre 43 y 215. Los resultados de los estudios de fiabilidad intra e inter observador superaban los criterios pre-establecidos, la consistencia interna fue buena (?: > 0,70 para todas las subescalas), la validez de contenido fue valorada mediante análisis respecto a un marco conceptual predefinido, y la validez de constructo y de criterio mostró buenos resultados en diversos exámenes [Ware JE et al, 1975; Ware JE, 1978; Ware JE et al 1983]. Roberts y Tugwell [1987] compararon el cuestionario de Hulka y el PSQ que mostraron una elevada fiabilidad (r = .64, r = .59) y evidencia de validez de criterio (r = .75-.81), así como resultados similares en la prevalencia de insatisfacción (0-7%). Una adaptación francesa también mostró excelentes propiedades clinimétricas [Etter JF, Perneger TV, 1997] El Primary Care Assessment Survey (PCAS) tiene como objeto evaluar la calidad del plan de cuidados y del médico de atención primaria en la población general de pacientes asegurados. Fue desarrollado por Safran et al [1988], se administra mediante entrevista personal o autoadministrado y consta de 45 ítem que valoran componentes de accesibilidad, continuidad, comprensividad, integración de la atención, interacción con los clínicos, relaciones interpersonales y confianza. Contiene 11 escalas de diverso tipo (ordinales, nominales y categóricas, así como de frecuencia y puntuación de opinión) que se agrupan en 7 dimensiones y puntúan de 0 a 100. Los estudios clinimétricos muestran una buena consistencia interna >0,70 para todas las escalas), y una aceptable validez de constructo (validación ítem-convergente entre 16 poblaciones >0,30 para la correlación ítem-escala. La validez ítem-discriminante alcanzó el 100% para 6 escalas y el 98,9% para la séptima). El SERVQUAL tiene como objeto evaluar la calidad de los servicios en cualquier contexto, no solo sanitarios, y sus autores y dimensiones han sido previamente comentados. Se puede administrar mediante entrevista aunque usualmente es autoadministrado y consta de 22 ítem que se preguntan en forma doble: para medir las expectativas y para medir la calidad percibi150 da. Las preguntas se responden en una escala tipo likert de 1 a 7. Los estudios de valoración de sus propiedades muestran una buena consistencia interna: de 0.72 a 0.86) pero las puntuaciones de diferencia entre expectativas y percepciones ha sido muy discutida [Peter et al, 1993], especialmente por la elevada correlación entre los dos componentes (en la práctica suelen ser casi idénticos). Este aspecto parece provocar inconsistencias en la estructura factorial del instrumento que, según estudios, parece ser unidimensional, o tener una, dos, tres, cuatro, cinco, seis o siete factores [Cronin, Taylor, 1992; 1994; Gagliano, Hathcote, 1994; Lam, 1995; 1997; Mels et al, 1997; Pitt et al, 1995; Triplett et al, 1994; Vandamme, Leunis, 1993]; en un estudio reciente, SERVQUAL mostró hasta trece dimensiones [Llosa et al, 1998] y los propios autores han señalado que no existe consenso a este respecto [Parasuraman et al, 1994]. La correlación entre expectativas y percepciones ha llevado también a algunos autores a sugerir que la medición de las expectativas podría ser innecesaria [Babakus, Boller, 1992; Cronin, Taylor, 1992]. De otro lado, también se ha cuestionado la restricción impuesta en el modelo de que, en la práctica, las expectativas siempre serán mayores que las percepciones [Brown et al, 1993]. McAlexander et al [1994], por su parte, han señalado que dadas las altas expectativas constatadas de forma uniforme en la atención sanitaria, la utilidad diagnóstica en este entorno es mínima. Este y otros trabajos sugieren que solo la escala de calidad percibida tiene propiedades útiles y que, pese a la intención original de que el SERVQUAL fuera útil en cualquier contexto, es mas que probable que requiera adaptaciones para su uso en el sector sanitario [Brown e al, 1993; Cronin, Taylor, 1992; Lam, 1995; McAlexander et al, 1994; Vandamme, Leunis, 1993; VanDyke et al, 1997]. El Visit Specific Questionnaire (VSQ-9), a diferencia de las encuestas para evaluar la satisfacción con la asistencia sanitaria o con los proveedores, fue diseñado para la evaluación en la prestación de una visita médica concreta. [Ware JE, Hays RD, 1988] Autoadministrado o por entrevista personal, consta de sólo 9 ítem que valoran componentes de calidad técnica, atención interpersonal y tiempo de la visita. Utiliza escalas tipo likert (1 a 5, pobre a excelente) y la puntuación total se obtiene mediante la retransformación a una escala de 0 a 100. Ha mostrado una elevada consistencia interna: 0,87 a 0,93) y la validez de contenido fue evaluada basándose en estudios previos como el Medical Interview Satisfaction Scale y la Patient Satisfaction Scale. Respecto a la validez de constructo, 62 de las 64 correlaciones analizadas con diversos resultados y comportamientos iban en la 151 dirección hipotetizada; y respecto a la validez de criterio, las puntuaciones correlacionan con diversos resultados y con la predisposición a recomendar un médico o de volver al mismo médico [Rubin HR et al, 1993]. Aunque sólo se ha hallado un trabajo que utilice el VSQ [Chung KC et al, 1999], el cuestionario destaca por el trabajo exploratorio y de diseño realizado [Ware JE, Hays RD, 1988] que la configura como uno de los más relevantes en esta cuestión, a pesar del mayor énfasis en la metodología que en la aplicación y la omisión de la conceptualización de la medida de la satisfacción desarrollada. El Patient judgments of Hospital Quality (PJHQ) fue desarrollado para evaluar la satisfacción de los pacientes con la atención hospitalaria, y compararlas en el tiempo [Haya R et al, 1990; Nelson EC et al, 1990]. Puede ser autoadministrado o emplearse mediante entrevista personal y consta de 106 ítem que valoran componentes del Proceso de admisión, aspectos de la atención hospitalaria, cambios en salud, satisfacción e intención de volver. Utiliza escalas de diverso tipo (ordinales, nominales y categóricas, puntuaciones), así como preguntas abiertas y cerradas y la puntuación total se obtiene por la suma global de puntuaciones. Se trata de uno de los cuestionarios con propiedades clinimétricas mejor estudiadas y presenta una elevada consistencia interna: 0,87 a 0,95); buena validez de apariencia a través de su desarrollo mediante paneles de expertos; validez de contenido valorada mediante la revisión de literatura y paneles de expertos para confeccionar una matriz de los elementos relevantes [Rubin HR, 1990; Meterko M, Rubin HR, 1990; Haya R et al, 1990]. Respecto a la validez de constructo mostró excelentes correlaciones interítem (0,39 a 0,75) y buenos resultados con métodos multivariantes. El Consumer Assessment of Health Plans Questionnaire (CAHPS) fue diseñado para ayudar a los “consumidores” a identificar el mejor plan de atención de salud dirigido a asegurados de seguros privados, Medicaid, pacientes Medicare en HMOs, niños de seguros privados y Medicaid por la Agency for Health Care Policy and Research [AHCPR, 1996; 1997]. Es un cuestionario autoadministrado (por correo) que consta de 57 ítem y evalúa componentes relacionados con el médico y enfermera, especialistas, ayuda telefónica durante la semana, atención sanitaria en los últimos 6 meses y plan de cuidados. Las preguntas utilizan escalas dicotómicas, tipo likert (1 a 5, nunca-siempre), escala de valoración de opinión (0 a 10) y escalas categóricas. 152 Aunque existe un cierto volumen de información sobre este cuestionario en internet (www.cmhcsys.com/articles/manage34.htm; www.ahcpr.gov/qual/cahpques.htm; www.rand.org/organization/health/highlights.html), no se han hallado referencias de sus propiedades clinimétricas. Se trata de un cuestionario muy utilizado en Estados Unidos, por estar incluido en el Proyecto de la AHCPR “New Initiative to Assist Consumers in Selecting High-Quality Health Plans” [CAHPS, 1996; 1997] y tener relación con la regulación de incentivos en el programa Medicare de atención a los mayores de 65 años (http://www.hcfa.gov/medicare/physincp/survey.htm). El Picker Adult Medical Surgical Inpatient es un cuestionario diseñado para medir la satisfacción de los pacientes adultos hospitalizados en servicios médicos y quirúrgicos desarrollado por la Fundación Picker en 1996 (www.picker.org/patient/research.html). Preparado para ser autoadministrado (correo), consta de 60 ítem que exploran componentes de accesibilidad, respeto por los valores de los pacientes, continuidad, comprensividad, integración de la atención, interacción con los clínicos, relaciones interpersonales y confianza. El cuestionario utiliza escalas de diverso tipo (nominales, likert, categóricas) de 0 a 100 agrupadas en 7 dimensiones. No se han hallado referencias sobre su fiabilidad y validez, aunque –en términos de validez de apariencia- el cuestionario fue desarrollado mediante 31 grupos focales, 300 adultos y 21 gestores mas estudios cualitativos [Cleary PD et al, 1993] El cuestionario no solo valora la satisfacción, sino si que se pregunta al paciente si se han realizado o no determinados procesos que se consideran importantes para mejorar ésta. El Picker Inpatient Survey ha sido utilizado por la American Hospital Association para valorar la calidad de la atención los hospitales universitarios estadounidenses [Gooding TD et al, 1999; Morehouse M, 1997], mostrando una elevada satisfacción junto a importantes preocupaciones por el funcionamiento de los servicios (www.amhpi.com/eyeonpatients/default.html) y es uno de los referentes actuales en la valoración de la calidad de la atención desde la perspectiva de los pacientes [Bechel DL et al, 2000] El cuestionario National Committee for Quality Assurance Member Satisfaction Survey (NCQA-CSS) fue diseñado por el National Committee for Quality Assurance (NCQA, 1997) para la evaluación de los planes de cuidados (seguros médico) y la atención médica recibida en los últimos 12 meses (que valora aspectos de satisfacción en relación con la afiliación, atención sanitaria, cobertura y aspectos específicos de los proveedores de servicios) en la población general de pacientes asegurados en planes de cuidados. Se trata de un cuestionario autoadministrado (usualmente por correo), que cons153 ta de 37 ítem y que incluye componentes de esperas, continuidad, compasión, administración, gestión de la atención, satisfacción, rendimiento, salud y actividades saludables. El NCQA-CSS. Incluye preguntas en escalas dicotómicas, escalas evaluativas tipo likert (de 4, 5 y 7 puntos), escalas categóricas, puntuación de opiniones y comentarios cerrados. Las puntuaciones se suman para grupos de ítem y se presentan como porcentajes (0 a 100) con su IC95%. Su uso fundamental es la puntuación comparativa de cada Plan de cuidados respecto a los otros (benchmarking) y no importa tanto la puntuación como la posición relativa de cada Plan [NCQA, 1998]. El NCQA señala en la documentación del cuestionario (los estudios no han sido publicados) que NCQA-CSS tiene una elevada fiabilidad intra y entre encuestados, y una consistencia interna aceptable en pacientes de planes de seguros pero muy baja en pacientes de Medicare, de Medicaid y en personas de bajo nivel de estudios. Respecto a la validez de contenido hay que señalar que no evalúa la relación entre médico y pacientes. Respecto a la validez de constructo se ha señalado su alta correlación con otros cuestionarios. Dado que se utiliza en los informes del sistema de indicadores HEDIS para planes de seguros en Estados Unidos, es una encuesta de gran utilización de la que puede hallarse amplia información en internet (http://www.ghc.org/quality/ncqa.html; http://www.ncqa.org; http://www.facct.org) aunque no los estudios de validación de los que solo se realizan algunos comentarios. Agradecimientos El Health Institute, de los New England Medical Hospitals –por mediación del Dr. Jordi Alonso (Institut Municipal d’Investigacions Mèdiques, Barcelona)- autorizó gratuitamente el uso de la versión española del MOSSF36 en este estudio. El proyecto de investigación contó con una Ayuda de investigación de la Fundación Mapfre Medicina, obtenida concurrencialmente en la convocatoria de ayudas de 1999. 154