Download Análisis de datos 2010 - Escuela de Medicina
Document related concepts
Transcript
C. D. Hortencia Castillo C. E.S.P., M.E.E. Análisis de datos Universidad Anáhuac Mayab / Escuela de Medicina “Uno de los retos que enfrentan los profesionales de la salud es contar con las herramientas analíticas que permitan el uso adecuado de la información disponible para la toma de decisiones en este sector” PAHO Fuente: http://www.paho.org/Spanish/DD/AIS/biostadisticas.htm 2 Objetivos: 3 Describir la importancia de la bioestadística en medicina. Describir los tipos de datos Describir las principales medidas epidemiológicas Calcular las medidas de tendencia central Hoy día es casi imposible… …que cualquier medio de difusión, periódico, radio, televisión, etc., no nos aborde diariamente con cualquier tipo de información estadística sobre: – – – – – – 4 accidentes de tráfico, índices de crecimiento de población, turismo, tendencias políticas, etc. En el campo de la investigación 5 Ciencias Sociales: Medicina, Biología, Psicología, ... La Estadística se convierte en la herramienta que permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio. Los métodos estadísticos 6 Tienen especial aplicación en el campo de las ciencias biológicas y sociales utilizadas por la medicina. En el estudio de fenómenos que tienen gran variabilidad y que están determinados por factores múltiples. Fuente: San Martín H. Salud y enfermedad, La Prensa Médica El curso de una enfermedad o las características de un hombre sano son hechos en extremo variables sin embargo es posible establecer estadísticamente criterios pronósticos aplicables a grupos de enfermos o determinar los límites de variaciones de característica del hombre normal para reconocer los casos patológicos. 7 Fuente: San Martín H. Salud y enfermedad, La Prensa Médica Definiciones 8 La estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, y analizar los datos, así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones. Bioestadística: Aplicación de la estadística a los procesos biológicos, incluyendo los de salud. Clasificación 9 Estadística descriptiva Describir y resumir y presentar datos. Estadística inferencial Muestreo de datos para sacar conclusiones sobre poblaciones más grandes. Estadística descriptiva: Describe, analiza y representa un grupo de datos utilizando métodos numéricos y gráficos que resumen y presentan la información contenida en ellos. Puede ser: – – – 10 Aritmética Tabular Gráfica Estadística inferencial Apoyándose en el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones, decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos. Puede ser: – – 11 Estimación Prueba de hipótesis Población y muestra 12 Fuente: http://www.ucm.es/info/genetica/Estadistica/estadistica_basica%202.htm Población Una población en estadística es el conjunto de todas las observaciones en las que estamos interesados. Las poblaciones pueden ser: – – 13 finitas infinitas Muestra 14 Una muestra aleatoria de tamaño n es un conjunto de n individuos tomado de tal manera que cada subconjunto de tamaño n de la población tenga la misma probabilidad de ser elegido como muestra. Tipos de datos Dependen de la clase de observación hecha y la forma de medirla La escala de medición* de una característica determina los métodos estadísticos que se usarán para analizar los datos. *Escala de medición: grado de precisión de la medida de una característica Escalas de medición mas frecuentes Nominales Ordinales Numéricas Nominales (categóricas) Los valores de los datos se ajustan en categorías Dicotómicas. Ejemplos: – si o no, presencia o ausencia. Cualitativas o categóricas. Ejemplo: – anemias microcítica, macrocítica y normocítica. Se describen en: proporciones, porcentajes, tablas de contingencia, gráficas de barras. Estado civil ia do s di vo rc vi ud os ca sa do s os 8 7 6 5 4 3 2 1 0 so lte r Frecuencias Diagrama de barras para una variable cualitativa 10 8 6 4 2 0 Población A di vo r ci ad o s s ud o vi ca sa do s s Población B so lt e ro Frecuencias Diagrama de barras para comparar una variable cualitativa en dos poblaciones Estado civil Ordinales Existe un orden inherente en las categorías. Las observaciones se clasifican, algunas “tienen más” o “son más grandes” que otras. Ejemplos: – – – El CACU* se clasifica en etapas de 0 a la IV. Pacientes con artritis de acuerdo a lo grave del deterioro clase 1 a la 4. Apgar (madurez del recién nacido): 1 al 10 Característica importante Aunque existe un orden entre las categorías, la diferencia entre dos grupos adyacentes no es la misma en escala. Ejemplo: En la calificación Apgar (1 al 10) los valores menores indican depresión de funciones cardiorespiratorias y neurológicas, sin embargo es probable que la diferencia entre una calificación de 8 y 10, no sea de la misma magnitud que entre 0 y 2. Forma de descripción de las ordinales Al igual que las nominales se emplean: – – – – Proporciones Porcentajes Las mismas clases de cuadros y gráficas En ocasiones el conjunto de datos completos se resume por el valor de la mediana Escalas numéricas Se designan como observaciones cuantitativas porque miden la cantidad de algo. Otra clasificación Escala continua. Tiene valores en continuo. Pueden tener valor decimal Ejemplo: edad, peso, estatura, tiempo de supervivencia, la mayoría de los valores de laboratorio (glucosa, sodio, potasio, ácido úrico, etc). Discreta. Solo puede medirse en números enteros. Ejemplo: número de fracturas, número de embarazos, operaciones previas, ataques isquémicos. Forma de presentarlas Cuadros o gráficas – – Tablas de frecuencia Gráficas De tronco y hoja Histogramas De caja y línea Polígonos de frecuencia Medidas de resumen: media y desviación estándar Medidas representativas de un conjunto de datos estadísticos 26 Presentación de datos: Aritmética: Cálculos numéricos de medidas De tendencia central: – – – 27 Media Mediana Moda De variabilidad o dispersión: – – – Rango Desviación estándar Varianza Fuente: Portilla E. Estadística, primer curso, Mc.Graw-Hill Medidas de tendencia central 28 Media Mediana Moda Media (media aritmética) Si x1, x2,.., xn representan una muestra de tamaño n de la población, la media aritmética se calcula: Sumando todas las observaciones y dividiendo entre el número de observaciones Xi= valor de cada observación n= número de observaciones 29 Ejercicio 1 Encuentra el promedio de los siguientes datos: 7, 4, 5, 5, 8, 3, 2, 7, 4 X= a) b) 30 Escribe con palabras lo que hiciste para encontrar el resultado. Resultado correcto 5 1. 2. 31 Se suman todos los datos Se divide el total entre el número de datos Propiedades 32 La media aritmética es la medida tendencia central que posee menor varianza. Engloba en ella toda la información de la muestra; esto, con ser una ventaja, supone una cierta desventaja pues los valores muy extremos, en muestras pequeñas la afectan. La mediana 33 Es un medida de posición Es el valor que es mayor o igual que el 50% de las observaciones de la muestra y menor o igual que el otro 50%. Para calcularla se ordenan las observaciones de menor a mayor. Si n es impar, la mediana es la observación central. Si n es par 34 La mediana se define como la media de las dos observaciones centrales. Ejercicio 2 Los siguientes datos representan los pesos de 12 niños. Encuentra cuál es el peso mediano de estos niños : 12, 11, 15, 8, 15, 21, 18, 25, 16, 21, 22, 27 b) Escribe con palabras lo que hiciste para calcular el resultado. a) 35 Resultado correcto 17 1. 2. 3. 36 Se ordenan los datos Se busca cuál es el dato central Como el número de datos es par se calcula el promedio de los dos datos centrales Propiedades 37 Es única. Es más fácil de calcular que la media aritmética y apenas se afecta por observaciones extremas. Sin embargo tiene mayor varianza que la media y sólo toma en cuenta la información de los valores centrales de la muestra. La moda 38 Es el valor más frecuente. Su cálculo es el más simple de los tres correspondientes a estadísticos de centralidad Es el estadístico de mayor varianza La moda (continuación) La moda puede no existir y cuando existe no es necesariamente única. – 39 Ejemplo, en los valores: 10, 21, 33, 53 y 54 no hay moda porque todos los valores son diferentes No tiene sentido en muestras pequeñas en las que la aparición de coincidencias en los valores es con gran frecuencia más producto del azar que de otra cosa. Ejercicio 3 Un laboratorio tiene 10 empleados, cuyas edades son: 20, 21, 20, 20, 34, 22, 24, 27, 27, 27 a) ¿Cuál es la edad modal de estos individuos? b) Explica con tus propias palabras lo que hiciste para calcularla 40 Resultado Hay 2 modas : 27 (se repite 3 veces) y 20 (que se repite también 3 veces). 1. 2. 41 Se observa en los datos cuál o cuáles se repiten más. Si ninguno se repite no hay moda y si son varios los que se repiten hay varias modas. Ejercicio 4 Los siguientes datos representan edades de personas con cardiopatía en una muestra : 6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26 – – – 42 ¿Cuál es la edad promedio de estas personas?___________________ ¿Cuál es la mediana?_________________ ¿Cuál es la moda?________________ Ejercicio 5 Un grupo de pacientes acudió a su valoración preoperatoria, sus resultados de hemoglobina fueron los siguientes: 17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13, 15. – – – 43 La media del valor de hemoglobina en estos pacientes fue de______________ La mediana fue de_______________ Y ¿Cuál es la moda?__________________ Ejercicios 4 y 5 Los siguientes datos representan edades de personas con cardiopatía en una muestra : 6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26 ¿Cuál es la edad promedio de estas personas?_____20.55____ – ¿Cuál es la mediana?___23______________ – ¿Cuál es la moda?_____23___________ Un grupo de pacientes acudió a su valoración preoperatoria, sus resultados de hemoglobina fueron los siguientes: – 17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13, 15. – – – 44 La media del valor de hemoglobina en estos pacientes fue de___15.6____ La mediana fue de___15____________ Y ¿Cuál es la moda?_14.9__________ Medidas epidemiológicas de frecuencia Tasas (por 1 000, por 10 000, por 100 000 habitantes) Prevalencia Incidencia Mortalidad Morbilidad Tasas En epidemiología una tasa es una cantidad o grado de enfermedad medida por unidad de población, siendo importante también el tiempo durante el cual se estudian los casos. Miden la probabilidad de que en una población ocurra algún hecho particular, caso o muerte debido a alguna enfermedad. Incidencia: Número de casos nuevos de una enfermedad en una población definida durante un intervalo de tiempo casos nuevos de una enfermedad población Prevalencia Número de personas que tienen una enfermedad en un momento dado número de pacientes enfermos población Tasa de Mortalidad: Es una medida de la ocurrencia de muertes dentro de una población definida número de fallecimientos población Tasa de letalidad Es el número de muertes debidas a tal enfermedad dividido entre tantos pacientes con tal enfermedad. Todas las medidas de frecuencia de la enfermedad contienen necesariamente alguna indicación de tiempo Prevalencia: Tiempo instantáneo, situación en ese momento específico Incidencia: Se define el intervalo en que los pacientes fueron monitorizados Ejercicio: Completa las celdas que faltan TASA TIPO DE MEDIDA Mortalidad Incidencia Morbilidad Incidencia NUMERADOR DENOMINADOR Total de la población (durante un período de tiempo) Total de la población (durante un período de tiempo) Total de casos nuevos + viejos Total de la población (En un momento dado) Casos fatales Prevalencia instantánea Total de casos que (letales) mueren por la enfermedad Autopsias Prevalencia Total de defunciones Malformaciones congénitas Incidencia acumulada Población de recién nacidos vivos Solución del ejercicio TASA TIPO DE MEDIDA NUMERADOR DENOMINADOR Mortalidad Incidencia Número de muertes Morbilidad Incidencia Total de casos nuevos Total de la población (durante un período de tiempo) Total de la población (durante un período de tiempo) Prevalencia Total de casos nuevos + viejos Total de la población (En un momento dado) Casos fatales Prevalencia instantánea Total de casos que (letales) mueren por la enfermedad Total de población que tiene la enfermedad Autopsias Prevalencia Total de autopsias Total de defunciones Malformaciones congénitas Incidencia acumulada Total de recién nacidos Población de recién con malformaciones nacidos vivos congénitas 55 ? 56 57