Download Análisis de datos 2010 - Escuela de Medicina

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Media (matemáticas) wikipedia , lookup

Nivel de medida wikipedia , lookup

Desviación típica wikipedia , lookup

Transcript
C. D. Hortencia Castillo C.
E.S.P., M.E.E.
Análisis de datos
Universidad Anáhuac Mayab / Escuela de Medicina

“Uno de los retos que enfrentan los profesionales de
la salud es contar con las herramientas analíticas
que permitan el uso adecuado de la información
disponible para la toma de decisiones en este
sector”
PAHO
Fuente: http://www.paho.org/Spanish/DD/AIS/biostadisticas.htm
2
Objetivos:




3
Describir la importancia de la bioestadística
en medicina.
Describir los tipos de datos
Describir las principales medidas
epidemiológicas
Calcular las medidas de tendencia central
Hoy día es casi imposible…
…que cualquier medio de difusión, periódico, radio,
televisión, etc., no nos aborde diariamente con
cualquier tipo de información estadística sobre:
–
–
–
–
–
–
4
accidentes de tráfico,
índices de crecimiento
de población,
turismo,
tendencias políticas,
etc.
En el campo de la investigación


5
Ciencias Sociales: Medicina, Biología,
Psicología, ...
La Estadística se convierte en la herramienta
que permite dar luz y obtener resultados, y
por tanto beneficios, en cualquier tipo de
estudio.
Los métodos estadísticos


6
Tienen especial aplicación en el campo de
las ciencias biológicas y sociales utilizadas
por la medicina.
En el estudio de fenómenos que tienen gran
variabilidad y que están determinados por
factores múltiples.
Fuente: San Martín H. Salud y
enfermedad, La Prensa Médica
El curso de una enfermedad o las
características de un hombre sano son
hechos en extremo variables sin embargo es
posible establecer estadísticamente criterios
pronósticos aplicables a grupos de enfermos
o determinar los límites de variaciones de
característica del hombre normal para
reconocer los casos patológicos.
7
Fuente: San Martín H. Salud y
enfermedad, La Prensa Médica
Definiciones
8

La estadística se ocupa de los métodos y
procedimientos para recoger, clasificar, resumir, y
analizar los datos, así como de realizar inferencias a
partir de ellos, con la finalidad de ayudar a la toma de
decisiones y en su caso formular predicciones.

Bioestadística: Aplicación de la estadística a los
procesos biológicos, incluyendo los de salud.
Clasificación
9

Estadística descriptiva

Describir y resumir
y presentar datos.

Estadística inferencial

Muestreo de datos
para sacar
conclusiones sobre
poblaciones más
grandes.
Estadística descriptiva:
Describe, analiza y representa un
grupo de datos utilizando métodos
numéricos y gráficos que resumen
y presentan la información
contenida en ellos. Puede ser:
–
–
–
10
Aritmética
Tabular
Gráfica
Estadística inferencial
Apoyándose en el cálculo de probabilidades y
a partir de datos muestrales, efectúa
estimaciones, decisiones, predicciones u
otras generalizaciones sobre un conjunto
mayor de datos. Puede ser:
–
–
11
Estimación
Prueba de hipótesis
Población y muestra
12
Fuente: http://www.ucm.es/info/genetica/Estadistica/estadistica_basica%202.htm
Población


Una población en estadística es el conjunto
de todas las observaciones en las que
estamos interesados.
Las poblaciones pueden ser:
–
–
13
finitas
infinitas
Muestra

14
Una muestra aleatoria de
tamaño n es un conjunto de
n individuos tomado de tal
manera que cada
subconjunto de tamaño n de
la población tenga la misma
probabilidad de ser elegido
como muestra.
Tipos de datos


Dependen de la clase de observación hecha
y la forma de medirla
La escala de medición* de una
característica determina los métodos
estadísticos que se usarán para analizar los
datos.
*Escala de medición: grado de precisión de la medida de una
característica
Escalas de medición mas
frecuentes



Nominales
Ordinales
Numéricas
Nominales (categóricas)


Los valores de los datos se ajustan en
categorías
Dicotómicas. Ejemplos:
–

si o no, presencia o ausencia.
Cualitativas o categóricas. Ejemplo:
–
anemias microcítica, macrocítica y normocítica.
Se describen en: proporciones, porcentajes,
tablas de contingencia, gráficas de barras.
Estado civil
ia
do
s
di
vo
rc
vi
ud
os
ca
sa
do
s
os
8
7
6
5
4
3
2
1
0
so
lte
r
Frecuencias
Diagrama de barras para una variable
cualitativa
10
8
6
4
2
0
Población A
di
vo
r
ci
ad
o
s
s
ud
o
vi
ca
sa
do
s
s
Población B
so
lt e
ro
Frecuencias
Diagrama de barras para comparar
una variable cualitativa en dos
poblaciones
Estado civil
Ordinales



Existe un orden inherente en las categorías.
Las observaciones se clasifican, algunas
“tienen más” o “son más grandes” que otras.
Ejemplos:
–
–
–
El CACU* se clasifica en etapas de 0 a la IV.
Pacientes con artritis de acuerdo a lo grave del
deterioro clase 1 a la 4.
Apgar (madurez del recién nacido): 1 al 10
Característica importante


Aunque existe un orden entre las categorías,
la diferencia entre dos grupos adyacentes no
es la misma en escala.
Ejemplo: En la calificación Apgar (1 al 10) los
valores menores indican depresión de
funciones cardiorespiratorias y neurológicas,
sin embargo es probable que la diferencia
entre una calificación de 8 y 10, no sea de la
misma magnitud que entre 0 y 2.
Forma de descripción de las
ordinales

Al igual que las nominales se emplean:
–
–
–
–
Proporciones
Porcentajes
Las mismas clases de cuadros y gráficas
En ocasiones el conjunto de datos completos se
resume por el valor de la mediana
Escalas numéricas

Se designan como observaciones
cuantitativas porque miden la cantidad de
algo.
Otra clasificación


Escala continua. Tiene valores en continuo.
Pueden tener valor decimal Ejemplo: edad,
peso, estatura, tiempo de supervivencia, la
mayoría de los valores de laboratorio
(glucosa, sodio, potasio, ácido úrico, etc).
Discreta. Solo puede medirse en números
enteros. Ejemplo: número de fracturas,
número de embarazos, operaciones previas,
ataques isquémicos.
Forma de presentarlas

Cuadros o gráficas
–
–
Tablas de frecuencia
Gráficas





De tronco y hoja
Histogramas
De caja y línea
Polígonos de frecuencia
Medidas de resumen: media y desviación
estándar
Medidas representativas de un
conjunto de datos estadísticos
26
Presentación de datos:
Aritmética: Cálculos numéricos de medidas
De tendencia
central:
–
–
–
27
Media
Mediana
Moda
De variabilidad o
dispersión:
–
–
–
Rango
Desviación
estándar
Varianza
Fuente: Portilla E. Estadística,
primer curso, Mc.Graw-Hill
Medidas de tendencia central



28
Media
Mediana
Moda
Media (media aritmética)


Si x1, x2,.., xn representan una muestra de
tamaño n de la población, la media
aritmética se calcula:
Sumando todas las observaciones y
dividiendo entre el número de observaciones
Xi= valor de cada observación
n= número de observaciones
29
Ejercicio 1
Encuentra el promedio de los siguientes
datos:
7, 4, 5, 5, 8, 3, 2, 7, 4
X=
a)
b)
30
Escribe con palabras lo que hiciste para
encontrar el resultado.
Resultado correcto
5
1.
2.
31
Se suman todos los datos
Se divide el total entre el número de
datos
Propiedades


32
La media aritmética es la medida tendencia
central que posee menor varianza.
Engloba en ella toda la información de la
muestra; esto, con ser una ventaja, supone
una cierta desventaja pues los valores muy
extremos, en muestras pequeñas la afectan.
La mediana




33
Es un medida de posición
Es el valor que es mayor o igual que el 50%
de las observaciones de la muestra y menor
o igual que el otro 50%.
Para calcularla se ordenan las
observaciones de menor a mayor.
Si n es impar, la mediana es la observación
central.
Si n es par

34
La mediana se define como la media de las
dos observaciones centrales.
Ejercicio 2
Los siguientes datos representan los pesos
de 12 niños. Encuentra cuál es el peso
mediano de estos niños :
12, 11, 15, 8, 15, 21, 18, 25, 16, 21, 22, 27
b) Escribe con palabras lo que hiciste para
calcular el resultado.
a)
35
Resultado correcto
17
1.
2.
3.
36
Se ordenan los datos
Se busca cuál es el dato central
Como el número de datos es par se
calcula el promedio de los dos datos
centrales
Propiedades



37
Es única.
Es más fácil de calcular que la media
aritmética y apenas se afecta por
observaciones extremas.
Sin embargo tiene mayor varianza que la
media y sólo toma en cuenta la información
de los valores centrales de la muestra.
La moda



38
Es el valor más frecuente.
Su cálculo es el más simple de los tres
correspondientes a estadísticos de
centralidad
Es el estadístico de mayor varianza
La moda (continuación)

La moda puede no existir y cuando existe no
es necesariamente única.
–

39
Ejemplo, en los valores: 10, 21, 33, 53 y 54 no
hay moda porque todos los valores son diferentes
No tiene sentido en muestras pequeñas en
las que la aparición de coincidencias en los
valores es con gran frecuencia más producto
del azar que de otra cosa.
Ejercicio 3
Un laboratorio tiene 10 empleados, cuyas
edades son:
20, 21, 20, 20, 34, 22, 24, 27, 27, 27
a) ¿Cuál es la edad modal de estos
individuos?
b) Explica con tus propias palabras lo que
hiciste para calcularla

40
Resultado
Hay 2 modas : 27 (se repite 3 veces) y 20 (que
se repite también 3 veces).
1.
2.
41
Se observa en los datos cuál o cuáles se
repiten más.
Si ninguno se repite no hay moda y si son
varios los que se repiten hay varias modas.
Ejercicio 4

Los siguientes datos representan edades de
personas con cardiopatía en una muestra :
6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26
–
–
–
42
¿Cuál es la edad promedio de estas
personas?___________________
¿Cuál es la mediana?_________________
¿Cuál es la moda?________________
Ejercicio 5

Un grupo de pacientes acudió a su valoración
preoperatoria, sus resultados de hemoglobina
fueron los siguientes:
17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7,
14.9, 15.7, 15.1, 14.9, 15, 13, 15.
–
–
–
43
La media del valor de hemoglobina en estos
pacientes fue de______________
La mediana fue de_______________
Y ¿Cuál es la moda?__________________
Ejercicios 4 y 5

Los siguientes datos representan edades de personas con cardiopatía en
una muestra :
6, 16, 18, 19, 22, 23, 23, 23, 24, 26, 26
¿Cuál es la edad promedio de estas personas?_____20.55____
– ¿Cuál es la mediana?___23______________
– ¿Cuál es la moda?_____23___________
Un grupo de pacientes acudió a su valoración preoperatoria, sus
resultados de hemoglobina fueron los siguientes:
–

17.2, 14.1, 16.4, 14.9, 16.9, 14.2, 20, 16.7, 14.9, 15.7, 15.1, 14.9, 15, 13,
15.
–
–
–
44
La media del valor de hemoglobina en estos pacientes fue de___15.6____
La mediana fue de___15____________
Y ¿Cuál es la moda?_14.9__________
Medidas epidemiológicas de
frecuencia

Tasas
(por 1 000, por 10 000, por
100 000 habitantes)

Prevalencia

Incidencia

Mortalidad
Morbilidad
Tasas
En epidemiología una tasa es
una cantidad o grado de
enfermedad medida por unidad
de población, siendo
importante también el tiempo
durante el cual se estudian los
casos.
Miden la probabilidad de que
en una población ocurra algún
hecho particular, caso o
muerte debido a alguna
enfermedad.
Incidencia:
Número de casos nuevos de
una enfermedad en una
población definida durante un
intervalo de tiempo
casos nuevos de una enfermedad
población
Prevalencia
Número de personas que tienen
una enfermedad en un momento
dado
número de pacientes enfermos
población
Tasa de Mortalidad:
Es una medida de la ocurrencia
de muertes dentro de una
población definida
número de fallecimientos
población
Tasa de letalidad
Es el número de muertes
debidas a tal enfermedad
dividido entre tantos pacientes
con tal enfermedad.
Todas las medidas de frecuencia de
la enfermedad contienen
necesariamente alguna indicación
de tiempo
Prevalencia: Tiempo
instantáneo, situación en ese
momento específico
Incidencia: Se define el
intervalo en que los pacientes
fueron monitorizados
Ejercicio: Completa las celdas que faltan
TASA
TIPO DE MEDIDA
Mortalidad
Incidencia
Morbilidad
Incidencia
NUMERADOR
DENOMINADOR
Total de la población
(durante un período de
tiempo)
Total de la población
(durante un período de
tiempo)
Total de casos nuevos
+ viejos
Total de la población
(En un momento dado)
Casos fatales
Prevalencia instantánea Total de casos que
(letales)
mueren por la
enfermedad
Autopsias
Prevalencia
Total de defunciones
Malformaciones
congénitas
Incidencia acumulada
Población de recién
nacidos vivos
Solución del ejercicio
TASA
TIPO DE MEDIDA
NUMERADOR
DENOMINADOR
Mortalidad
Incidencia
Número de muertes
Morbilidad
Incidencia
Total de casos nuevos
Total de la población
(durante un período de
tiempo)
Total de la población
(durante un período de
tiempo)
Prevalencia
Total de casos nuevos
+ viejos
Total de la población
(En un momento dado)
Casos fatales
Prevalencia instantánea Total de casos que
(letales)
mueren por la
enfermedad
Total de población que
tiene la enfermedad
Autopsias
Prevalencia
Total de autopsias
Total de defunciones
Malformaciones
congénitas
Incidencia acumulada
Total de recién nacidos Población de recién
con malformaciones
nacidos vivos
congénitas
55
?
56
57