Download descargar - Centro de Estudios Adlerianos
Document related concepts
no text concepts found
Transcript
Centro de Estudios Adlerianos Conceptos Básicos de Estadística Eduardo Aguilar Enero - 2010 Para qué sirve estadística? Estadística nos ayuda a generalizar conclusiones que inferimos a partir de datos (hechos) particulares. Ejemplo: elecciones nacionales Con estadística no podemos demostrar que una hipótesis (conjetura) es correcta: apenas podemos descartar una hipótesis por ser poco verosímil a la luz de los datos (hechos) que disponemos. Para qué sirve probabilidad? Probabilidad nos ayuda a deducir conclusiones particulares a partir de un conocimiento general. Ejemplo: dado balanceado, moneda balanceada. Para medir probabilidades usamos números reales comprendidos entre 0 y 1. (o porcentajes) Importante! Estadistica vs Probabilidad Estadística parte de conocimiento particular (datos) Estadística INFIERE conocimiento general Probabilidad parte de conocimiento general (modelo, ley) Probabilidad DEDUCE conocimiento particular Marie-Louise von Franz El hombre y sus símbolos “...Pero las estadísticas son injustas con el indivíduo. A pesar de que el diámetro promedio de las piedras de una pila sea de cinco centímetros, encontraremos que poquísimas piedras de ese montón tienen exactamente cinco centímetros de diámetro...” Cuándo precisamos estadística? Dos dificultades al inferir conclusiones generales: • Diferencias observadas pequeñas comparadas con imprecision experimental y variabilidad biológica. • Para protegernos de conclusiones equivocadas debidas a nuestra capacidad para detectar patrones. Jean Baudrillard (sociólogo francés) “Les statistiques sont une forme d'accomplissement de désir, tout comme les rêves.” Al igual que los sueños, las estadísticas son una forma de realización de deseos En la práctica... • No es necesario conocer los detalles matemáticos: hay programas que se encargan de hacer los cálculos PERO • Es imprescindible entender conceptualmente cuándo usar una determinada herramienta y, sobre todo, no perder de vista sus limitaciones. Anónimo “Sin datos, todo lo que sos es una persona más opinando” Conceptos: muestra y población • Muestra es el conjunto de información (datos) que dispongo para inferir conclusiones generales. • Población es el conjunto de indivíduos (objetos) a los cuales se aplican las conclusiones generales. Muestra “representativa” • Eliminar tendencias en la selección de los elementos de la muestra: el candidato ideal es cualquiera! • El tamaño de la muestra determina la incertidumbre de nuestra generalización. • Siempre considerar el tamaño de la muestra. Proyecciones de Resultados Electorales Tamaño Muestra: 1209 Error: 3% Resultados Elecciones Nacionales Población: ciudadanos habilitados Opción Porcentaje F. Amplio 49 P. Nacional 32 P. Colorado 14 P. Indep.60 2,5 Blanco y Anulado 2,5 Proyecciones Para Elecciones Octubre 18/10/2009 - Consultora Cifra 50 Porcentaje 40 30 20 10 0 F. Amplio P. Nacional P. Colorado Opción de voto P. Indep. Blanco y Anulado Qué es una variable aleatoria? Toda observación (intención de voto, resultado lotería, temperatura de mañana, etc) cuyo valor no podemos conocer de antemano con certeza. Qué es una distribución de probabilidad? Para cada valor posible de una variable aleatoria, la distribución de probabilidad informa la probabilidad de la variable tomar ese valor. Por qué la distribución Normal es importante? La distribución Normal (o Gausiana, o campana) emerge cuando varios componentes aleatorios independientes se superponen para generar la variabilidad. Primer Experimento: Histograma com los pesos de mil gotas Segundo Experimento: Pesos de mil pares de gotas Tercer Experimento: Pesos de diez mil decenas de gotas Por qué la distribución Normal es importante? Porque los promedios de grupos de medidas tienen una distribución Normal ! ( Teorema del Límite Central ) Des McHale (humorista irlandés) “The average human has one breast and one testicle.” El humano promedio tiene un seno y un testículo Tipos de variables aleatorias • Nominales (o categóricas): voto • Ordinales: estrellas de hoteles • Intervalo: temperatura en grados Celsius • Racionales: temperatura em grados Kelvin Variables Correlacionadas Dos (o más) variables están correlacionadas si tienen variaciones sincronizadas (conjuntas). • • Diámetro abdominal y probabilidad de infarto coronario Presión atmosférica y probabilidad de lluvia Importante! Correlación NO implica Causalidad Anónimo “Está demostrado que festejar el cumpleaños es saludable. Las estadísticas muestran que las personas que más cumpleaños festejan son las más longevas” Dos usos diferentes de estadística • • Estudios para generar nuevo conocimiento (escuela bayesiana - Fisher) – Investigación científica – Datamining (exploración de datos) Estudio para tomar decisiones concretas (escuela frecuentista – Neyman-Pearson) – Control de calidad – Eficacia de medicamentos Dos tipos de estudio para generar conocimiento Estudios Exploratorios Estudios para descartar una hipótesis específica • Usa Base de Datos pre-existente • • Busca relaciones sugestivas de nuevas hipótesis. Los datos no pueden • • usarse para evaluar las nuevas hipótesis. Usa datos recabados en experimento planificado. Estudia la verosimilitud de una hipotesis específica. El orden es importante! Para generalizar conocimiento particular: PRIMERO formulo una conjetura (hipótesis) concreta SEGUNDO planifico cómo recabar datos (experimento) TERCERO uso estadística para evaluar la verosimilitud de la conjetura a la luz de los datos obtenidos. Andrew Lang Biography (poeta escocés) “He [an unsophisticated forecaster] uses statistics as a drunken man uses lamp posts for support rather than for illumination.” Él [un predictor burdo] utiliza las estadísticas como un borracho utiliza las columnas de alumbrado más para apoyarse que para iluminarse. Qué significa “estadísticamente significativo”? • Es una medida de la verosimilitud de nuestra conjetura a la luz de los datos recogidos. • Cuál es la probabilidad de haber recogido esos datos si nuestra conjetura es falsa? • Cuanto menor es esa probabilidad más significativo desde el punto de vista estadistico es el resultado del experimento. Algunos valores arbitrarios • Un experimento produce resultados significativos si la probabilidad (valor p) es menor a 0,05. • Parámetros tales como el valor promedio se presentan con su intervalo de confianza del 95%. • El poder estadístico de un control de calidad debe ser como mínimo de 80%. Henri Poincaré “On fait la science avec des faits, comme on fait une maison avec des pierres : mais une accumulation de faits n'est pas plus une science qu'un tas de pierres n'est une maison.” Hacemos ciencia usando datos, análogamente a como construimos una casa usando piedras: PERO datos acumulados no constituyen una ciencia así como un montón de piedras no es una casa. FIN al FIN