Download Análisis2

Document related concepts
no text concepts found
Transcript
Planteamiento del problema
¿Tenemos los humanos la capacidad de percibir si nos miran desde atrás?
O, más exactamente:
¿Es defendible que existen otras formas de percepción diferentes de las
habitualmente consideradas?
Podemos diseñar un procedimiento para poner a prueba esta hipótesis:
• Se realizan 20 ensayos donde un observador mira (o no) de forma
completamente aleatoria a otra persona.
• El sujeto observado debe responder si cree que le miran o no.
• Si el fenómeno existe, el número de aciertos debería ser superior al esperado
por azar.
1
Nuestros resultados
Nos centraremos especialmente en dos datos: La media de
aciertos en mirar (5.9) y la media esperada de aciertos, que es
el 50% de los ensayos de mirar (10.24/2 = 5.12)
2
Si no tuviésemos estadística inferencial...
Hemos realizado el experimento y hemos obtenido una media de 5.9 cuando
esperábamos una media de 5.12. Podríamos oír dos comentarios respecto de
estos resultados:
• Sí existe el fenómeno, porque aciertan más de lo que esperábamos.
• Bah, seguro que es casualidad.
Y no sería posible llegar a una decisión.
En cualquier caso, la estadística inferencial no habla de síes o noes, sino
en términos probabilísticos. En realidad, no da una respuesta, sino que nos
afirma hasta qué punto es probable una determinada respuesta.
3
ANÁLISIS ESTADÍSTICO DE DATOS
1. Planteamiento de las hipótesis.
2. Gráficos.
3. Traducción de la hipótesis nula a una distribución muestral
de un estadístico.
4. Decisión.
5. Tamaño del efecto y la potencia del contraste.
4
1. Planteamiento de las hipótesis
•
•
H0: No podemos percibir cuando nos miran desde atrás.
H1: Podemos percibir cuando nos miran desde atrás.
•
•
H0: No podemos superar el nivel del azar.
H1: Podemos acertar más de lo esperado por azar.
•
•
H0: Aciertos = 50%
H1: Aciertos > 50%
•
•
H0:  AC  5.12
H1:  AC  5.12
5
2. Gráficos
•
•
•
Los gráficos son imprescindibles. Nos indican de forma clara qué está pasando.
Hay que atender con cuidado a la escala.
Las barras de la izquierda responden a nuestra pregunta. Las otras garantizan
(hasta cierto punto) la ausencia de trampas o sesgos de respuesta.
6
3. Traducción de la hipótesis nula a una distribución (i)
• Según la hipótesis nula, el fenómeno no existe: los sujetos sólo
podrán responder por azar. Acertarán el 50%.
• No obstante, sabemos que los sucesos azarosos son, por definición,
impredecibles, y fluctúan.
• En realidad, responder al azar sólo garantiza que, a la larga (en la
población), acertarán el 50% de las veces. Pero en una situación
concreta (en una muestra), los resultados (su media) no tienen por
qué coincidir con ese valor necesariamente.
• ¿Hay alguna forma de saber si mis resultados son “razonables” dada
la hipótesis nula?
• Sí: Podemos hacer como si conociésemos todas las posibilidades,
todas las medias que pueden salir. Es decir: podemos construir los
resultados (concretamente, las medias) que nos vamos a encontrar si
la hipótesis nula es cierta.
7
3. Traducción de la hipótesis nula a una distribución (ii)
•Vamos a ello: conocer las posibles medias de aciertos. Pero no podemos
hacerlo sin más ni más. Necesitamos un marco, un punto de partida: unas
condiciones o supuestos.
(*)
•Supuesto 1: Lo que ocurra lo hará de forma normal, gausiana. ¿Y por qué?
Porque es lo más habitual (para las medias: Teorema central del límite). ¿Y si en
nuestro caso no se cumpliese? Entonces no podremos usar nada de lo que
veremos en adelante.
•Supuesto 2: Los aciertos se obtendrán de forma aleatoria, de manera que
ninguno de los que salgan podrá ser anticipado; no tiene relación con los que ya
salieron (o saldrán). ¿Por qué? Porque si estuvieran relacionados existirá
probablemente un sesgo particular sistemático. Y ese es otro tipo de problema.
En nuestro caso, además, se ajusta perfectamente: si la persona no tiene esa
capacidad, no tendrá manera de responder correctamente; haga lo que haga,
acertará y fallará de forma impredecible.
(*) Esto no es totalmente cierto. En nuestra situación habríamos de usar la distribución t, no la
normal, pero eso podría hacer las cosas menos claras. Como resultado, nuestros resultados
parecerán “más significativos”. Por lo demás, el razonamiento es completamente aplicable.
8
3. Traducción de la hipótesis nula a una distribución (iii)
• Una manera de hacerlo es mediante el generador de números
(pseudo)aleatorios de un ordenador.
• Le indicamos que simule unas respuestas aleatorias a los ensayos de
mirar, lo hacemos para varios sujetos y calculamos la media. Ya
tenemos un experimento: una media.
• Pero queremos muchas medias para ver qué ocurre con ellas. Así que le
decimos al ordenador que repita lo anterior 1000 veces. Y que nos
presente los resultados: A menor tamaño, más imprecisión.
9
3. Traducción de la hipótesis nula a una distribución (iv)
• Hay que indicar la media y la desviación típica de la distribución normal
para que lleve a cabo el proceso:
• Media: Si el número de ensayos de mirar fue, por término medio,
10.24, se esperará que se acierten, por azar, la mitad: 5.12.
• Desv. Típica: utilizamos la de la muestra (insesgada)
• Hay que decirle cuántos sujetos responderán, el famoso n. Debemos
poner el mismo n que en nuestro experimento: 50.
Repetido 10.000
veces, hemos obtenido sólo 8
medias iguales o
mayores que 5.9.
10
4. Decisión (i)
La decisión no nos llevará a un sí/no. Más bien a una afirmación
modulada por la probabilidad. La pregunta correcta es: ¿Hasta qué
punto nuestro resultado es defendible si la H0 es cierta? ¿Hasta qué
punto es probable? Con lo que sabemos, podemos calcularlo al menos
de tres maneras:
(1) Directamente mediante la simulación: los resultados anteriores
nos dan una probabilidad de 0.0008 (probabilidad frecuencial: hemos
contado la frecuencia de casos que son mayores de 5.9, y son 8 de
10.000).
11
4. Decisión (ii)
(2) O también podemos usar las propiedades de la normal. Nuestra distribución
original tiene media 5.12 y dt 1.705, y es lo que hemos utilizado para simular. La
distribución de medias obtenidas tiene también media 5.12, pero es mucho más
estrecha. Su dt (que podemos obtener de la simulación anterior), es 0.24. Para
interpretar la media obtenida (5.9) usando la distrib. normal, deberemos tipificarla:
Z AC
X AC  X 5.9  5.12 0.78



 3.25
SX
0.24
0.24
Mirando en las tablas de la normal
para z = 3.25, tenemos que este valor
deja a la izquierda 0.9988, luego la
probabilidad de un valor mayor o
igual es de 0.0012
12
4. Decisión (iii)
(3) O podemos hacer un contraste al uso, utilizando un estadístico de contraste. En
este caso, partimos de la distribución original, con media 5.12 y dt 1.705, y no hace
falta simular la distribución de medias obtenidas. El estadístico de contraste resuelve
ese problema:
Z AC
X   5.9  5.12
0.78



 3.23
 n 1.705 50 0.2411
Con lo que llegamos prácticamente al
mismo resultado, consultando la
distrib. normal igual que antes.
(No obstante, hemos considerado que
la varianza poblacional coincide con
la muestral, cosa incorrecta pero que
ayuda a simplificar el proceso)
13