Download VARIABLE ALEATORIA
Document related concepts
no text concepts found
Transcript
Probabilidad y Estadística 11 Probabilidad y distribuciones de probabilidad discretas VARIABLE ALEATORIA Según vimos el concepto de probabilidad se define para eventos asociados al espacio muestral de un experimento. Los elementos del espacio muestral pueden ser de naturaleza muy diversa: letras, números, pares de números, sucesiones, etc.. Ahora bien, en muchas situaciones resulta más adecuado trabajar con eventos numéricos, esto es con eventos que pueden ser descriptos mediante subconjuntos de números. Con este fin se introduce el concepto de variable aleatoria. Este concepto permite “mirar” los eventos como eventos numéricos. Variable aleatoria. Sea S el espacio muestral asociado a un experimento. Una variable aleatoria es una función real X definida sobre S, es decir, X : S IR Según la definición anterior, una variable aleatoria lo que hace es asignar un valor numérico a cada elemento del espacio muestral. Ejemplo. El experimento consiste en tirar una moneda. S = {cara, seca} Se puede definir X : S IR dada por X(cara) = 1, X(seca) = 0. Ejemplo. El experimento consiste en tirar dos monedas distinguibles (por ejemplo, de distinto valor). S = {(cara, cara), (cara, seca), (seca, cara), (seca, seca)} donde por ejemplo el par (cara, seca) significa que salió cara en la primer moneda y seca en la segunda. Se puede considerar la variable aleatoria X : S IR dada por X((s1, s2)) = cantidad de caras en (s1, s2), es decir, X(cara, cara) = 2, X(cara, seca) = 1, X(seca, cara) = 1, X(seca, seca) = 0. También se podría definir la variable aleatoria Y : S IR dada por Y((s1, s2)) = 1 si s1 y s2 son caras Y((s1, s2)) = 0 en otro caso es decir, Y(cara, cara) = 1, Y(cara, seca) = 0, Y(seca, cara) = 0, Y(seca, seca) = 0. El como se defina la variable aleatoria para un experimento dado dependerá de lo que se quiera estudiar. Las variables aleatorias se clasifican en discretas y continuas. Variable aleatoria discreta. Una variable aleatoria X se dice discreta si sólo puede tomar un número finito o infinito numerable de valores distintos. Variable aleatoria continua. Una variable aleatoria X se dice continua si toma cualquier valor en un intervalo. Las variables aleatorias continuas las estudiaremos en la próxima clase. Probabilidad y Estadística 12 Probabilidad y distribuciones de probabilidad discretas Los ejemplos considerados anteriormente son ejemplos de variables aleatorias discretas pues los valores que pueden tomar son {0, 1}, {0, 1, 2} y {0, 1} respectivamente. Veamos otros ejemplos, Ejemplo. El experimento consiste en tirar una moneda 10 veces. S = {(s1, ..., s10) : si es cara o seca} S consta de todas las 10uplas de caras y secas Definamos la variable aleatoria X : S IR, X(s1, ..., s10) = cantidad de caras en (s1, ..., s10) que asigna a cada 10upla la cantidad de caras que tiene. Luego los valores que puede tomar X son {0, 1, ..., 10}. Ejemplo. El experimento consiste en tirar una moneda infinitas veces. S = {(s1, s2, s3,...) : si es cara o seca} S consta de todas las sucesiones de caras y secas Definamos la variable aleatoria X : S IR X(s1, s2, s3,...) = i tal que si es la primer cara. que asigna a cada sucesión el lugar en el que aparece la primer cara. Luego los valores que puede tomar X son {1, 2, ...} = IN. Algunas otras situaciones concretas donde aparecen variables aleatorias discretas son: Si se estudia la eficacia de un fármaco para controlar el crecimiento de bacterias: número de bacterias por unidad de área determinado a intervalos de 5 hs.. Número de computadoras defectuosas en envíos mensuales de 100 unidades a lo largo de un año. Número de pedidos semanales nuevos en una planta manufacturera durante un año. DISTRIBUCIÓN DISCRETA. DE PROBABILIDAD DE UNA VARIABLE ALEATORIA Antes de seguir vamos a hacer un comentario acerca de la notación. Si X denota una variable aleatoria, entonces x denotará un valor cualquiera de esta variable. Por ejemplo, si el experimento consiste en tirar una moneda, entonces S = {cara, seca} Si X : S IR está dada por X(cara) = 1, X(seca) = 0, entonces x va a denotar cualquiera de los valores 0 o 1. Si la variable aleatoria se denota con Y, entonces y denotará un valor cualquiera de esta variable. Cuando se usan variables aleatorias para estudiar problemas estadísticos resulta de interés calcular cuando se realiza el experimento asociado a X una vez, por ejemplo: la probabilidad de que dicha variable toma algún valor determinado P(X = x) = P( {s S : X(s) = x} ) la probabilidad de que su valor sea menor o igual que determinado número Probabilidad y Estadística 13 Probabilidad y distribuciones de probabilidad discretas P(X x) = P( {s S : X(s) x} ) la probabilidad de que su valor caiga dentro de ciertos límites P(x1 X x2) = P( {s S : x1 X(s) x2} ) . Ejemplo. Consideremos el experimento que consiste en tirar dos dados balanceados distinguibles, por ejemplo, uno negro y otro blanco. Si, por ejemplo, el par (1, 2) significa que salió 1 en el dado negro y 2 en el blanco, S = {(1, 1), (1, 2), ..., (1, 6), (2,1), (2, 2), ..., (2, 6), ..., (6,1), (6, 2), ..., (6, 6))}, S consta de todos los pares ordenados cuyas componentes toman cualquier valor entre 1 y 6. Como los dados son balanceados podemos considerar la distribución de igual probabilidad. Como S tiene 36 elementos cada evento simple tendrá probabilidad 1/36 P({(i, j)}) = P(i, j) = 1/36. Consideremos la variable aleatoria X : S IR definida por X(i, j) = i + j suma de las componentes de (i, j) Podemos calcular la probabilidad de que tome el valor 4, esto es P(X = 4) = P( { (s1, s2) S : X(s1, s2) = 4 } ) Como X toma el valor 4 para (1, 3), (2, 2), (3, 1) P(X = 4) = P( { (1, 3), (2, 2), (3, 1) } ) = 3 / 36 = 1 / 12. Podemos ahora calcular la probabilidad de que su valor esté entre 10 y 12, esto es P(10 X 12) = P( { (s1, s2) S : 10 X(s1, s2) 12 } ) = P( { (4, 6), (5, 5), (5, 6), (6, 4), (6, 5), (6, 6)) } ) = 6 / 36 = 1 / 6. Como vemos estas probabilidades asociadas a variables aleatorias se calculan en función de probabilidades asociadas a eventos que corresponden al experimento. Sin embargo, es posible definir directamente probabilidades para los valores de la variable aleatoria. Distribución de probabilidad de una variable aleatoria discreta. La distribución de probabilidad de una variable aleatoria discreta X es una fórmula, una tabla o una gráfica que proporciona la probabilidad p(x) asociada a cada valor x, es decir, p(x) = P(X = x) (la probabilidad de que X tome el valor x). Los valores p(x) cumplen, 1. 0 p(x) 1. 2. p(x) = 1 toda x Probabilidad y Estadística 14 Probabilidad y distribuciones de probabilidad discretas Ya vimos en el ejemplo anterior cómo puede determinarse p(x) a partir de la distribución de probabilidad P correspondiente al experimento al cual se asocia X. Veamos ahora otro ejemplo, Ejemplo. El experimento consiste en tirar dos monedas distinguibles. S = {(cara, cara), (cara, seca), (seca, cara), (seca, seca)} Consideremos la variable aleatoria X : S IR está dada por X((s1, s2)) = cantidad de caras en (s1, s2), es decir, X(cara, cara) = 2, X(cara, seca) = 1, X(seca, cara) = 1, X(seca, seca) = 0. Los eventos simples son {(cara, cara)} {(cara, seca)} {(seca, cara)} {(seca, seca)} Si las monedas están bien balanceadas podemos usar la distribución de igual probabilidad. Como #S = 4, cada uno de los eventos simples tiene probabilidad 1/4, de donde: Distribución de probabilidad P. Evento simple {(cara, cara)} {(cara, seca)} {(seca, cara)} {(seca, seca)} Probabilidad 1/4 1/4 1/4 1/4 Para determinar p(x) = P(X = x) procedemos como en el ejemplo anterior. P(X = 0) = P({(seca, seca)}) = 1/4, entonces p(0) = 1/4. P(X = 1) = P({(cara, seca), (seca, cara)}) = 2/4 = 1/2, entonces p(0) = 1/2. P(X = 2) = P({(cara, cara)}) = 1/4, entonces p(0) = 1/4. Tabla de la distribución de probabilidad para X X Eventos 0 {(seca, seca)} 1 {(cara, seca), (seca, cara)} 2 {(cara, cara)} p(x) 1/4 2/4 = 1/2 1/4 p(0) + p(1) + p(2) = 1 En la primer columna aparecen los valores que puede tomar X. En la segunda columna los eventos con los elementos del espacio muestral para los cuales X toma cada uno de sus valores. Se usó la distribución de igual probabilidad basándonos en que las monedas estaban bien balanceada. Si se interpreta p(x) usando la definición a posteriori, p(x) es la frecuencia relativa con la que aparece x si se repite el experimento un número grande de veces. Es decir, si se tira las monedas se tiran un número grande de veces y se calcula el valor de X en cada tirada se obervaría X toma el valor 0, 1/4 de las veces X toma el valor 1, 1/2 de las veces X toma el valor 2, 1/4 de las veces Probabilidad y Estadística 15 Probabilidad y distribuciones de probabilidad discretas de donde la tabla anterior (sin la 2da. columna) es una tabla de frecuencias relativas y el histograma de frecuencias relativas asociado es Como se hace con cualquier distribución de frecuencias relativas, para la distribución de probabilidad de una variable aleatoria se pueden considerar entonces las medidas descriptivas numéricas como la media, variancia y desviación estándar. Valor esperado de X. Sea X una variable aleatoria discreta con una distribución de probabilidad p(x). El valor esperado de X es E(X) = xp( x) x Ejemplo. Para el ejemplo anterior, p(0) = 1/4, p(1) = 1/2 y p(2) = 1/4, entonces E(X) = 0 1 1 1 +1 +2 = 1. 4 2 4 Observación. La media es un promedio de los datos. Este promedio también puede calcularse sumando lo productos de cada dato por la frecuencia relativa correspondiente. Así, si es la media de la distribución de frecuencia relativa de la población correspondiente a la distribución de probabilidad p(x), entonces E(X) = . Probabilidad y Estadística 16 Probabilidad y distribuciones de probabilidad discretas Variancia y desviación estándar. La variancia de una variable aleatoria X es el valor esperado de (X )2, es decir, 2 = E(X )2 = ( x ) 2 p ( x) x La desviación estándar es la raíz cuadrada de 2. Ejemplo. Para el ejemplo anterior, p(0) = 1/4, p(1) = 1/2, p(2) = 1/4, = E(X) = 1, entonces 2 = ( x ) 2 p ( x) x = (0 1)2 p(0) + (1 1)2 p(1) + (2 1)2 p(2) =1 1 1 1 1 +0 +1 0= . 2 4 2 4 Observación. Se definió la variancia como el promedio o media de los cuadrados de las diferencias entre los datos y la media . Como la media corresponde a la esperanza de una variable aleatoria, se obtiene la fórmula anterior para la variancia.