Download Unidad III. Variables aleatorias
Document related concepts
Transcript
Unidad III.Variables aleatorias Prof. Eliana Guzmán U. Semestre A-2015 Variable Aleatoria Concepto: p es una función que q asigna g un número real, a cada elemento del espacio muestral. y Solo los experimentos aleatorios que dan lugar g a espacios p muestrales no numéricos,, requieren formalmente la definición de una variable aleatoria sobre ellos. y Variable Aleatoria y Ejemplo: j p en el lanzamiento de una moneda balanceada. R S X(S) Cara Sello 0 1 La variable aleatoria X se definiría como: X: cantidad de sellos obtenidos en el lanzamiento d la de l moneda. d Tipos de Espacios Muestrales Espacio p muestral discreto: si contiene un número finito de posibilidades o una secuencia interminable con tantos elementos, como números naturales existen. y Espacio muestral continuo: si contiene un número infinito de posibilidades, igual al número de puntos g de línea. en un segmento y Espacios Muestrales Para un mismo espacio p muestral se pueden p definir múltiples variables aleatorias, dependiendo p de lo que q se esté interesado en estudiar. Por ejemplo, si se está haciendo un estudio de control de calidad en una línea lí de d producción, d ió y para esto se seleccionan l i 3 artículos al azar sin reemplazo y se clasifican como defectuoso (D) o no defectuoso (N), se pueden definir las siguientes variables aleatorias: Espacios Muestrales ◦ X: cantidad de artículos defectuosos seleccionados. ◦ Y: cantidad de artículos no defectuosos seleccionados. ◦ Z: diferencia entre la cantidad de artículos d f defectuosos y la l cantidad id d de d artículos í l no defectuosos seleccionados. ◦ W: pérdida monetaria generada por los artículos defectuosos seleccionados. Clasificación de las Variables Aleatorias Las variables aleatorias se clasifican en: ◦ Variables aleatorias discretas: son aquellas que sólo pueden tomar un número finito o infinito numerable de valores enteros. ◦ Variables aleatorias continuas: son aquellas que pueden tomar un número finito no numerable de valores,, es decir,, ppuede tomar cualquier valor en una escala continua de medición. Función de Probabilidad para Variables Aleatorias Discretas y Una variable U i bl aleatoria l i asume cada d uno de d sus valores con una cierta probabilidad. P esta razón, Por ó es común ú expresar dichas di h probabilidades de forma tabular. x x1 x2 x3 xn f(x) f(x1) f(x2) f(x3) f(xn) Función de Probabilidad para Variables Aleatorias Discretas Con frecuencia es conveniente representar con una fórmula, todas las probabilidades de una variable aleatoria X. Dicha fórmula debe ser necesariamente una función de los valores numéricos de X, que se expresa normalmente por f(x). Por lo tanto se escribe: f(x)=P(X=x) Función de Probabilidad para Variables Aleatorias Discretas Definición: El conjunto de pares ordenados (x,f(x)), es una función de probabilidad de la variable aleatoria discreta X si, si para cada valor posible x: 1) f(x) f( ) ≥ 0 2) ∑ f ( x) = 1 3) P(X=x) = f(x) x Función de Distribución para Variables Aleatorias Discretas La Función de Distribución Acumulada F(x) de una variable aleatoria discreta X, cuya función de probabilidad es f(x) f(x), es: F ( x) = P( X ≤ x) = ∑ f (t ) t≤x −∞ < x < ∞ Función de Probabilidad para Variables Aleatorias Continuas Una variable U i bl aleatoria l i continua i tiene i una probabilidad cero de asumir cualquiera de sus valores l exactamente. Consecuentemente su función de probabilidad b bilid d no puede d d darse d de forma f tabular: P(a<X≤b) = P(a<X<b) + P(X=b) = P(a<X<b) Función de Probabilidad para Variables Aleatorias Continuas La función de probabilidad de una variable aleatoria continua, normalmente es una fórmula que necesariamente debe ser una función de los valores numéricos de dicha variable y se expresa con f(x) y recibe el nombre de función de densidad de probabilidad de X. X Función de Probabilidad para Variables Aleatorias Continuas f(x) f(x) x f(x) x x El área total comprendida bajo la curva f(x) es igual a 1, cuando se calcula para el rango de valores de X. Función de Probabilidad para Variables Aleatorias Continuas f(x) b P(a < X < b) = ∫ f ( x)dx a a b x Ejercicios de Funciones de Probabilidad de variables aleatorias discretas Valor Esperado para Variables Aleatorias Discretas El valor esperado es el centro de la distribución, también llamado el centro de gravedad de la misma, misma por esto no es necesario que sea igual a uno de los valores que toma la variable aleatoria. aleatoria Se expresa en las mismas unidades que la variable i bl aleatoria. l i Valor Esperado para Variables Aleatorias Discretas y Definición: D fi i ió SSea X una variable i bl aleatoria l i discreta, con función de probabilidad f(x), l media la di o valor l esperado d de d X es: μ = E ( x) = ∑ xff ( x) x Varianza para Variables Aleatorias Discretas Mide el grado de dispersión de los valores que toma la variable aleatoria con respecto a su valor central (media). (media) y Definición: sea X una variable aleatoria con función de probabilidad f(x) y media μ. La varianza es: y σ = E ( x ) − (E ( x ) ) 2 2 2 Varianza para Variables Aleatorias Discretas y Se expresa p en las mismas unidades de la variable aleatoria, pero elevadas al cuadrado. Por lo cual, se usa mucho para p comparar distribuciones del mismo tipo: f(x) ( ) σ2 f(x) ( ) 1 >σ2 2 σ22 σ21<σ22 σ21 σ21 σ22 x b x Desviación Estándar para Variables Aleatorias Discretas y Es la raíz cuadrada positiva de la varianza. varianza σ = σ2 y Se expresa p en las mismas unidades de la variable aleatoria. Ejercicios j de valor esperado, p , varianza y desviación estándar de variables aleatorias discretas Distribuciones Conjuntas de variables aleatorias discretas y y Si X y Y son dos variables aleatorias discretas, la función de probabilidad de sus ocurrencias simultáneas, ppuede ppresentarse por una función de valores f(x,y), para cualquier par de valores (x,y) dentro del rango de d llas variables i bl aleatorias l i X y Y. Y f(x,y)=P(X=x,Y=y), esto es, los valores de f(x y) proporcionan la probabilidad de que f(x,y) los resultados x y y ocurran al mismo p tiempo. Distribuciones Conjuntas de variables aleatorias discretas Definición: D fi i ió la l ffunción ió f( f(x,y)) es una ffunción ió de probabilidad conjunta de las variables aleatorias l i di discretas X y Y, Y si:i 1. f(x,y)≥0 ∀ (x,y) 2. ∑∑ f ( x, y ) = 1 3. x y P(X=x,Y=y)=f(x,y) ( , y) ( ,y) Distribuciones Marginales de variables aleatorias discretas y El término marginal se utiliza debido a que en el caso discreto, los valores de g(x) y h(y) son exactamente los totales marginales de las columnas y filas respectivas cuando los valores de f(x,y) respectivas, f(x y) se muestran en forma tabular. Distribuciones Marginales de variables aleatorias discretas y Definición: D fi i ió llas di distribuciones ib i marginales i l de X y Y, están dadas por: g ( x ) = ∑ f ( x, y ) y y h ( y ) = ∑ f ( x, y ) x Distribuciones Condicionales de variables aleatorias discretas Sean X y Y variables aleatorias discretas. discretas La distribución condicional de la variable aleatoria Y, Y dado que X=x, X=x está dada por: f ( x, y ) g ( x) g ( x) > 0 f ( x, y ) f ( x / y) = h( y ) h( y ) > 0 f ( y / x) = Similarmente, Ejercicios j de distribuciones conjuntas, marginales y condicionales Covarianza y y La covarianza entre dos variables aleatorias es una medida de la naturaleza de la asociación entre ellas, en otras palabras, es una medida de la forma en qque varían conjuntamente j dos variables aleatorias. El signo g de la covarianza indica si la relación entre las dos variables aleatorias es p positiva o negativa. g Covarianza La covarianza entre dos variables aleatorias, discretas o continuas, se determina por: COV(X,Y)=E(XY) CO ( , ) ( ) – E(X)E(Y) ( ) ( ) Entre más se alejada esté la covarianza de cero mayor es el grado de asociación cero, entre las variables y entre más cercano es el valor a cero, cero es menor la relación que existe entre las variables. Covarianza y ¿¿Cómo se calcula la covarianza? E ( XY ) = ∑∑ xyf ( x, y ) x y E ( X ) = ∑ xg ( x) x E (Y ) = ∑ yh( y ) y Finalmente se usa la fórmula: ( , ) ( ) – E(X)E(Y) ( ) ( ) COV(X,Y)=E(XY) Covarianza y Cómo se interpreta p los valores obtenidos al calcular la covarianza: >0 valores pequeños de X se asocian con valores pequeños de Y, y valores grandes de X >0 valores pequeños de X se asocian con valores pequeños de Y y valores grandes de X se asocian con valores grandes de Y. COV(X,y)= =0 no existe relación entre X y Y. <0 valores pequeños de X se asocian con valores grandes de Y, y valores grandes de X se asocian con valores pequeños de Y. Independencia Estadística y Sean X y Y dos variables aleatorias discretas o continuas, con función de pprobabilidad conjunta j f(x,y), ( y) y distribuciones marginales g(x) y h(y), p las variables aleatorias X respectivamente, y Y, se dice que son estadísticamente p si y solo si f(x,y) ( y) = independientes g(x)h(y) para todo (x,y) dentro de sus g rangos. Independencia Estadística Cuando X y Y son estadísticamente independientes, puede demostrarse que la covarianza es cero. Lo contrario, sin embargo, generalmente no es cierto, lo que indica que q q dos variables aleatorias pueden tener covarianza igual a cero y aún así no ser estadísticamente independientes. Ejercicios de covarianza e independencia estadística Tema 7. Distribuciones de Probabilidad para variables aleatorias discretas (Parcial 4) Distribuciones de variables aleatorias discretas Con ffrecuencia las C l observaciones b que se generan en diferentes experimentos estadísticos tiene el mismo tipo de estadísticos, comportamiento en términos generales. En consecuencia, las variables aleatorias discretas que se asocian con estos experimentos, pueden describirse esencialmente, i l t por la l misma i ffunción ió d de probabilidad y por lo tanto se representan por una sola fórmula. Distribución de Bernoulli y Es aquel q modelo que q sigue g un experimento de Bernoulli, que se realiza una sola vez y qque puede p tener dos posibles resultados, clasificados como éxito o fracaso. Distribución de Bernoulli Ejemplos: j p ◦ Lanzamiento de una moneda. ◦ Nacimiento de un bebé. ◦ Se aprueba o no un examen. (Estudio estadístico de aprobados en una facultad). ◦ Un artículo seleccionado es defectuoso o no (control de calidad). ◦ Curar o no una enfermedad (Medicina). ◦ Dar en el blanco o errar (Militar). Distribución de Bernoulli Al existir solo 2 p posibles resultados se trata de eventos complementarios: Probabilidad obab a dee ééxito to → p p+q=1 Probabilidad de fracaso → q Distribución de Bernoulli f(x) F(x) x x Experimento de Bernoulli El p proceso de Bernoulli, debe tener las siguientes propiedades: ◦ El experimento p consiste en n intentos repetidos. ◦ Los resultados de cada uno de los intentos pueden clasificarse como éxito o fracaso. ◦ La probabilidad de éxito representada por p, permanece constante para todos los intentos. ◦ Los intentos repetidos son independientes ( (muestreo con reemplazo). l ) Distribución Binomial Parte o surge g del Experimento p de Bernoulli. y Se ap aplica ca cuando cua o se realiza ea a un u número ú e on de veces el experimento de Bernoulli, estando interesados en el número ó cantidad de éxitos obtenidos. y Distribución Binomial Definición: La cantidad X de éxitos en n repeticiones del experimento de Bernoulli recibe el nombre de v.a. Binomial : X ~ b(x; n, p) ⎛ n ⎞ x n− x f ( x) = ⎜⎜ ⎟⎟ p q ⎝ x⎠ x = 0,1,2,..., n Donde: n: número de intentos o repeticiones p del experimento. p p: probabilidad de éxito en un intento. q: probabilidad de fracaso en un intento (q = 1 – p). Distribución Binomial Media: μ = np y Varianza: σ2 = npq y f(x) x Distribución Hipergeométrica Son experimentos p donde, al igual g que q la Distribución Binomial, en cada ensayo hay tan solo dos p posibles resultados (éxito ( o fracaso). Pero se diferencia de la Distribución Binomial, en q que los distintos ensayos son dependientes entre sí ((muestro sin reemplazo). p ) Ejemplo: prueba de vida útil de un bombillo. Distribución Hipergeométrica y Experimento p hipergeométrico: p g consiste en calcular la probabilidad de seleccionar x éxitos de los k p posibles resultados considerados éxitos, y n-x fracasos de los N-k p posibles resultados considerados fracasos, cuando una muestra de tamaño n se selecciona de N resultados posibles. p Distribución Hipergeométrica Posee las dos características siguientes: g ◦ Una muestra de tamaño n se selecciona, sin reemplazo, de un total de N. ◦ k resultados del total de N pueden clasificarse como éxitos y N-k como fracasos: k: éxitos N N-k: N k: fracasos Distribución Hipergeométrica y Definición: La distribución de probabilidad de una v.a. hipergeométrica X, que representa el número o cantidad de éxitos en una muestra aleatoria de t tamaño ñ n, seleccionada l i d de d N resultados lt d posibles, ibl de los cuales k son considerados éxitos y N-k como fracasos es: ⎛k ⎞⎛ N − k ⎞ ⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ x n−x ⎠ f ( x) = ⎝ ⎠ ⎝ ⎛N⎞ ⎜⎜ ⎟⎟ ⎝n ⎠ x = 0,1,2,..., n Distribución Hipergeométrica Media: μ = nk/N y Varianza: σ = N − n × n × k × ⎛⎜1 − k ⎞⎟ N −1 N ⎝ N⎠ y 2 Distribución Hipergeométrica Distribución de Poisson Experimento de Poisson: son experimentos que resultan de valores numéricos de una v.a. X que representa la cantidad de resultados lt d obtenidos bt id durante d t un intervalo i t l de tiempo dado ó una región específica. El intervalo de tiempo puede ser de cualquier duración: un minuto, una semana, un mes, un año….Y la región podría ser un segmento de línea, un área, pedazo de material, etc. un volumen, un p Distribución de Poisson Ejemplos: y Estudio de las colas o líneas de espera. y Cantidad de fallas de equipos q p en un intervalo de tiempo dado. y Número de errores de impresión en un libro. y Cantidad de pacientes que llegan al servicio de emergencias de un hospital. y Cantidad de bacterias en un cultivo. Distribución de Poisson y Definición: La distribución de probabilidad p de la v.a. de Poisson X, que representa la cantidad de resultados q que ocurren en un intervalo de tiempo dado ó en una región específica p indicada por p t, es: X ~ P(x; ( λt)) e − λt (λ t ) x f ( x) = x! y x = 0,1,2,... Media y varianza: μ = σ2 = λt Distribución de Poisson Distribución de Poisson Tema 8 Distribuciones de variables aleatorias l continuas Distribución Uniforme o Rectángular á Es aquella que puede tomar cualquier valor dentro de un intervalo, todos ellos con la misma probabilidad de ocurrencia. y Definición: la variable aleatoria continua X tiene una distribución uniforme continua con parámetros á t a y b, b sii su función f ió de d densidad es: y f ( x) = F ( x) = ∫ x a 1 b−a para a ≤ x ≤ b 1 x−a dx = b−a b−a para a ≤ x ≤ b Distribución Uniforme o Rectángular á Media: E(X) ( ) = ((a+b)/2 ) y Varianza: σ2= (b-a)2/12 y Distribución Exponencial Tiene múltiples p aplicaciones p y está emparentada con la Distribución de Poisson, yya que q describe el tiempo p hasta que ocurre un evento de Poisson (o tiempo p entre eventos de Poisson). ) Distribución Exponencial Se aplica p en muchos campos, p como ppor ejemplo: y Modelar o e a laa vida v a útil út dee equipos equ pos y también ta b é de organismos vivos. y En estudios de confiabilidad. confiabilidad y Tiempo entre llegadas en las instalaciones de servicio. servicio Distribución Exponencial Definición: la variable aleatoria continua X tiene una distribución exponencial, con parámetro β p β, si su función de densidad es: 1 f ( x) = β e −x / β x 1 0 β F ( x) = ∫ e −t / β x>0 dt = 1 − e −x β x>0 Distribución Exponencial Media: E(X) = β y Varianza: σ2= β2 y Distribución Exponencial Distribución Normal Es la distribución de p probabilidad más importante, ya que describe en forma aproximada p muchos fenómenos que q ocurren en la naturaleza, la industria y la investigación. g Distribución Normal Una v.a. continua X q que tiene la distribución en forma de campana se llama v.a. normal. y La ecuación matemática para la distribución de p probabilidad de la variable aleatoria normal, depende de los parámetros: media μ y desviación p estándar σ. X ~ normal (x; μ, σ). y Distribución Normal Definición: La función de densidad de la v.a. normal X, con media μ y desviación estándar σ es: n( x; μ , σ ) = 1 2π σ e −1 / 2[( x − μ ) / σ ]2 para − ∞ < x < ∞ Distribución Normal Propiedades p de la curva normal: y La moda, que es el punto sobre el eje horizontal o o ta donde o e laa curva cu va tiene t e e su máximo ocurre en x = μ. y La curva es simétrica respecto a su eje vertical, donde se tiene la media μ. Distribución Normal La curva tiene sus p puntos de inflexión en x = μ ± σ. y La a cu curva va normal o a se ace acerca ca aal eje horizontal en forma asintótica en q de las dos direcciones cualquiera alejándose de la media. y El área total bajo la curva y arriba del eje horizontal es igual a 1. y Distribución Normal Distribución Normal Distribución Normal Distribución Normal y Áreas bajo j la curva normal: x2 P( x1 < X < x 2 ) = ∫ n( x; μ , σ )dx x1 x1 x2 Distribución Normal Estándar Es p posible transformar todas las observaciones de cualquier v.a. normal X, en un nuevo conjunto j de observaciones de una v.a. normal Z, con media cero y varianza 1. Esto puede realizarse por medio de la transformación: Z= X −μ σ que recibe el nombre de estandarización. Distribución Normal Estándar Entonces P(x ( 1 < X < x2) = P(z ( 1 < Z < z2)), donde Z es una v.a. normal con media cero y varianza uno. y Tablas de la Distribución Normal Estándar: P(Z ( < z). ) y Tabla de la Normal Estándar