Download Probabilidad y Estadística
Document related concepts
no text concepts found
Transcript
Reforma del Bachillerato Tecnológico 2004 SUBSECRETARIA DE EDUCACIÓN MEDIA SUPERIOR DIRECCIÓN GENERAL DE EDUCACIÓN TECNOLÓGICA AGROPECUARIA SAETA- Educación humana y de calidad Probabilidad y Estadística (Basado en la Reforma del Bachillerato Tecnológico 2004) Guía d i d á c t i ca Compiladores: Alejandro Acebo Gutiérrez Rubén Henríquez Francisco Romo Romero Tirso Cuevas Nolasco Raúl Arellano Ibarra Ernesto Zamora Hernández Junio de 2006 DIRECTORIO Lic. Reyes Tamez Guerra Secretario de Educación Pública Yoloxochitl Bustamante Díaz Subsecretario de Educación Media Superior Ing. Ernesto Guajardo Maldonado Director General de Educación Tecnológica Agropecuaria Prof. Saúl Arellano Valadez Director Técnico Ing. Agustín Velázquez Servín Director de Apoyo a la Operación Desconcentrada M.C. Maria Elena Hernández Mejia Coordinadora Nacional del Programa Sistema Abierto de Educación Tecnológica Agropecuaria ASIGNATURA: “Probabilidad y Estadística ” REGISTRO No. IV SEP / SEMS / DGETA JOSE MARIA IBARRARAN No. 804 COL. SAN JOSE INSURGENTES SUR. 06720, MÉXICO, D.F. TEL. 01 5 328 10 00 y 01 5 328 10 97 ISBN 2 Se autoriza la reproducción del contenido con fines educativos que no implique lucro directo ó indirecto, siempre y cuando se cite la fuente, previa autorización por escrito de la DGETA. COMITÉ EDITORIAL Prof. Saúl Arellano Valadez M. en C. María Elena Hernández Mejía En el proceso de elaboración de esta antología, participaron los siguientes docentes del estado de: Aguascalientes, Nayarit, Tabasco y Veracruz NOMBRE Alejandro Acebo Gutiérrez Rubén Henríquez Francisco Romo Romero Tirso Cuevas Nolasco Raúl Arellano Ibarra Ernesto Zamora Hernández PLANTEL CBTa No. 107 CBTa No. 107 CBTa No. 88 CBTa No. 86 CBTa No. 61 CBTa No. 30 ESTADO Nayarit Nayarit Zacatecas Veracruz Aguascalientes Aguascalientes 3 GUÍA DE CONTENIDOS Pág. VARIABLES Y REPRESENTACIONES ______________________________ 9 Introducción _____________________________________________ 9 Población y muestras ____________________________________ 10 Variable discreta y continua _______________________________ 11 Redondeo de datos ______________________________________ 14 Notación sistematizada ___________________________________ 15 Cifras significativas ______________________________________ 16 Cálculos ______________________________________________ 16 DISTRIBUCIONES DE FRECUENCIAS ____________________________ 19 Toma y ordenación de datos _______________________________ 19 Distribuciones de frecuencias ______________________________ 20 Intervalos de clase ______________________________________ 20 Límites de clase ________________________________________ 21 Límites reales de clase ___________________________________ 21 Tamaño del intervalo de clase _____________________________ 21 Marca de clase _________________________________________ 22 Histograma y polígono de frecuencia ________________________ 23 Distribución de frecuencia relativa __________________________ 27 Distribución de frecuencia acumulada _______________________ 27 Distribución de frecuencias relativas acumuladas _______________ 30 MEDIDAS DE TENDENCIA CENTRAL _____________________________ 33 Promedios _____________________________________________ 33 Media ________________________________________________ 33 Mediana ______________________________________________ 34 4 Moda _________________________________________________ 35 Cuartiles, deciles, percentiles ______________________________ 50 Regresión líneal ________________________________________ 53 MEDIDAS DE DISPERSIÓN _____________________________________ 55 Dispersión _____________________________________________ 55 Rango ________________________________________________ 56 Desviación media _______________________________________ 60 Varianza ______________________________________________ 61 Desviación típica ________________________________________ 62 Rango semi cuartílico ____________________________________ 63 Rango entre percentiles __________________________________ 63 PROBABILIDAD ______________________________________________ 70 Introducción ____________________________________________ 70 Conceptos básicos ______________________________________ 70 Modelos matemáticos ____________________________________ 72 Permutaciones y combinaciones ____________________________ 73 Diagrama de árbol _______________________________________ 73 Proceso de contar _______________________________________ 74 Combinaciones _________________________________________ 85 Teorema del Binomio ____________________________________ 91 PROBABILIDAD AXIOMÁTICA ___________________________________ 93 Simbología básica _______________________________________ 93 Probabilidad para eventos _______________________________ 104 Probabilidad condicional _________________________________ 104 Eventos independientes _________________________________ 104 Eventos dependientes ___________________________________ 106 5 Teorema de Bayes _____________________________________ 110 GLOSARIO _________________________________________________ 111 BIBLIOGRAFÍA CONSULTADA _________________________________ 115 BIBLIOGRAFÍA RECOMENDADA ________________________________ 116 6 INTRODUCCIÓN El presente trabajo esta dirigido a los estudiantes del SAETA que cursan el Bachillerato Tecnológico bajo el enfoque de estrategias educativas centradas en el aprendizaje, con la firme intención de que sirva de guía y que con las actividades que desarrollaras te permitirán adquirir los conocimientos que competen a los contenidos del programa de estudios de la asignatura de Probabilidad y Estadística que se imparte en el quinto semestre y que estas a punto de iniciar. Con el desarrollo de los contenidos programáticos dentro y fuera del aula, tú como participante entusiasta y responsable de tu propio aprendizaje, te permitirá comprender los conceptos analizados y la aplicación significativa para resolver problemas de la vida cotidiana. La meta se logrará con tú valiosa participación porque eres el principal actor de tu propio aprendizaje y que con el apoyo de tu facilitador determinarás el éxito en tú desempeño escolar, familiar y laboral. 7 MENSAJE Ya sabes que no puedes gozar del juego de la vida a menos que conozcas sus reglas, sea de convivencia de juego de pelota, de uso de computadora o tan sólo de salón. Igualmente no puedes cuantificar o cualificar tu entorno, sino hasta que comprendas las reglas de la probabilidad y estadística, que te harán comprender las formas de presentar las ocurrencias de un fenómeno social, físico o biológico que te llevarán a ampliar tu horizonte de conocimientos en donde verás la estructura matemática en numerosas ecuaciones, pero más que recetas de cálculo, verás ecuaciones y ordenamientos como guías para pensar. Yo disfruto de la probabilidad y la estadística, y tú también lo harás, porque la comprenderás. Si te tomas la idea de enfocarte hacia esta disciplina. Y resolver los problemas matemáticos. Ahora trata de comprender los conceptos, si después vienen los cálculos los harás comprendiéndolos. Disfruta de la probabilidad de que ocurra tu felicidad. Y serás parte de la estadística de los estudiantes felices. VARIABLES Y REPRESENTACIONES INTRODUCCIÓN 8 Estadística: Es un método científico que recopila, organiza, analiza e interpreta los datos obtenidos para tener conocimiento de los hechos pasados, para prever situaciones futuras y tomar decisiones en base a la experiencia. En el estudio de la estadística, se diferencian dos tipos de estadísticas: Estadística descriptiva o deductiva y Estadística inferencial o inductiva. Estadística Descriptiva: Es aquella cuyo objetivo es describir cuantitativamente una serie de personas, animales o cosas, su estudio incluye las técnicas de colectar, presentar, analizar e interpretar datos. Esta parte de la estadística es la que estudiaremos en el presente curso de probabilidad y estadística 1, será la que nos auxilie a resolver preguntas de investigaciones como las siguientes: ¿Cómo ordenar los datos y analizarlos adecuadamente? ¿Qué tipo de representación gráfica es más conveniente utilizar para presentar los datos? ¿Cuál es la media aritmética o promedio de los datos obtenidos? ¿Qué tan dispersos están los datos con respecto a otra muestra? Estadística Inferencial: Es aquella cuyo objetivo es obtener información sobre una población o grupo grande de personas o cosas, mediante un metódico procedimiento de los datos de una muestra tomada de él. Este último tipo de estadística no la utilizaremos en éste curso, pero hagamos un ejercicio para analizar cuál es la diferencia entre estos dos tipos de estadística: A un grupo de 50 alumnos del CBTA 107 extensión Xalisco le preguntamos ¿Cuál es la materia que les gusta más? Los datos arrojados por ésta encuesta, en éste grupo en particular, es incumbencia de la Estadística Descriptiva, ya que ordenamos los datos, los analizamos obteniendo sus parámetros como la media, la desviación, los graficamos y hasta los interpretamos Pero… Si queremos hacer conclusiones a nivel estatal de todos los alumnos de los CBTAs del estado de Nayarit, éste grupo de 50 encuestados sería una parte de las diferentes muestras que nos servirían para saber la tendencia de toda la población estudiantil respecto a la materia que les gusta mas, y debemos tomar más muestras de estudiantes de otros CBTAs, por lo cual ya entraríamos en el campo de la Estadística Inferencial y sus datos deberán de analizarse de otra manera más profunda, haciendo pruebas de hipótesis para obtener las inferencias o conclusiones a futuro. Con tus propias palabras escribe ¿CUAL ES LA DIFERENCIA ENTRE ESTADÍSTICA DESCRIPTIVA Y ESTADÍSTICA INFERENCIAL? _______________________________________________________________ 9 ______________________________________________________________________ ______________________________________________________________________ Población: Es el conjunto de todos los elementos, medidas, individuos y objetos que tienen una característica en común, pero en muchas ocasiones debido a limitaciones de tiempo o de recursos no se puede trabajar con la totalidad de la población. Muestra: Es la parte de una población que podemos utilizar para obtener conclusiones de toda una población sin tener que analizar su totalidad. La muestra elegida debe cumplir con ciertos requisitos indispensables: a) Validez. Debe representar a la población, esto es, ha de pertenecer a ésta y ser elegida al azar o 67en forma aleatoria, para que todos los elementos de la población tengan la misma probabilidad de ser considerados. b) Confiable. Los resultados que se obtengan deben poder generalizarse a toda la población con cierto grado de precisión. c) Práctica. Debe ser sencilla de llevar acabo. d) Eficiente. Debe proporcionar la mayor información con el menor costo. DATOS: Son las medidas, valores o características susceptibles de ser observadas y contadas. VARIABLES: Es una propiedad o característica de algún evento, objeto o persona, que puede tener diversos valores en diferentes instantes, según las condiciones. La altura, el peso, el tiempo de reacción y la dosis de un medicamento, son ejemplos de variables. Las variables son las herramientas fundamentales de la estadística y se clasifican de la siguiente manera: En las VARIABLES CATEGÓRICAS los valores pueden ser EXPRESIONES y también estas expresiones pueden ser sustituidas por SÍMBOLOS que nos permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada por el valor de la variable. Hagamos unos ejemplos: 10 Si queremos saber la forma en que se trasladan los estudiantes del CBTA-XALISCO para recibir sus clases grupales; preguntaremos a cada estudiante del grupo, si usualmente se trasladan de su casa a la escuela CAMINANDO o EN ALGÚN VEHICULO, por lo tanto los valores de la variable serán (C) "caminando" o (V) " Vehículo" y se clasifican a los alumnos en éstas dos categorías. Otro ejemplo: Si quisiéramos conocer la materia que prefieren los estudiantes de una lista de 4 materias en donde se incluyen Ciencias Sociales, Matemáticas, Ciencias Naturales y Español; En este caso la materia de preferencia puede tomar cuatro valores: (CS) que es Ciencias Sociales; (M) que es Matemáticas, (CN) Ciencias Naturales y (E) será Español. Es claro pues que la variable, materia de preferencia clasifica a los estudiantes en cuatro categorías. Observa que los valores que pueden tomar las variables en los ejemplos anteriores son EXPRESIONES y que estas expresiones han sido sustituidas por SÍMBOLOS que nos permiten diferenciar la categoría a la que pertenece cada individuo, la cual está determinada por el valor de la variable. Los ejemplos anteriores son VARIABLES CATEGÓRICAS NOMINALES. Veamos ahora otros ejemplos de VARIABLES CATEGÓRICAS: Si deseamos saber si el contenido de la materia de Procesos de Producción Pecuaria tiene relación con las prácticas de campo que se realizaron el semestre pasado y le pedimos la opinión a cada estudiante, los valores que puede tomar la variable pueden ser: "Nunca" (A), "Raras veces" (B), "Algunas veces" (C), Casi siempre" (D) y "Siempre" (E). Observe que esta variable clasifica a cada uno de los estudiantes que contestaron la pregunta, según la opinión que haya elegido. Otro ejemplo: Si queremos saber cómo se alimentan los estudiantes del CBTA-XALISCO, para relacionarlo con el aprovechamiento escolar, preguntaremos cada semana a todos los estudiante del grupo, cuáles alimentos ingirieron durante la semana y clasificamos la variable calidad de la alimentación de la siguiente manera: “MD” al alumno que se alimentó muy deficientemente, “D” el de alimentación deficiente, “R” el de alimentación regular, “B” el de alimentación buena y “MB” el de alimentación muy buena. Con esto todos los estudiantes del grupo, quedarán distribuidos en cinco posibles categorías. Observa que los valores de las variables también son EXPRESIONES, sin embargo, entre los valores de estos dos ejemplos últimos hay UN ORDEN. Los ejemplos anteriores SON VARIABLES CATEGÓRICAS ORDINALES. Si comprendiste, escribe con tus propias palabras: ¿Cuándo es variable Categórica nominal? ______________________________________________________________________ ¿Cuándo es una variable Categórica Ordinal? 11 ______________________________________________________________________ Ahora con las VARIABLES NUMÉRICAS. En las variables numéricas, sus valores no son expresiones sino NUMEROS y es en donde además tiene sentido efectuar operaciones aritméticas con ellos y compararlos. 12 Si los valores de la variable son NÚMEROS ENTEROS, se llamará NUMÉRICA DISCRETA, pero si los valores de la variable pueden tomar CUALQUIER VALOR NUMÉRICO en algún intervalo de números reales (con decimales o fracciones), la variable será NUMÉRICA CONTINUA. Hagamos unos ejemplos: Si queremos saber el número de hermanos de los alumnos del CBTA-XALISCO. Serán desde cero en adelante y como es lógico no puede haber medio hermano o tres cuartos de hermano, por lo tanto la variable número de hermanos es una variable numérica discreta. Otro ejemplo será el número de preguntas acertadas en un examen de conocimientos; los años cumplidos de los estudiantes, el número de materias que cursan en el quinto semestre, etc.... Ya que son variables numéricas que pueden tomar sólo valores enteros. Veamos por último los ejemplos de las variables numéricas continuas: Si queremos saber la estatura de los alumnos del quinto semestre con una aproximación a milímetros, tendríamos que utilizar una regla de dos metros y dividida en centímetros y milímetros. Los valores posibles de la variable serán todos los números pertenecientes a algún intervalo. Otro ejemplo es El peso que tienen las personas que asisten a un evento será también una variable numérica continua, pues podrán pesar kilos, con gramos y hasta miligramos, dependiendo de la precisión que queramos los resultados. Si observas estas variables numéricas pueden tomar cualquier valor en algún intervalo. AHORA TE TOCA PRACTICAR LOS SIGUIENTES EJERCICIOS: ACTIVIDADES DE APRENDIZAJE: Describe los valores que pueden tomar las siguientes variables y escribe si ésta es, una variable categórica nominal, categórica ordinal, numérica discreta o numérica continua: a) El Género (sexo) de cada alumno del grupo de quinto semestre. Variable: __________________________________________ b) La cantidad de estudiantes en cada grupo de una escuela: Variable: _________________________________________ c) El Peso de los niños mexicanos de 6 años. Variable: ________________________________________ 13 d) El daño causado a los pulmones de los jóvenes que fuman. Variable: _______________________________________ e) Tipo de material con el que se construyen los techos de las viviendas de una localidad. Variable: ________________________________ f) El número de naranjas producidas por cada naranjo en una huerta. Variable: _______________________________________ g) La cantidad de afecto o amor que siente un niño por su mamá. Variable: ______________________________________ h) El tiempo de reacción de una sustancia química en el laboratorio. Variable: ______________________________________ REDONDEO DE DATOS Dado que estaremos dando nuestras respuestas finales con dos decimales y en ciertas ocasiones hasta con cuatro cifras decimales, necesitamos decidir cómo determinar el valor de los últimos dígitos. Si nuestro resultado final tiene ENTEROS redondearemos a DOS DECIMALES Primer ejemplo cuando el residuo es menor que 0.5: 34.01350 = 34.01 es la respuesta potencial y .350 el residuo; como .350 es menor que 0.5, el último dígito de la respuesta potencial permanece sin cambio y la respuesta final es 34.01 Segundo ejemplo cuando el residuo es mayor que 0.5: 34.01761 34.01 es la respuesta potencial y .761 el residuo; como .761 es mayor que 0.5, al último dígito de la respuesta potencial debemos sumar 1 al último dígito, por lo que la respuesta correcta es 34.02 Tercer ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es impar: 43.07500 43.07 es la respuesta potencial y .500 el residuo; como es impar el último dígito de la respuesta potencial se AUMENTA 1, por lo que la respuesta correcta es 43.08 Cuarto ejemplo cuando el residuo es igual a 0.5 y el último dígito de la respuesta potencial es par: 17.06500 17.06 es la respuesta potencial y .500 el residuo; como es par el último dígito de la respuesta potencial NO se aumenta 1, por lo que la respuesta correcta es 17.06 Si nuestro resultado final tiene puras DECIMALES redondeamos a CUATRO DECIMALES 14 Siguiendo los mismos principios anteriores, si tenemos una cifra de 0.7544762 su respuesta correcta es 0.7545; en cambio si es 0.1136211 la respuesta correcta es 0.1136; si tenemos que 0.3463500 lo correcto será 0.3464; finalmente si tenemos 0.7728500 lo correcto será 0.7728. ACTIVIDADES DE APRENDIZAJE DE “REDONDEO”. Redondea las siguientes cifras: 22.666666 = __________________ 0.7654598 = ___________________ 57.87754 = ____________________ 0.0663597= ___________________ 3876.2255 = ___________________ 0.3877865 = ___________________ 99.7156 = _____________________ 0.005329 = _____________________ NOTACIÓN SISTEMATIZADA En estadística, por lo general, trabajamos con datos agrupados resultantes de medir una o más variables. Con gran frecuencia, los datos se obtienen de las muestras y en ocasiones de las poblaciones. Para fines matemáticos, generalmente se utiliza la letra mayúscula X y a veces la Y, para representar la(s) variable(s). Así, si estuviéramos midiendo la edad de los sujetos, haríamos que X represente la variable “edad”. Si existen muchos valores de la variable agregamos un subíndice al símbolo X. Ilustramos este proceso en la siguiente tabla, la cual contiene las edades de seis sujetos: Número de sujeto Símbolo del dato Valor del dato, edades 1 2 3 4 5 6 X1 X2 X3 X4 X5 X6 8 10 7 6 10 12 En este ejemplo representamos la variable “edad” mediante el símbolo X, además, N representa el número total de datos que hay en la distribución. En este ejemplo, N = 6, Cada uno de los seis datos representa un valor específico de X. Distinguimos los seis datos diferentes, al agregar un subíndice a X, correspondiente al número de sujeto que tiene el valor dado. Así, el símbolo X1 corresponde al valor del dato 8, X2 al valor del dato 10 hasta el X6 al 12. En general, podemos referirnos a un único dato de la distribución X como Xi, donde i puede asumir cualquier valor de 1 a N, según el dato que queramos designar. En resumen: X o Y representa la variable medida. N representa el número total de sujetos o datos. Xi es el i-ésimo dato, donde i puede variar de 1 a N CIFRAS SIGNIFICATIVAS: En la estadística analizamos datos; este análisis implica muchos cálculos matemáticos. Con mucha frecuencia tenemos un residuo decimal, por ejemplo, después de realizar una división. 15 Cuando esto ocurre, necesitamos decidir la cantidad de cifras decimales que utilizaremos para el residuo. En las ciencias físicas, por lo general, se utiliza el mismo número de cifras significativas que tienen los datos en bruto, Por ejemplo, si medimos el peso de cinco sujetos hasta tres cifras significativas (173, 156, 162, 165, y 175 libras) y queremos calcular el promedio de estos pesos, nuestra respuesta debe contener sólo tres cifras significativas. Así X 173 156 162 165 175 831 X 166.2 166 N 5 5 La respuesta de 166.2 se redondea a tres cifras significativas, dando un resultado final de 166 libras. Por varias razones y mas por continuar una tradición, en el presente curso de estadística utilizaremos DOS cifras decimales redondeadas cuando el resultado tenga ENTEROS y CUATRO cifras decimales cuando NO EXISTAN ENTEROS, sin importar las cifras significativas de los datos en bruto. Así cuando se pida que el resultado tenga dos cifras decimales, debemos realizar los cálculos intermedios con al menos CUATRO cifras decimales y redondear la respuesta final a dos cifras. CÁLCULOS Una de las operaciones que se realizan con más frecuencia en estadística consiste en sumar todos o una parte de los datos que pertenecen a una distribución. Como no es práctico escribir “suma de todos los datos” cada vez que se necesite emplear esta operación, particularmente en las ecuaciones, se utiliza una abreviatura simbólica. La letra griega mayúscula sigma ( ∑ ) indica la operación de sumatoria. La frase algebraica utilizada para la sumatoria es: N X i 1 i Esta expresión se lee como “la suma de la variable X de i = 1 a N”. Las notaciones que aparecen arriba y debajo del signo de la sumatoria indican los datos que deben incluirse en la operación. El término que aparece debajo del signo de la sumatoria nos indica el primer dato en esta operación, y el término que se encuentra arriba de dicho signo indica el último dato. Así, esta frase señala que debemos sumar los datos X, comenzando con el primero y concluyendo con el N-ésimo dato. Así. N X i 1 i X 1 X 2 X 3 ... X N Ecuación de una sumatoria Al “aplicar la sumatoria” a los datos de las edades de la tabla anterior, tenemos que: N X i 1 i X1 X 2 X 3 X 4 X 5 X 6 = 8 + 10 + 7 + 6 + 10 + 12 = 53 Cuando la sumatoria se realiza con todos los datos (de 1 a N), es frecuente que la propia frase de esta operación se abrevie, omitiendo las notaciones arriba y abajo del signo de la N suma, al igual que el subíndice i. Así. X X Se abrevia con frecuencia como i i 1 En el ejemplo anterior, = 53 Esta expresión indica que la suma de todos los datos X es X 53. 16 Observa que no es necesario que la sumatoria se realice de 1 a N, Por ejemplo, podríamos querer sumar sólo el segundo, tercer, cuarto y quinto dato. Recuerda que la notación debajo del signo de la sumatoria nos dice dónde comenzar la suma, y el término arriba de 5 terminarla. dicho signo nos dice dónde Xi Utilizaríamos el símbolo Para los datos anteriores, tenemos que: i 2 N X i 1 i X 2 X 3 X 4 X 5 10 7 6 10 33 3 X Resolvamos algunos ejemplos: i 1 i Para los siguientes datos, determine X1= 10, X2 = 12, X3 = 13, X4= 18 3 Por lo tanto: X i 1 i 10 12 13 35 4 X Para los siguientes datos, determine X6=31 4 Por lo tanto: X i 2 i i 2 3: X 1=20, X2=24, X3=25, X4=28, X5=30, 3 (24 25 28) 3 80 4 Para los siguientes datos, determine X6=31 4 Por lo tanto: i ( X i 2 i (X i 2 i 3) X 1=20, X2=24, X3=25, X4=28, X5=30, 3) (24 3) (25 3) (28 3) 86 Existen otros dos tipos de sumatorias que veremos con frecuencia en estadística y son: ∑X 2 y (∑X)2. Aunque se parecen, son distintos y, en general, proporcionan diferentes respuestas. El símbolo ∑X2 (suma de los cuadrados de los datos X) indica que primero debemos elevar el cuadrado de los datos X y luego sumarlos. Así:, X 2 X 12 X 22 X 32 ... X N2 El símbolo (∑X)2, o (el cuadrado de la suma de los datos X), indica que primero debemos sumar los datos X y luego elevar al cuadrado la suma resultante. Así, ( X ) 2 ( X 1 X 2 X 3 ... X N ) 2 La confusión es muy común cometerlo, sobre todo cuando se calculan las desviaciones estándar, eso lo analizaremos un poco mas adelante. ACTIVIDADES DE APRENDIZAJE “CÁLCULO” Primer ejercicio si X1=3; X2=6; X3=8; X4=2; X5=9; X6=1; X7=5 17 7 X i 3 i 5 (X i 1 4 X i 2 i i 12) 205 Segundo ejercicio si X1=10; X2=7; X3=3; X4=16; X5=2; X6=22; 6 ( X i ) 8 2 i 2 5 ( X i ) 2 510 i 1 DISTRIBUCIONES DE FRECUENCIAS 18 La Tabla de Distribución de Datos o Tabla de Distribución de Frecuencias, además de ser un instrumento útil para resumir un conjunto de datos obtenidos en una investigación, es una herramienta muy importante con que cuenta la estadística para realizar las observaciones de manera rápida y sencilla. Para construir dicha Tabla realizaremos siete pasos y para tu mejor aprendizaje, desarrollaremos un ejemplo con una variable numérica continua, ya que deseamos conocer el “tiempo en minutos que emplearon para estudiar” 50 estudiantes del CBTA en la materia de estadística 1. PASO UNO: TOMA Y ORDENACIÓN DE DATOS: La recopilación de los datos consiste en asistir al grupo de estudiantes y obtener los valores mediante una pregunta abierta sobre el tiempo en minutos que emplearon para estudiar el tema de estadística o si desconfiamos, podemos medir directamente el tiempo durante las asesorías que emplearon cada uno de los alumnos al estudiar estadística. En resumen para recopilar los datos debemos "asistir" al lugar donde vamos a 'tomar" o "levantar" los datos. Esto puede ser mediante entrevistas, cuestionarios, observaciones o mediciones directas a los individuos o cosas que corresponda nuestra variable. Supongamos que los 50 datos obtenidos en nuestra variable: tiempo de estudio de la materia de estadística en minutos fueron los siguientes y que corresponden a los 50 estudiantes: 75 60 80 67 81 71 74 63 72 70 76 62 82 63 81 66 78 68 80 74 67 74 84 70 63 77 68 82 74 72 76 64 75 80 69 85 71 79 60 74 83 75 67 72 78 64 77 81 76 70 La Ordenación de los datos consiste en colocar los datos tomados en orden creciente (de menor a mayor) o decreciente (de menor a mayor). Nosotros los vamos a ordenar en forma creciente y sobre todo "contando" y "anotando" los que se repitan, que será la frecuencia. Ordenación de datos: DISTRIBUCIÓN DE FRECUENCIAS 19 Tiempo empleado en minutos 60 62 63 64 66 67 68 69 70 71 72 74 75 76 77 78 79 80 81 82 83 84 85 Conteo // / /// // / /// // / /// // /// ///// /// /// // // / /// /// // / / / Total Frecuencia 2 1 3 2 1 3 2 1 3 2 3 5 3 3 2 2 1 3 3 2 1 1 1 50 Es importante que la suma total sea igual al número de datos que tomamos en la investigación. PASO DOS: RANGO. El rango o recorrido es la diferencia que hay entre el dato mayor y el menor. Una vez que se ordenaron los datos en forma creciente obtenemos el rango 85 60 25 que es el dato mayor que es el dato menor será el rango o recorrido PASO TRES: INTERVALOS DE CLASE. Cuando se tiene un gran número de datos, se recomienda distribuirlos en clases o categorías llamadas intervalos de clase o celdas. Para decidir la cantidad de intervalos de clase que se van a utilizar (o número de clases) y la amplitud de los intervalos (o ancho del intervalo) se siguen las siguientes operaciones: Primero el NÚMERO DE CLASES o INTERVALOS se obtienen con la fórmula: Q = 1 + 3.322 (log. n) donde n es el número de datos y log. Es el logaritmo de dicho número. Siguiendo el ejemplo tenemos: Q = 1+ 3.322 (og. 50) observa que obtendremos el logaritmo de 50. En una calculadora el logaritmo de 50 es 1.69897... Redondeando su valor será 1.70 Este valor lo multiplicamos por 3.322 y nos da en la calculadora 5.64... Que redondeado será 5.64 y finalmente le sumamos 1 a dicha cantidad arrojándonos = 6.64 Si el número que nos arroje la formula tiene su 20 primera decimal igual o mayor que .5 se aumenta el entero. Así en nuestro ejemplo tenemos que 6.6 seria igual a 7. En resumen y de acuerdo a la formula el número de intervalos será de 7 Resulta claro que si lo ancho del intervalo es de 4 y el número de intervalos son 7; (4 ) (7) = 28 se cubrirá todo el rango que es de 25. Debemos hacer uso de los Límites reales Inferiores (L.R.I.), quitando 0.5 al dato más chico que en nuestro caso es de 60 minutos. Por lo tanto será de 59.5 el L.R.I. Luego a este se le suma lo ancho del intervalo que es de 4 resultando 63.5 que es el Límite Real Superior (L.R.S.) por lo que ahora si podemos decir que los dos datos 64 se deberán anotarse en el 2do. Intervalo que iniciaría en 63.5 hasta 67.5 como límite real superior. Ahora si podemos construir cada uno de los intervalos con sus límites reales inferiores y limites reales superiores. ADELANTE AYÚDANOS A COMPLETAR EL SIGUIENTE CUADRO, Recuerda que el ancho de cada intervalo es de 4 y que en total son siete (7) intervalos de acuerdo a las operaciones realizadas anteriormente: INTERVALOS DE CLASE Límite Real Inferior Límite Real Superior 59.5 63.5 63.5 71.5 71.5 79.5 87.5 PASO CUATRO: TAMAÑO DEL INTERVALO DE CLASE. Con los datos del ejemplo, el dato más bajo es el 60 y como el ancho del intervalo es de 4, su límite superior será de 64. El siguiente intervalo sería 64 más 4 del ancho del intervalo nos da 68 como limite superior y así sucesivamente. ... Intervalos 60 64 68 72 a a a a 64 68 72 etc… Observación Importante: Si te fijas detenidamente en los intervalos y los datos ordenados del cuadro anterior; los dos datos de 64 quedarían comprendidos en el 1er. y 2do. Intervalo, es decir, pueden anotarse en el primero o en el segundo intervalo, también los 72 en el 3er o 4to intervalo; pero se sabe que una observación dada (los 64 y 72) deben colocarse en uno y solamente uno de los intervalos de clase. Ahora para el ANCHO DEL INTERVALO: Se divide el rango entre el número de intervalos para obtener la anchura de cada intervalo o celda. 21 Rango = Número de intervalos = 25 7 = 3.57 redondeando será igual a 4 Por lo tanto el ancho del intervalo será de 4 PASO CINCO: MARCA DE CLASE. La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los límites reales inferiores más los límites reales superiores, dividiendo el resultado entre dos. Hagámoslo practicando...Llena los espacios que faltan. Se suma 59.5 + 63.5 = 123 = 61.5 2 Intervalos de Clase L.R. Inferior L.R. Superior 59.5 63.5 63.5 67.5 67.5 71.5 71.5 75.5 75.5 79.5 79.5 83.5 83.5 87.5 MARCA DE CLASE 61.5 85.5 ¿Como voy hacerle aceboman? PERO SI UNA GRÁFICA O DIBUJO DICE MAS QUE 100 PALABRAS 22 ¿CÓMO PODEMOS PRESENTAR LOS DATOS DE UNA VARIABLE NUMÉRICA EN UNA GRÁFICAS? HISTOGRAMA y POLÍGONO DE FRECUENCIAS. Cuando las variables son cuantitativas o numéricas sean discretas o continuas la representación gráfica más común es el HISTOGRAMA DE FRECUENCIAS y el POLÍGONO DE FRECUENCIAS. HISTOGRAMA DE FRECUENCIAS: Este tipo de gráfica consiste en una serie de rectángulos trazados en un sistema de coordenadas cartesianas o rectangulares. Para realizar el histograma es necesario agrupar los datos en intervalos de clase, con sus límites reales inferiores y superiores, además de su frecuencia absoluta. Los rectángulos tienen sus bases sobre el eje horizontal con centros en las marcas de clase y su longitud es igual a la anchura de los intervalos de clase. La altura de cada rectángulo corresponde al valor de la frecuencia que tenga el intervalo que representa. En éstos histogramas los rectángulos se trazan adyacentes entre si. ¡¡¡ VAMOS A PRACTICARLO PARA APRENDER MEJOR!!! De acuerdo a los datos de la "Tabla de distribución de frecuencias" del ejemplo (pag.16), donde analizamos el tiempo que dedican a estudiar la materia de estadística 50 estudiantes, vamos a construir su Histograma de Frecuencias. Histograma: F R E Tiempo en minutos dedicados a estudiar Estadística por 50 estudiantes 23 14 12 10 8 6 4 2 0 59.5 63.5 67.5 61.5 71.5 75.5 79.5 83.5 87.5 INTERVALOS DE CLASE (con sus L.R.I. y L.R.S.) Si observas en el eje vertical de las "Y", se ubican las frecuencias absolutas, mientras que en el eje horizontal de las "X" se ubican los intervalos de clase en donde cada límite real superior corresponde al límite real inferior del siguiente intervalo. Las marcas de clase (61.5) aunque es permitido no escribirse en el histograma, se pueden ubicar ya que corresponde al punto medio de cada intervalo. Como habrás observado, el histograma nos ayuda a mostrar la frecuencia absoluta con que se presentan algunos datos; otra forma de gráfica son los… 14 F R E C U E N C I A S 12 10 8 6 4 2 0 61.5 65.5 69.5 73.5 77.5 81.5 85.5 MARCAS DE CLASE (puntos medios) POLÍGONOS DE FRECUENCIA. 24 Los polígonos de frecuencia también se construyen a partir de datos con variables cuantitativas o numéricas y se puede realizar a partir de un histograma si se desea. Una vez trazado el histograma, se localizan los puntos medios o marcas de clase en la parte superior de cada uno de los rectángulos o intervalos de clase. Se trazan segmentos de recta que unen cada punto medio de cada uno de los intervalos. Este polígono se encierra uniendo con el eje horizontal en el punto que corresponde al punto medio de un rectángulo imaginario y adyacente al histograma, esto se hace en los extremos izquierdos y derechos del polígono. ¡¡¡VAMOS HACIÉNDOLO CON EL MISMO EJEMPLO!!! En el histograma se localizan los puntos medios en la parte superior de cada intervalo de clase y en el eje horizontal, se indican las marcas de clase o puntos medios de cada intervalo. Construyamos un polígono.... 14 F R E C U E N C I A S Polígono de Frecuencia: Tiempo en minutos dedicados a estudiar Estadística por 50 estudiantes 12 10 8 6 4 2 0 61.5 65.5 69.5 73.5 77.5 81.5 85.5 MARCAS DE CLASE (Puntos medios) Para trazar el polígono de frecuencia unimos con rectas los puntos medios o marcas de clase con su frecuencia absoluta respectiva, en donde estaban la parte alta de los rectángulos del histograma. ACTIVIDADES DE APRENDIZAJE: Dibuja en ésta hoja el HISTOGRAMA y el POLIGONO DE FRECUENCIAS del ejercicio de la página 16. HISTOGRÁMA: “Estatura de 55 estudiantes” 25 POLÍGONO DE FRECUENCIAS. “Estatura de 55 estudiantes” Escribe las conclusiones más importantes que nos indican las gráficas anteriores: ______________________________________________________________________ ______________________________________________________________________ PASO SEIS: FRECUENCIA RELATIVA. La Frecuencia Relativa, es la frecuencia que se representa con un Tanto por Ciento ( % ) y se obtiene al dividir la frecuencia de un intervalo de clase entre el total de frecuencias de todas las celdas por cien. La frecuencia Relativa se emplea para mostrar la proporción o 26 porcentajes de los valores incluidos en los intervalos de clase, por lo que también se le llama Distribución Porcentual. SIGAMOS PRACTICANDO Y APRENDIENDO. Del 1er. y 2do Intervalos; Frecuencia Relativa de clase = 6 = 0.12 x 100 = 12 % 50 Del 6to intervalo; La Frecuencia Relativa = 9 = 0.18 x 100 = 18 % 50 Con todos los datos anteriores, finalmente construyamos nuestra… Tabla de distribución de frecuencias de una variable numérica “Tiempo dedicado a estudiar la materia de estadística” Intervalos de Clase Marca de Frecuencia Frecuencia L.R.I. L.R.S. Clase Absoluta Relativa (%) 59.5 - 63.5 61.5 6 12 63.5 - 67.5 65.5 6 12 67.5 - 71.5 69.5 8 16 71.5 - 75.5 73.5 11 22 75.5 - 79.5 77.5 8 16 79.5 - 83.5 81.5 9 18 83.5 - 87.5 85.5 2 4 TOTAL = 50 100% PASO SIETE: DISTRIBUCIÓN DE FRECUENCIAS ACUMULADAS Así se llama al número de observaciones que pertenecen aun determinado intervalo. Para obtener las frecuencias de cada clase es necesario contabilizar las observaciones, valores o casos pertenecientes a cada intervalo, utilizando el cuadro donde ordenamos los datos que está en la página 13. . Sigamos Practicando INTERVALOS DE CLASE MARCA DE FRECUENCIA L.R. Inferior L.R. Superior CLASE ABSOLUTA 59.5 63.5 61.5 6 (2+1+3) 63.5 67.5 65.5 67.5 71.5 69.5 71.5 75.5 73.5 11 (3+5+3) 75.5 79.5 77.5 79.5 83.5 81.5 83.5 87.5 85.5 2 (1+1) TOTAL = 50 Con los datos anteriores terminamos los componentes principales del cuadro que también recibe el nombre de... "TABLA DE DISTRIBUCIÓN DE FRECUENCIAS" por lo que... Ya podemos obtener algunas CONCLUSIONES de nuestra investigación. EJEMPLO DE ALGUNAS CONCLUSIONES… Te recordamos que los 50 datos son del tiempo en minutos dedicado a estudiar estadística por los estudiantes. Si analizamos detenidamente sus datos, podemos ver que el mayor número de casos (frecuencia absoluta) es 11 y dedican de 71.5 a 75.5 minutos en estudiar (su intervalo) pero además representan el mayor porcentaje con un 22% del total. 27 Caso contrario, son lo que dedican de 83.5 a 87.5 minutos en estudiar pues únicamente son 2 y representan un 4 % del total. Si observamos en global el cuadro, podemos decir que la mayoría de los estudiantes (Los intervalos 3,4 y 5) dedican de 67.5 a 79.5 minutos en estudiar y representan el 54 % del total. Analizando otros datos podremos obtener más conclusiones de nuestro trabajo e ir descubriendo lo importante de nuestra investigación. Mas adelante aprenderás a realizar GRÁFICAS con los datos obtenidos de la tabla de frecuencias. Quedamos pendientes. .. , AHORA REALIZA LA SIGUIENTE ACTIVIDAD DE APRENDIZAJE: 1) siguiendo los siete pasos para una variable numérica, ordena los datos de la siguiente variable y realiza las operaciones correspondientes hasta obtener completa la "tabla de distribución de frecuencias" de las “Estaturas de 55 estudiantes” con aproximación de un centímetro. Datos: 154 160 159 161 162 165 173 168 161 160 156 160 149 174 170 160 161 163 160 163 159 166 169 168 168 170 162 157 152 157 151 153 162 169 165 163 163 159 165 159 166 156 168 156 163 166 170 155 166 160 153 165 163 166 160 Aquí realiza los siete pasos y tus cálculos correctamente hasta llenar tu Tabla de distribución de frecuencias Paso 1 Ordenación de datos. Paso 2 Rango... etc Tabla de distribución de frecuencias de una variable numérica “______________________________________________________” Intervalos de Clase L.R.I. L.R.S. Marca de Clase Frecuencia Absoluta Frecuencia Relativa (%) TOTAL = PRINCIPALES CONCLUSIONES: 28 1.____________________________________________________________________ 2.____________________________________________________________________ 3_____________________________________________________________________ DISTRIBUCIÓN DE FRECUENCIA RELATIVA ACUMULADA 29 Ahora estudiemos como se construye la DISTRIBUCIÓN DE FRECUENCIA ACUMULADA y su gráfica LA OJIVA además de la FRECUENCIA RELATIVA ACUMULADA. La frecuencia total de todos los valores menores que el límite real superior de un determinado intervalo de clase, es conocida como frecuencia acumulada incluyendo hasta este intervalo. Lo anterior lo comprenderás mejor si nos ayudas a resolver el ejemplo que sigue: Si tomamos los datos obtenidos al medir el “tiempo en minutos que emplearon los estudiantes en ir de su casa a la escuela”. Se construye la siguiente tabla de distribución de frecuencias y una columna que corresponde a la distribución de frecuencia acumulada y otra a la frecuencia relativa acumulada. Concluyen los datos que faltan en la frecuencia acumulada de clase, de tal forma que sumen un total de 243. En la columna de frecuencia acumulada relativa, también calcula los espacios que faltan hasta que obtengas el 100% INTERVALO DE CLASE MARCA DE CLASE 9.5 – 12.5 12.5 –15.5 15.5 – 18.5 18.5 – 21.5 21.5 – 24.5 24.5 – 27.5 27.5 – 30.5 30.5 – 33.5 33.5 – 36.5 T O T A L: 11 14 17 20 23 26 29 32 35 FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA % 3 4 6 7 9 8 5 3 2 47 6.38% 8.51% 12.77% 14.89% 19.15% 17.02% 10.64% 6.38% 4.26% 100% FRECUENCIA ACUMULADA 7 13 20 3 (3+4 ) (7+6) ( ) FRECUENCIA RELATIVA ACUMULADA 3/47X 100= 6.38% 7/47X100=14.89% 100% 243 LA OJIVA O POLÍGONO DE FRECUENCIA ACUMULADA. Se le llama ojiva o polígono de frecuencia acumulada, a la gráfica que muestra la distribución de frecuencia acumulada. Al construirla, los intervalos de clase se disponen en el eje horizontal, y las frecuencias acumuladas se representan en el eje vertical. Luego se unen los puntos localizados mediante segmentos. Para entender la forma en que se traza una ojiva, considere el ejemplo de los datos obtenidos al registrar el tiempo empleado por los estudiantes para ir de su casa a la escuela. Primero se coloca un punto sobre el eje horizontal donde está el 9.5, puesto que no hay observaciones de ésta o de inferior magnitud. Luego se traza el siguiente punto en el 12.5 a la altura del 3, esto se puede hacer porque hay 3 registros iguales o menores de 12.5 de esta manera se continúan representando el resto de los puntos. 30 Ejemplo: Tomando como base la distribución de frecuencia acumulada del ejemplo anterior, y el tiempo en minutos que emplean los integrantes de un grupo de estudiantes de ir de su casa a la escuela, construyamos la ojiva correspondiente: 50 45 FRECUENCIA ACUMULADA 40 35 30 25 20 15 10 5 0 9.5 12.5 15.5 18.5 21.5 24.5 27.5 30.5 33.5 INTERVALO DE CLASE ¿Esto es una ojiva Aceboman? Yo creía que era la carga explosiva de un misil de USA En esta página transfiere los datos de la tabla de distribución de frecuencias del ejercicio de la página 16 y en las dos columnas últimas obtén la FRECUENCIA ACUMULADA y la FRECUENCIA RELATIVA ACUMULADA, además construye su gráfica llamada OJIVA. 31 TABLA DE DISTRIBUCIÓN DE FRECUENCIAS INTERVALO DE CLASE MARCA DE CLASE FRECUENCIA ABSOLUTA FRECUENCIA ACUMULADA FRECUENCIA RELATIVA ACUMULADA 100% T O T A L: 55 227 DIBUJA LA OJIVA O POLIGONO DE FRECUENCIA ACUMULADA 32 MEDIDAS DE TENDENCIA CENTRAL PROMEDIOS En estadística al promedio se le conoce como medida de tendencia central, ya que está localizado hacia el medio o centro de una distribución, en la que la mayoría de los valores tenderán a concentrarse. Entre los más comunes se pueden mencionar: la media aritmética, la mediana y la moda Media Aritmética MEDIDAS DE TENDENCIA CENTRAL Mediana Moda LA MEDIA ( X ). La media aritmética o simplemente media, es el promedio aritmético de un conjunto de observaciones y “se obtiene al sumar todos los datos y dividir dicha suma entre el total de datos”. MEDIA ARITMÉTICA PARA DATOS NO AGRUPADOS. Algebraicamente se representa como: Donde: X = X 1 X 2 X 3 ... Xn n X es la media aritmética de la muestra X1 , X2, X3, ... Xn son los datos de la muestra y “n” es el total de los datos de la muestra. Ejemplo: En la muestra siguiente la media aritmética es: X = 30 32 32 32 32 34 34 34 34 34 34 36 36 36 36 36 38 38 38 40 20 X= 696 = 34.8 20 Obsérvese que la “media” no necesariamente tiene que ser uno de los valores de la muestra. Una manera más sencilla de encontrar esta “media aritmética” es multiplicando cada dato por su frecuencia y continuar el proceso respectivo, como se ilustra a continuación: X = 1(30) 4(32) 6(34) 5(36) 3(38) 1(40) 20 33 X= 30 128 204 180 114 40 20 X= 696 20 X = 34.8 Principales características de la media aritmética: 1. El cálculo de la media aritmética está basado en todos los valores de un conjunto de datos. El valor de cada elemento en los datos afecta el valor de la media. 2. Cuando algunos valores extremos son incluidos en los datos, la media puede llegar a ser menos representativa del conjunto de valores. 3. La media tienen dos propiedades matemáticas importantes que proporcionan un análisis matemático adicional, haciéndola más popular que cualquier otro tipo de promedio. a. La suma algebraica de las desviaciones de los valores individuales respecto a la media, es cero. b. La suma del cuadrado de las desviaciones con respecto a la media es mínima. ~ LA MEDIANA ( X ) (Me) ~ La mediana ( X ) de una muestra de “n” datos, se localiza en la mitad de la muestra del conjunto de elementos ordenados de mayor a menor o viceversa. o Su característica principal es dividir el conjunto ordenado en 2 grupos iguales; la mitad de los números tendrá valores que son “menores que” la mediana y la otra mitad alcanza “valores mayores” que ésta. MEDIANA PARA DATOS NO AGRUPADOS Si el número de elementos es impar, se toma el dato central; si es par la mediana está dada por el promedio de los datos centrales, pudiéndose obtener un valor no dado en la muestra. Ejemplo: ¿Cuál es la mediana aritmética de 3, 4, 4, 5, 6, 8, 8, 10? Como los números están ya ordenados, la mediana es Me = 5+6 / 2 = “5.5“, Otro ejemplo: 5.1, 6.5, 8.1, 9.1, 10.1, 15.5, Como los números están ordenados, la mediana es Me = 8.1+9.1 / 2 = 8.6 Principales características de la mediana 1. La mediana es un promedio de posición y por su forma de cálculo no es afectada por valores extremos. 2. La mediana no está definida algebraicamente como lo está la media aritmética. 34 3. La mediana en algunos casos, no puede ser calculada exactamente como sí puede serlo la media. 4. Cuando el número de elementos incluidos en una serie de datos es par, la mediana es aproximadamente el punto medio de los elementos centrales en una serie de datos. ^ LA MODA ( X ) (Mo) La moda se define como el valor que tiene la mayor frecuencia (o que se repite mas) en un grupo de datos, Hay casos en que la moda no es única, esto es, puede ser bimodal con dos modas, o trimodal con tres modas. También hay casos en que la moda no existe. MODA PARA DATOS NO AGRUPADOS. Ejemplo: ¿Cuál es la moda de la serie: 4, 5, 5, 6, 7, 7, 7, 8, 9, 1 La Moda es Mo = 7 porque es el número que más se repite. Otro ejemplo: 60, 74, 82, 85, 90, 95, La moda no existe. Otro ejemplo: 10,12, 14, 16, 17, 17, 18, 19, 20, 20, 21. La moda es bimodal o sea, Mo = 17 y 20 Principales características de la Moda. 1. La moda representa más elementos que cualquier otro valor dentro de un conjunto de datos. 2. La moda no se calcula incluyendo todos los valores y no está definida algebraicamente como si lo está la media. 3. La moda no es afectada por valores extremos. 4. Para una distribución de frecuencias, la moda no puede ser calculada exactamente, como si puede serlo la media. En resumen, hagamos una comparación de estas tres medidas de tendencia central. COMPARACIÓN DE LA MEDIA, MEDIANA Y MODA. En comparación con la media y la mediana, la moda es la menos útil para la mayoría de los problemas estadísticos, ya que no se inclina por un análisis matemático, en el mismo sentido que lo hacen las otras dos. Sin embargo, desde un punto de vista puramente descriptivo, la moda es indicativa del valor típico en términos del valor que se presenta con mayor frecuencia. La moda es más útil cuando uno o dos valores, o un grupo de éstos, ocurren con 35 mayores frecuencias que otros. Por el contrario, cuando la mayoría o todos los valores se presentan casi con la misma frecuencia, la moda no sirve para describir datos. Comparación entre la media, mediana y moda para datos no agrupados. Medida Definición Media Aritmética Es la suma de los valores de cierto número de cantidades, dividido entre su número. Mediana Moda Es el valor que divide un conjunto de datos previamente ordenados. Ventajas 1. Refleja cada valor. 2. Tiene propiedades matemáticas atractivas. 3. Todos los valores afectan su resultado. 4 Si se quiere calcular los totales, es mejor usar la media. 1. La mitad de los valores son mayores, la otra mitad son menores. 2. Es menos sensible a valores extremos que la media. 3. Si se quiere ubicar las condiciones de una variable categórica es mejor usar la mediana. 1. Es la de menor sensibilidad a los valores extremos. Es el valor que ocurre con 2. Tiene más valores reunidos mayor frecuencia. en este punto que en cualquier otro. Limitaciones 1. Puede ser excesivamente influida por los valores extremos. 1. Difícil de determinar si hay gran cantidad de datos. 2. Puede resultar falsa si los datos son irregulares y si hay lagunas en los valores. 1. No se presta para análisis matemático. 2. Puede no haber un valor modal para algunos conjuntos de datos. 3. Puede tener varias modas. Finalmente, la medida de tendencia central que se debe utilizar depende de la información disponible y el objetivo que se desea alcanzar. ACTIVIDADES DE APRENDIZAJE: 1) Calcula la media aritmética, la mediana y la moda de las series de valores siguientes: a) 2, 3, 7, 4, 5, 4, 8. Media Aritmética =___________________________________________= ________ Mediana = _________________________________________________ = ________ Moda = ___________________________________________________ = ________ b) 1, 9, 9, 4, 3, 5, 2, 7, 6. Media Aritmética =___________________________________________= ________ 36 Mediana = _________________________________________________ = ________ Moda = ___________________________________________________ = ________ 2) Obtén la mediana y la moda de la siguiente variable categórica. Variable categórica “Actividad Económica de 16 alumnos del 5to. Semestre” Trabajo en hogar (TH); Trabajo albañil (TA); Trabajo en campo (TC); Trabajo en Tiendas (TT) TH, TH, TC, TA, TC, TA, TT, TT, TC, TH, TC, TA, TT, TC, TC, TA. Ordenación de los datos; Media aritmética = No se puede utilizar Mediana = _________________ Moda = ___________________ Ahora analicemos la media, mediana y moda pero con “DATOS AGRUPADOS” o también se llaman de distribución de frecuencias agrupadas. Empecemos con la… MEDIA ARITMÉTICA PARA DATOS AGRUPADOS Si los datos o valores han sido agrupados en intervalos de clase, entonces se considera que todos los valores incluidos dentro de un determinado intervalo son iguales o están representados por el punto medio del intervalo o la marca de clase. En este caso se procede a multiplicar cada punto medio por su respectiva frecuencia. Luego se suman estos productos, para finalmente dividir este resultado entre el total de datos. Es importante señalar que el valor de la media de la frecuencia agrupada es suficientemente aproximado para trabajos de estadística y que el valor de la media no será suficientemente aproximado si la distribución de frecuencias agrupadas es muy irregular o demasiado asimétrica. La fórmula para la media aritmética en datos agrupados es la siguiente: X ( f )( X ) n Donde f = Frecuencias absolutas de los intervalos. X = Marca de clase o punto medio. n = La suma de las frecuencias. 37 MEDIANA PARA DATOS AGRUPADOS Cuando Los datos simples son agrupados en una distribución de frecuencias, cada uno de los valores pierde su identidad en la tabla, significando que la mediana de los datos simples puede no ser igual a la mediana obtenida de una distribución de frecuencias del mismo conjunto de datos. Es importante mencionar, que la mediana de los datos agrupados es una aproximación de la verdadera mediana. La aproximación puede ser obtenida mediante el uso de la siguiente fórmula: n 2 c Me Li (i ) Fme n c Donde: Me Li 2 (i ) Me = Mediana fme Li = Límite real inferior de la clase que contiene la mediana. n = El número de datos o frecuencia total. c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o la suma de las frecuencias de los intervalos por debajo de la mediana. fme = La frecuencia de la clase mediana. i = Tamaño del intervalo o amplitud de la clase mediana. MODA PARA DATOS AGRUPADOS. Cuando la moda se calcula a través de la fórmula para datos agrupados, los valores y frecuencia en la clase modal y las frecuencias en las clases inmediatamente antes y después de la clase modal, son también empleadas. Por lo tanto se aplica la siguiente fórmula. d1 Mo Li (i) d1 d 2 Donde: Mo = Moda L1 = Límite real inferior de la clase que contiene la moda 38 d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua inferior. d2 = diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua superior. i = Tamaño del intervalo o amplitud del intervalo de la clase modal. A continuación resolveremos un ejercicio para utilizar las fórmulas de la media, la mediana y la moda de datos agrupados. Ejemplo: En la siguiente tabla se resumen los datos de los pesos en kilogramos de 50 estudiantes. Con base a la siguiente tabla de distribución de frecuencias, calculemos los valores de la media, la mediana y la moda, recordando cómo se conforman las columnas de Intervalos de clase ( I ), Marca de clase o punto medio ( X ), Frecuencia absoluta( f ), Frecuencia relativa % ( f’ ) y la Frecuencia acumulada ( F ). Intervalos de clase (I) 30.5 – 33.5 33.5 – 36.5 36.5 – 39.5 39.5 – 42.5 42.5 – 45.5 45.5 – 48.5 48.5 – 51.5 51.5 – 54.5 Marca de clase (X) 32 35 38 41 44 47 50 53 TOTAL = Frecuencia Absoluta (f ) 1 2 6 11 16 9 4 1 50 Frecuencia relativa ( f’ ) .02 .04 .12 .22 .32 .18 .08 .02 1.0 o 100% Frecuencia acumulada (F) 1 3 9 20 36 45 49 50 CALCULO DE LA MEDIA ARITMÉTICA para datos agrupados Su fórmula es… X ( f )( X ) n Esta expresión no se puede aplicar directamente, ya que únicamente se cuenta con el dato del denominador, esto es n = 50, pero no se tiene el dato del numerador. Para ello se agrega una columna a la tabla, donde se proporcionan los datos agrupados en intervalos. Esta columna se construye multiplicando el punto medio de cada intervalo por su respectiva frecuencia y cuando se tengan todos los productos, se procede a obtener la suma de ellos. La tabla original ya con la columna Fx y la suma de ésta queda de la siguiente manera. I 30.5 – 33.5 33.5 – 36.5 36.5 – 39.5 39.5 – 42.5 x 32 35 38 41 f 1 2 6 11 f’ .02 .04 .12 .22 F 1 3 9 20 fx 32 70 228 451 39 42.5 – 45.5 45.5 – 48.5 48.5 – 51.5 51.5 – 54.5 44 47 50 53 TOTAL = 16 9 4 1 50 .32 .18 .08 .02 1 o 100 36 45 49 50 704 423 200 53 2161 Entonces: _ 2161 X = = 43.22 será el resultado de la media aritmética 50 MÁS ACTIVIDADES DE APRENDIZAJE: Calcula la media aritmética de los tres ejercicios siguientes. De la página 16… Intervalos de Clase L.R.I. L.R.S. 59.5 63.5 67.5 71.5 75.5 79.5 83.5 - 63.5 67.5 71.5 75.5 79.5 83.5 87.5 Marca de Clase (x ) Frecuencia Absoluta (f ) 61.5 65.5 69.5 73.5 77.5 81.5 85.5 TOTAL = 50 (f)(x) 6 6 8 11 8 9 2 De la pagina 18… Intervalos de Clase L.R.I. L.R.S. 148.5 152.5 Marca de Clase (x) Frecuencia Absoluta (f) 150.5 3 (f)(x) TOTAL = 55 De la página 23… Intervalo de clase L.R.I. L.R.S Marca de clase (x) Frecuencia de clase (f) – – 11 14 3 4 9.5 12.5 12.5 15.5 (f)(x) 40 T O T A L: 47 CALCULO DE LA MEDIANA para datos agrupados. I 30.5 – 33.5 33.5 – 36.5 36.5 – 39.5 39.5 – 42.5 42.5 – 45.5 45.5 – 48.5 48.5 – 51.5 51.5 – 54.5 x 32 35 38 41 44 47 50 53 TOTAL = f’’ .02 .04 .12 .22 .32 .18 .08 .02 1 f 1 2 6 11 16 9 4 1 50 F 1 3 9 20 36 45 49 50 Si partimos de la definición, la mediana es el dato central, como hay OCHO INTERVALOS estará entre el cuarto y quinto intervalo; entonces, debe estar comprendida en el intervalo 42.5 – 45.5, ya que observando la columna “F”, a este intervalo le corresponde una frecuencia acumulada de 36. Note Usted que si se toma el intervalo inmediato inferior, 39.5 – 42.5 se observa en la columna “F”, que hasta esta celda hay 20 VEINTE casos y como se tiene un total de 50 datos, el caso central es el número 25. Así pues el intervalo donde está la mediana es: 42.5 – 45.5 44 16 32 36 Algunos autores efectúan el siguiente razonamiento, sin utilizar la fórmula, pero si interpolando una relación proporcional: ANALIZA DETENIDAMENTE n = 50 por lo tanto la media está en 50/2 = 25 El L.R.I. de la mediana = 42.5 Como 20 casos (1+2+6+11) caen por debajo del L.R.I. de la mediana, necesitamos 5 datos más, para llegar a 25. Dado que existen 16 casos (frecuencia) en el intervalo y éste tiene 3 de amplitud o ancho, hacemos una regla de tres. 16 es a 3 como 5 es a x 16 : 3 :: 5 : x x= (3)(5) = 16 Al L.R.I. le sumamos el resultado 15 16 = 0.9375 Me = 42.5 + 0.9735 = 43.4375 Finalmente mediana = 43.44 Kg. 41 Ahora utilicemos la fórmula para determinar la mediana en datos agrupados: n c Me Li 2 (i ) Fme Li = Límite real inferior de la clase que contiene la mediana. n = El número de datos o frecuencia total. c = La frecuencia acumulada precisamente hasta la clase anterior a la clase mediana o la suma de las frecuencias de los intervalos por debajo de la mediana. fme = La frecuencia de la clase mediana. i = Tamaño del intervalo o amplitud de la clase mediana. 39.5 -- 42.5 41 11 .22 20 .40 451 42.5 – 45.5 44 16 .32 36 .72 704 Analizando estos dos intervalos se pueden obtener los siguientes valores: L1 = 42.5 límite real inferior que contiene la mediana n 25 2 c = 20 es la frecuencia acumulada hasta la clase anterior a la clase mediana n = 50 es el número total de frecuencias de donde: fme = 16 es la frecuencia de la clase mediana i = 3 es el tamaño del intervalo o amplitud de la clase mediana. Sustituyendo estos datos en la fórmula se tiene: 25 20 5 15 15 Me = 42.5+ ( 3 ) = 42.5 + ( 3 ) = 42.5 + = 42.5 + 16 16 16 16 Me = 42.5 + 0.9375+ = 43.4375 Finalmente mediana = 43.44 Kg MÁS ACTIVIDADES DE APRENDIZAJE: Calcula la MEDIANA de los tres ejercicios que se han presentado. 42 De la página 16… Intervalos de Clase L.R.I. L.R.S. 59.5 63.5 67.5 71.5 75.5 79.5 83.5 - 63.5 67.5 71.5 75.5 79.5 83.5 87.5 Marca de Clase (x ) 61.5 65.5 69.5 73.5 77.5 81.5 85.5 TOTAL = Frecuencia Absoluta (f ) 6 6 8 11 8 9 2 50 De la pagina 18… Intervalos de Clase L.R.I. L.R.S. 148.5 152.5 156.5 160.5 164.5 168.5 172.5 152.5 156.5 160.5 164.5 168.5 172.5 176.5 Marca de Clase (x) 150.5 154.5 158.5 162.5 166.5 170.5 174.5 TOTAL = Frecuencia Absoluta (f) 3 7 13 12 13 5 2 55 De la página 23… Intervalo de clase L.R.I. L.R.S. Marca De clase (x) Frecuencia de clase (f) 9.5 – 12.5 12.5 –15.5 15.5 – 18.5 18.5 – 21.5 21.5 – 24.5 24.5 – 27.5 27.5 – 30.5 30.5 – 33.5 33.5 – 36.5 11 14 17 20 23 26 29 32 35 3 4 6 7 9 8 5 3 2 T O T A L: 47 43 CALCULO DE LA MODA para datos agrupados. Para determinar el valor de la moda, habrá que observar las columnas “ f ” y seleccionar el intervalo que presenta la mayor frecuencia. En este caso, el intervalo que donde está incluida la moda es: 42.5 – 45.5 44 16 .32 36 .72 704 La fórmula que se utiliza para encontrar el valor de la moda es: d1 Mo Li (i) d d 2 1 L1 = Límite real inferior de la clase que contiene la moda d1 = Diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua inferior. d2 = diferencia de la frecuencia de la clase modal y la frecuencia de la clase contigua superior. i = Tamaño del intervalo o amplitud del intervalo de la clase modal. Para determinar los valores de cada término en esta expresión, se requiere además del intervalo donde está localizada la moda, de las celdas inmediata inferior y superior que queda como sigue: 39.5 - 42.5 42.5 - 45.5 45.5 - 48.5 41 44 47 11 16 9 .22 .32 .18 20 36 45 .40 .72 .90 451 704 423 A partir de estos intervalos se adquieren los valores requeridos y que son: Li = 42.5 d1 = 16 - 11 = 5 d2 = 16 – 9 = 7 i =3 Sustituyendo estos datos en la formula se obtiene: 5 Mo = 42.5 + (3) 5 7 Mo = 42.5 + 5 Mo = 42.5 + ( 3 ) 12 15 = 42.5 + 1.25 = 43.75 12 Finalmente la Moda = 43.75 44 MÁS ACTIVIDADES DE APRENDIZAJE: Calcula la MODA de los tres ejercicios que se han presentado. De la página 16… Intervalos de Clase Marca de Frecuencia L.R.I. L.R.S. Clase (x ) Absoluta (f ) 59.5 - 63.5 61.5 6 63.5 - 67.5 65.5 6 67.5 - 71.5 69.5 8 71.5 - 75.5 73.5 11 75.5 - 79.5 77.5 8 79.5 - 83.5 81.5 9 83.5 - 87.5 85.5 2 TOTAL = 50 De la pagina 18… Intervalos de Clase L.R.I. L.R.S. 148.5 152.5 156.5 160.5 164.5 168.5 172.5 152.5 156.5 160.5 164.5 168.5 172.5 176.5 Marca de Clase (x) Frecuencia Absoluta (f) 150.5 154.5 158.5 162.5 166.5 170.5 174.5 3 7 13 12 13 5 2 55 TOTAL = De la página 23… Intervalo de clase L.R.I. L.R.S. 9.5 – 12.5 12.5 –15.5 15.5 – 18.5 18.5 – 21.5 21.5 – 24.5 24.5 – 27.5 27.5 – 30.5 30.5 – 33.5 33.5 – 36.5 T O T A L: Marca de clase (x) Frecuencia de clase (f) 11 14 17 20 23 26 29 32 35 3 4 6 7 9 8 5 3 2 47 45 REALIZA LA SIGUIENTE ACTIVIDAD DE APRENDIZAJE: De las edades de 40 maestros de los C.B.T.a s, calcula las MEDIDAS DE TENDENCIA CENTRAL (MEDIA, MEDIANA Y MODA) Tanto de los datos sin agrupar como agrupados. Edades: 36, 53, 35, 28, 30, 36, 45, 29, 43, 28, 30, 46, 39, 54, 47, 44, 34, 40, 50, 38, 47, 56, 48, 42, 39, 47, 53, 51, 38, 29, 48, 52, 47, 46, 41, 40, 45, 39, 47, 38. CALCULA PRIMERO LA MEDIA ARITMETICA, MEDIANA Y MODA DE LOS DATOS SIN AGRUPAR. Media Aritmética = _____________________________________________________ Ordena los datos: ______________________________________________________________________ ______________________________________________________________________ Cual es la Mediana =____________________ Cual es la Moda = ___________________ 46 AHORA PARA DATOS AGRUPADOS. Realiza la Tabla de distribución de frecuencias con los 7 pasos: PASO 1. Ordenación de datos: EDAD DE LOS MAESTROS CONTEO FRECUENCIA PASO DOS: Rango o recorrido: PASO TRES: Intervalos de Clase: Número de intervalos o clases: Ancho del Intervalo o clase: PASO CUATRO: Límites reales inferiores y límites reales superiores: PASO CINCO: Marca de Clase PASO SEIS: Frecuencia Absoluta PASO SIETE: Frecuencia Relativa (%) 47 Realiza tus operaciones en orden y limpieza hasta llenar la tabla de frecuencias TABLA DE DISTRIBUCIÓN DE FRECUENCIAS “Edades de los maestros del C.B.T.a.” Intervalos de Marca Frecuencia Frecuenc Frecuencia (f )(x) Clase de Absoluta (f) ia Acumulada L.R.I. Clase Relativa (F) L.R.S (X) (f’) AHORA UTILIZA LAS FORMULAS PARA DATOS AGRUPADOS Y CALCULA….. MEDIA ARITMETICA: Resultado Media =__________ MEDIANA: Resultado Mediana =_______ MODA: Resultado Moda =__________ 48 FINALMENTE REALIZA UNA COMPARACIÓN DE LOS TRES EJERCICIOS ANTERIORES, COMPARANDO SU MEDIA MEDIANA Y MODA DE CADA UNO De la página 16 Intervalos de Clase L.R.I. L.R.S. 59.5 - 63.5 63.5 - 67.5 67.5 - 71.5 71.5 - 75.5 75.5 - 79.5 79.5 - 83.5 83.5 - 87.5 De la pagina 18 Intervalos de Clase L.R.I. L.R.S. 148.5 152.5 152.5 156.5 156.5 160.5 160.5 164.5 164.5 168.5 168.5 172.5 172.5 176.5 Marca de Frecuencia Clase (x ) Absoluta (f ) 61.5 6 65.5 6 69.5 8 73.5 11 77.5 8 81.5 9 85.5 2 TOTAL = 50 Marca de Clase (x) 150.5 154.5 158.5 162.5 166.5 170.5 174.5 TOTAL = Frecuencia Absoluta (f) 3 7 13 12 13 5 2 55 Media = ____________ Mediana=:___________ Moda=_____________ Media = ____________ Mediana=:___________ Moda=_____________ De la página 29… Intervalo de clase 9.5 – 12.5 12.5 –15.5 15.5 – 18.5 18.5 – 21.5 21.5 – 24.5 24.5 – 27.5 27.5 – 30.5 30.5 – 33.5 33.5 – 36.5 T O T A L: Marca de clase (x) 11 14 17 20 23 26 29 32 35 Frecuencia de clase (f) 3 4 6 7 9 8 5 3 2 47 Media = ____________ Mediana=:___________ Moda=_____________ 49 CUARTILES, DECILES Y PERCENTILES: La mediana no es más que uno de muchos fractiles; éstos dividen los datos en dos o más partes, tan iguales “como sea posible”. Entre ellos también encontramos los cuartiles, deciles y percentiles, que pretenden dividir los datos en cuatro, diez, y cien partes. Hasta hace poco, los fractiles se manejaban principalmente para distribuciones de conjuntos numerosos de datos. El cuartil se utiliza a fin de conocer los intervalos dentro de los cuales quedan representados proporcionalmente los términos de una distribución, para esto, se divide la distribución de frecuencias en 4 partes iguales, cada una contiene IGUAL NÚMERO DE OBSERVACIONES (el 25% del total). Los puntos de separación de los valores de X se llaman CUARTILES. El primer cuartil corresponde al 25% y se designa con Q1. El segundo cuartil se designa con Q2 que representa el valor de 50% y coincide con la mediana. El tercer cuartil es Q3 representa el 75% de las observaciones. Si en lugar de dividir en 4 partes iguales se hace con 10 partes, se tienen 9 puntos de división, CORRESPONDIENDO A CADA PUNTO UN DECIL, de donde, el primer decil es el valor por debajo del cual está el 10% de las observaciones, para el segundo decil el 20% y así sucesivamente. PRIMER EJEMPLO: Consideremos las siguientes lecturas de temperaturas altas en doce ciudades Europeas en un día de junio: 90, 75, 86, 77, 85, 72, 78, 79, 94, 82, 74, y 93 grados. Ordenando estas cifras de acuerdo con su tamaño, tenemos: 72 74 75 77 78 79 82 85 86 90 93 94 observa que son 12 datos Para el cálculo de los cuartiles dividimos los datos en CUATRO PARTES IGUALES. Para ilustrar dicho procedimiento tenemos la siguiente figura: n = 12 72 74 75 77 78 79 82 85 86 90 93 94 Se puede apreciar que las líneas punteadas dividen los datos en cuatro partes iguales. Si determinamos que los puntos centrales entre 75 y 77, 79 y 82, y 86 y 90 sean los tres cuartiles, tenemos: Q1 75 77 76 2 Q2 79 82 80.5 2 Q3 86 90 88 2 Es evidente que Q2 = 80.5, también es la mediana y se puede verificar con facilidad que se satisfacen las tres propiedades de los cuartiles. Todo lo anterior funcionó muy bien porque los doce datos resultó ser múltiplo de 4. No obstante ¿Qué podemos hacer si fueran 11 datos? Como los siguientes. 50 72 74 75 78 79 82 85 86 90 93 94 observa que son 11 datos Una solución es n = 11, la posición de la mediana es dato 2 11 + 1 = 12 = 6 o sea el sexto 2 La mediana o Q2 ahora es 82. n = 11 72 74 75 78 79 82 85 86 90 93 94 El cuartil inferior (Q1) es la mediana de los cinco valores por debajo de la mediana, esto es, 75. Y el cuartil superior (Q3) es la mediana de los cinco valores por arriba de la mediana, o sea, 90. 51 AHORA TE TOCA REALIZAR LAS ACTIVIDADES DE APRENDIZAJE: Realiza un esquema o dibujo de cada uno de los ejercicios, aun lado de la página a) Calcula a mediana (Q2) y los cuartiles (Q1) y (Q3) de las siguientes calificaciones de nueve alumnos en una prueba de matemáticas. 86, 82, 73, 94, 88, 66, 79, 90, y 74 b) Calcula los tres cuartiles de las siguientes lecturas de presión de nueve personas después de haber efectuado ejercicios de esfuerzo; 104, 100, 98, 111, 191, 94, 103, 96, 108 y 99. 52 REGRESIÓN LINEAL La regresión lineal es un modelo de regresión mediante el cual es posible inferir datos acerca de una población. Se conoce como regresión lineal ya que usa parámetros lineales (potencia 1). Supuestos del error Para poder crear un modelo de regresión lineal, es necesario que se cumpla con los supuestos del error: Los errores son independientes. Los errores tienen media cero. Los errores tienen varianza constante. Los errores tienen una distribución normal. Tipos de modelos de regresión lineal Existen diferentes tipos de regresión lineal que se clasifican de acuerdo a sus parámetros: Regresión lineal simple. Sólo se maneja una variable independiente, por lo que sólo cuenta con dos parámetros. Regresión lineal múltiple. Maneja varias variables independientes. Cuenta con varios parámetros. Regresión lineal simple Para calcular los parámetros se cuenta con las siguientes fórmulas: Regresión lineal múltiple Para calcular los parámetros debe tomarse en cuenta que se está refiriendo a matrices: 53 Ahora estudiemos las… 54 MEDIDAS DE DISPERSIÓN A menudo escuchamos que en los países latinoamericanos existe mucha DIFERENCIA entre los ingresos que perciben por ejemplo los políticos y los trabajadores de otra clase social de la población. Esas diferencias tienen sus raíces en distintos fenómenos sociales, políticos y económicos; sin embargo, un economista diría “el ingreso per cápita en los países latinoamericanos está más DISPERSO que el ingreso per cápita de los países desarrollados”. El concepto de DISPERSIÓN resulta importante en casi todos los estudios, ya que puede darse el caso de poblaciones con igual valor central (Media aritmética, Mediana o Moda), pero una puede estar más DISPERSA que la otra, es decir, los promedios nos sirven para describir los datos representados por la tendencia central del conjunto. Por lo tanto, el promedio no logra por si mismo describir completamente a una colección de datos; se necesitan otros valores que nos indiquen el grado en que las observaciones estudiadas se apartan o VARÍAN con respecto al valor central, es decir, el GRADO DE VARIACIÓN O DISPERSIÓN. ANALIZA CON DETENIMIENTO EL SIGUIENTE EJEMPLO… Con los siguientes datos de dos poblaciones, analicemos primeramente sus medias aritméticas: Población A) : 1 (7) , 2 (11), 3 (13), 4 (9), 5 (5), 6( 3), 7( 2), 8(1) = 169 = 3.31 51 n = 51 15 -13 -11 -Frecuencia 9 -7 -5 -3 -1 -- Histograma de los datos de la población A Media aritmética (promedio) = 3.31 1 2 3 4 5 6 7 8 55 Población B) : 1 ( 3 ), 2 ( 9 ), 3 ( 15 ), 4 ( 12 ), 5 ( 9 ) = A 159 = 3.31 igual que la población 48 n = 48 15-13-11-Frecuencia 9-7-5-3-1-- Histograma de los datos de la población B Media aritmética (promedio) = 3.31 1 2 3 4 5 No obstante que en las dos poblaciones se obtuvo una media aritmética igual de 3.31; al observar los dos histogramas nos damos cuenta que no son iguales PERO... ¿EN CUÁL HISTOGRAMA ESTÁN MÁS DISPERSOS LOS DATOS? En la población “A”____________ o en la población “B”_____________ Explica porque? ________________________________________________________ ______________________________________________________________________ Por tal motivo las medidas de tendencia central, no dicen nada por sí mismas, por lo que se deben calcular las MEDIDAS DE DISPERSIÓN o LAS VARIACIONES de los datos. Por su cálculo las MEDIDAS DE DISPERSIÓN se dividen en absolutas y relativas, aún que existen mas, estudiaremos las siguientes: DISPERSIÓN ABSOLUTA: Rango o recorrido Rango intercuartilico o desviación cuartil Desviación Media Varianza Desviación Estándar DISPERSIÓN RELATIVA: Coeficiente de variación RANGO O RECORRIDO: Como se ha indicado con anterioridad, el rango o recorrido es la diferencia entre el valor mayor y el valor menor de un grupo de datos o sea: RANGO = Dato mayor – Dato menor El rango es una medida de dispersión que no se utiliza mucho, aunque su cálculo es muy rápido. Si analizamos el rango de los histogramas anteriores tenemos que; 56 En la primera población A su rango es: R=8–1=8 (su rango o recorrido es 8) En la segunda población B se rango es: R=5–1=5 (su rango o recorrido es 5 ) Por lo tanto y como 8 > 5, podemos señalar con seguridad que los datos de la primera población A), está más dispersa o desviados que los datos de la segunda población B). 57 AHORA ESTUDIAREMOS OTRAS MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE DE VARIACIÓN, que son medidas de dispersión que tienen relación con la media aritmética, y por sus propiedades algebraicas son las de más frecuente aplicación y de mayor importancia. PERO ANTES QUE NADA … ¿QUE ES EL DESVÍO O DESVIACIÓN ? El desvío de cada observación (o dato) es la DIFERENCIA ENTRE LA OBSERVACIÓN (o el dato) Y LA MEDIA ARITMÉTICA. El desvío es un concepto fundamental que nos permitirá comprender posteriormente otras medidas de dispersión. Por lo tanto. x Desvío ( d ) = x1 – Pero hagamos un ejemplo… Si el conjunto de datos son: 4, 2, 5, 8, 2, 1, 7, 8, 5, y 7 su media aritmética es = 4.9 ¿Cuál es la dispersión de cada dato? ¿Cuál es el dato que está mas disperso? ¿Cuál es el dato menos disperso? Ordenamos los datos de menor a mayor 1, 2, 2, 4, 5, 5, 7, 7, 8, 8 y grafiquemos x 1 2 4 4.9 7 8 9 Según la fórmula anterior, desvío es igual al dato menos la media aritmética por lo tanto tenemos: 58 La desviación de cada dato será: Calculo del desvío Datos d = X1 -x 1 1 – 4.9 = 2 2 – 4.9 = 2 2 – 4.9 = 4 4 – 4.9 = 5 5 – 4.9 = 5 5 – 4.9 = 7 7 – 4.9 = 7 7 – 4.9 = 8 8 – 4.9 = 9 8 – 4.9 = 49/10= 4.9 desvío = - 3.9 -2.9 -2.9 -0.9 0.1 0.1 2.1 2.1 3.1 3.1 -10.6 +10.6= 0.0 Suman – 10.6 Suman + 10.6 De acuerdo a los resultados de la tabla ¿Cuál es el dato que está más disperso? Es el número 1, porque independientemente de su signo, su valor absoluto es el mas alto y es de – 3.9 de desvío. Ahora ¿Cuál es el dato menos disperso?. Es el número 5 porque está más cerca de la media aritmética y tiene un desvío de 0.1. Si observas la tabla anterior en muy importante obtener primero el valor de la media aritmética que en nuestro caso fue de 49 / 10 = 4.9 para después restarle al valor de cada dato, dicha media. Por otro lado, al sumar los resultados NEGATIVOS de los desvíos nos arroja un valor de – 10.6 y al sumar los resultados POSITIVOS de los desvíos también nos da un valor de + 10.6 por lo tanto, se comprueba que la diferencia de los desvíos negativos y los positivos, nos da cero o en su defecto tiende a ser cero. Ahora resolvamos un problema para utilizar las medidas de dispersión 59 DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTANDAR O TÍPICA Y COEFICIENTE DE VARIACIÓN CON D A T O S N O A G R U P A D O S Número de muestra 1 2 3 4 5 6 DATOS de la resistencia del concreto kg/cm2 358 369 363 358 336 341 Un constructor, para asegurarse de la calidad de su obra, tomó seis muestras de concreto y obtuvo los resultados del cuadro. Al preguntarle uno de sus colaboradores ¿Cuál de todas las muestras del grupo era la más dispersa? el constructor elaboró la siguiente tabla: Finalmente el constructor en base a la tabla y a los cálculos realizados le indicó a su colaborador: LA MUESTRA NÚMERO 5 ES LA MÁS DISPERSA, DEBIDO A QUE OBTUVO EL MAYOR VALOR ABSOLUTO DE DESVÍO CON -18.17. En este caso particular, el mayor valor tuvo el signo negativo lo que significa que la observación es menor que el valor de la media. Número Resistencia de Kg/cm2 muestra 1 358 2 369 3 363 4 358 5 336 6 341 Suma =2125 2125/6= Media =354.17 desvíos d = x1 – x 358 – 354.17 = 3.83 369 – 354.17 = 14.83 363 – 354.17 = 8.83 358 – 354.17 = 3.83 336 – 354.17 = 18.17 341 – 354.17 = 13.17 Diferencia = 0.02 Calculemos ahora la… DESVIACIÓN MEDIA.: La desviación media es la media aritmética de los valores absolutos (ignorando el signo) de las desviaciones de cada elemento del conjunto de datos, es decir, hay que restar a la media aritmética cada valor del conjunto de datos, ignorando el signo, y sumamos todas las diferencias para dividirlo entre el número total de datos. N Su formula es dm x i 1 1 N x Suma de los valores absolutos Número de datos 60 Sigamos el mismo ejemplo y AUMENTEMOS UNA COLUMNA para los valores absolutos al cuadro anterior: Número de muestra 1 2 3 4 5 6 Datos de resistencia Desvío x -x 358 369 363 358 336 341 2125 6 = 354.17 3.83 14.83 8.83 3.83 -18.17 -13.17 0.02 x Valor absoluto | x -x | 3.83 14.83 8.83 3.83 18.17 13.17 Suma = 62.66 Desviación media es igual a... La suma de los valores absolutos entre el número de muestras Desviación Media ( dm ) = 62.66 = 10.44 6 Como se ve en el ejemplo anterior, La Desviación Media MIDE LA DISPERSIÓN ALREDEDOR DEL PROMEDIO, mas que la dispersión de ciertos valores, ya que el concepto de desviación media se origina cuando los desvíos se toman en valor absolutos, eliminando así el efecto de que la suma de los desvíos (x1 – x = 0 ) que es igual a cero (o tiende a cero). Otra forma de hacerlo, es elevar al cuadrado los desvíos, por lo que surge la... VARIANZA (S2) : Que es la media aritmética (promedio) de los cuadrados de los desvíos y su fórmula es la siguiente: N S2 (x i 1 1 x )2 Suma de desvíos al cuadrado Número de datos N Sigamos el mismo ejemplo para calcular la varianza ( S2 ): AUMENTAMOS OTRA COLUMNA a la tabla, ahora para los desvíos al cuadrado Número de muestra 1 2 3 4 5 6 Datos de resistencia Desvío x- 358 369 363 358 336 341 2125/6 x = 354.17 3.83 14.83 8.83 3.83 -18.17 -13.17 Se tiende a 0.02 x Valor Desvíos al absoluto cuadrado | x -x | (x - x ) 2 3.83 144.67 14.83 219.93 8.83 77.97 3.83 14.67 18.17 330.15 13.17 173.45 Suma= 62.66 Suma = 830.83 61 Calculamos la varianza según la fórmula anterior y tenemos: Varianza (S2) = Suma de desvíos al cuadrado = 830.83 Número de datos = 138.47 6 DESVIACIÓN ESTÁNDAR o TÍPICA ( S ): Es la raíz cuadrada de la varianza (S2 ) También se puede definir como la raíz cuadrada de la media aritmética de los cuadrados de los desvíos. ( x1 x)2 S N En el mismo ejemplo tendríamos lo siguiente: Varianza (S2) fue igual a = 138.47 por lo tanto… Desviación Estándar ( S ) = 138.47 = 11.77 Finalmente analicemos la medida de dispersión relativa llamada COEFICIENTE DE VARIACIÓN ( C.V ): Es el resultado de la división de la desviación estándar entre la media aritmética. Este tipo de coeficiente es muy útil para medir la DISPERSIÓN RELATIVA en base a la desviación estándar y la media y sirve básicamente para comparar muestras distintas en términos numéricos adimensionales, es decir, que mientras las demás medidas de dispersión tienen unidades, el coeficiente de variación carece de ellas. Su formula es... C. V. = S ( Desviación Estándar) . X ( Media Aritmética) En el mismo ejemplo que estamos analizando, el coeficiente de variación será: C. V = 11.77 . = 0.033 354.17 También se puede expresar en porcentaje al multiplicar por 100 esto es, (0.033) (100) = 3.30% C.V. = 3.30 % RANGO INTERCUARTIL El rango intercuartil es el resultado de la diferencia entre el tercer cuartil Q 3 y el primero Q1, se expresa: Rango intercuartil Q = Q3 - Q1 62 Cuando habiéndose aplicado la media aritmética se quiere evitar la influencia de los valores extremos, se analiza únicamente la situación intermedia de la distribución de frecuencias aplicando el RANGO INTERCUARTIL. El RANGO SEMIINTERCUARTIL o DESVIACIÓN CUARTIL, es la mitad del rango intercuartil, se designa con QD Rango semiintercuartil QD = Q3 - Q1 2 Hagamos un ejemplo: Calcular el rango intercuartil y la desviación cuartil de los siguientes datos. 72 n = 12 Q1 74 75 77 76 2 75 77 78 79 82 Q2 79 82 80.5 2 85 86 Q3 90 93 94 86 90 88 2 Rango intercuartil Q = Q3 – Q1 Q =88 – 76 = 12 Rango semiintrecuartil o Desviación cuartil QD = Q3 – Q1 2 QD = 12 = 6 2 El rango semiintercuartil (desviación cuartil) mide la dispersión con mayor precisión que el rango, sin embargo, presenta las limitaciones siguientes: a) No toma en consideración todos los valores de la distribución de frecuencias y puede suceder que los valores menores a Q1 o superiores a Q3 estén muy compactos o muy dispersos, y el valor de Q sería el mismo. b) No es posible, conociendo únicamente Q, hacer la ubicación precisa de una observación dentro de la distribución de frecuencias. c) Igual que la mediana, no tiene propiedades que permitan su uso en las relaciones matemáticas que utiliza la estadística Percentiles Percentil, en estadística, parámetro que indica el porcentaje de individuos de una distribución que tienen un valor inferior a él. Es una medida de posición. Por ejemplo, el percentil 80, p80, es un número que supera al 80% de los datos de la distribución. Los percentiles también se llaman centiles. 63 Ja, Ja, Ja, eso está fácil y entendible aceboman Ja, Ja,Ja UN RESUMEN DE LAS MEDIDAS DE DISPERSIÓN ESTUDIADAS Y SU USO ADECUADO RANGO ( R )= Es la diferencia del valor mayor menos el valor menor en un conjunto de datos y se emplea de manera muy limitada, ya que es sólo una apreciación de la amplitud de los datos, y presenta poca estabilidad; se usa, casi siempre que se requiera rapidez. RANGO INTERCUARTIL ( Q ): es el resultado de la diferencia entre el tercer cuartil Q3 y el primero Q1. Su utilidad es baja y su valoración respecto a la cantidad de datos que incluye en su aplicación en una distribución normal es del 50 % DESVIACIÓN MEDIA ( dm )= Es el promedio de los valores absolutos (ignorando signos) de las desviaciones de cada dato; En ésta prueba se pueden calcular los desvíos tanto con la media aritmética como la mediana, según convenga. Actualmente ésta prueba casi no se usa. En una distribución normal, la cantidad de datos que incluye en su aplicación es de aproximadamente el 58%. VARIANZA ( S2 ) = Es el promedio de los cuadrados de los desvíos y se utiliza en análisis estadístico avanzado, pero tiene el inconveniente de que sus unidades son las mismas de la variable al cuadrado. DESVIACIÓN ESTÁNDAR ( S ) = Es la raíz cuadrada de la varianza o del promedio de los cuadrados de los desvíos. Es la más importante de todas las medidas de dispersión ya que incluye más o menos el 68% de los términos de una distribución normal, además por sus propiedades algebraicas se utiliza con facilidad en el análisis estadístico COEFICIENTE DE VARIACIÓN ( CV ) = Es el cociente entre la desviación estándar y la media aritmética. Generalmente se utiliza para comparar muestras distintas y saber cuál tiene mayor o menor dispersión en sus datos. 64 SIGAMOS PRACTICANDO PARA OBTENER LAS MEDIDAS DE DISPERSIÓN PARA DATOS NO AGRUPADOS Los siguientes datos son las edades de dos grupos de estudiantes del SAETA-XALISCO, de la generación Agosto -2001. A cada uno de los grupos le obtendrás las medidas de dispersión siguientes: DESVIOS de cada edad, DESVIACIÓN MEDIA, VARIANZA, DESVIACIÓN ESTÁNDAR Y COEFICIENTE DE VARIACIÓN GRUPO “D” 20 ESTUDIANTES 16 19 22 27 16 19 22 29 18 20 22 29 19 21 22 30 ¡¡¡ Claro que puedo!!! 15 17 18 19 21 19 21 23 32 Valor Edad Desvíos absoluto 16 16 18 19 19 19 19 20 21 21 22 22 22 22 23 27 29 29 30 32 GRUPO “F” 25 ESTUDIANTES Desvíos al cuadrado 15 17 18 20 22 15 17 19 20 22 Valor Edad Desvíos absoluto 15 15 15 16 16 17 17 17 18 18 18 18 19 19 19 19 20 20 21 21 21 22 22 29 30 16 16 18 18 19 19 21 21 29 30 Desvíos al cuadrado 65 En la siguiente página… REALIZA TUS CÁLCULOS DE ACUERDO A LAS FÓRMULAS CORRESPONDIENTES, HASTA OBTENER SUS RESULTADOS PARA CADA GRUPO. Cálculos para el grupo “D” RESULTADOS DEL GRUPO “D” DESVIACIÓN MEDIA (dm) = ____________________ 2 Cálculos para el grupo “F” RESULTADOS DEL GRUPO “F” DESVIACIÓN MEDIA (dm) = ____________________ VARIANZA (S ) = ______________________________ VARIANZA (S2) = _____________________________ DESVIACIÓN ESTÁNDAR ( S ) = _________________ DESVIACIÓN ESTÁNDAR (S) = _________________ COEFICIENTE DE VARIACIÓN ( CV ) = ____________ COEFICIENTE DE VARIACIÓN (CV) = ___________ AHORA CONTESTA ¿CUÁL DE LOS DOS GRUPOS TIENE SUS DATOS MÁS DISPERSOS? Respuesta: Porque?___________________________________________________ _______________ 66 FINALMENTE OBTENGAMOS LAS MEDIADAS DE DISPERSIÓN PARA DATOS AGRUPAD OS OBTENER LA DESVIACIÓN MEDIA (dm), VARIANZA (S2), DESVIACIÓN ESTANDAR (S) Y COEFICIENTE DE VARIACIÓN (C.V.) Completa las siguientes filas de las columnas para que calcules la Desviación media (dm), la Varianza (S2) la Desviación estándar o típica ( S ). Intervalo Marc Frecuen Frecuen Valor Frecuen Desvío Frec. por clase a de cia cia por absoluto cia por s al desvíos clase marca del desvíos cuadra al (estaturas ) (alumno (X) de clase desvío do cuadrad s) f X1 X o 2 (f)(X) X1 X X1 X (f) f XX 2 121.5 – 126.5 124 126.5— 13.1.5 2 248 20.62 3 131.5—136.5 134 136.5—141.5 46.86 8 112.78 23 141.5—146.5 144 27 146.5—151.5 20 151.5—156.5 16 156.5—161.5 159 161.5—166.5 3 0.62 383.60 477 14.38 206.78 2 Totales n = 104 15041 638.64 6383.92 Media aritmética = 15041/ 104 = 144.625 = 144.62 Aquí o aun lado de la página, realiza tus cálculos con orden y limpieza; y utilizando las formulas correspondientes hasta que obtengas la Desviación media, Varianza y Desviación estándar. N Formula para obtener la desviación media dm = f i 1 N N Formula para obtener la varianza = N S f (x i 1 1 S2 f (x i 1 x1 x 1 x)2 N X )2 N 67 Formula para obtener la desviación estandar (S) = Formula para obtener el coeficiente de variación en porcentaje C.V . S (100) X RESULTADOS Desviación media =_______________ Varianza = ____________________ Desviación estándar = ______________ Coeficiente de variación = ACTIVIDADES DE APRENDIZAJE: _______________ Calcula las medidas de dispersión (desviación media, varianza, desviación estándar y coeficiente de variación) de los siguientes dos ejercicios. De la página 16… Intervalos de Marca Frecuencia Clase de Clase Absoluta (x) (f ) 59.5 - 63.5 61.5 6 63.5 - 67.5 65.5 6 67.5 - 71.5 69.5 8 71.5 - 75.5 73.5 11 75.5 - 79.5 77.5 8 79.5 - 83.5 81.5 9 83.5 - 87.5 85.5 2 TOTAL = 50 RESULTADOS Desviación media =_______________ Varianza = ____________________ Desviación ______________ Coeficiente de _______________ estándar variación = = 68 De la pagina …18 Intervalos de Clase 148.5 152.5 152.5 156.5 156.5 160.5 160.5 164.5 164.5 168.5 168.5 172.5 172.5 176.5 Marca de Clase (x) 150.5 Frecuencia Absoluta (f) 154.5 7 158.5 13 162.5 12 166.5 13 170.5 5 174.5 2 TOTAL = 55 3 RESULTADOS Desviación media =_______________ Varianza = ____________________ Desviación ______________ Coeficiente de _______________ estándar variación = = 69 PROBABILIDAD I N T R O D U C C I Ó N: El problema central de la estadística es el manejo del azar y la incertidumbre. Los eventos aleatorios siempre se han considerado como misteriosos. El libro de Job ponderó hace mucho tiempo la función del intento divino en los acontecimientos al azar y fue, varios siglos más tarde, que se usó el poder de las matemáticas para explicar la aleatoriedad. Los orígenes de las matemáticas de la probabilidad se remontan al siglo XV, las primeras aplicaciones se relacionan básicamente a los juegos de azar. Los jugadores ganadores utilizaron el conocimiento probabilístico para desarrollar estrategias de apuestas en loterías, casinos, carreras de caballos etc. Los avances científicos de los siglos que siguieron al Renacimiento, enfatizando la observación y la experimentación cuidadosa, dieron lugar a la teoría de la probabilidad para estudiar las leyes de la naturaleza y los problemas de la vida cotidiana. CONCEPTOS BÁSICOS Con el objeto de familiarizarse con el concepto de la probabilidad comenzaremos por dar una definición de probabilidad que sólo es válida cuando todos los resultados son igualmente probables. Si hay n posibilidades igualmente probables y una de ellas debe ocurrir, entonces la probabilidad de que ocurra algún evento o suceso de k de estas n posibilidades es k / n. Las palabras SUCESO O EVENTO aquí los utilizaremos como sinónimos. Si un experimento se repite muchas veces, digamos n y si el suceso o evento E1 se observa k veces, entonces la probabilidad S del suceso E1 es el cociente de la razón k / n. Probabilidad S = núm de veces que el suceso E1 ocurrió Total de sucesos realizados = k . n La experiencia justifica esta igualdad, pues a medida que n se hace mayor, la frecuencia relativa se aproxima más a la probabilidad matemática. Este concepto se utiliza para definir la razón citada como probabilidad empírica, algunos autores la citan como FORMULA BÁSICA de la probabilidad. Otro concepto importante es que la probabilidad de que suceda un evento es un número real entre cero y uno. Entre más pequeño sea este número, el evento es menos probable, y entre más cercano a uno sea este número, el evento es más probable. Cuando la probabilidad es igual a ½ el evento tiene la misma probabilidad de ocurrir que de no ocurrir. Coloquialmente también hablamos de probabilidades empleando porcentajes. Así la posibilidad de que al tirar el dado el resultado sea 2 o 5 es de 2/6 = 1/3 que sería igual al 33.33 % ya que se dividió 1/3 por 100. 70 ¿Cuál es la probabilidad de obtener un número impar al lanzar un dado?. S = ( 1, 2, 3, 4, 5, 6 ) E = ( 1, 3, 5, ) p(E)= 3 = 1 6 2 La probabilidad es de ½ o 0.5 en porcentaje será el 50% ¿Cuál es la probabilidad de extraer una ficha de dominó con 7 puntos de una caja, sin ver?. S = (6,6), (6,5), (6,4), (6,3), (6,2), (6,1), (6,0), (5,5), (5,4), (5,3), (5,2), (5,1), (5,0), (4,4), (4,3), (4,2), (4,1), (4,0), (3,3), (3,2), (3,1), (3,0), (2,2), (2,1), (2,0), (1,1), (1,0), (0,0) E = { (6,1), (5,2), (4,3) } p ( E ) = 3 = 0.1071 en porcentaje será el 10.71% 28 71 MODELOS MATEMÁTICOS En la teoría de probabilidad matemática se define la probabilidad con los tres axiomas de Kolmogorov. Axiomas de Kolmogorov Primer axioma La probabilidad de un suceso A es un número real entre 0 y 1. . Segundo axioma Ocurre un suceso de la muestra de todos los sucesos o espacio de sucesos con probabilidad 1. . la probabilidad del espacio muestral es igual a 1: p(S)=1 Tercer axioma Si A1, A2 ... son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de intersección vacía dos a dos), entonces: . 72 PERMUTACIONES Y COMBINACIONES Para pronosticar el triunfador de una elección municipal necesitamos al menos conocer quiénes son los candidatos de los distintos partidos políticos, así como para pronosticar si la selección mexicana de fútbol ganará un partido, es necesario saber si en caso de empate el partido se decidirá en tiempos extras o por medio de penales. En general, NO ES POSIBLE HACER PREDICCIONES RAZONABLES A MENOS DE QUE CONOZCAMOS LO QUE ES POSIBLE, es decir, es necesario conocer LO QUE ES POSIBLE antes de juzgar LO QUE ES PROBABLE. Por lo tanto estudiaremos someramente cómo determinar en algunos casos lo que es posible. En el estudio de “lo que es posible” hay esencialmente dos tipos de problemas. Existe el problema de hacer una lista de todo lo que puede suceder en una situación determinada y se tiene el problema de determinar cuántas cosas diferentes pueden suceder. El segundo tipo de problema es de especial importancia porque hay muchas situaciones en que no necesitamos una lista completa y por tanto, podemos ahorrarnos una gran cantidad de trabajo. Presión sanguínea DIAGRAMA DE ÁRBOL Tipo sanguíneo BAJA NORMAL ALTA Aunque el primer tipo de problema A puede parecer directo y sencillo, existen BAJA problemas que ilustran que esto no B siempre es el caso; hagamos unos NORMAL ejercicios para reflexionar. AB ALTA En un estudio médico se clasifica a los BAJA pacientes de acuerdo con el tipo de sangre que tengan, ya sea, tipo A; B, AB O NORMAL u O y también de acuerdo con su tipo de ALTA presión sanguínea, ya sea baja, normal BAJA o alta. ¿De cuántas maneras distintas se puede NORMAL clasificar a un paciente? ALTA Este tipo de problemas se puede manejar sistemáticamente trazando un DIAGRAMA DE ÁRBOL como el siguiente, donde se puede apreciar que la respuesta es 12. Comenzando por la parte superior, el primer camino a lo largo de las “ramas” corresponde a un paciente con tipo de sangre A y presión sanguínea baja, el segundo camino a un paciente con tipo de sangre A y presión sanguínea normal … y el duodécimo camino corresponde a un paciente que tiene sangre tipo O y una presión sanguínea alta. La respuesta que obtuvimos es de 4 por 3 = 12, específicamente es el producto del número de tipos de sangre por el número de niveles de presión sanguínea. Otro ejemplo: ¿Cuántas palabras de tres letras se pueden formar si se dispone de un alfabeto con dos letras; a y b.? (Nota: Son permisibles palabras como bba) Solución: Si tenemos 2 letras (a, b) y formamos la palabra con tres letras tendremos 23 = 2 x 2 x 2 = 8 esto quiere decir que formaremos ocho palabras con tres letras. 73 Para comprender mejor hagamos otro “DIAGRAMA DE ÁRBOL” Letra Inical Letra central letra final palabra formada a ………………….. a a a a b …………………… a a b a a …………………… aba b b ………………….. a b b a ………………….. b a a a b …………………. b a b b a …………………. b b a b b …………………. b b b Te toca a ti resolver el siguiente ejercicio utilizando un principio de conteo. ¿Cuántas placas distintas hay con dos letras a la izquierda y tres números a la derecha? Considerando que el alfabeto es de 27 letras castellanas y por supuesto 10 números Realiza aquí tus operaciones. ANIMO TU PUEDES PLACA DE NAYARIT _____ _____ _____ Letras s _____ _____ n ú m e r o SI OBTUVISTE BIEN EL RESULTADO, HAS DESCUBIERTO UN PRINCIPIO DEL CONTEO QUE ES EL… PROCESO DE CONTAR Si un primer suceso o evento puede efectuarse de p1 maneras diferentes, y si después de que este suceso ha sido efectuado, un segundo suceso puede efectuarse de p2 maneras diferentes, entonces los dos sucesos pueden verificarse siguiendo el orden indicado de p1. p2 maneras diferentes. Analiza con cuidado: De cuantas maneras diferentes se pueden seleccionar parejas de diferentes sexo de un grupo de 4 hombres y 6 mujeres? Solución: Como cada hombre puede ser seleccionado de cuatro maneras diferentes y cada mujer puede ser seleccionada de 6 maneras diferentes; entonces, cada pareja puede ser escogida de: 4 ( 6 ) = 24 maneras diferentes. 74 Si el suceso o evento incluye más de dos sucesos diferentes podemos ampliar el principio multiplicativo, de manera que si después de haber ocurrido los dos primeros sucesos, puede ocurrir un tercero de p3 maneras diferentes, un cuarto de p4 maneras diferentes, y por último un n-ésimo de pn maneras diferentes, entonces los sucesos pueden ocurrir en el orden siguiente: p1 p2 p3 p4 …, pn maneras diferente. Reflexiona y piensa: Una cafetería ofrece una comida especial que consiste en un emparedado (usando una de ocho carnes distintas y uno de cuatro tipos diferentes de pan), una de cuatro clases distintas de sopa y una de tres bebidas diferentes. ¿De cuántas maneras distintas una persona puede seleccionar una de estas comidas especiales? Solución: Dado que p1 = 8, p2 = 4, p3 = 4, p4 = 3, hay (8)(4)(4)(3) = 384 maneras diferentes en que se puede seleccionar una comida especial. Sigue pensando y analizando: Un examen de estadística, consta de quince preguntas de opción múltiple, de las cuales cada una tiene cuatro posibles respuestas. ¿De cuántas maneras distintas un estudiante puede marcar una respuesta para cada pregunta? Solución: puesto que p1=p2=p3=…= p15 = 4, en total hay 4.4.4.4.4.4.4.4.4.4.4.4.4.4.4 = 1,073,741,824 diferentes maneras en que un estudiante puede marcar una respuesta para cada pregunta. Nótese que sólo en una de las 1,073,741,824 posibilidades todas las respuestas son correctas. Y si queremos saber todas las respuestas incorrectas? será: 3.3.3.3.3.3.3.3.3.3.3.3.3.3 = 14,348,907 todas las respuestas incorrectas. En una calculadora científica este tipo de problema se resuelve de la siguiente forma: p 15 (o quince preguntas) tiene 4 posibles respuestas = cuatro respuestas por las 15 preguntas tenemos = 415 ponemos 4 y tecleamos X y , ponemos 15 y la tecla = y nos arroja el resultado 1,073,741,824 El principio multiplicativo nos permite en muchos casos calcular el número de posibilidades sin necesidad de listar todas ellas o de desarrollar un diagrama de árbol excesivamente grande. ES IMPORTANTE TENER EN CUENTA QUE PARA APLICAR ESTA REGLA, NO DEBE HABER RESTRICCIONES EN LAS COMBINACIONES POSIBLES. FACTORIAL ¿QUE ES EL FACTORIAL DE UN NÚMERO? Uno de los principales conocimientos que nos servirán como base para el cálculo de las técnicas de conteo (permutaciones y combinaciones), es el factorial de un número. Su definición y algunos ejemplos se comentan enseguida. 75 El producto de cualquier número entero positivo n por todos los enteros menores que n se llama FACTORIAL de n y se expresa con el símbolo n!, por lo tanto: 0! = 1 por definición 1! = 1 (1) = 1 2! = 2 (1) = 2 3! = 3 (2) (1) = 6 4! = 4 (3)(2)(1) = 24 5! = 5 (4)(3)(2)(1) = 120 . . . n! = (n) (n-1) (n-2) ,…(1) El factorial de los primeros números enteros positivos se pueden obtener directamente utilizando una calculadora, para números mayores se obtienen con la formula aproximada de Stirling o consultando tablas elaboradas con resultados. En tu calculadora científica pon 6 y oprime la tecla n! y te arrojará 720, que es el factorial de 6. Cuanto es el factorial de 7! = _______________________ 8! = ______________________ 9! =_______________________ 10! = _______________________________ 76 ACTIVIDADES DE APRENDIZAJE: Resuelve los siguientes problemas de probabilidades de frecuencia relativa en fracciones ( 0 a 1) y en porcentajes (%). REALIZA AQUÍ TUS CÁLCULOS. 1) ¿Cuál es la probabilidad de obtener un as de una baraja de póker (de 52 cartas)? 2) De cada 1000 personas a quienes se les practican exámenes médicos 35 tienen problemas de la vista. ¿Cuál es la probabilidad de que una persona examinada padezca algún malestar con su vista? 3) En una caja hay 75 canicas azules y 225 rojas. ¿Cuál es la probabilidad de sacar al azar una canica azul? Además calcula ¿cual es la probabilidad de sacar una roja? 4) En una caja hay 25 tornillos en buen estado y 80 defectuosos. ¿Cuál es la probabilidad de sacar de la caja al azar? a) Un tornillo en buen estado b) Un tornillo defectuoso? 77 MAS ACTIVIDADES DE APRENDIZAJE: UTILIZA LA HOJA DE AUN LADO O DE ATRAZ, PARA RESOLVER LOS SIGUIENTES PROBLEMAS DE CONTEO (Diagrama de árbol y principio multiplicativo,) 1) ¿De cuántas maneras diferentes se puede arreglar uno de los viajes especiales de fin de semana a 12 ciudades distintas, por avión, tren o autobús, que ofrece una agencia de viajes?: ELABORA UN DIAGRAMA DE ÁRBOL PARA ESTE EJERCICIO EN LA PÁGINA DE AÚN LADO. 2) En un restaurante ofrecen 4 tipos de comidas (a,b,c,d); 3 tipos de sopas (1,2,3); y 3 tipos de postres( x,y,z), ¿Cuáles son el número total de posibles formas de arreglos? ELABORA UN DIAGRAMA DE ÁRBOL PARA ESTE EJERCICIO EN LA PÁGINA DE AÚN LADO. 3) Un examen de 10 preguntas consiste en 6 preguntas de elección múltiple, cada una con 4 posibles respuestas, y la otra parte del examen con 4 preguntas de falso y verdadero. a) ¿De cuántas maneras (diferentes) se puede contestar el examen? b) ¿En cuantas maneras es posible responder el examen y obtener todas las respuestas mal? 4) Una persona piensa comprar cierto automóvil. El fabricante ofrece cualquier combinación de las siguientes alternativas: SEIS colores diferentes; DOS tipos de motor; TRES tipos de rines; Transmisión manual o automática; sin radio, con radio AM-FM, con radio AM-FMTocacintas o con radio AM-FM-CD; y sin aire acondicionado o con aire acondicionado. Cada comprador debe hacer UNA elección con respecto al color, motor, rines, transmisión, radio y aire acondicionado. 5) De una ciudad A a otra B hay 4 caminos; a su vez de, la ciudad B a la C hay 6 caminos, si todos los caminos son diferentes, de cuantas formas es posible: a) Viajar de A hasta C pasando por B b) Hacer el viaje “redondo” saliendo de A hasta C pasando por B y de C hasta A pasando por B c) Hacer el viaje “redondo” desde A hasta C pasando por B pero sin utilizar el mismo camino más de una vez. Ciudad A Ciudad B Ciudad C 78 P E R M U T A C I O N E S. Si estamos eligiendo de un conjunto de objetos, algunos de ellos en un orden o jerarquía determinada estamos haciendo una permutación, esto es, si al seleccionar o acomodar (r) objetos de un conjunto de (n) objetos distintos, cualquier arreglo (u orden) de estos objetos se conoce como, una permutación. En cada arreglo pueden participar parte o la totalidad de los elementos del conjunto. Permutaciones tomando sólo “parte de los elementos” del conjunto a la vez En esta técnica de conteo en la que EL ORDEN SI IMPORTA en que aparecen cada elemento del conjunto y en donde en cada arreglo participan una parte de los elementos del conjunto. También le llamaremos permutaciones de n elementos diferentes en grupos de r elementos. Es decir, en cada arreglo aparecerá parte de los elementos del conjunto y se n! utilizará la siguiente fórmula: n pr (n r )! Iniciemos: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los números 1,2,3 tomando DOS a la vez? n=3 r=2 3 p2 3! 3! 6 6 (3 2)! 1! 1 n = 1 2 3 Serían: 12; 13; 21; 23; 31; 32. Lo que hace que un arreglo sea diferente a otro es el orden en que aparecen los elementos del conjunto en cada arreglo. Para una PERMUTACIÓN, el arreglo {1,2} es diferente al arreglo {2,1}. Entonces, esta técnica de conteo es idónea para problemas en los que es importante la jerarquía que tienen algunos elementos sobre otros. Algunos ejemplos de ello, es cuando se requiere conocer el orden de llegada de personas, formas posibles de arranque y llegada en una justa atlética, colocación de objetos, la jerarquía en algunos puestos administrativos, la jerarquía en equipos médicos, el orden en que deben tomarse o medirse algunos objetos en experimentos, etcétera. Ahora: ¿Cuantas diferentes permutaciones o acomodos se pueden realizar con los números 1,2,3,4 tomando DOS a la vez? n=4 r=2 4 p2 4! 4! 24 12 (4 2)! 2! 2 n = 1 2 3 4 Serían: 12; 13; 14; 21; 23; 24; 31; 32; 34; 41; 42; 43; De nuevo te recordamos que es muy importante que te fijes que aquí si interesa el orden en que se seleccionaron los dos números (la pareja) de entre los cuatro números (1,2,3,4) y resulta que hay 12 permutaciones. Un problema más complicado: ¿Cuántas diferentes quintas ( r ) de baloncesto pueden formarse con 7 jugadores disponibles (n) para jugar cualquier posición? 7 p5 7! 5040 2520 (7 5)! 2 79 Se pueden formar 2520 quintas diferentes con 7 jugadores disponibles. Observa como utilizando la ley de la multiplicación utilizando un ORDEN nos arroja el mismo resultado: 7(6)(5)(4)(3)= o sea 7 opciones serían para la primer quinta, 6 la segunda quinta, 5 la tercer quinta, 4 la cuarta quinta y por último 3 la quinta, quinta. Si lo multiplicas nos dará igual = 2520. Otro para reafirmar el aprendizaje: el entrenador de la selección mexicana de fútbol debe decidir cómo se deben tirar los cinco primeros penales obligatorios en caso de un empate. ¿Cuántas elecciones posibles puede considerar? Partimos de que ya sabes que un equipo de fútbol tiene 11 jugadores. ¿ Hoooo? Eres mi ídolo acaboman 11 p5 11! 39916800 39916800 55440 (11 5)! 6! 720 Otra vez, utilizando la ley de la multiplicación sería: 11(10)(9)(8)(7)== 55440 elecciones posibles para determinar cómo tirarán los cinco penales obligatorios. Permutaciones tomando “todos los elementos” del conjunto Otro tipo de permutaciones es cuando en cada arreglo participan TODOS LOS ELEMENTOS DEL CONJUNTO(n), o sea cuando el número de permutaciones de n objetos se toman TODOS los elementos n a la vez. Iniciemos, Permutar los elementos de un conjunto de TRES tomando todos a la vez, es igual a 3! = 6 los arreglos resultantes son los siguientes 123,- 132, - 213, - 231, - 312, - 321. La fórmula que se utiliza para estos casos es n Pn n! Otro para comprender mejor: ¿De cuantas maneras distintas se pueden asignar a diez profesores las diez secciones de un curso de economía? n = 10, obtenemos: P 10! 3,628,800 10 10 Aquí si aplicamos la ley de la multiplicación sería: 10 (9)(8)(7)(6)(5)(4)(3)(2)(1) = 3,628,800 Fíjate que aquí si se multiplican toda la serie de los números. Un último para confirmar: Obtener cuántos números pueden formarse con los dígitos 1,2,3,4,5 sin repetir ningún dígito, n = 5 P 5! 120 5 5 Si aplicamos la ley de la multiplicación sería 5(4)(3)(2)(1) = 120. ESTO SI ESTÁ MUY INTERESANTE ¿VERDAD? 80 Pero… ¿Cómo se elabora un espacio muestral para permutaciones tomando todos los elementos? Ejemplo para pensar, sea S= { a,b,c,d, } un conjunto con cuatro elementos genéricos, calcular las posibles formas en que se pueden permutar tomando todos los objetos a lan P vez. n n! Para ello la forma de cálculo está referida simplemente a sustituir el número de elementos en n!. Como ya se explicó, el factorial de un número es el producto de todos los enteros desde n hasta 1. Entonces, para éste ejemplo el número de elementos es 4, así, 4! = (4)(3)(2)(1) = 24 que será el número de formas posibles, pero queremos saber todos los posibles arreglos o los espacios maestrales para dicho problema. Como primer paso se elabora una tabla que contenga todos los posibles arreglos para lo cual utilizamos la regla del cociente. Regla del cociente = Número total de arreglos Número de elementos . = 24 = 6 arreglos 4 El número 6 nos indica que cada elemento del conjunto deberá repetirse seis veces en la primera columna. COMPLETA EL EJERCICIO PARA LAS PRIMERAS COLUMNAS (1) N.A Arreglo N.A Arreglo N.A Arreglo N.A Arreglo 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 a b c d 7 b 13 19 2 a b d c 8 b 14 20 3 a c b d 9 b 15 21 4 a c 10 b 16 22 5 a 11 b 17 23 6 a 12 b 18 24 d c b a Como te darás cuenta se han creado cuatro subgrupos de seis elementos. El segundo paso consiste en hacer la misma operación que el paso anterior, solamente que esta vez, el total de arreglos serán 6 y el número de elementos serán tres, (6/3 = 2) ya que uno de los cuatro elementos ya han sido permutados en la primera columna. En el subgrupo de arreglos que comienzan con “a” ese elemento quedará fuera en esta operación, o sea que los elementos a permutar serán el resto del conjunto; b,c,d. Similarmente, en el subgrupo de arreglos que comienzan con “b” ese elemento quedará fuera de esta operación, o sea que los elementos a permutar serán el resto del conjunto: a,c,d; y así sucesivamente. A continuación podrás observar dicho procedimiento. COMPLETA EL EJERCICIO EN LA SEGUNDA COLUMNA El tercer paso es una característica de esta forma de permutación. Lo que procede es permutar los dos últimos elementos del conjunto. Por ejemplo, en los arreglos 1 y 2 está el arreglo parcial { a,b }. Si S = { a,b,c,d }, entonces los elementos que no están presentes en esos arreglos son los elementos c y d, para el primer arreglo y d y c para el segundo arreglo. COMPLETA EL EJERCICIO PARA LA TERCERA Y CUARTA COLUMNAS hasta llenar todos los arreglos según corresponda. 81 Finalmente algunas características de las permutaciones tomando “todos los elementos”. a) En cada arreglo están presentes todos los elementos del conjunto: { a,b,c,d }. b) Todos los arreglos son mutuamente excluyentes. Es decir, cada uno de ellos es diferente al resto, por lo tanto no existen dos arreglos iguales. c) Se forman bloques de arreglos que inician con el mismo elemento. Para este caso, existen cuatro bloques de seis arreglos que inician con el mismo elemento. Este tipo de agrupamiento es el mayor para 4! d) El menor agrupamiento en bloques es por pares. De hecho, las dos últimas columnas de cada par forman un modelo 2! e) En el primer arreglo, todos los elementos están arreglados en un orden ascendente f) En el último arreglo sucede lo contrario, están arreglados en forma descendente. g) El arreglo de los elementos se realiza en estricto orden. h) En referencia a los 24 arreglos, aparecen todos los elementos en la primera columna. i) En referencia a cualquier bloque de seis, en la segunda columna aparecen n -1(4-1=3) elementos del conjunto. j) En referencia al bloque más pequeño, cualquier par de arreglos, en la tercera aparecen n - 2 (4-2= 2) elementos del conjunto. k) En referencia a cualquier arreglo, en la k-ésima columna aparece el elemento faltante del conjunto. l) Ninguno de los 24 arreglos presenta un elemento repetido. AHORA… ¿Cómo se elabora un espacio muestral para permutaciones “tomando sólo parte de los elementos” del conjunto a la vez? Un problema para reflexionar: Supongamos que en el primer nivel de las eliminatorias realizadas para participar en la final de los 400 metros femenil de Grecia 2004, participaron 5 atletas por evento. Entonces, sea S = {1,2,3,4,5} el conjunto de elementos que representa esas cinco atletas. Supongamos, además que Ana Gabriela Guevara está representada por el número 1. a) Calcula el número de formas posibles en que esas cinco atletas pueden llegar a la meta en el primero, segundo y tercer lugar. b) Elabora el espacio muestral. c) ¿De cuantas formas puede llegar Ana Gabriela en primero, segundo y tercer lugar?. Si tenemos un conjunto de 5 elementos, de los cuales sólo nos interesa permutar 3 de ellos (primero, segundo y tercer lugar) en cada arreglo. Así, n = 5 y r = 3 entonces… 5 p3 5! (5)(4)(3)(2)(1) 120 60 (5 3)! (2)(1) 2 Para dar respuesta a la pregunta a) podemos concluir que si participan 5 atletas y sólo deseamos conocer las posibles formas en las cuales llegan los tres primeros lugares, entonces tenemos 60 posibles formas. La pregunta b) se resuelve de la siguiente manera: Primer paso se elabora la tabla en la que colocaremos los arreglos, para lo cual realizamos el cálculo del número de veces que aparecerá cada elemento en la primera columna, utilizando de nuevo la regla del cociente. Regla del cociente = Número total de arreglos Número de elementos . = 60 = 12 arreglos 5 82 El número 12 nos indica que esas serán las veces que podría aparecer cada atleta en primer lugar. COMPLETA LOS PRIMEROS LUGARES DE LLEGADAS DE LA TABLA N. Llegada N. Llegada N. Llegada N. Llegada N. Llegada A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° A. 1° 2° 3° 1 1 2 3 13 2 25 37 49 2 1 2 4 14 2 26 38 50 3 1 2 5 15 2 27 39 51 4 1 3 2 16 2 28 40 52 5 1 3 4 17 2 29 41 53 6 1 3 5 18 2 30 42 54 7 1 4 19 2 31 43 55 8 1 4 20 2 32 44 56 9 1 4 21 2 33 45 57 10 1 22 2 34 46 58 11 1 23 2 35 47 59 12 1 24 2 36 48 60 5 4 3 El segundo paso consiste en calcular los segundos lugares para las otras cuatro corredoras. Regla del cociente = Número total de arreglos . = 12 = 3 arreglos Número de elementos 4 Habrá que poner tres veces el 2, tres veces el 3 etc. a excepción del que ya está en 1er lugar. COMPLETA LOS SEGUNDOS LUGARES DE LLEGADAS DE LA TABLA El tercer paso puede tener dos lecturas; la primera determinar mediante la regla del cociente el número de veces que aparecerá cada elemento en la tercer columna ( 3 / 3 = 1); La segunda, colocar el resto de los elementos para el menor subgrupo. Recomendaremos la segunda opción, por tanto, en este caso el subgrupo más pequeño es de tres elementos idénticos. Por ejemplo, los arreglos uno, dos y tres tienen los elementos 1 y 2 hasta la segunda columna. Al contrario de la anterior técnica de permutaciones (tomando todos los elementos), en esta ocasión colocaremos el resto de los elementos en una forma vertical hacia abajo. Esta acción nos servirá para distinguir esa tercia de arreglos idénticos. COMPLETA LOS TERCEROS LUGARES DE LLEGADAS DE LA TABLA ¿AHORA SI PUEDES CONTESTAR A LA PREGUNTA c)? ¿De cuantas formas puede llegar Ana Gabriela Guevara en primero, segundo y tercer lugar?. En primer lugar_________________ formas En segundo lugar _______________ formas En tercer lugar _________________formas MUCHAS FELICIDADES GANASTE LA CARRERA 83 ACTIVIDADES DE APRENDIZAJE: CALCULA LAS POSIBLES FORMAS DE PERMUTACION Y ELABORA LOS ESPACIOS MUESTRALES UTILIZANDO LA PAGINA DE LADO O ATRAZ DE ELLA. 1) Sea S = { a,b,c,}, o sea un conjunto con tres elementos genéricos, calcular las posibles formas en que se pueden permutar tomando todos los objetos a la vez y elaborar el espacio muestral correspondiente. 2) Sea W = { A,B,C,D} un conjunto con cuatro elementos, calcular las posibles formas en que se pueden permutar tomando tres a la vez y elaborar el espacio muestral correspondiente. 3) Sea X = { a,b,c,d,e,f} un conjunto con seis elementos, calcular las posibles formas en que se pueden permutar tomando dos a la vez y elaborar el espacio muestral correspondiente. 84 C O M B I N A C I O N E S: Una combinación es un subconjunto o un arreglo de todos o parte de los objetos de un conjunto sin considerar el orden de los objetos, donde el número total de combinaciones posibles de un conjunto de objetos tomados todos a la vez es 1. Por ejemplo, los arreglos posibles del conjunto de letras {a,b} son ab y ba. Puesto que el orden del arreglo NO es considerado, el arreglo ab es el mismo que ba. Por tanto, hay solamente una combinación posible para el conjunto. Combinaciones “tomando parte del conjunto” de elementos Esta técnica de conteo consiste en obtener en cualquier orden grupos de r elementos de un total disponible de n elementos diferentes y en cada arreglo participan una parte de los elementos del conjunto. Se utilizará la siguiente fórmula: n Cr n! r!(n r )! HAGAMOS LOS MISMOS EJEMPLOS QUE HICIMOS EN PERMUTACIONES ÚNICAMENTE QUE AHORA CON COMBINACIONES PARA QUE ANALICES SUS DIFERENCIAS. Para iniciar: Cuantas diferentes combinaciones o grupos se pueden realizar con los números 1,2,3 tomando DOS a la vez? n=3 r=2 3 C2 3! 3! 6 3 2!(3 2)! 2!1! 2 n = 1 2 3 Serían: 12; 13; 23 21; 31; 32; Estos se eliminan, porque no nos interesa el orden en que se seleccionan los dos números ( r ) de entre los tres números ( n ). Aquí es mas chico el resultado que en la permutación, porque el orden no tiene importancia. Para que lo compares: Cuantas diferentes combinaciones o agrupaciones se pueden realizar con los números 1,2,3,4 tomando DOS a la vez? n=4 r=2 4 C2 4! 4! 24 6 2!(4 2)! 2!2! 4 n = 1 2 3 4 Serían: 12; 13; 14; 23; 24; 34; 21; 31; 32; 41; 42; 43; Estos se eliminan por la misma razón anterior. Es muy importante que te fijes que aquí NO interesa el orden en que seleccionan los dos números (la pareja) de entre los cuatro números (1,2,3,4) y resulta que hay 6 combinaciones. HAGAMOS ALGUNOS EJEMPLOS PARA QUE ESTES LISTO PARA TUS… ACTIVIDADES DE APRENDIZAJE. 85 PRIMER PROBLEMA: Con una parte de su primer salario, un alumno de quinto semestre decide comprar TRES de los SIETE discos compactos que ha sacado a la venta el grupo MANA. ¿Cuántas posibilidades tiene? Ya que hay que elegir 3 discos (sin importar el orden) de un conjunto de siete. n=7 r=3 7 C3 7! 7! 5040 5040 35 3!(7 3)! 3!4! (6)(24) 144 Tiene 35 combinaciones al comprar tres discos de los siete. OTRO PARA PENSAR; ¿De cuantas maneras una persona puede seleccionar TRES libros de una lista de OCHO best-sellers? Aquí tampoco es importante el orden en que se seleccionen los tres libros. n=8 8! 8! 40320 40320 r=3 56 8 C3 3!(8 3)! 3!5! (6)(120) 720 Tiene 56 maneras para seleccionar los tres libros. PARA REFLEXIONAR Y CONFIRMAR: Un alumno del CBTa No. 107 Ext. Xalisco del turno vespertino, tiene 7 libros de física y 5 de matemáticas. Calcular de cuántas maneras se pueden ordenar 3 libros de física y 2 de matemáticas en un librero. Primeramente hacemos las combinaciones posibles de libros de física. n=7 7! 7! 5040 5040 35 7 C3 r=3 combinaciones de libros de física 3!(7 3)! 3!4! (6)(24) 144 Ahora hacemos las combinaciones posibles de libros de matemáticas 5! 5! 120 120 10 5 C2 n=5 combinaciones de libros 2!(5 2)! 2!3! (2)(6) 12 matemáticas r=2 Multiplicamos 35 por 10 nos resulta 350 combinaciones posibles. de AHORA… ¿Cómo se elaboran espacios muestrales para combinaciones “tomando sólo parte del conjunto” de elementos? De una manera general, la propuesta para elaborar espacios muestrales para este tipo de técnica de conteo está basada en un sistema numérico a la n, el cual denominamos “Método de la cifra”. (Tomado de: Técnicas de muestreo y espacios maestrales sin maestro. Héctor Francisco Reynoso Titrado) Sea S = { 1,2,3,4,5 }, un conjunto con cinco elementos genéricos. Calcule… a) El número de posibles arreglos tomando cuatro de ellos a la vez, b) Elabore el espacio muestral de esos arreglos o combinaciones. 5 C4 5! 5! 120 120 5...combinacio nes 4!(5 4)! 4!1! (24)(1) 24 La respuesta a la primera pregunta es 5 posibles combinaciones. 86 En el caso de la segunda pregunta, empezaremos por preparar el espacio para arreglar esas cinco combinaciones Primer paso Colocamos los primeros cuatro elementos del conjunto en el primer arreglo. N.A. 1 2 3 4 5 a 1 Combinaciones b c 2 3 d 4 En el segundo paso, colocaremos el segundo arreglo que representaría el tope de los arreglos que inician con los elementos 1,2 y 3. También cubrimos el tercer arreglo con la columna k-1 con el elemento n-1, o sea el elemento 4 N.A. 1 2 3 4 5 a 1 1 1 Combinaciones b c 2 3 2 3 2 4 d 4 5 5 Observa cómo nuestra atención está siendo demandada en las últimas columnas, arreglando, de los elementos menores a los mayores, similar a un sistema numérico. Finalmente… Tercer paso, será cambiar el elemento 2 de la columna k-2, por el siguiente elemento, el 3 (arreglo número cuatro). Lo demás ya es sabido, no habrá elementos mayores a la izquierda. N.A. 1 2 3 4 5 a 1 1 1 1 2 Combinaciones b c 2 3 2 3 2 4 3 4 3 4 d 4 5 5 5 5 Este método permite ir agotando los elementos a usar de derecha a izquierda. Observa que en el cuarto arreglo ya están agotadas la k-ésima columna con el n-ésimo elemento, la columna k-1 con el elemento n-1 y la columna k-2 con el elemento n-2. Así, lo único que nos resta es colocar el elemento 2 en la primera columna y combinarlo con el resto de los elementos del conjunto que están a la derecha (arreglo número cinco). Algunas características de las combinaciones a) Las combinaciones son arreglos de elementos en los que no nos interesa el orden de los mismos. b) El primer arreglo tiene combinados los primeros elementos del conjunto. c) El último arreglo tiene combinados los últimos elementos del conjunto. d) Los elementos del conjunto aparecen arreglados del menor al mayor de los elementos, al menos en las escalas nominales y de razón. Justamente, en esta característica está 87 basado el método de la cifra que usamos para elaborar espacios maestrales para combinaciones. e) El número que aparece cada elemento del conjunto es el espacio muestral está dado por la siguiente fórmula: Repeticiones de cada elemento en el espacio muestral (RCE) = (c) (r) . n donde: c = Número de combinaciones o arreglos posibles r = Elementos tomados a la vez en cada arreglo n = Número total de elementos en el conjunto. Para comprobar ésta formula con el ejemplo anterior tenemos: RCE = ( 5 ) ( 4 ) = 20 = 4 5 5 N.A. 1 2 3 4 5 a 1 1 1 1 2 Combinaciones b c 2 3 2 3 2 4 3 4 3 4 d 4 5 5 5 5 Observamos que cada elemento (1,2,3,4,5) en el espacio muestral se repite cuatro veces; esto es, hay cuatro 1, cuatro 2, cuatro 3, cuatro 4 y cuatro 5. En resumen: Es muy importante que recuerdes que en una permutación SI importa el orden y se relaciona a sucesiones ordenadas; parejas ordenadas, tríadas ordenadas, etc. En las combinaciones NO importa el orden y se relacionan con la selección de un subconjunto de un conjunto dado. JA, JA, está bien fácil; ya le entendí aceboman Yo También ya agarré la onda ENTONCES REALIZA TUS ACTIVIDADES DE APRENDIZAJE: 88 CALCULA LAS POSIBLES FORMAS DE COMBINACIÓN POSIBLES Y ELABORA LOS ESPACIOS MUESTRALES UTILIZANDO LA PAGINA DE LADO O ATRAZ DE ELLA, PARA REALIZAR LOS EJERCICIOS 1) Sea X = { a,b,c,d,e }, un conjunto con cinco elementos genéricos. Calcule a) el número de posibles arreglos tomando dos de ellos a la vez, b) elabore el espacio muestral de esos arreglos 2) Sea W = { 1,2,3,4,5}, un conjunto con cuatro elementos genéricos. Calcule a) el número de posibles arreglos tomando tres de ellos a la vez, b) elabore el espacio muestral de esos arreglos 3) Sea Z = { a,b,c,d,e,f }, un conjunto con cinco elementos genéricos. Calcule a) el número de posibles arreglos tomando tres de ellos a la vez, b) elabore el espacio muestral de esos arreglos 89 MÁS ACTIVIDADES DE APRENDIZAJE: En cada uno de los siguientes problemas, decide si se trata de una permutación o de una combinación y obtén su resultado correcto. UTILIZA LA HOJA DE AUN LADO Y/O LA DE ATRAZ PARA TUS OPERACIONES. 1) Calcular el número de palabras de 5 letras, que se pueden formar con 12 letras diferentes, aunque no necesariamente tengan algún significado. Permutación _____ o combinación________ Resolver: 2) Calcular el número de palabras, que pueden formarse seleccionando 6 consonantes y 2 vocales entre 10 consonantes y 4 vocales, no necesariamente con significado. Permutación _____ o combinación________ Resolver: 3) Calcular de cuántas maneras diferentes pueden colocarse 7 libros en un librero Permutación _____ o combinación________ Resolver: 4) Un parque de diversiones tiene 28 recorridos distintos. ¿De cuántas maneras diferentes una persona puede tomar cuatro de estos recorridos, suponiendo que el orden es importante y que no quiera tomar un recorrido más de una vez? Permutación _____ o combinación________ Resolver: 5) Una bolsa contiene 6 bolas rojas numeradas del 1 al 6 y 8 bolas azules numeradas del 1 al 8. ¿De cuántos modos se pueden seleccionar 6 bolas de manera que 2 sean rojas y 4 azules? Permutación _____ o combinación________ Resolver: 6) La carta de una fonda indica que hay 4 sopas, 7 carnes, 8 ensaladas y 5 postres. ¿De cuántos modos se puede ordenar una comida consistente en una sopa, una carne, 3 ensaladas y un postre? Permutación _____ o combinación________ Resolver: Analicemos otros temas relacionado con lo anterior…… ANIMO 90 TEOREMA DEL BINOMIO Y TRIÁNGULO DE PASCAL En aritmética y álgebra ya se definió que es igual a uno “ a° = 1 “Toda cantidad elevada a la cero potencia OBSERVA DETENIDAMENTE “EL TEOREMA DEL BINOMIO” (Tómate tu tiempo) ( x + y )1 = x + y ( x + y )2 = x2 + 2xy + y2 ( x + y )3 = x3 + 3x2y + 3xy2 + y3 ( x + y )4 = x4 + 4x3y + 6x2y2 + 4xy3 + y4 ( x + y )5 = __________________________________ ( x + y )6 = _______________________________________________ ¿Puedes resolver los dos binomios que faltan? ¡Yo SI puedo! !!Yo No Puedo aceboman¡¡ Entonces analiza las siguientes conclusiones: A la mejor se te ocurre algo 1. El número de términos es igual al grado del binomio más uno. 2. El grado del primer término es igual al grado del binomio y disminuye sucesivamente en uno, en cada uno de los siguientes términos y es factor en todos los términos, menos en el último. 3. El segundo término, “y” en los ejemplos, aparece en el segundo término del desarrollo con exponente uno, y aumenta sucesivamente en uno en cada uno de los términos siguientes hasta llegar al exponente del binomio, el cual es el último del resultado. 4. El coeficiente del primer término del resultado es uno y el del segundo es el exponte del binomio; el último término también es uno. 5. El coeficiente de un término cualquiera es igual al coeficiente del término inmediato anterior, por el exponente de “x” en éste término y dividido entre el número de términos desarrollados. 6. El grado de cada término es igual al grado del binomio. 7. Los términos que equidistan de los extremos tienen coeficientes iguales 8. Cada término del binomio se considera con coeficiente y signo. AHORA SI PUEDES? ANIMO RESUELVELO Matemáticamente el binomio de Newton es el siguiente: ( x y) n x n nx n 1 y n(n 1) x n 2 y 2 n(n 1)(n 2) x n 3 y 3 ... y n 1(2) 1(2)(3) 91 El triángulo de TARTAGLIA junto con el triángulo de PASCAL, facilitan el calculo de los coeficientes de la potencia de un binomio (o coeficientes binomiales) observa: TRIANGULO DE PASCAL ( x + y )0 = primera fila 1 ( x + y )1 = 1 ( x + y )2 = 1 ( x + y )3 = ( x + y )4 = 1 1 1 2 3 4 1 3 6 1 4 1 ( x + y )5= (x + y )6 = Observa que si sumas dos coeficientes adyacentes, su suma es el coeficiente entre ellos una fila abajo; por ejemplo, para obtener el 2 de la tercer fila sumamos los dos UNOS(1+1=2) de la segunda fila; para obtener el 4 de la quinta fila sumamos el UNO y TRES (1 +3 = 4) Preparados ahora si con todo este conocimiento, podemos escribir fácilmente TODO EL DESARROLLO de los binomios (x+y)5 ; (x+y)6 y (x + y )7 (x + y )5 = _______________________________________________ Por supuesto que si deseamos desarrollar la sexta potencia del binomio, podemos hacerlo utilizando los coeficientes de la quinta potencia y así sucesivamente. Fácil o no? ( x + y )6 = ____________________________________________________________ (x + y)7 = _________________________________________________________________ ¡¡¡MUY BIEN FELICIDADES!!! 92 PROBABILIDAD AXIOMÁTICA Los problemas de probabilidad en situaciones prácticas, son sucesos o eventos compuestos que requerirían para su solución la enumeración de muchos puntos muestrales, procedimiento lento y cansado; de ahí, que haya un segundo procedimiento que se llama composición de sucesos o probabilidad axiomática. Esta composición se forma con dos o más sucesos y se realiza con la UNIÓN o con la INTERSECCIÓN DE CONJUNTOS o con la combinación de ambos; se basa en: la clasificación de los sucesos, las relaciones entre ellos y tres leyes: LA ADITIVA (o regla de la suma), LA MULTIPLICATIVA (o regla del producto) Y LA DE SUSTRACCIÓN ( o regla de la diferencia). Como estamos refiriéndonos a la probabilidad axiomática, es conveniente recordar que un axioma es una proposición matemática evidente por sí misma que no requiere demostración. SIMBOLOGÍA BÁSICA DE CONJUNTOS El propósito del presente apartado es realizar un recordatorio somero de la teoría de conjuntos ya que es un instrumento adecuado para la sistematización de nuestra forma de pensar y permitir la capacidad de análisis y comprensión de las interrelaciones que hay entre todas las partes de un problema, y así facilitar su solución en el estudio de la probabilidad axiomática. A) UNIÓN ( su símbolo es U ) Si se reúnen los elementos de dos o más conjuntos para formar uno solo, a este conjunto que resulta se la llama UNIÓN DE CONJUNTOS; si existen elementos comunes entre los conjuntos originales éstos no se repiten en el conjunto unión. Piensa detenidamente: Sean los conjuntos P = { 1, 2, 3, 4,} M = { 3, 4, 5, 6 } En Diagrama de Venn - Euler P ( P U M) = { 1, 2, 3, 4, 5, 6 } P 1,2 M 3, 4 5, 6 P (P o M) = { 1, 2, 3, 4, 5, 6 } B. INTERSECCIÓN (su símbolo es ∩ ) La intersección de dos conjuntos A y B es el conjunto que forman los elementos comunes a ambos conjuntos, se representa con el símbolo ∩ colocado entre los conjuntos, así; A ∩ B se lee “intersección de A y B” o “A intersección de B” Ejemplo 1) Sean los conjuntos A = { 1, 2, 3, 4, } B = { 1, 2, 5, 6 } 93 En Diagrama de Venn - Euler P (A ∩ B) = { 1, 2 } A P (A y B) = { 1, 2 } Otra variante de lo mismo: Sean los conjuntos 1,2 P = { 1, 2, 3 } B M = { 6, 7 } En Diagrama de Venn - Euler P (P ∩ M) = Ø P (P y M) = Ø Ø = Se refiere a un conjunto vacío o disjunto Debido a que no existen elementos en común Ø P 1, 2, 3 M 6, 7 C. COMPLEMENTO DE UN CONJUNTO Cuando se ha establecido un conjunto universal u, a la diferencia de u y un conjunto sea por ejemplo A, se le llama COMPLEMENTO de A, se expresa A’ . El apóstrofe señala que hemos formado el complemento de A. Algunos autores expresan el complemento, así; A c con una pequeña c de donde A’ = Ac , otros mas, lo expresan con una barra arriba de la letra mayúscula. Observa detenidamente: u = { 1, 2, 3, 4, 5, 6 } A = { 1, 2, 3 } En diagrama de Venn - Euler u P ( A’ ) = { 4, 5, 6 } A A’= 4, 5, 6 D. DIFRENCIA ENTRE CONJUNTOS Dados los conjuntos A y B, : la diferencia de A – B, en este orden, es el conjunto de todos los elementos que pertenecen a A, pero no a B. La diferencia de A y B se expresa A – B que se lee “ A diferencia de B ” o “ A menos B “ En diagrama de Venn - Euler Ejemplo: A = { 1, 2, 3, 4, 5 } B = { 1, 2 } A – B = { 3, 4, 5 } A -B B 3, 4, 5 Se utiliza cuando es necesario que ocurra el suceso A y simultáneamente No ocurra el suceso B 94 En muchos problemas de probabilidad debemos considerar eventos que se forman por medio de UNIONES, INTERSECCIONES Y COMPLEMENTOS. Para ilustrar estos conceptos reflexionemos y analicemos el siguiente problema: EL ESPACIO DE LOS DÍAS DE LLUVIA EN JULIO EN LA PARTE MAS LLUVIOSA DE NAYARIT ES EL CONJUNTO S = { 0, 1, 2, 3, …, 31}, TOMEMOS LOS SUBCONJUNTOS A = { 0, 1, 2, 3, 4, 5, 6 } B = { 20,21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31} C = { 0, 15, 31 } D = { 18, 19, 20, 21, 22, 23, 24 } E = { 22 } A = es el evento que llueva a lo más seis días B = es el evento que llueva cuando menos 20 días C = es el evento que llueva o todos los días del mes, o quince días o bien ningún día del mes. D = es el evento que llueva entre 18 y 24 días E = es el evento que llueva exactamente 22 días al mes. Analicemos y aprendamos a resolver los siguientes eventos: a) A U D; c) D ∩ B; e) B’ g) D’ U B’ b) B U D; d) A ∩ B; f) D’ h) B’ ∩ A’ a) Como A U D es el evento de los resultados que están en A o en D, A U D es por tanto el evento { 0, 1, 2, 3, 4, 5, 6, 18, 19, 20, 21, 22, 23, 24} b) B U D = { 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31} c) D ∩ B es el de los resultados que están tanto en D como en B, por lo que D ∩ B = {20, 21, 22, 23, 24} representa que llueva de 20 a 24 días durante el mes de julio. d) A ∩ B; Observamos que A y B no tienen elementos en común, de modo que la intersección de A y B es el conjunto vacío, esto es, A∩ B = Ø. Cuando dos eventos no tienen resultados en común decimos que son mutuamente excluyentes y equivale a que no pueden ocurrir los dos simultáneamente. Esto lo estudiamos en el siguiente tema. e) B’ es el evento formado por los resultados que no están en B, así que B’ = { 0, 1, 2, …, 19}; B’ es el evento que llueva de los 0 a los 19 días. f) Como D’ = { 0, 1, 2, …, 16, 17, 25, 26, …, 30, 31} entonces D’ es el evento de que llueva a lo más (o menos que) 17 días, o bien, que llueva mas de 25 días. g) Como D’ = { 0, 1, 2, …, 16, 17, 25, 26, …, 30, 31} y B’ = { 0, 1, 2, …, 18, 19} entonces D’ U B’ = { 0, 1, 2, …, 16, 17, 18, 19, 25, 26, …, 30, 31} ¿como se interpreta? 95 h) B’ ∩ A’ como B’ = { 0, 1, 2, …, 19} y A’ = { 7, 8, 9, …, 31} , entonces la intersección B’ ∩ A’ es el evento { 7, 8, 9, …, 18, 19 } que llueva de 7 a 19 días. TIPOS DE EVENTOS En función de la relación de probabilidad que se puede establecer entre los eventos o sucesos éstos se clasifican en: MUTUAMENTE EXCLUYENTES O DISJUNTOS. Son aquellos sucesos o eventos en los que en un mismo experimento aleatorio no es posible que ocurran simultáneamente. En sucesos mutuamente excluyentes se tienen que la ocurrencia de uno de ellos elimina automáticamente la posibilidad de que ocurra el otro. NO EXCLUYENTES ENTRE SI. Son aquellos eventos en un mismo experimento aleatorio, en los que la posibilidad de que ocurra uno de ellos, no impide que el otro suceso ocurra; es decir, pueden ocurrir conjuntamente. Analiza el primer problema: En un experimento aleatorio, se analiza en un momento dado el estado de salud de los habitantes de una comunidad. Consideremos los sucesos siguientes: A: La persona es diabética. B: La persona está sana. C: La persona tiene un problema de salud permanente, tiene una enfermedad crónica D: La persona tiene gripa. E: La persona es hipertensa. A y B = los eventos A y B SON MUTUAMENTE EXCLUYENTES, puesto que una persona sana no puede ser diabética y si es diabética no está sana. C y E = Los sucesos C y E NO SON MUTUAMENTE EXCLUYENTES porque en el conjunto de personas que tienen un problema de salud permanente están los que sufren de hipertensión, a la vez un hipertenso es una persona con un problema de salud permanente. B y C = Los sucesos B y C SON MUTUAMENTE EXCLUYENTES porque una persona no puede considerarse a la vez sana y tener un problema de salud permanente. C y D = Los eventos C y D NO SON MUTUAMENTE EXCLUYENTES porque existe la posibilidad de que una persona con un problema de salud permanente esté enfermo de gripa. Otro para confirmar: se observa la escolaridad de las personas de 20 a 60 años de edad en una comunidad. Consideremos los sucesos siguientes: A: Una persona tiene menos de 40 años B: La persona es ingeniero C: La persona es analfabeta D: La persona tiene 40 años o más. Los sucesos A y B NO SON MUTUAMENTE EXCUYENTES porque es posible que una persona entre 20 y 40 años sea ingeniero, a la vez que un ingeniero puede tener menos de 40 años y mas de 20. Los sucesos B y D NO SON MUTUAMENTE EXCLUYENTES ya que un ingeniero puede tener más de 40 años y entre las personas de 40 a 60 años pueden haber ingenieros. 96 Los sucesos B y C SON MUTUAMENTE EXCLUYENTES O DISJUNTOS, puesto que un analfabeta no puede ser ingeniero y un ingeniero no es un analfabeta. Los sucesos A y D SON MUTUAMENTE EXCLUYENTES O DISJUNTOS, porque una persona no puede tener menos de 40 años o mas de 40 años en un mismo momento. Finalmente, antes de analizar problemas de probabilidad con uniones, complementos e intersecciones de eventos; analicemos cuando intervienen tres o más eventos y sus relaciones, dibujando la siguiente figura en donde el espacio muestral queda dividido en ocho regiones diferentes. Y Z Digamos que X es el evento que los autos nuevos que 6 2 5 lleguen a la agencia sean automáticos, Y es el 1 evento que los autos nuevos que lleguen a la 3 4 agencia sean de cuatro puertas, Z que los autos nuevos que lleguen a la agencia tengan rines 7 deportivos 8 X ¿Que representan las siguientes regiones o números? a) La región 3. b) la región 6, c) la región 7. La región 3 está formada por los resultados que están en X y en Y, ( X ∩ Y ), pero no están en Z, de modo que representa el evento de que los autos nuevos que lleguen a la agencia sean automáticos, de cuatro puertas y no tengan rines deportivos. La región 6 está formada por los resultados que tiene el evento Z, esto es que los autos nuevos que lleguen a la agencia tengan nomás rines deportivos. La región 7 está formada por los resultados que NO están ni en Y ni en Z, por lo que representa el evento que los autos que lleguen a la agencia NO tengan cuatro puertas ni tampoco rines deportivos, pero que si sean automáticos. Podrías contestar que representa (escríbelo)_________________________ la región 1 y la 8 ? ___________________________________________________________________________ _ y la región 2 y ?,_____________________________________________________________ 4 ___________________________________________________________________________ _ Finalmente la región 5 ?_____________________________________________________ PROBABILIDAD DE UNIONES Y EVENTOS COMPLEMENTARIOS Una vez que ya nos hemos familiarizado con los eventos y sus relaciones vamos a describir algunas reglas sencillas que nos permitan determinar la probabilidad de que ocurra algún evento. Para expresar simbólicamente estas reglas denotaremos por P ( A ) a la probabilidad de que ocurra el evento A. Ya hemos comentado que la probabilidad de que suceda un evento es un número real entre cero y uno y que entre más pequeño sea este número, el evento es menos probable y entre más cercano a uno el número el evento es más probable. 97 REGLAS BÁSICAS DE PROBABILIDAD 1. Las probabilidades son números reales entre 0 y 1 2. P ( u ) = 1 y P ( Ø ) = 0 como el espacio muestral ( u ) universo “otros libros utilizan P(S)” contiene a todos los posibles resultados que pueden ocurrir, se tienen que el evento u ocurre con certeza, de modo que P (u ) = 1 y cuando con certeza un evento no puede ocurrir, su probabilidad es cero P ( Ø ) = 0 3. Regla de la suma ( ley aditiva de la probabilidad) Esta ley se utiliza cuando se quiere obtener la probabilidad de que ocurra el suceso A o el suceso B, para lo cual es necesario revisar si los sucesos SON O NO MUTUAMENTE EXCLUYENTES. a) Cuando dos sucesos son mutuamente excluyentes se tiene que A ∩ B = Ø ; (es el conjunto vacío) se utiliza entonces P ( A U B ) = P ( A ) + P ( B ) es decir, que la probabilidad de que A o B ocurran indistintamente, es igual a la suma de sus probabilidades individuales. Hagamos un diagrama… U P (A ) + P (B) Eventos mutuamente excluyentes b) Regla para eventos complementarios ( ‘ ). En consecuencia de las reglas anteriores, surge P ( A’ ) = 1 – P (A) ya que los eventos A y A’ son mutuamente excluyentes por no tener elementos en común y su unión es todo el universo (u). Hagamos un diagrama… P (A’) = U 1 – P (A ) Eventos mutuamente excluyentes c) Cuando dos sucesos NO son mutuamente excluyentes, se tiene que A ∩ B ≠ Ø (no es el conjunto vacío) ; se utiliza entonces P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) es decir, que la probabilidad de que A o B ocurran indistintamente, es igual a la suma de sus probabilidades individuales y restar sus intersecciones para rectificar el doble conteo que se lleva a cabo cuando se suman las dos probabilidades. 98 Hagamos un diagrama… U P (A) P (B) No son mutuamente excluyentes P (A U B) = P (A) + P (B) – P (A ∩ B) AHORA SI PONGAMONOS A PRACTICAR DICHAS REGLAS DE LA PROBABILIDAD. PRIMERO UTILIZANDO LA LEY ADITIVA Y CUANDO UN EVENTO ES MUTUAMENTE EXCLUYENTE. P ( A U B ) = P ( A ) + P ( B ) Primer problema para pensar: ¿Cuál es la probabilidad de elegir al azar un 10 o un 4 al extraer una carta de una baraja ordinaria de 52 cartas? (la “ o “ se interpreta como unión) Como queremos un 10 o un 4 y como estos eventos son mutuamente excluyentes, aplicamos la regla de la suma P ( A o B ) = P ( A ) + P ( B ). Así, P (10 U 4) ; donde A representa sacar un 10 y B obtener un 4. y como existen cuatro 10, cuatro 4 y 52 cartas en la baraja, P (10 ) = 4/ 52 y P ( 4 ) = 4/52 tenemos P ( 10 o 4 ) = 4/52 + 4/52 = 8/52 = 0.1538 Otro para reflexionar: Supongamos que va a elegirse de manera aleatoria UN individuo entre una población de 130 personas. En esta población hay 40 NIÑOS menores de 12 años, 60 ADOLECENTES y 30 ADULTOS ¿Cuál es la probabilidad de que el individuo elegido sea un adolescente o un adulto? Los eventos son mutuamente excluyentes porque queremos obtener un adolescente o un adulto y no los dos al mismo tiempo, por lo tanto utilizamos la ley aditiva P ( A o B ) = P ( A ) + P ( B ). Donde P (A) será obtener un adolescente y P (B) será obtener un adulto. Como hay 60 adolescentes, 30 adultos y 130 personas en la población tenemos, P ( A o B ) = P ( 60/130) + P ( 30/130 ). = 60/130 + 30/130 = 90/130 = 0.6923 Ahora con otro problema para que utilices mas reglas… ECHALE GANAS Supongamos que A es el evento: el martes a las 16:00 hrs, estará lloviendo B es el evento: el martes a las 16:00 hrs, estará despejado Y que de acuerdo al Observatorio Nacional la P (A) = 0.45 y P (B) = 0.3, ¿Cuáles son las probabilidades de P ( A’ ), P ( A U B ) y P ( A ∩ B )? Para que tu aprendizaje sea significativo contesta por favor las siguientes preguntas 99 Son eventos mutuamente _______________________ excluyentes SI____ NO___ Porque? ___________________________________________________________________________ _ P ( A’ ) como se interpreta __________________________ o que significa en éste problema?: ___________________________________________________________________________ _ Que nos pide el problema con _________________________________________ P ( A U B ): ___________________________________________________________________________ _ Como se interpreta P ( A ∩ B ) en el contexto del problema? ___________________________________________________________________________ Si P (A) es la probabilidad de que el martes esté lloviendo; P (A’) será la probabilidad de que NO LLUEVA el martes a las 16:00 hrs. Por lo tanto utilizamos P ( A’ ) = 1 – P (A) y sustituyendo los valores P (A’) = 1 – 0.45 = 0.55 Para poder calcular las probabilidades de P (A U B) y P ( A ∩ B) debemos primero observar que los eventos A y B son mutuamente excluyentes, ya que el tiempo no puede estar lloviendo y despejado simultáneamente, por lo que … Bien y Fácil aceboman P (A∩ B) = P ( Ø ) = 0 la intersección de A y B es un evento nulo Ya que no puede suceder al mismo tiempo. Finalmente P (A U B) = P (A) + P(B) = P ( 0.45) + P (0.3) = 0.75 En resumen... P (A’) = La probabilidad de que NO LLUEVA el martes a las 16:00 hrs = 0.55 P (A∩ B) = La probabilidad de estar lloviendo y despejado simultáneamente = P ( Ø ) = 0 P (A U B) = La probabilidad de que esté lloviendo o esté despejado = 0.75 Antes de realizar algunas actividades de aprendizaje finalmente… Analicemos otro problema donde Si k eventos son mutuamente excluyentes, la probabilidad de que ocurra alguno de ellos es igual a la suma de sus respectivas probabilidades Si las probabilidades de que una agencia de automóviles venda 0, 1, 2, 3, 4, y 5 automóviles durante cierta semana son respectivamente 0.05, 0.1, 0.15, 0.18, 0.12 y 0.05 ¿Cuáles son las probabilidades de que vendan de 2 a 5 automóviles y de que vendan 5 o más automóviles. 100 Como estos eventos son mutuamente excluyentes, usando la regla P (A1 U… Ak ) = P (A1 ) + P(A2)... + P (A k ) para saber si la agencia venderá de 2 a 5 automóviles, por lo tanto será: 0.15 + 0.18 + 0.12 + 0.05 = 0.5 Ahora para calcular la probabilidad de que vendan 5 o más automóviles, o sea P (vender 5 o más automóviles), COMO ES UN EVENTO COMPLEMENTARIO DE (A’) debemos primero calcular la probabilidad de vender a lo más cuatro automóviles…(AK ) P ( Ak vender a lo más 4 automóviles) = 0.05 + 0.1 + 0.15 + 0.18 + 0.12 = 0.6 Ahora P (A’ vender cinco o más automóviles) = 1 – P (Ak ) = 1 – 0.6 = 0.4 ACTIVIDADES DE APRENDIZAJE: Realiza tus esquemas, reflexiones y cálculos con orden hasta obtener lo que se te señala. 1) Determina si los siguientes eventos son mutuamente excluyentes. Explica tus respuestas. a) El “toro” Valenzuela lanza el martes un juego sin hit ni carrera y el “Toro” Valenzuela pierde el martes su juego: _____________________________________________________________________ _ b) Lucía llega tarde a su empleo y Lucía quema accidentalmente una compresora del taller donde trabaja. _____________________________________________________________________ _ c) Lucía llega tarde a su empleo y Lucía emplea todo el día arreglando el pago del impuesto predial de su casa. _____________________________________________________________________ _ d) En una mano de póker la primera carta es as y en la misma mano de póker la quinta carta es as. e) En una mano de póker las primeras cuatro cartas son ases y en la misma mano de póker la quinta carta es as. _____________________________________________________________________ __ 2) Al lanzar un dado una vez, ¿Cuál es la probabilidad de obtener un 1 o un número par? 3) Para participar en la rifa de un reloj, los alumnos del primer año compraron 18 boletos; los de segundo año 12 boletos. Si son 50 boletos. ¿Cuál es la probabilidad de que un alumno de primero o segundo gane la rifa? 101 4) En un experimento tiramos un par de dados y contamos los puntos obtenidos. a) Describe el espacio muestral : ______________________________________ b) Si A = { 2, 3, 4, 5, y 6} y B = { 3, 5, 7, 9, 11} describe los eventos: P ( A’ ) = _______________________________ __________________________ P ( B’ ) = P ( A U B ) : ________________________ P ( A ∩ B’ ) = _________________________ P ( A ∩ B ) = ____________________________________ 5) Las probabilidades de que un hospital reciba a,1, 2, 3, 4, 5, 6, 7 y hasta 8 enfermos durante un día son, respectivamente, 0.02, 0.04, 0.08, 0.13, 0.15, 0.17, 0.16 y 0.08. Determina las probabilidades de que el hospital reciba a) Cuatro o más pacientes; b) A lo más cinco pacientes; c) De 3 a 6 pacientes. Ahora analicemos dos problemas para aplicar la ley aditiva cuando dos sucesos NO son mutuamente excluyentes, donde ya se indicó que P ( A ∩ B ) ≠ Ø y se utiliza entonces… P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) o sea la probabilidad de que A o B ocurran indistintamente. Problema para pensar: Un estudio de mercado estima que las probabilidades de que una familia en cierta zona vea el noticiero de TV Azteca es de 0.3, que vea el noticiero de Televisa es de 0.2 y de que vea a ambos es de 0.02. ¿Cuál es la probabilidad de que una familia vea al menos uno de los dos noticieros? Sea A el evento la familia ve el noticiero de TV Azteca Entonces P ( A ) = 0.3 Sea B el evento la familia ve el noticiero de Televisa Entonces P ( B ) = 0.2 y P ( A ∩ B ) = 0.02 Observemos primero que como la probabilidad de que vean ambos noticieros es positiva, los eventos A y B NO son mutuamente excluyentes, por lo tanto se deben transmitir a diferente horario. P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) = P ( 0.3 ) + P ( 0.2 ) – P ( 0.02 ) = 0.48 Otro problema para reflexionar y confirmar aprendizaje… Queremos determinar al utilizar una baraja de póker ¿Cuál es la probabilidad de sacar UN AS o UN TREBOL de dicha baraja? 102 Sea A el evento sacar UN AS y como en la baraja hay 4 ases en 52 cartas P ( A ) = 4/52 Sea B el evento sacar UN TREBOL y en la baraja hay 13 tréboles en 52 cartas P (B) = 13/52 La probabilidad de obtener UN AS y UN TREBOL al mismo tiempo es de 1/ 52 Por lo tanto… P ( A U B ) = P ( A ) + P ( B ) – P ( A ∩ B ) = P (4/52) + P ( 13/52) – P ( 1/52) = 16/52 = 0.3077 Pero ¿Por qué debemos restar la probabilidad de obtener un as y un trébol a la vez? Porque hemos contado el as de trébol dos veces. Sin restarlo, pensaríamos de manera errónea que existen 17 eventos favorables en vez de 16. Realiza las siguientes ACTIVIDADES DE APRENDIZAJE: 1) Una alumna del CBTa.- Xalisco estima que durante una fiesta la probabilidad de que se le declare JOSE es de 0.7, la probabilidad de que se le declare ENRIQUE es de 0.4 y la probabilidad de que se le declaren ambos es de 0.2. ¿Cuál es la probabilidad de que se le declare alguno de los dos durante la fiesta? 2) Si extraes de una baraja de póker ordinaria, una sola carta ¿Cuál es la probabilidad de de que sea: Una reina o un corazón? Un 3 o una carta negra? 103 PROBABILIDAD PARA EVENTOS SUCESIVOS Regla del producto ( ley multiplicativa de la probabilidad) La probabilidad de que ocurran SIMULTÁNEAMENTE DOS SUCESOS A y B, se obtiene con el producto de sus probabilidades. Esto es, mientras que la regla de la suma proporciona la probabilidad de que ocurra CUALQUIERA DE varios sucesos, la regla del producto analiza la ocurrencia CONJUNTA O SUCESIVA de varios eventos. Observa que la regla del producto analiza con frecuencia lo que ocurre en más de un lanzamiento o extracción, mientras que la regla de la suma estudia sólo un lanzamiento o extracción. Al analizar la regla del producto, es útil distinguir tres condiciones: A) CUANDO LOS EVENTOS SON MUTUAMENTE EXCLUYENTES B) CUANDO LOS EVENTOS SON INDEPENDIENTES C) CUANDO LOS EVENTOS SON DEPENDIENTES. Regla del producto: Eventos mutuamente excluyentes Ya se ha indicado anteriormente (cuando estudiamos la regla de la suma) que cuando dos sucesos son mutuamente excluyentes la probabilidad de A y B es el conjunto vacío, P ( A ∩ B ) = Ø otros autores la señalan como P ( A y B ) = Ø , esto es, la ocurrencia de un evento impide la ocurrencia del otro y la probabilidad de su ocurrencia CONJUNTA es nula o cero. Regla del producto: Eventos Independientes Dos eventos son independientes si la ocurrencia de un evento NO TIENE EFECTO sobre la probabilidad de ocurrencia del otro. El muestreo con reemplazo ilustra bien esta situación. Por ejemplo, suponga que vamos a extraer dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. Denotamos por A a la carta extraída primero y B a la carta obtenida en segundo lugar. Cuando A se reemplaza antes de extraer a B, la aparición de A en la primera extracción no tiene efecto alguno sobre la probabilidad de ocurrencia de B. Por lo tanto son eventos A y B son independientes. Bajo esta condición, la regla del producto se convierte en… P ( A ∩ B ) = P ( A ) P ( B ) . . . regla del producto para eventos independientes. P(A y B)=P(A)P(B) Vamos a analizar dos problemas para emplear esta ecuación. Suponga que vamos a obtener al azar dos cartas, una a la vez, con reemplazo, de una baraja ordinaria. ¿Cuál es la probabilidad de que ambas cartas seas Ases? Como el problema nos pide DOS cartas; la primera que sea As “y ” en la segunda extracción sea también otro As y además con reemplazo, podemos utilizar la regla del producto P (A ∩ B) = P ( A ) P ( B ) 104 P ( A ) = (un as en la primera extracción) P ( B ) = (un as en la segunda extracción) 4 ases o eventos favorables de 52 barajas también 4 ases o eventos favorables de 52 barajas P (A y B) = P ( 4/52 ) P ( 4/52 ) P (A y B) = ( 16/ 2704 ) = 0.0059 Otro para reflexionar y pensar. Se lanza un dado y se saca una canica de una bolsa; en la bolsa hay 3 canicas, una roja, una azul y una verde. ¿Cuál es la probabilidad de que salga un número primo y una canica azul? Lee detenidamente el problema y contesta ¿los eventos (lanzar un dado y sacar una canica) son independientes? _____ porque? __________________________________________________ Si el lanzar el dado es el evento A, ¿Cuales son los eventos muestrales para A ? A = { _____________} P ( A ) = ( 4/ 6 ) el evento B será B = { sale una canica azul } P ( B ) = ( 1/3 ) P (A y B) = P ( 4/6 ) P ( 1/3 ) P (A y B) = ( 4/ 18 ) = 0.2222 Esto lo podemos comprobar contando de los resultados posibles, los que son favorables al suceso A y B, así: (A, 1) (A, 2) ( A, 3) (A, 4) (A, 5) ( A, 6) (R, 1) (R, 2) ( R, 3) (R, 4) (R, 5) ( R, 6) (V, 1) (V, 2) ( V, 3) (V, 4) (V, 5) ( V, 6) P (A y B ) = 4 resultados favorables = 4 18 resultados posibles 18 = 0. 2222 La anterior regla del producto para eventos independientes, también se aplica en situaciones con más de dos eventos. En tales casos, la probabilidad de la ocurrencia conjunta de los eventos es igual al producto de las probabilidades individuales de cada evento. En forma de ecuación es… P ( A y B y C …Z ) = P ( A ) P ( B ) P ( C ) … P ( Z ) Queremos obtener al azar 4 individuos de una población de 110 habitantes, los cuales 50 son varones y 60 mujeres. El muestreo es un individuo a la vez, con reemplazo. ¿Cuáles la probabilidad de obtener 3 mujeres y 1 hombre, en ese mismo orden? Como el problema pide una mujer en la primera, segunda y tercera extracción y un hombre en la cuarta y como el muestreo es con reemplazo, aplicamos la ley del producto para más de dos eventos independientes. A = representa una mujer en la 1ra extracción B = una mujer en la 2da. Extracción C = una mujer en la tercera extracción D = un hombre en la cuarta extracción P ( A y B y C y D ) = P (60/ 110) P (60/110) P (60/110) P (50/110) = 1080/ 14,641 = 0.0738 105 Regla del producto: Eventos dependientes Dos eventos son dependientes si la ocurrencia de un evento, AFECTA la probabilidad de ocurrencia del otro. Cuando A y B son dependientes, la probabilidad de que ocurra B se ve afectada por la ocurrencia de A. En este caso se utiliza la regla… P ( A ∩ B ) = P ( A ) P ( B | A ) . . . Regla del producto para eventos dependientes P(A y B)=P(A)P(B|A) En esta nueva regla nos dice que la probabilidad de ocurrencia de A y B es igual a la probabilidad de ocurrencia de A por la probabilidad de que B ocurra, dado que A ha ocurrido. El muestreo sin reemplazo ilustra bien esta situación de los eventos dependientes. Primer problema para pensar… Suponemos que vamos a extraer DOS cartas, una a la vez, sin reemplazo (sin volver a meter la primera), de una baraja ordinaria ¿Cuál es la probabilidad de que ambas cartas sean ases? Como va a ser sin reemplazo la ocurrencia de A realmente afecta la probabilidad de B por lo tanto son eventos dependientes y usaremos la regla… Aquí está la clave P(Ay B)=P(A)P(B|A) P (A) = (un as en la primera extracción) = P ( 4/ 52) P (B | A) = ( un as en la segunda extracción) = P ( 3/51 ) observa que aquí se trata de obtener un as en la 2da. extracción dado un as en la 1ra extracción. P ( A y B ) = P ( 4/52 ) P ( 3/51 ) = 12/ 2652 = 0.0045 Otro problema para aprender… Queremos obtener DOS frutas, una a la vez, de una bolsa de frutas que contienen 4 manzanas, 6 naranjas y 5 duraznos, sin reemplazo ¿Cuál es la probabilidad de obtener una naranja y una manzana, en ese mismo orden? P ( A ) = Obtener una naranja en la 1ra extracción Eventos favorables a A = 6 naranjas de 15 posibles (frutas) P ( B | A ) = Obtener una manzana en la 2da extracción Si es sin reemplazo: Eventos favorables a B = 4 manzanas de 14 posibles (ya que afectó la 1ra) Por lo tanto… P ( A y B ) = P ( A ) P ( B | A ) = P ( 6/15) P ( 4/14 ) = 24/ 210 = 0.1143 106 Un último problema para reafirmar y después realices tus actividades de aprendizaje: De un grupo del CBTa – Xalisco turno vespertino, se van a elegir por sorteo a 3 alumnos que se hagan cargo de una ceremonia escolar del “día del maestro”; en el grupo hay 24 hombres y 12 mujeres. ¿Cuál es la probabilidad de que el grupo de representantes esté conformado de las maneras siguientes; sean Tres hombres y sean dos hombres y una mujer P ( A ) = Sean Tres hombres P ( B ) = Sean dos hombres y una mujer PARA QUE SEAN TRES HOMBRES Para calcular P (A) es necesario que se den los sucesos siguientes: A1, el primer alumno seleccionado sea hombre - - - - - A2 ; el segundo seleccionado sea hombre - - - - - - P ( A1 ) = 24/ 36 P ( A2 ) = 23/ 35 Observa que la ocurrencia de A, AFECTA la probabilidad de que ocurra A 2 puesto que tanto el número de hombres como el número de alumnos cambia ( han disminuido) para el evento A2. A3 ; el tercer alumno seleccionado sea hombre - - - - P ( A3 ) = 22/34 Entonces P ( A ) = P ( A1 ) P ( A2 ) P ( A3 ) = (24/ 36) (23/ 35) (22/34 ) = 12144/ 42840 = 0.2834 = 28.34 % PARA QUE SEAN DOS HOMBRES Y UNA MUJER Para calcular P ( B ) se deben cumplir los sucesos siguientes: B1 = Sale el primer hombre -- - - - - P ( B1 ) = 24/36 B2 = Sale el segundo hombre- - - - - P ( B2 ) = 23/35 B3 = Sale la tercera mujer- - - - - - P ( B3 ) = 12/34 Entonces P ( B ) = P (B1 ) P (B2 ) P (B3 ) = (24/ 36) (23/ 35) (12/34 ) = 6624/ 42840 = 0.1546 = 15.46 % Observa que el orden en que salgan los dos hombres y la mujer no cambia el valor de la probabilidad. 107 ACTIVIDADES DE APRENDIZAJE 1) Determina si los siguientes eventos son Independientes o dependientes. Explica tus respuestas a) Se toma una carta de una baraja de póker bien revuelta y sin regresar esta carta se toma una segunda carta: ___________________________________________________________________________ _ b) Si A es el evento que el automovilista maneja en estado de ebriedad y B es el evento el automovilista tuvo un accidente. ___________________________________________________________________________ _ c) Si A es el evento que una moneda caiga águila en un primer volado y B es el evento que la moneda caiga águila en el segundo volado. ___________________________________________________________________________ d) Se toma una carta de una baraja bien revuelta. Se regresa la carta y después de revolver la baraja se toma una segunda carta. ___________________________________________________________________________ e) El evento A es una luna llena y el evento B es comer una hamburguesa. ___________________________________________________________________________ 2) Si se realiza un muestreo aleatorio, tomando un elemento a la vez, con reemplazo, de una bolsa que contiene OCHO canicas azules, SIETE canicas rojas y CINCO canicas verdes. ¿Cuál es la probabilidad de obtener: a) Una canica azul en una extracción de la bolsa? b) Tres canicas azules en tres extracciones de la bolsa? c) Una canica roja, una verde y una azul, en ese orden en tres extracciones de la bolsa. 3) En cierto grupo de la universidad, hay 15 estudiantes de música, 24 de historia y 46 de psicología. Y se escoge a los alumnos al azar una persona a la vez, sin reemplazo ¿Cual es la probabilidad de … a) Dos estudiantes sean de historia? b) Cuatro estudiantes sean de historia? 4) Si se lanzan dos monedas una sola vez. ¿Cuál es la probabilidad de que ambas caigan con cara hacia arriba? 108 5) Dada una población de 30 bats, 5 guantes de béisbol y 60 pelotas, si el muestreo es aleatorio, uno a la vez, sin reemplazo. ¿Cuál es la probabilidad de obtener: a) Un guante si se extrae un objeto de la población b) Un bat y una pelota si se extraen dos objetos de la población c) Un bat, un guante y un bat, en ese orden, si se extraen tres objetos de la población? 6) Usted quiere llamar a una amiga por teléfono. Sólo recuerda los tres primeros dígitos de su número telefónico y ha olvidado los últimos cuatro. ¿Cuál es la probabilidad de que marque al azar el número correcto? 7) Durante una comida de fin de año se rifan dos televisores entre un grupo de empleados. Los participantes en la rifa son cuatro hombres y ocho mujeres. Encuentra la probabilidad de que los televisores los ganen… a) Dos hombres b) Dos mujeres c) Un hombre y una mujer. 8) Determina la probabilidad de obtener de una baraja de póker bien revuelta dos tréboles si.. a) Después de sacar la primer carta se regresa y se vuelve a revolver. b) Se saca la segunda carta sin regresar la primera. 109 TEOREMA DE BAYES El teorema de Bayes, descubierto por Thomas Bayes, en la teoría de la probabilidad, es el resultado que da la distribución de probabilidad condicional de una variable aleatoria A dada B en términos de la distribución de probabilidad condicional de la variable B dada A y la distribución de probabilidad marginal de sólo A. Sea A1, A2, ...,An un conjunto de sucesos incompatibles cuya unión es el total y tales que la probabilidad de cada uno de ellos es distinta de cero. Sea B un suceso cualquiera del que se conocen las probabilidades condicionales P(B/Ai). entonces la probabilidad P(Ai/B) viene dada por la expresión: donde: P(Ai) son las probabilidades a priori. P(B | Ai) es la probabilidad de B en la hipótesis Ai. P(Ai | B) son las probabilidades a posteriori. Esto se cumple El teorema de Bayes es válido en todas las aplicaciones de la teoría de la probabilidad. Sin embargo, hay una controversia sobre el tipo de probabilidades que emplea. En esencia, los seguidores de la estadística tradicional sólo admiten probabilidadades basadas en experimentos repetibles y que tengan una confirmación empírica mientras que los llamados estadisticos bayesianos permiten probabilidades subjetivas. El teorema puede servir entonces para indicar como debemos modificar nuestras probabilidades subjetivas cuando recibimos información adicional de un experimento. La estadística bayesiana está demostrando su utilidad en ciertas estimaciones basadas en el conocimiento subjetivo a priori y permitir revisar esas estimaciones en función de la evidencia es lo que está abriendo nuevas formas de hacer conocimiento. N Como observación, se tiene P( A / B) 1 y su demostración i 1 i resulta evidente 110 GLOSARIO ARREGLO DE DATOS. Organización de los datos brutos por observaciones en orden ascendente o descendente. CENSO. Medición o examen de cada elemento de la población. CLASE. Intervalo en el cual se agrupan los datos en una tabla de distribución de frecuencias. CLASE DE LA MEDIANA. Clase de distribución de frecuencias que contiene el valor medio de (MEDIANA DE CLASE) un conjunto de datos COEFICIENTE DE VARIACIÓN. Medida de dispersión relativa de un conjunto de datos, se calcula dividiendo la dispersión estándar entre la media y multiplicando el cociente por cien. COMBINACIONES. Técnica de conteo. Si el orden de cualquier conjunto de elementos no n! importa, el número de ordenaciones o arreglos se determina por medio de: n Cr r!(n r )! COMPLEMENTO DEL EVENTO A. El evento que contiene todos los puntos maestrales que no están en A CONJUNTO DE DATOS. Todos los datos reunidos en determinado estudio. CUARTILES. Los percentiles 25%, 50% y 75% se llaman primer cuartil, segundo cuartil (mediana) y tercer cuartil respectivamente. Se pueden usar los cuartiles para dividir al conjunto de datos en cuatro partes, cada una de las cuales contiene aproximadamente el 25% de los datos. DATOS. Los hechos y números que se reúnen, analizan e interpretan DATOS CUALITATIVOS. Datos que indican etiquetas o nombres de categorías, para artículos semejantes. DATOS CUANTITATIVOS. Datos que indican cuánto o cuántos de algo. Los datos cuantitativos siempre son numéricos. DECILES. Fractiles que dividen los datos en diez partes iguales. DESVIACIÓN ESTANDAR. Medida de la dispersión de un conjunto de datos; se calcula sacando la raíz cuadrada positiva de la varianza. DESVIACIÓN MEDIA. También se llama Desviación promedio o desviación media absoluta. Es la media aritmética de las desviaciones con respecto a la media aritmética en términos absolutos. DIAGRAMA DE ARBOL. Dispositivo gráfico útil para definir puntos maestrales de un experimento donde se presentan varias etapas. 111 DIAGRAMA DE DISPERSIÓN. Método gráfico para mostrar la relación entre dos variables cuantitativas. Una variable se representa sobre el eje horizontal y la otra sobre el eje vertical. DISPERSIÓN. Esparcimiento o variabilidad de un conjunto de datos. DISTRIBUCIÓN DE FRECUENCIAS. Representación organizada de los datos que muestra el número de observaciones del conjunto de datos que caen dentro de cada clase mutuamente excluyentes. ERROR DE MUESTREO. El que se presenta porque se usa una muestra y no toda la población, para estimar un parámetro de población. ESTADÍSTICA. Ciencia de la recopilación, organización, análisis e interpretación de datos numéricos con objeto de tomar decisiones más efectivas. EVENTO. Uno o más de los posibles resultados al hacer algo, o bien uno de los posibles resultados que se producen al efectuar un experimento. EVENTOS INDEPENDIENTES. Dos eventos son independientes si la ocurrencia de un evento no tiene efecto sobre la probabilidad de ocurrencia del otro. EVENTOS DEPENDIENTES. Dos eventos son dependientes si la ocurrencia de un evento si tiene efecto sobre la probabilidad de ocurrencia del otro. EXPERIMENTO. Cualquier proceso que genere resultados bien definidos, que se representan por Ei. FRACTIL. En una distribución de frecuencias, la localización de un valor en determinada fracción de los datos o arriba de ellos. HISTOGRAMAS. Es la representación gráfica de una distribución de frecuencia. INFERENCIA ESTADÍSTICA. El proceso de reunir datos obtenidos de una muestra para hacer estimaciones o probar hipótesis acerca de las características de una población. INTERVALO. Distancia existente entre el valor máximo y el más bajo en un conjunto de datos. MEDIA ARITMÉTICA. Suma de los valores dividida entre el número total de ellos. MEDIA GEOMÉTRICA. Medida de tendencia central que se usa para medir la tasa promedio de cambio o crecimiento de alguna cantidad; se calcula tomando la enésima raíz del producto de n valores que representan el cambio. MEDIA PONDERADA. Promedio que se calcula a fin de tener en cuenta la importancia de cada valor para el total global; es decir, un promedio donde el valor de cada observación se pondera mediante algún índice de su importancia. MEDIDA DE TENDENCIA CENTRAL. Es el dato que queda al centro de un ordenamiento de menor a mayor. 112 MEDIDA DE DISPERSIÓN. Aquella que describe cómo las observaciones están esparcidas en un conjunto de datos. MEDIANA. Es el dato intermedio de un conjunto, ordenado de menor a mayor o viceversa. a) Si el número de datos es impar, se toma el dato central. b) Si el número de datos es par, la mediana está dada por el promedio de los datos centrales. MODA. Es el valor que tiene la mayor frecuencia de un grupo de datos. METODOS NO PARAMÉTRICOS. Métodos estadísticos que requieren muy poco o ningún supuesto acerca de las distribuciones de probabilidad de la población, y acerca del nivel de medición. Esos métodos se pueden aplicar cuando se dispone de datos nominales u ordinales. MUESTRA. Porción o subconjunto de la población que se estudia. MUESTRA ALEATORIA SIMPLE. Muestra tomada de tal manera que cada muestra de tamaño n tiene la misma probabilidad de ser seleccionada. MUESTREO CON REEMPLAZO. Es un método en el cual cada miembro de la población elegida para la muestra se regresa a la primera antes de elegir al siguiente miembro. MUESTREO SIN REEMPLAZO. Es un método en el cual los miembros de la muestra no se regresan a la población antes de elegir a los miembros siguientes. MUTUAMENTE EXCLUYENTES. Dos eventos son mutuamente excluyentes si no pueden ocurrir al mismo tiempo. Otra forma de decirlo es que dos eventos son mutuamente excluyentes si la ocurrencia de uno impide la ocurrencia del otro. OJIVA. Gráfica de una distribución de frecuencias acumulada. PARÁMETRO. Una característica numérica de una población, como la media de población ( ( ), proporción poblacional ( p ), etc. µ ), desviación estándar poblacional PERCENTILES. Fractiles que dividen los datos en 100 partes iguales. PERMUTACIONES. Técnica de conteo. Se utiliza para obtener el número de posibles arreglos resultantes de un conjunto de elementos, n! considerando la importancia o jerarquía. El p número de arreglos posibles está determinado por: n r (n r )! POBLACIÓN. Conjunto de todos los elementos que estamos estudiando y acerca de los cuales tratamos de sacar conclusiones. POLIGONO DE FRECUENCIAS. Gráfica lineal que une los puntos medios de cada clase en un conjunto de datos; se grafica en la altura correspondiente a la frecuencia de cada clase. PRINCIPIO DE MULTIPLICACIÓN. Técnica de conteo. Es una de las fórmulas que pueden utilizarse para contar el número de posibles resultados de un experimento. Indica que si hay m formas de hacer una cosa y n formas de hacer otra, existen (m) ( n ) formas de hacer ambas. 113 PROBABILIDAD. Es el número de posibilidades que hay de que un fenómeno suceda o no suceda. PROMEDIO. Número que describe la centralización o tendencia central de los datos. Existe un cierto número de promedios especializados, entre los que se incluye la media aritmética, la media ponderada, la mediana, la moda, y la media geométrica. RANGO. Medida de dispersión definida como el valor máximo menos el valor mínimo. VARIABLE. Una característica de interés de los elementos. VARIANZA. Medida de dispersión para un conjunto de datos, en las desviaciones de los valores de los datos respecto a la media, elevadas al cuadrado. 114 BIBLIOGRAFÍA CONSULTADA. 1. FREUND John E. y Gary A. Simón. Estadística Elemental. Octava edición. México. D.F. Editorial Prentice Hall. Traducción José Julián Díaz Díaz. 1994. pp. 566 2. FUENLABRADA De la Vega Trucíos Samuel. Probabilidad y Estadística. México. D.F. Editorial MvGraw-Hill Interamericana. 2002. pp.255. 3. PAGANO, Roberto R. Estadística para las ciencias del comportamiento. Quinta edición. Edit. Internacional Thomson Editores. México. 1999. pp. 548 4. PASTOR Guillermo. Estadística Básica. México D.F. Editorial Trillas. SEP-CONALEP. 1998. (reimp. 2003). Pp.198. 5. PÉREZ SEGUÍ María Luisa. Combinatoria. Instituto de Matemáticas, UNAM. Cuadernos de olimpiadas. 2000. 6. REYNOSO Tirado Héctor Francisco. Lecturas seleccionadas de Estadística Básica. Universidad Autónoma de Nayarit. México. Facultad de Economía. Septiembre de 2001. pp129. 7. REYNOSO Tirado Héctor Francisco. Glosario de estadística. Universidad Autónoma de Nayarit. México. Facultad de Economía. Abril del 2002. pp.75. 8. REYNOSO Tirado Héctor Francisco. Técnicas de conteo y espacios maestrales sin maestro. Universidad Autónoma de Nayarit. México. Facultad de Economía. Verano de 2003. pp.89. 9. SEP-SEIT-DGETA. Antología para el módulo 4 “Formación Matemática Básica” Bachillerato Tecnológico Agropecuario. México. D.F. Sistema Abierto de Educación Tecnológica Agropecuaria. SAETA. 1997. pp. 426. 10. SEP, CINVESTAB del IPN, Sección de matemática educativa “probabilidad “ ( Programa Nacional de Formación y Actualización de Profesores), México 1990 11. VILENKIN. N. ¿De cuantas formas? Combinatoria. Libro de la editorial MIR, Moscú, 1972. Impreso en el taller de publicaciones de Matemáticas de la Facultad de Ciencias UNAM. Vínculos matemáticos No. 219. 1996. 115 BIBLIOGRAFÍA RECOMENDADA. 1. CÓNCAVOS, George, Probabilidad y estadística, Ed. Mc. Graw Hill, México 1998. 2. ALMAGRE, Guadalupe, Matemáticas 3, Ed. Limusa, México 1990. 3. Subsecretaría de Educación Básica Telesecundarias, matemáticas I, México 1993. Conceptos básicos de 4. MORENO, G. José y Ortiz, G. Mariano, Matemáticas primer curso, Ed. Mc Graw Hill, México 1994. 5. WILLOUGHBY, S. Stepten, Probabilidad y estadística, Publicaciones Culturales, México 1991. 6. ADDISON – WESLEY, Prealgebra. 7. GONZALEZ, H. Miguel, Estadística metodología. Escuela Normal Superior de Nayarit (Departamento de Psicopedagogía), México 1992. 8. COBACH/SONORA, Cuadernillo básico de lectura de matemáticas 4, México 1995. 9. YAMANTE, Taro, Estadística, Ed. Harla, México 1990. 10. GOVINDEN y LINCOYAN, Curso práctico de estadística Ed. Mc. Graw Hill, México 1990. ENCICLOPEDIAS DIGITALES Microsoft ® Encarta ® 2006. © 1993-2005 Microsoft Corporation. Reservados todos los derechos. http://es.wikipedia.org/wiki/Portada 116