Download Diapositivas de Estadística
Document related concepts
no text concepts found
Transcript
Docente: MSc. Tania Díaz Iglesias Email: taniadiglesias@gmail.com tania@uclv.edu.cu 1 Objetivos: Introducir los fundamentos y principales aplicaciones de los métodos estadísticos - probabilísticos. Identificar las condiciones de aplicabilidad de cada una de las herramientas estadísticas previstas en el curso. Aplicar, a partir del software correspondiente, dichas herramientas estadísticas que faciliten el proceso de toma de decisiones. Interpretar los resultados que se deriven de la aplicación de estas herramientas. Sistema de Conocimientos: Espacios muestrales y eventos. Cálculo de probabilidades. Independencia. Variables aleatorias. Distribuciones de probabilidad. Medidas de tendencia central y dispersión. Distribuciones más utilizadas. La investigación estadística. Estadística descriptiva. Algunas técnicas de muestreo probabilístico. Tamaño de muestra. Pruebas de hipótesis estadísticas Caracterizar procesos a partir de la representación gráfica y numérica de las distribuciones de las variables asociadas a estos. Calcular y seleccionar muestras para la aplicación de encuestas. Identificar y aplicar las herramientas estadísticas en el procesamiento de encuestas. Utilizar software especializado para el procesamiento de información y análisis estadístico. Tema I: Generalidades sobre estadística y probabilidades. Introducción al SPSS. Tema II: La estadística en la aplicación y procesamiento de encuestas. Tema III: Pruebas de Hipotesis Levin, R.I. & Rubin, D.S.“Estadística para Administradores”.6ª. Edición PRENTICE-HALL HISPANOAMERICANA S.A., 1996. Berenson, M. L.; Levine, D. M.; Krehbiel, T. C. “Estadística para Administración”.Pearson Educación. 4ta edición. México, 2006. Materiales complementarios elaboradas en soporte digital. Elementos importantes sobre Probabilidades Probabilidad. Un concepto sencillo Medida matemática de la posibilidad de que algo pase Rango de variación: 0 – 1 ò 0 – 100% Tres tipos de probabilidad Probabilidad clásica. Probabilidad frecuencial o estadística. Probabilidad subjetiva. ¿Distribuciones de probabilidad? Son como distribuciones de frecuencia teóricas. Describe la forma en que se espera que varíen los resultados. Teoría de las Probabilidades Ofrece un modelo matemático para el estudio de los fenómenos aleatorios Algunos ejemplos: • • • • • lanzamiento de una moneda el arribo de aviones a un aeropuerto el % de artículos defectuosos el tiempo hasta el fallo de un equipo la llegada de clientes a una cola Conceptos y definiciones de Probabilidades Punto muestral: Cada uno de los posibles resultados de un fenómeno aleatorio. Espacio muestral: Es el conjunto de todos los puntos muestrales de un experimento aleatorio. Se denotará por S. Ejemplo: Lanzamiento de una moneda (S: cara, escudo) Lanzamiento de un dado (S: 1,2,3,4,5,6) Conceptos y definiciones de Probabilidades Evento: Conjunto de puntos muestrales. Se denotará con letra mayúscula: A, B,… Ejemplo: A: que el dado muestre un # par. Ocurrencia de un evento: Sea A un evento de cierto experimento E. Diremos que el evento A ocurre cuando al realizar el experimento E, el resultado que obtenemos es un punto muestral de A. Álgebra de eventos Operaciones que pueden realizarse entre eventos tales como: suma ( +), el producto ( .) ó el complemento de un evento ('). Siendo A y B dos eventos cualesquiera de un espacio muestral S: A B ó A+B: Subconjunto de S que contiene todos los elementos que están en A, en B ó en ambos. A B ó A*B: Subconjunto de S que contiene los elementos que están a la vez en A y en B. A': Subconjunto de S que contiene todos los elementos de S que no están en A (complemento de A). Diagrama de Venn A B A B S S AB AB A S A' Álgebra de eventos Eventos mutuamente excluyentes: Cuando la ocurrencia simultánea de dos eventos A y B sea imposible, se dice que estos eventos son mutuamente excluyentes. A.B= Álgebra de eventos Eventos exhaustivos: Cuando la suma de dos eventos A y B da como resultado el espacio muestral S, se dice que estos eventos son exhaustivos A + B =S m P(A) n Donde: m: casos favorables a la ocurrencia de A n: todos los casos que puedan ocurrir N ( A) P( A) N (S ) Donde: N(A): puntos muestrales de A N(S): puntos muestrales de S Suponga el experimento aleatorio correspondiente al lanzamiento de un dado perfectamente balanceado de 6 caras: a) Describa el Espacio Muestral correspondiente. b) Describa y calcule las probabilidades de los eventos siguientes: ◦ ◦ ◦ A: Que salga par B: Que salga impar C: Que salga un número mayor que dos. P(A) = fr (A) = f(A)/n Donde: fr(A): frecuencia relativa de ocurrencia del evento A f(A):cantidad de veces que ocurrió el evento A en las n pruebas realizadas n: cantidad de pruebas realizadas 1. La probabilidad es un número real positivo o cero para cualquier evento A. P(A) ≥ 0 2. Todo espacio muestral tiene la probabilidad 1 P(S) = 1 3. Si A y B son dos eventos mutuamente excluyentes cualesquiera: P(A+B) = P(A) + P(B) si A.B = ø 1. P (ø) = 0 2. P (A') = 1 - P(A) 3. P (A+B) = P(A) + P(B) - P(A.B) 4. P (A.B') = P (A) - P(A.B) 5. P (A'.B') = P (A+B)' 6. P (A'+B') = P (A.B)' si A.B ≠ ø Si A y B son eventos de un espacio de probabilidad, tales que P(B) > 0; entonces la probabilidad condicional de A dado B es: P(A B) P(A / B) P(B) siendo P(B) 0 P(A . B) = P(A/B) . P(B) = P(B/A) . P(A) Para eventos independientes: P(A . B) = P(A) . P(B) Se dice que dos o más eventos son independientes si la ocurrencia o no ocurrencia de uno no afecta de ninguna manera la ocurrencia de cualquiera de los otros. Variables aleatorias. Clasificación 31 Dado un Espacio Muestral S de un experimento aleatorio, una variable aleatoria (va) es cualquier regla que asocia un número con cada resultado de S. Una variable aleatoria es generalmente denotada como “x”, pudiendo ser discreta o continua. Una VA es discreta si su conjunto de valores posibles es un conjunto discreto, es decir, está formado por un número contable o numerable en secuencia. Una VA es continua si su conjunto de posibles valores es todo un intervalo de números, enteros o fraccionarios. Cualitativas o discretas: Conjunto finito o numerable de valores posibles (atributos, etiquetas, …) ◦ Nominales ◦ Ordinales Cuantitativas o continuas: Conjunto infinito de valores posibles. 35 Lugar de nacimiento Profesión 36 Peso Edad ◦ Bajo ◦ Medio ◦ Alto Adolescente Adulto Temperatura Baja Media Alta 37 Peso Edad Temperatura ◦ Kg años ºC 38 Sea p una función de una variable real, discontinua, que toma valores en el intervalo [0,1] subconjunto de R; p es una función de probabilidad de una variable aleatoria X si: p( X ) xR 1 Sea f una función real integrable; f es una función de densidad probabilística si: f(X) 0, x R f ( X ) dx 1 Sea p una función de una variable real, discontinua, que toma valores en el intervalo [0,1] subconjunto de R; p es una función de probabilidad de una variable aleatoria X si: p( X ) xR 1 Sea f una función real integrable; f es una función de densidad probabilística si: f(X) 0, x R f ( X ) dx 1 Definiciones de Estadística Estadística: Censo o recuento de la población, de los recursos naturales o industriales o de otra manifestación de un Estado, comarca, etc. Estudio de los hechos que se pueden numerar o contar y del resultado de la comparación de las cifras que a ellos se refieren (Diccionario ARISTOS). Estadística Aplicada: Es la parte de las Matemáticas que tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un conjunto. Estadística: recolectar, interpretar evaluarse la El desarrollo y aplicación de métodos para organizar, presentar, resumir, analizar e datos cuantitativos, de manera que pueda confiabilidad de sus resultados. Estadística: Está relacionada con los métodos científicos para la recolección, organización, tabulación, presentación y análisis de los datos, así como para sacar conclusiones válidas y tomar decisiones razonables en base a ese análisis. Estadística: Investiga la posibilidad de obtener inferencias válidas a partir de los datos estadísticos y construye los métodos para realizar dichas inferencias. Estadística: Trata de problemas relativos a las características operatorias de las reglas de comportamiento inductivo basado en experimentos aleatorios. Estadística: Estudia los fenómenos decisorios estadísticos. Estadística general: estudia métodos para obtener información acerca de la estructura de la población respecto a las características escogidas y se dan procedimientos para expresar esa información en forma compacta. Ciencia cuyo objeto es la creación de métodos y técnicas que permitan recolectar, organizar, tabular, presentar y analizar datos estadísticos con el fin de obtener conclusiones científicas para tomar decisiones y aplicarlas en la práctica. Descripción de grandes colecciones de datos empíricos y su reducción a estadígrafos. (Estadística Descriptiva). Análisis científico de datos experimentales (Inferencia Estadística). Predicción del futuro (Máxima aspiración práctica de toda ciencia). Describe Caracteriza Resume Organiza Descriptiva A partir del estudio de una muestra, se “infieren” conclusiones para la población. Inferencial 48 Población Muestra Definición Conjunto de elementos Parte de la población que van a ser seleccionada para la considerados en la investigación investigación Características Parámetros: cualquier característica medible de la población Estadígrafos: función evaluada con lo datos de una muestra Símbolos Tamaño: N Media: Desviación estándar: Tamaño: n Media: x Desviación estándar: s La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. 6. Presentación de los resultados. La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. Definir objetivo de la investigación (incluye el objeto) 3. Adquisición o registro de los datos necesarios. Ejemplo: de mantenimiento, 4. Tratamiento estadístico de losproblemas datos. fluctuación de la fuerza de trabajo, etc. 5. Análisis de los datos. 6. Presentación de los resultados. La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. •Preparación teórica (características locales y temporales del objeto de 4. Tratamiento estadístico de los datos. investigación; definir unidad de 5. Análisis de los datos.registro) •Preparación técnico-organizativa (tipo de registro, extensión del registro y 6. Presentación de los resultados. frecuencia del registro) Definir la unidad de registro Ejemplo, en el análisis de los activos fijos, las unidades de registro pueden ser los equipos o máquinas, en el análisis de la fuerza de trabajo las unidades son los obreros, en el análisis de los costos las unidades pueden ser los productos.... Definir las características locales, temporales y objetivas de la unidad de registro Ejemplo : Objeto de investigación: Análisis de las especificaciones para el tiempo de servicio de un mesero o dependiente de un Restaurante ( a la carta o de especializados). Objeto investigación: Análisis de las especificaciones de calidad del diámetro de los ejes Unidad de registro: dependiente utilizados en los molinos de los centrales. Unidad de registro: ejes Características locales y temporales: Restaurante (Restaurante Italiano, todo incluido), segunda semana, noviembre 2007. Fecha: Julio/00-Oct/01 Material: Acero 45 Características objetivas: anticipación, años de experiencia, sexo (f ó Longitud Peso: 46.5 Kg M), edad, ….del eje: 1540 mm Diámetro: 74.91.5mm Variable a estudiar: tiempo de servicio (desde que el cliente entra hasta Lugar: Taller de Corte 44420 .Empresa Planta que se le sirve el plato fuerte):≤ 10 minutos. Mecánica Establecimiento del tipo de registro a realizar Determinación de la frecuencia del registro Determinación de la extensión del registro Determinación de la extensión del registro Registro Total Registro por Muestreo Registro Total: Es muy costoso, requiere gran cantidad de medios y fuerza de trabajo en largos períodos, tal es el caso de los censos de población. Registro por Muestreo: Es más barato, requiere menos recursos, pero tiene la desventaja de que requiere ser diseñado correctamente para que la muestra sea representativa de la población. Muestra representativa: Es aquella que contiene todas las características de la población en la misma proporción en que figuran en esa población. Ejemplo: si nuestra población de mujeres tiene una tercera parte de mujeres de raza negra, una muestra que sea representativa de la población respecto a la raza deberá tener una tercera parte de mujeres de raza negra. El Muestreo es una herramienta de la investigación científica cuya función básica es determinar, que parte de una población debe examinarse, con el fin de hacer inferencias confiables sobre el total de la población de procedencia. Importancia del muestreo El hecho de utilizar un muestreo en un estudio estadístico tiene los siguientes fines: Práctico (rápido) Lógico (si las pruebas son destructivas) Económico (ahorra recursos de todo tipo) Tipos de muestreo Aleatorio o probabilístico No aleatorio o no probabilístico Muestreo aleatorio Cada elemento de la población tiene alguna probabilidad de pertenecer a la muestra. Este tipo de muestreo exige más análisis estadístico y planeación al inicio de una investigación. Muestreo Aleatorio Muestreo Aleatorio Simple o M.A.S. Muestreo Estratificado Muestreo Sistemático Muestreo por Conglomerados o Agrupado Muestreo aleatorio simple: Método para seleccionar muestras de manera que cada miembro de la población tiene igual probabilidad de quedar incluido. Métodos para aleatorizar una población: utilización de tablas aleatorias programas de aleatorización en los paquetes estadísticos Muestreo Aleatorio Simple o M.A.S Diseño muestral: Se enumeran todos los miembros de la población y luego seleccionamos un número de forma aleatoria, aquel elemento de la población que posea dicho número será seleccionado constituyendo el primer elemento de la muestra. Muestreo Aleatorio Simple o M.A.S recomendable su uso cuando tenemos una población relativamente homogénea en que todos sus elementos sean accesibles. Al aplicar una encuesta a los clientes en un hotel (diferentes nacionalidades), para medir calidad del servicio quizás si se aplica este tipo de muestreo no se garantice la representatividad de la muestra. Muestreo estratificado En este tipo de muestreo la población se divide precisamente en esos grupos homogéneos llamados estratos y se toman muestras aleatorias separadamente en cada uno de los estratos. Estratos: Grupos dentro de una población formados de tal modo que cada grupo es relativamente homogéneo, pero existe una variación más amplia entre los grupos. Muestreo Estratificado Diseño muestral: Se determina el tamaño de muestra dentro de cada estrato, los elementos dentro de cada estrato se seleccionan aleatoriamente Determinación del tamaño de muestra dentro de cada estrato Afijación simple: a cada categoría se le asigna el mismo número de individuos. Afijación proporcional: la asignación de los individuos a cada categoría es proporcional al número de individuos que la componen. Afijación óptima: el número de individuos que se asigna a cada categoría está en función de la desviación típica. Así, cuando en una categoría la desviación típica es muy pequeña, nos bastará con una muestra pequeña. Determinación del tamaño de muestra dentro de cada estrato Afijación proporcional: Ni ni n N Ni: tamaño de la población del estrato ni: tamaño de la muestra del estrato Muestreo estratificado Es recomendable su en poblaciones en las que se pueden diferenciar grupos con características propias. Cuando los miembros de estos grupos individuales son relativamente homogéneos, pero los grupos difieren considerablemente entre sí, el muestreo estratificado es mejor que el aleatorio simple para inferir acerca de los parámetros de la población. Muestreo Estratificado Ejemplo En una empresa que brinda servicios al turismo se decidió realizar una encuesta a los trabajadores con el objetivo de valorar algunos elementos de la cultura organizacional que pudieran ser causa de los bajos rendimientos registrados en los últimos meses. Los investigadores consideraron, de acuerdo a los objetivos del estudio y a las hipótesis planteadas, que sería conveniente considerar como estratos las diferentes categorías ocupacionales. En la empresa laboran 150 trabajadores, divididos en cinco categorías ocupacionales. Se determinó que el tamaño de muestra debía ser de 80 encuestados. Realice el diseño muestral y determine cuántos trabajadores se encuestarán por categorías Muestreo Estratificado Ejemplo19 Categorías Ni Dirigentes 5 Técnicos 25 Administrativos 13 Servicio 12 Obreros 95 Total 150 ni Muestreo Estratificado Pueden formarse estratos por edades, género, ocupación, nacionalidad, nivel socioeconómico … Muestreo sistemático: Método de muestro aleatorio, en el cual los elementos se seleccionan a intervalos uniformes que se miden en el tiempo, orden o espacio. Muestreo sistemático Diseño muestral: Se realiza fijando, en primer lugar, un tamaño de muestra determinado y calculando después el cociente N/n: un elemento cada 100, uno cada 50, etc.; aunque puede fijarse a priori esta proporción o frecuencia: un elemento cada 15 minutos. En Esta forma de muestreo sólo se selecciona aleatoriamente un elemento: el primero. Muestreo sistemático Este muestreo se usa frecuentemente en Control de la Calidad, Control de Procesos, Estudio del trabajo. Sin embargo tiene el peligro de que los resultados obtenidos en la muestra estén viciados por factores subjetivos, ya que se conoce de antemano qué elemento va a ser seleccionado. Muestreo sistemático Ejemplo , Usted va a realizar 100 encuestas a los clientes de un centro comercial donde como promedio acuden diariamente 2000 de ellos. Seleccione la muestra mediante un muestreo sistemático, realice el diseño muestral. Muestreo no aleatorio Consecutivo Conveniencia A criterio o intencional Por cuotas Con fines especiales Muestreo no aleatorio Consecutivo: consiste en reclutar todos los individuos de la población, accesibles, en el período de reclutamiento fijado. Ejemplo: Se realiza un estudio para conocer las horas de sueño diarias de niños recién nacidos. Se toman todos los bebés que acuden a un centro de salud ¨X¨ durante un año. Muestreo no aleatorio Conveniencia: se seleccionan los sujetos más accesibles (voluntarios, participa el que le convenga) Ejemplo: se coloca un anuncio en un periódico para recabar individuos para participar en la investigación. Muestreo no aleatorio A criterio o intencional: el investigador selecciona a los sujetos que considera más apropiados para formar la muestra. Ejemplo: se desea realizar un trabajo en grupo con expertos en un tema dado. Ejemplo: se realiza una encuesta a pacientes diabéticos para saber a que atribuyen su enfermedad Muestreo no aleatorio Muestreo con fines especiales: Se escoge la muestra de un grupo previamente concebido aunque no sea representativa de la población. Por ejemplo, niños que rompen juguetes. Aspectos a considerar en la delimitación del tamaño de muestra Si se trata de una población finita o infinita. Nivel de confianza deseado. Nivel de homogeneidad o heterogeneidad en la población, en cuanto a la variable a estudiar.Esta característica (que más adelante se verá que queda reflejada en el valor de p) se puede estimar a través de muestras pilotos, experiencias previas o a partir de conjeturas de los investigadores. Precisión deseada en la estimación. Recursos disponibles para realizar la investigación. Cálculo del tamaño de la muestra en poblaciones infinitas n 2 Zα pq 2 2 d n = tamaño de la muestra. Zα/2 = percentil de la distribución normal relacionado con el nivel de confianza seleccionado por el investigador. p = proporción estimada de la población que establecería un acuerdo determinado sobre la variable a estudiar. q = 1- p d = error muestral, margen de error o diferencia máxima entre la media de la muestra y la de la población que estamos dispuestos a aceptar. Ejemplo Para realizar una encuesta de satisfacción a clientes de un determinado centro comercial, en la que queremos una confianza del 95% que determina que Z=1.96, deseamos un error muestral del 5% (d) y consideramos que estarán satisfechos el 50% (p=q=0.5) necesitaríamos una muestra de 385 clientes. Cálculo del tamaño de la muestra en poblaciones finitas 2 N Zα n 2 d n pq 2 N 1 Z 2α 2 pq = tamaño de la muestra. Zα/2 = percentil de la distribución normal relacionado con el nivel de confianza seleccionado por el investigador. p = proporción estimada de la población que establecería un acuerdo determinado sobre la variable a estudiar. q = 1- p d = error muestral, margen de error o diferencia máxima entre la media de la muestra y la de la población que estamos dispuestos a aceptar. Ejercicio Se desea realizar una encuesta en el Hotel “X” referida a la satisfacción de los clientes con la calidad del alojamiento (habitación y cuarto de baño): incluye la comodidad de las camas, iluminación, Mobiliario, limpieza y funcionamiento del equipamiento. En el hotel están hospedados 1000 turistas y queremos un nivel de confianza del 95% que determina Z=1.96, deseamos un error muestral del 5% y consideramos que estarán satisfechos el 50% (p= 0.5) ¿Cuántos turistas necesitaríamos encuestar? Ejercicio Un investigador de una empresa de urbanización quiere averiguar las opiniones de los residentes ante las instalaciones recreativas del lugar y los mejoramientos que les gustaría que se hicieran. En ese desarrollo urbano viven residentes de varias edades y niveles de ingresos, pero una gran proporción tiene un alto nivel de ingreso y su edad fluctúa entre 30 y 50 años. El investigador todavía no está seguro de que haya diferencias entre los grupos de edad y los niveles de ingreso respecto al deseo de las instalaciones recreativas. ¿Conviene aplicar en este caso: Muestreo aleatorio simple. Muestreo sistemático. Muestreo de juicio. Muestreo de conveniencia. Muestreo aleatorio estratificado. Estadística Descriptiva: Resultado del proceso de tabulación u organización de los datos. Se puede tener la información de la siguiente forma. Recolección simple o no organizada: es decir listado de los datos, presentación en su forma primaria. Organizados: ordenamiento en tablas: que a su vez pueden estar, agrupados o no. no agrupados: es decir se leen directamente los valores observados. agrupados: se construyen intervalos para resumir la información observada. ¿Qué quiere decir Organizados? Cuando los datos se presentan en forma de tabla de frecuencia. Esto es, se colocan los datos en columnas que representan: -los distintos valores de la variable. -las frecuencias (las veces) conque ocurren sus valores Distribución de frecuencias: Representación tabular de los datos correspondientes a una variable. ¿Por qué se dice que los datos están organizados, pero no agrupados? Porque en esta tabla, se muestran todos y cada uno de los valores que toma la variable. La tabla puede ser ampliada con otros tipos de frecuencia como: fi: frecuencia relativa = ni/n (definición frecuencial de probabilidad) Ni: frecuencia absoluta acumulada Fi : frecuencia relativa acumulada Punto medio de la clase: (semisuma de los límites de las clases) Li Ls Yi 2 Intervalo Frecuencia absoluta (ni) Frecuencia relativa (fi) Frecuencia acumulada absoluta (Ni) Frecuencia acumulada relativa (Fi) La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. Preguntas sobre los datos 6. Presentación de los resultados. 1. ¿De dónde vienen los datos?. ¿La fuente es parcial?, es decir, ¿es posible que haya un interés en proporcionar datos que conduzcan a una cierta conclusión más que a otras?. La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. Preguntas sobre los datos 6. Presentación de los resultados. 2. ¿Los datos comprueban o contradicen otra evidencia que se posee? La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. Preguntas sobre los datos 6. Presentación de los resultados. 3. ¿Hace falta alguna evidencia cuya ausencia podría ocasionar que se llegue a una conclusión diferente? La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. Preguntas sobre los datos 6. Presentación de los resultados. 4. ¿Cuántas observaciones se tienen? ¿Representan a todos los grupos que se desea estudiar?. La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. Preguntas sobre los datos 6. Presentación de los resultados. 5. ¿La conclusión es lógica? ¿Se ha llegado a conclusiones que nuestros datos no confirman? La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. 6. Presentación de los resultados. La investigación estadística 1. Planteamiento de la tarea estadística. 2. Preparación de la tarea estadística. 3. Adquisición o registro de los datos necesarios. 4. Tratamiento estadístico de los datos. 5. Análisis de los datos. 6. Presentación de los resultados. 10 5 Datos… 20 observaciones 10 6 Valores xi 1 2 3 4 5 6 Total Frecuencias Frecuencias Frecuencias Frecuencias acumuladas relativas relativas ni acum. Ni fi=ni/N Fi=Ni/N 2 2 4 5 5 2 20 2 4 8 13 18 20 0.10 0.10 0.20 0.25 0.25 0.10 1.00 0.10 0.20 0.40 0.65 0.90 1.00 10 7 Valores xi Frecuencias Frecuencias Frecuencias Frecuencias acumuladas relativas relativas ni acum. Ni fi=ni/N Fi=Ni/N 1 2 3 4 5 6 Total 2 2 4 5 5 2 20 2 4 8 13 18 20 0.10 0.10 0.20 0.25 0.25 0.10 1.00 6 25 5 20 4 0.10 0.20 0.40 0.65 0.90 1.00 15 3 10 2 10 8 1 5 0 0 1 2 3 4 5 6 1 2 3 4 5 6 10 8 Datos… 50 observaciones 10 9 Clases Marca de clases di [50,60] (60,70] (70,80] (80,90] (90,100] 55 65 75 85 95 Total Frecuencias Frecuencias Frecuencias Frecuencias acumuladas relativas relativas ni acum. Ni fi=ni/N Fi=Ni/N 5 10 25 8 2 50 5 15 40 48 50 0.10 0.20 0.50 0.16 0.04 1.00 0.10 0.30 0.80 0.96 1.00 11 0 Clases Marca de clases di Frecuencias ni Frecuencias acumuladas Ni Frecuencias relativas 55 65 75 85 95 Total 5 10 25 8 2 50 5 15 40 48 50 0.10 0.20 0.50 0.16 0.04 1.00 [50,60] (60,70] (70,80] (80,90] (90,100] 30 60 25 50 20 40 15 30 10 20 5 10 0 11 1 0 55 65 75 85 95 55 65 fi=ni/N 75 Frecuencias relativas acum. Fi=Ni/N 0.10 0.30 0.80 0.96 1.00 85 95 11 1 Medidas de tendencia central 11 2 Elemento que más se repite Ejemplos: ◦ 2 3 5 5 5 8 Mo=5 ◦ 2 2 5 5 7 8 Mo=2 Mo=5 11 3 Valor que divide la muestra en dos partes iguales Ejemplos: ◦2 3 ◦2 ◦2 4 Me=4 5 6 3 4 5 6 7 Me=4.5 3 5 6 700 Me=4.5 4 11 4 Valor promedio Ejemplos: ◦ 3 ◦ ◦ 4 n x 4 5 Media=4 4 4 Media=4 x i 1 i n 11 5 Analizar – Estadísticos descriptivos – Frecuencias… 11 6 11 7 Medidas de posición 11 8 Cuartiles: son tres valores que dividen a la muestra en cuatro partes iguales Percentiles: valores que dividen a la muestra en 100 partes iguales Cuantiles: valores que dividen a la muestra en partes iguales 11 9 Analizar – Estadísticos descriptivos – Frecuencias… 12 0 12 1 Medidas de dispersión 12 2 Medida cuadrática de variabilidad 1 n V X xi x n i 1 Ejemplos: ◦3 7 9 Var=6.22 ◦4 4 4 Var=0 2 12 3 Medida lineal de variabilidad Ejemplos: s V X ◦3 7 9 s=2.49 ◦4 4 4 s=0 12 4 Rango = máximo – mínimo Ejemplos: ◦3 3 3 Amplitud=0 ◦1 3 5 Amplitud=5-1=4 12 5 Analizar – Estadísticos descriptivos – Frecuencias… 12 6 12 7 Medidas de distribución 12 8 Nos permite identificar si los datos se distribuyen de forma uniforme alrededor del punto central (media) 12 9 g1 < 0: asimetría negativa g1 = 0: simétrica g1 > 0: asimetría positiva ◦ Los valores tienden a reunirse más en la parte derecha de la media ◦ Existe aproximadamente la misma cantidad de valores a los dos lados de la media, (± 0.5) ◦ Los valores se tienden a reunir más en la parte izquierda de la media Características Coeficiente de asimetría 13 0 Determina el grado de concentración que presentan los valores en la región central de la distribución 13 1 g2 > 0: Leptocúrtica ◦ Existe una gran concentración de valores alrededor de la media g2 = 0: Mesocúrtica ◦ (± 0.5) g2 < 0: Platicúrtica ◦ Existe poca concentración de valores alrededor de la media Características Coeficiente de curtosis 13 2 Analizar – Estadísticos descriptivos – Frecuencias… 13 3 Distribución simétrica Distribución platicúrtica 13 4 Asimetría positiva Leptocúrtica 13 5 Conocer cada una de las etapas componentes del proceso de investigación por encuesta. Aplicar, apoyados en el SPSS, las herramientas estadísticas pertinentes en cada una de los pasos del proceso de investigación por encuestas. Interpretar, a la luz del proceso de toma de decisiones, los resultados derivados de la aplicación de las herramientas estadísticas. Encuesta Herramienta para recolectar información mediante la elaboración de un cuestionario sobre un tema o temas específicos. Al hacer el cuestionario hay que formular preguntas que revelen realmente la información deseada (por ejemplo causas de insatisfacción de los usuarios con el servicio prestado) La investigación por encuesta 1. Definición del problema y objetivos de la investigación. 2. Selección y definición de las variables. 3. Diseño del cuestionario. 4. Validación y prueba del cuestionario. 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. La investigación por encuesta 1. Definición del problema y objetivos de la investigación. 2. Selección y definición de las variables. 3. Diseño del cuestionario. 4. Validación y prueba del cuestionario. 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. La investigación por encuesta 1. Definición del problema y objetivos de la Trabajo con expertos investigación. Prueba piloto 2. Selección y definición de las variables. 3. Diseño del cuestionario. 4. Validación y prueba del cuestionario. 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. Valorar: 1. 2. 3. 4. 5. 6. 7. 8. La investigación por encuesta Si el cuestionario responde a los objetivos del estudio Si el cuestionario tiene lógica y consistencia interna. La comprensión de las preguntas y aceptación por los encuestados. Idoneidad de la secuencia de preguntas y de las preguntas cerradas preestablecidas. 1. Definición del problema y objetivos de la La discriminación de las preguntas. investigación. Idoneidad de todos los aspectos del protocolo de procedimientos Idoneidad y nivel de preparación de los encuestadores 2. Selección y definición las variables. Aspectos logísticos: disponibilidad,de recogida y entrada de cuestionarios, la propia supervisión, etc. 3. Diseño del cuestionario. 4. Validación y prueba del cuestionario. 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. La investigación por encuesta 1. Definición del problema y objetivos de la investigación. 2. Selección y definición de las variables. 3. Diseño del cuestionario. 4. Validación y prueba del cuestionario. 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. Cálculo del tamaño de muestra Población infinita: n 2 Zα pq 2 2 d Población finita: 2 N Zα n 2 d pq 2 N 1 Z 2α 2 pq Entendiendo el error muestral 1: si los resultados de una encuesta dicen que 100 personas comprarían un producto y tenemos un error muestral del 5% comprarán entre 95 y 105 personas. 2: si hacemos una encuesta de satisfacción a los empleados con un error muestral del 3% y el 60% de los encuestados se muestran satisfechos significa que entre el 57% y el 63% (60% +/- 3%) del total de los empleados de la empresa lo estarán. 3: si los resultados de una encuesta electoral indicaran que un partido iba a obtener el 55% de los votos y el error estimado fuera del 3%, se estima que el porcentaje real de votos estará en el intervalo 52-58% (55% +/- 3%). La investigación por encuesta 1. Definición del problema y objetivos(Identificar de la • Revisión de los cuestionarios y corregir errores) investigación. 2. Selección y definición de las variables. • Codificación, clasificación y preparación de la base de datos 3. Diseño del cuestionario. • Análisis de las preguntas y aplicación de 4. Validación y prueba del cuestionario. técnicas estadísticas 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. Fiabilidad del cuestionario (Coeficiente Alfa de Cronbach) La fiabilidad hace referencia al grado de precisión que ofrecen las medidas obtenidas mediante un test, es decir, es el grado en que los ítems miden lo mismo La investigación por encuesta 1. Definición del problema y objetivos de la Trabajo con expertos investigación. Fiabilidad del cuestionario Prueba piloto 2. Selección y definición de las variables. 3. Diseño del cuestionario. 4. Validación y prueba del cuestionario. 5. Selección de la muestra. Aplicación del cuestionario. 6. Tratamiento y análisis de la información. 7. Presentación de los resultados. Coeficiente Alfa de Cronbach (Ejemplo) SUJETOS 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 ITEM1 4 2 5 3 5 2 5 4 2 3 2 4 2 4 1 4 ITEM2 5 2 6 2 6 1 3 5 1 2 3 5 3 5 2 5 ITEM3 5 1 4 3 4 1 2 5 1 1 1 6 1 4 1 6 ITEM4 4 2 5 3 5 1 5 5 2 1 2 4 1 6 2 5 TEST 18 7 20 11 20 5 15 19 6 7 8 19 7 19 6 20 Coeficiente Alfa de Cronbach (Ejemplo) SUJETOS ITEM1 ITEM2 ITEM3 ITEM4 TEST 1 4 5 5 4 18 2 2 2 1 2 7 3 5 6 4 5 20 4 3 2 3 3 11 Item 1: La escuela es divertida 5 5 6 4 5 20 6 2 1 1 1 5 útiles 15 7 Item 2: En la 5escuela3aprendo 2 cosas 5 8 4 5 5 5 19 es1un rollo1 9 Item 3: La escuela 2 2 6 10 3 2 1 1 7 11Item 4: En la 2escuela3pierdo el 1 tiempo 2 8 12 4 5 6 4 19 2)muy en desacuerdo; 131)completamente 2 en desacuerdo; 3 1 1 7 3) en desacuerdo; 4) de acuerdo; 5) muy de acuerdo; 6) 14 4 5 4 6 19 completamente de acuerdo 15 1 2 1 2 6 16 4 5 6 5 20 Reliability Statistics Cronbach's Alpha .935 N of Items 4 Item-Total Statistics La es cuela es divertida En la es cuela aprendo cos as útiles La es cuela es un rollo En la es cuela pierdo el tiempo Scale Mean if Item Deleted 9.69 Scale Variance if Item Deleted 26.096 Corrected Item-Total Correlation .842 Cronbach's Alpha if Item Deleted .928 9.44 21.463 .883 .903 10.06 20.196 .840 .923 9.63 21.583 .881 .903 15 2 Son explicaciones tentativas del fenómeno investigado. Son proposiciones (Lógica Matemática) 15 3 H0: hipótesis nula o fundamental (hipótesis de ninguna diferencia) H1: hipótesis alternativa (por lo general coincide con la hipótesis de investigación) Ejemplos: ◦ H0: µ = µ0 ◦ H1: µ ≠ µ0 15 4 Realidad H0 cierta H0 falsa Aceptar H0 Decisión correcta Error de tipo II (β) Rechazar H0 Error de tipo I (α) Decisión correcta Acción tomada 15 5 Error de Tipo I: Rechazar una hipótesis nula (H0) cuando ella es cierta =Probabilidad de Error de Tipo I : nivel de significación (5%) Error de Tipo II: Aceptar la hipótesis nula (H0) cuando debió ser rechazada = Probabilidad de Error de Tipo II 15 6 Significación < , se rechaza H0 Significación >= , se “acepta” H0 No existen razones suficientes para rechazar H0 15 7 Las técnicas o métodos estadísticos que no parten del supuesto de que las distribuciones o parámetros de la variable estudiada se conocen, son llamados Métodos de distribución libre ó Métodos no paramétricos y tienen uso en gran variedad de situaciones. 1. Prueba de bondad del ajuste Kolmogorov-Smirnov para una muestra Se utiliza para probar el ajuste de un grupo de datos a una distribución teórica dada, la Prueba de Kolmogorov-Smirnov es muy potente para tamaños de muestra pequeños. H0: La variable sigue una distribución teórica X Estadígrafo: Dn = máx | Fei - Fi | donde: Fei: Frecuencia relativa acumulada Esperada o Teórica Fi: Frecuencia relativa observada Acumulada (se determina cuando se agrupan los datos en clases) Regla de decisión (Región de rechazo de la H0): Si Dn > Dn* (Tabla Kolmogorov – Smirnov) se rechaza la hipótesis de ajuste. Prueba de Kolmogorov-Smirnov para una muestra N Parám etros norm ales a,b Diferencias más extrem as Media Desviación típica Absoluta Positiva Negativa Z de Kolmogorov-Sm irnov Sig. as intót. (bilateral) a. La distribución de contras te es la Norm al. b. Se han calculado a partir de los datos. tiempo de servicio 45 31.24 2.917 .199 .199 -.146 1.332 .058 Otras pruebas no paramétricas: Podemos dividirlas en los grupos siguientes: 1. Para dos muestras independientes. Prueba U de Mann-Whitney 2. Para “k” muestras independientes. Kruskal-Wallis H 3. Para dos muestras relacionadas Prueba de Wilcoxon Para k muestras relacionadas Prueba de Friedman Para una muestra Prueba de rachas o corridas Ejemplo En una instalación turística de Varadero, actualmente se hospedan turistas de diferentes regiones del mundo (Europa, Asia, Latinoamérica, América del Norte y África). Aprovechando la gran representatividad de culturas que actualmente existe entre los huéspedes del hotel, la gerencia decidió aplicar una encuesta para evaluar los servicios recreativos y gastronómicos que se brindan. Para ello, se aplicó una encuesta a 15 turistas de Asia, 12 de Europa, 21 de Latinoamérica, 14 de América del Norte y 10 de África. Entre los ítems que incluía la encuesta existía uno relacionado con el nivel de satisfacción con las actividades que se desarrollan en el cabaret. Dicho nivel de satisfacción se evaluó en una escala de 1 a 10 (1 totalmente insatisfecho y 10 totalmente satisfecho). Al inicio de la investigación se trazó como objetivo comparar las distintas regiones en cuanto a su nivel de satisfacción. A continuación se muestran los resultados obtenidos en la aplicación de la encuesta a los turistas Asiáticos y de América del Norte. Asia 4 5 3 6 5 4 7 4 3 2 3 4 5 6 América Norte 6 7 8 5 6 7 8 9 6 6 5 6 7 8 7 ¿A qué conclusión puede usted arribar a partir de la aplicación a los datos anteriores de la prueba de hipótesis correspondiente? Trabaje con un nivel de confianza del 95%. Rangos PUNTAJE país Asia América Total N 15 14 29 Rango promedio 9.93 20.43 Suma de rangos 149.00 286.00 Te st St atist icsb Ma nn-Whitn ey U Wi lcoxo n W Z As ymp. Sig. (2-ta iled) Exact Sig. [2 *(1-tailed Sig .)] PUNTAJE 29 .000 14 9.00 0 -3.364 .00 1 a. No t cor recte d for ties. b. Gr oupin g Va riab le: pa ís a .00 1 En el Hotel “Los Caneyes” se aplicó una encuesta para evaluar algunos elementos del clima organizacional. Uno de los ítems que estaba en el cuestionario era: el ambiente de trabajo en el hotel me incentiva día a día. La escala establecida para este ítem fue de 1 (totalmente en desacuerdo hasta 5 totalmente de acuerdo). Se sospecha que existen diferencias entre los graduados de nivel superior y los demás trabajadores en cuanto a este ítem. A continuación aparecen los resultados de la aplicación de la encuesta a 12 graduados de nivel superior y 15 otros trabajadores. Nivel superior 2 3 2 4 1 3 2 4 2 3 1 2 Otros trabajadores 4 2 4 5 4 5 6 3 4 5 3 4 5 4 4 ¿A qué conclusión puede usted arribar a partir de la aplicación a los datos anteriores de la prueba de hipótesis correspondiente? Trabaje con un nivel de confianza del 95%. Ejercicio En una instalación turística se aplica desde hace seis meses un nuevo sistema de mantenimiento. Para comprobar la efectividad de dicho sistema se realizó hace 1año atrás (cuando no existía el sistema actual) una encuesta, la cuál fue repetida recientemente. En la siguiente tabla se muestran los resultados de la encuesta a 20 trabajadores. Los datos representan la suma de las puntuaciones de la encuesta para cada trabajador, donde los mayores valores corresponden a los aspectos positivos, es decir, mayor efectividad. Trab. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 año antes 14 15 14 13 15 16 14 12 14 15 12 14 15 16 14 13 12 14 15 16 actual 15 16 17 15 17 18 14 13 15 14 13 15 14 14 15 14 13 15 16 15 ¿A qué conclusión puede usted arribar a partir de la aplicación a los datos anteriores de la prueba de hipótesis correspondiente? Trabaje con un nivel de confianza del 95%. Ranks N puntaje des pues - puntaje antes Negative Ranks Positive Ranks Ties Total 4a 15 b 1c 20 Mean Rank 9.75 10.07 a. puntaje des pues < puntaje antes b. puntaje des pues > puntaje antes c. puntaje antes = puntaje despues Test Statisticsb Z As ymp. Sig. (2-tailed) puntaje despues puntaje antes -2.368a .018 a. Based on negative ranks . b. Wi lcoxon Signed Ranks Test Sum of Ranks 39.00 151.00 Ejemplo La gerencia de cierta instalación hotelera ha decidido realizar estudios sobre la calidad de sus servicios pues sus niveles de ocupación han disminuido considerablemente lo que se corrobora con los resultados de las encuestas realizadas a los turistas al evaluar la calidad percibida. Se realiza una generación de gráficos de pareto y se detecta que el servicio de restaurante es el que mayor problemas presenta (aproximadamente 70%). Se decidió hacer primeramente un trabajo con 8 expertos para determinar los requisitos fundamentales que están afectando la calidad de este servicio, para esto se les pidió que evaluaran cada uno en una escala del 1(el que más está afectando la calidad del servicio) al 9(el que menos está afectando la calidad del servicio) obteniéndose: No Requisito 1 Rapidez del servicio 2 Higiene 3 Variedad 4 Temperatura de los alimentos 5 Dominio del idioma 6 Presentación del plato 7 Sabor de los alimentos 8 Cortesía y destreza 9 Proporción y cantidad de los alimentos Requisito Expertos E1 E2 E3 E4 E5 Rj E6 E7 E8 1 2 1 1 1 2 2 2 2 13 2 4 4 4 4 4 3 3 4 30 3 5 5 5 5 3 5 5 3 36 4 3 3 3 3 5 4 4 5 30 5 9 9 9 7 7 9 7 9 66 6 8 8 8 9 9 7 9 8 66 7 1 2 2 2 1 1 1 1 11 8 6 6 6 6 6 8 8 6 52 9 7 7 7 8 8 6 6 7 56 Ra ngos Rapidez del servicio Higiene Variedad Temperatura de los alimentos Dominio del idioma Presentación del plato Sabor de los alimentos Cortes ía y destreza Proporción y cantidad de los alimentos Rango promedio 1.63 3.75 4.50 3.75 8.06 8.31 1.38 6.63 7.00 Estadísticos de contraste N W de Kendalla Chi-cuadrado gl Sig. as intót. 8 .916 58.619 8 .000 a. Coeficiente de concordancia de Kendall Aplicación especial K- Muestras Relacionadas (Test Kendall´s W) N P a r T e s t s K e n d a l l ' s W T e s t Ranks problema1 problema2 problema3 problema4 problema5 problema6 problema7 problema8 problema9 problema10 problema11 problema12 Mean Rank 11.50 11.50 9.38 9.63 7.50 1.13 5.38 5.50 7.50 2.88 3.75 2.38 Test Statistics N Kendall's Wa Chi-Square df As ymp. Sig. 8 .971 85.481 11 .000 a. Kendall's Coefficient of Concordance 18 4 1. 2. IBM SPSS Statistics Base.pdf Illowsky, B. Collaborative Statistics, 2010 <http://cnx.org/content/col10522/1.38/> 18 5