Download estadistica descriptiva, medidas de tendencia central

Document related concepts

Parámetro estadístico wikipedia , lookup

Medidas de dispersión wikipedia , lookup

Asimetría estadística wikipedia , lookup

Desviación típica wikipedia , lookup

Medidas de tendencia central wikipedia , lookup

Transcript
UNIVERSIDAD MARIANO GÁLVEZ DE GUATEMALA
FACULTAD DE CIENCIAS DE LA ADMINISTRACIÓN
DIRECCIÓN DE POSTGRADOS
MAESTRÍA EN DIRECCIÓN Y GESTIÓN DEL RECURSO HUMANO
SEDE: ESCUINTLA
CURSO: Modelos para la toma de decisiones
CATEDRÁTICA: Ing. Claudia Esmeralda Marisol Villela Cervantes
INVESTIGACIÓN
ESTADISTICA DESCRIPTIVA, MEDIDAS DE TENDENCIA
CENTRAL, MEDIDAS DE FORMA Y MEDIDAS DE DISPERSION
NOMBRE
CARNE
Ismael Estuardo Ruiz Fernández
2728-08-1838
Bianca Aracely Marín Luis
2728-06-13901
Ana Lucía
2728-
Bilena Alejandra Gálvez
2728-
Escuintla, 07 de febrero 2015
ESTADISTICA
La Estadística es la ciencia que se encarga de recolectar datos de una población o
muestra. Los conceptos estadísticos se han trabajado intuitivamente desde la
antigüedad, las primeras culturas recopilaban datos poblacionales por medio de
censos como los realizados en Egipto por Moisés (según consta la Biblia) y el
empadronamiento que fue efectuado por los romanos en Judea.
ESTADISTICA DESCRIPTIVA
La estadística descriptiva es una gran parte de la estadística que se dedica a
recolectar, ordenar, analizar y representar un conjunto de datos, con el fin de
describir apropiadamente las características de este. Este análisis es muy básico.
Aunque hay tendencia a generalizar a toda la población, las primeras conclusiones
obtenidas tras un análisis descriptivo, es un estudio calculando una serie de
medidas de tendencia central, para ver en qué medida los datos se agrupan o
dispersan en torno a un valor central.
AREAS DE APLICACIÓN
La estadística es una ciencia de aplicación práctica casi universal en todos los
campos científicos:
 En las ciencias naturales: Se emplea con profusión en la descripción de
modelos termodinámicos complejos (mecánica estadística), en física
cuántica, en mecánica de fluidos o en la teoría cinética de los gases, entre
otros muchos campos.
 En las ciencias sociales y económicas: Es un pilar básico del desarrollo
de la demografía y la sociología aplicada.
 En
economía:
Suministra
los
valores
que
ayudan
a
descubrir
interrelaciones entre múltiples parámetros macro y microeconómicos.
 En las ciencias médicas: Permite establecer pautas sobre la evolución de
las enfermedades y los enfermos, los índices de mortalidad asociados a
procesos morbosos, el grado de eficacia de un medicamento, etc.
ESTADÍSTICAS COMUNES
Varios estudios estadísticos comunes que aparecen con frecuencia en los medios
de comunicación son los siguientes:

Encuesta de Población Activa (EPA), elaborada por el Instituto Nacional
de Estadística (INE) con periodicidad trimestral, según recomendaciones de
la Organización Internacional del Trabajo (OIT), para obtener y clasificar
datos sobre la actividad de la población. Esta encuesta se realiza por
muestreo, y los resultados se ordenan por edad, sexo, nivel de estudios,
profesión y otros parámetros.

Índice de Precios al Consumo (IPC), que mide por medios estadísticos la
evolución experimentada por los precios de los bienes y servicios
consumidos por la población española. Se basa en la Encuesta de
Presupuestos Familiares (EPF), y selecciona varios centenares de
artículos, clasificados en ocho grupos, que se consideran representativos
de la evolución de los precios. Los artículos seleccionados componen lo
que se denomina cesta de la compra, considerada en la encuesta.

Producto Interior Bruto (PIB), que registra la producción nacional de un
país en bienes y servicios asociados a procesos considerados productivos.

Poder adquisitivo, que maneja combinadamente datos del Salario Mínimo
Interprofesional (SMI) y el IPC.
MEDIDAS DE TENDENCIA CENTRAL
Al describir grupos de observaciones, con frecuencia es conveniente resumir la
información con un solo número. Este número que, para tal fin, suele situarse
hacia el centro de la distribución de datos se denomina medida o parámetro de
tendencia central o de centralización
Entre las medidas de tendencia central tenemos:
 Media
 Media ponderada
 Media geométrica
 Mediana
 Moda
MEDIA: La media aritmética es el valor obtenido por la suma de todos sus valores
dividida entre el número de sumadores. La media aritmética es, probablemente,
uno de los parámetros estadísticos más extendidos. Se le llama también promedio
o, simplemente, media.
MEDIA PONDERADA: La media ponderada se aplica cuando en un conjunto de
datos cada uno de ellos tiene una importancia relativa (o peso) respecto de los
demás datos. Se obtiene multiplicando cada uno de los datos por su ponderación
(peso) para luego sumarlos, obteniendo así una suma ponderada; después se
divide ésta entre la suma de los pesos, dando como resultado la media ponderada
MEDIA GEOMETRICA: La media geométrica de una cantidad arbitraria de
números (por decir n números) es la raíz n-ésima del producto de todos los
números, es recomendada para datos de progresión geométrica, para promediar
razones, interés compuesto y números índices.
MEDIANA: la mediana representa el valor de la variable de posición central en un
conjunto de datos ordenados.
Sean
los datos de una muestra ordenada en orden creciente y
designando la mediana como
, distinguimos dos casos:
a) Si n es impar, la mediana es el valor que ocupa la posición
una vez
que los datos han sido ordenados (en orden creciente o decreciente), porque éste
es el valor central. Es decir:
.
Por ejemplo, si tenemos 5 datos, que ordenados son:
,
,
,
,
=> El valor central es el tercero:
. Este valor,
que es la mediana de ese conjunto de datos, deja dos datos por debajo ( ,
)y
otros dos por encima de él ( ,
).
b) Si n es par, la mediana es la media aritmética de los dos valores centrales.
Cuando es par, los dos datos que están en el centro de la muestra ocupan las
posiciones
y
. Es decir:
.
Por ejemplo, si tenemos 6 datos, que ordenados son:
,
,
,
,
,
. Aquí dos valores que están por debajo del
y otros dos que quedan por encima del siguiente dato
. Por tanto, la mediana de este grupo de datos es la media
aritmética de estos dos datos:
MODA: En estadística, la moda es el valor con una mayor frecuencia en una distribución
de datos.
Hablaremos de una distribución bimodal de los datos adquiridos en una columna
cuando encontremos dos modas, es decir, dos datos que tengan la misma
frecuencia absoluta máxima.
Una distribución trimodal de los datos es en la que encontramos tres modas. Si
todas las variables tienen la misma frecuencia diremos que no hay moda.
MEDIDAS DE FORMA
ASIMETRIA: Es una medida de forma de una distribución que permite identificar y
describir la manera como los datos tiende a reunirse de acuerdo con la frecuencia
con que se hallen dentro de la distribución. Permite identificar las características
de la distribución de datos sin necesidad de generar el gráfico.
Como eje de simetría consideramos una recta paralela al eje de ordenadas que
pasa por la media de la distribución. Si una distribución es simétrica, existe el
mismo número de valores a la derecha que a la izquierda de la media, por tanto, el
mismo número de desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetría positiva (o a la derecha) si la "cola" a la derecha de la
media es más larga que la de la izquierda, es decir, si hay valores más separados
de la media a la derecha. Diremos que hay asimetría negativa (o a la izquierda) si
la "cola" a la izquierda de la media es más larga que la de la derecha, es decir, si
hay valores más separados de la media a la izquierda.
CURTOSIS: La curtosis mide el grado de agudeza o achatamiento de una
distribución con relación a la distribución normal, es decir, mide cuán puntiaguda
es una distribución.
TIPOS DE CURTOSIS
La curtosis determina el grado de concentración que presentan los valores en la
región central de la distribución. Así puede ser:
Leptocúrtica: Existe una gran concentración.
Mesocúrtica: Existe una concentración normal.
Platicúrtica: Existe una baja concentración.
MEDIDAD DE DISPERSION
Las medidas de dispersión, también llamadas medidas de variabilidad, muestran
la variabilidad de una distribución, indicando por medio de un número, si las
diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto
mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más
homogénea será a la media. Así se sabe si todos los casos son parecidos o varían
mucho entre ellos.
RANGO ESTADISTICO: El rango o recorrido estadístico es la diferencia entre el
valor máximo y el valor mínimo en un grupo de números aleatorios.
Requisitos del rango
 Ordenamos los números según su tamaño.
 Restamos el valor mínimo del valor máximo.
Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus
valores se encuentran en un rango de:
VARIANZA: La varianza es una medida estadística que mide la dispersión de los
valores respecto a un valor central (media), es decir, es el cuadrado de las
desviaciones.
DESVIACION TIPICA: La varianza a veces no se interpreta claramente, ya que se
mide en unidades cuadráticas. Para evitar ese problema se define otra medida de
dispersión, que es la desviación típica, o desviación estándar, que se halla como
la raíz cuadrada positiva de la varianza. La desviación típica informa sobre la
dispersión de los datos respecto al valor de la media; cuanto mayor sea su valor,
más dispersos estarán los datos. Esta medida viene representada en la mayoría
de los casos por S, dado que es su inicial de su nominación en inglés.
COVARIANZA: La covarianza entre dos variables es un estadístico resumen
indicador de si las puntuaciones están relacionadas entre sí. La formulación
clásica, se simboliza por la letra griega sigma (σ) cuando ha sido calculada en la
población. Si se obtiene sobre una muestra, se designa por la letra
COEFICIENTE DE CORRELACION: El coeficiente de correlación de Pearson, r,
permite saber si el ajuste de la nube de puntos a la recta de regresión obtenida es
satisfactorio. Se define como el cociente entre la covarianza y el producto de las
desviaciones típicas (raíz cuadrada de las varianzas).
FUENTES
Estadística: http://destadistica.ingenieria.usac.edu.gt
Estadística Descriptiva: http://destadistica.ingenieria.usac.edu.gt
Aplicaciones de la Estadística: http://www.hiru.com/matematicas/aplicaciones-dela-estadistica
Estudios Estadísticos Comunes: http://www.hiru.com/matematicas/aplicacionesde-la-estadistica
Medidas de tendencia central:
http://es.wikipedia.org/wiki/Medidas_de_tendencia_central
Media Ponderada: Mario F. Triola (2008). Estadistica (décima edición). Pearson Educacion.
ISBN 9789702612872.
Media Geometrica: Lages, Pinto, Wagner, Morgado: La Matemática de la Enseñanza Media
Vol. 2 [2000] IMCA, Perú, ISBN 9972-753-48-4; pg. 127
Mediana: http://es.wikipedia.org/wiki/Mediana_%28estad%C3%ADstica%29
Moda: http://es.wikipedia.org/wiki/Moda_%28estad%C3%ADstica%29
Asimetría: http://es.wikipedia.org/wiki/Asimetr%C3%ADa_estad%C3%ADstica
Curtosis: http://www.monografias.com/trabajos87/medidas-forma-asimetriacurtosis/medidas-forma-asimetria-curtosis.shtml
Medidas de Dispersión:
http://es.wikipedia.org/wiki/Medidas_de_dispersi%C3%B3n