Download DATOS AGRUPADOS EN INTERVALOS
Document related concepts
Transcript
ESTADÍSTICA EN QUÍMICA ANALÍTICA Q.F. Carlos Roberto Gutiérrez Arce. Q.F. Walter Nelson Gutiérrez Zerpa. Q.F. Carlos R. Gutiérrez Arce IMPORTANCIA DE LA ESTADÍSTICA Y LA QUIMIOMETRÍA EN LA QUÍMICA ANALÍTICA Durante la realización de una análisis cuantitativo es muy importante tomar en cuenta todas las variables que pueden afectar nuestro resultado, dentro de estos están los factores provocados por los instrumentos utilizados y los errores provocados por quien maneja el material. En el reporte de cualquier análisis químico, es importante tomar en cuenta este tipo de errores , hacer un análisis de los resultados y así se podrá concluir sobre él. Q.F. Carlos R. Gutiérrez Arce ¿ Qué es estadística? La estadística es una colección de métodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusión basada en esos datos. Es la ciencia encargada de recopilar, organizar, analizar e interpretar información numérica o cualitativa, de manera que pueda llevar a conclusiones válidas. Q.F. Carlos R. Gutiérrez Arce ESTADISTICA DESCRIPTIVA Es la ciencia que recopila, organiza e interpreta la información numérica o cualitativa INFERENCIAL Es la ciencia que interpreta información de manera que pueda llevar a conclusiones válidas. Q.F. Carlos R. Gutiérrez Arce La Estadística se utiliza como tecnología al servicio de las ciencias donde la variabilidad y la incertidumbre forman parte de su naturaleza. La Estadística es la Ciencia de la Sistematización, recolección, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de deducir las leyes que rigen esos fenómenos, y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones. Q.F. Carlos R. Gutiérrez Arce DATOS NO AGRUPADOS • Medidas de tendencia central Medidas de dispersión Media aritmética Mediana Moda Percentiles (posición) Rango (amplitud) Rango intercuartílico Varianza Coef. de variación Q.F. Carlos R. Gutiérrez Arce MAGNITUD MESURANDO O MEDIDA VARIABLE ANALISIS • Atributo o propiedad que puede ser medida • Ejemplos de magnitudes : La longitud, la masa, concentración de una solución, Absortividad molar volumen de un líquido, absorbancia, etc. • Magnitud de un objeto específico que estamos interesado en medir • Es la determinación experimental de la MAGNITUD • Toda MAGNITUD que permite diferenciar entre si a los componentes de una población • Proceso que nos da una información física o química acerca de los componentes de una muestra Q.F. Carlos R. Gutiérrez Arce Medidas de tendencia central • Mediana – En una serie de datos ordenados (creciente o decreciente) es la puntuación o valor central de la distribución estadística • Datos no agrupados – Si el nº de datos es impar: valor central – Si el nº de datos es par: media aritmética de los 2 puntos centrales Q.F. Carlos R. Gutiérrez Arce Medidas de tendencia central • Mediana – Características • Menos sensible que la media a la variación de las puntuaciones. • Se puede calcular aunque algún intervalo carezca de límite. • Más representativa que la media cuando puntuaciones muy extremas. Q.F. Carlos R. Gutiérrez Arce Medidas de tendencia central • Moda – Valor de la variable que más veces se repite en una serie estadística (máxima frecuencia) • Distribuciones: Unimodales o multimodales • Marca de clase (en intervalos) – Características: • Sencilla de calcular • Se puede calcular si algún intervalo no tiene límites • Poco representativa Q.F. Carlos R. Gutiérrez Arce Medidas de tendencia central • Media –Suma de todos los valores de una variable dividida por el número total de valores –Sólo en variables cuantitativas • X = xi / N Q.F. Carlos R. Gutiérrez Arce Medidas de tendencia central • Media. Cálculo – Datos no agrupados: aplicar fórmula – Datos agrupados • En tabla de frecuencia: Suma de todos los valores multiplicados por sus frecuencias y dividido por el nº total. X = x i fi / N Q.F. Carlos R. Gutiérrez Arce Medidas de tendencia central • Media – Características • La media es sensible a la variación de las puntuaciones. • No se puede calcular si algún intervalo es de límite abierto. • No es recomendable si valores muy extremos Q.F. Carlos R. Gutiérrez Arce Medidas de dispersión • Reflejan la dispersión, oscilación de los datos, respecto al fenómeno estudiado. • Complementan las de tendencia central para la descripción de una distribución Q.F. Carlos R. Gutiérrez Arce Medidas de dispersión • Amplitud o rango – Diferencia entre el valor más alto y más bajo de la distribución. • Ofrece poca información sobre la agrupación de los datos. • Indica el “campo de variabilidad”. • Suele acompañar a la moda. Q.F. Carlos R. Gutiérrez Arce Medidas de dispersión • Varianza – Junto a la desviación típica, la que mejor expresa la variabilidad del fenómeno – Media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética •S2 = (xi – x)2 / N •S2 = xi2 / N – x2 – Para datos agrupados: •S2 = fi(xi – x) 2 / N Q.F. Carlos R. Gutiérrez Arce •S2 = fixi2 / N – x2 Medidas de dispersión • Desviación típica – Es la raíz cuadrada de la varianza •S2 = x i2 / N – x 2 – Para datos agrupados: •S2 = fixi2 / N –x2 Q.F. Carlos R. Gutiérrez Arce Medidas de dispersión • Varianza y desviación típica – Características • Ambas toman siempre valores positivos. • Si todos los datos de una distribución son iguales entre sí, toman el valor 0. • Sólo son aplicables a variables cuantitativas • La que más se suele usar es la desviación típica. • Si los datos están muy dispersos, la desviación típica será muy grande. Q.F. Carlos R. Gutiérrez Arce Medidas de dispersión • Coeficiente de variación de Pearson – Para poder comparar la dispersión entre 2 ó más variables entre sí, o una misma variable en 2 ó más grupos estudiados – Es una medida relativa: Relaciona la media con la desviación típica • CV = S / X . 100 Q.F. Carlos R. Gutiérrez Arce Q.F. Carlos R. Gutiérrez Arce Q.F. Carlos R. Gutiérrez Arce DISTRIBUCIÓN DE FRECUENCIAS • En una distribución de datos estos pueden estar o no agrupados. DATOS AGRUPADOS EN INTERVALOS: DATOS NO AGRUPADOS EN INTERVALOS: X n Xi 4 3 2 1 0 Xi 4 3 2 1 0 SUPUESTO DE CONCENTRACION EN EL PUNTO MEDIO (Xi): X i i n n X i i X n ni 1 3 7 6 3 ni 1 3 7 6 3 mitjana= Xi*ni 4 9 14 6 0 33 33/5= 6,6 Xi 18 20 15 17 12 14 9 11 6 8 3 5 ni 20 30 60 40 30 20 P. M. 19 16 13 10 7 4 Q.F. Carlos R. Gutiérrez Arce mitjanna= Xi 18-20 15-17 12-14 9-11 6-8 3-5 PM*ni 380 480 780 400 210 80 2330 2330/200= ni 20 30 60 40 30 20 11,65 ¿CUANDO ELEGIR LA MEDIANA EN LUGAR DE LA MEDIA?: 1. CUANDO LA VARIABLE ESTE MEDIDA EN UNA ESCALA ORDINAL. 2. CUANDO HAYA VALORES EXTREMOS, PUES ESTOS DISTORSIONAN LA INTERPRETACION DE LA MEDIA. EJEMPLO: 3,4,8,5,6,124 Media=25 LA MEDIA ES MUY SENSIBLE A LAS PUNTUACIONES EXTREMAS 3. CUANDO HAYA INTERVALOS ABIERTOS, YA QUE ESTOS CARECEN DE PUNTO MEDIO. Q.F. Carlos R. Gutiérrez Arce La distribución normal f(X) Media Mediana Moda X • Datos simétricos: coinciden la media, la mediana y la moda Q.F. Carlos R. Gutiérrez Arce En resumen • Podemos concluir que hay una familia de distribuciones con una forma común, diferenciadas por los valores de su media y su varianza. • La desviación estándar (σ ) determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de σ, más se dispersarán los datos en torno a la media y la curva será más plana. • La media indica la posición de la campana, de modo que para diferentes valores de μ la gráfica es desplazada a lo largo del eje horizontal. • De entre todas ellas, la más utilizada es la distribución normal estándar, que corresponde a una distribución de media 0 y varianza 1. Q.F. Carlos R. Gutiérrez Arce ERRORES EN LOS ANALISIS QUIMICOS • Es imposible efectuar análisis químicos totalmente libres de errores o incertidumbres. • La fiabilidad de un resultado se analiza de diferentes maneras • Se analizan patrones de composición conocida • Se aplican pruebas estadísticas a los datos Q.F. Carlos R. Gutiérrez Arce En ciencias e ingeniería, el concepto de error tiene un significado diferente del uso habitual de este término. Coloquialmente, es usual el empleo del término error como análogo o equivalente a equivocación. En ciencia e ingeniería, el error, está más bien asociado al concepto de INCERTEZA, INCERTIDUMBRE, en la determinación del resultado de una medición. Gloria María Mejía Z ERROR: es la medida del sesgo en el resultado de una medición. INCERTIDUMBRE: es el intervalo o rango de los valores posibles de una medida. Incluye tanto los errores sistemáticos como aleatorios. La incertidumbre de un resultado es bien diferente de la precisión, ésta da una medida del error aleatorio. Q.F. Carlos R. Gutiérrez Arce Error: Es la medida del sesgo en el resultado de una medición Incertidumbre: Es el intervalo o rango de los valores posibles de una medida. Incluye tanto errores aleatorios como sistemáticos La incertidumbre de un resultado es bien diferente de la precisión, ésta da una medida del error aleatorio. Más precisamente, lo que procuramos en toda medición es conocer las cotas (o límites probabilísticos) de estas incertezas. Q.F. Carlos R. Gutiérrez Arce Errores Groseros o accidentales Son errores que son tan importantes que no existe alternativa real que abandonar el experimento y empezar de nuevo por completo. Aleatorio Estos provocan que los resultados individuales difieran uno del otro de manera que caigan a ambos lados del valor medio. Estos errores afectan la precisión de un experimento. Este tipo de errores son los que comete el operador del instrumento utilizado. Sistemáticos Provocan que todos los resultados sean erróneos en el mismo sentido, son demasiado grandes, y se denomina también sesgo de la medida. Este tipo de error es responsabilidad del material empleado y de su origen y presión de fabricación. Q.F. Carlos R. Gutiérrez Arce Sistemáticos • Determinados: Posibles de evitar y o de corregir. Pueden ser constantes como pesar en una balanza descalibrada, o variables. Aleatorios • Indeterminados: A menudo se llaman accidentales. Estos errores se evidencian por pequeñas diferencias en mediciones sucesivas. Q.F. Carlos R. Gutiérrez Arce Errores experimentales • Error absoluto.- Nos indica si medimos u obtuvimos mas o menos que el valor experimental, y en qué cantidad excedimos del valor real o qué cantidad nos faltó; esto según el signo de la sustracción. EA = valor experimental – valor teórico • Error relativo.- Es una forma de conocer el porcentaje de error que obtuvimos en nuestros resultados. ER = (valor experimental – valor teórico) x 100 (valor teórico) Q.F. Carlos R. Gutiérrez Arce Los errores presentes en un estudio analítico modifican: • Precisión Es el grado de confianza con que se puede repetir un experimento y este puede dar los mismo resultados. Es utilizado como sinónimo de repetitibilidad. • Exactitud Es el grado de concordancia entre el resultado de un ensayo y el valor de referencia aceptado. Q.F. Carlos R. Gutiérrez Arce 2.2.- EXACTITUD Y PRECISION EXACTITUD: es el grado de concordancia entre el valor medido y el valor aceptado o verdadero. PRECISIÓN: Grado de concordancia entre resultados obtenidos de la misma manera. Cuanto menores sean los errores aleatorios mayor precisión tendrá el proceso analítico. La precisión solo afecta a la dispersión de los resultados, no a su desviación del valor verdadero. Relacionados con la precisión encontramos dos términos: Repetibilidad: grado de concordancia entre resultados independientes obtenidos con: mismo método, misma muestra, mismas condiciones (mismo operador, equipos, laboratorio y en un corto intervalo de tiempo). Reproducibilidad: es el grado de concordancia entre resultados independientes obtenidos con: mismo método, misma muestra, diferentes condiciones (distinto operador, aparatos, laboratorios, y un intervalo de tiempo más o menos amplio). TERMINOS IMPORTANTES Media, Media aritmética y promedio (X) son términos sinónimos. Es la medida de tendencia central mas utilizada .Se obtiene dividiendo la suma de los valores de una serie y dividiendo por el numero de medidas del conjunto. • Mediana es el resultado alrededor del cual se reparten los demás por igual. Si la serie es un numero impar la mediana es el numero de la mitad. Si la serie es un numero par se toma el promedio del par central después de haber ordenado la serie Q.F.de Carlosmenor R. Gutiérrez a Arcemayor. TERMINOS IMPORTANTES • Ejemplo: calcular la media y la mediana de 10.06, 10.20, 10.08, 10.10. • Media = X =10.06+10.20+10.08+10.10 = 10.11 4 Mediana = 10.08 +10.10 = 10.09 2 Q.F. Carlos R. Gutiérrez Arce CIFRAS SIGNIFICATIVAS • Es el numero necesario de dígitos para expresar los resultados de una medición congruente con la precisión de medida. 237 : 2 centenas, 3 decenas y 7 unidades • El numero de cifras significativas incluye todos los dígitos que se conocen mas el primer digito incierto. Q.F. Carlos R. Gutiérrez Arce El numero de cifras significativas en una medición es independiente de la colocación del punto decimal. Por ejemplo el numero 92.067: Este numero tiene cinco cifras significativas independiente donde se coloque el punto decimal. En este caso el cero si es una cifra significativa. En el numero 727.0 el cero no se usa para localizar el punto decimal es significativo Q.F. Carlos R. Gutiérrez Arce Ejemplos: 0.216 Tres Cifras significativas. 90.7 Tres cifras significativas. 800.0 Cuatro cifras significativas. 0.0670 Tres cifras significativas Q.F. Carlos R. Gutiérrez Arce TERMINOS IMPORTANTES Precisión. • El término precisión describe la reproducibilidad de los resultados y se puede definir como la concordancia que hay entre los valores numéricos de dos o más mediciones que se han realizado de idéntica manera. La precisión sólo depende de la distribución de los errores aleatorios y no se relaciona con el valor verdadero ni con el valor especificado. Q.F. Carlos R. Gutiérrez Arce PRECISION • Para describir la precisión de un conjunto de datos repetidos se utilizan tres términos muy conocidos: • La desviación estándar, la varianza y el coeficiente de variación. Q.F. Carlos R. Gutiérrez Arce • La desviación estándar (DS/DE) es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. Asi la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución. Aunque esta fórmula es correcta, en la práctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1 Q.F. Carlos R. Gutiérrez Arce TERMINOS IMPORTANTES • METODOS ABSOLUTOS PARA EXPRESAR LA PRECISION • Desviación estándar S= Xi-X n-1 • Desviación respecto a la media numérica entre un valor experimental y la media es la diferencia • Varianza: S2 • Coeficiente de variación. C.V = S/Media *100 Q.F. Carlos R. Gutiérrez Arce TERMINOS IMPORTANTES • Desviación estándar relativa (DER) : se calcula al dividir la desviación estándar entre la media del conjunto de datos. • DER se expresa en partes por mil o en %. • DER * 100% = CV. • Dispersión (W): Es la diferencia entre el valor mas alto y el valor mas bajo del conjunto Q.F. Carlos R. Gutiérrez Arce TERMINOS IMPORTANTES • EXACTITUD : El término denota el grado de coincidencia del resultado de una medición con el valor verdadero o aceptado de la misma y se expresa en función del error. La exactitud implica una comparación con el valor verdadero o aceptado como tal. • Cuando no se conoce el valor verdadero se debe usar un valor aceptado. Q.F. Carlos R. Gutiérrez Arce TERMINOS IMPORTANTES • METODOS PARA MEDIR LA EXACTITUD • Error absoluto: Es la diferencia entre el valor experimental y el valor real. • Error relativo: Es el error absoluto dividido por la cantidad medida. • Ejemplo: • Una muestra tiene 20.34% de Fe y un analista encuentra que es 20.44%. • Error Absoluto = 20.44-20.34 = 0.10% • Error relativo = 0.1/20.34 = 0.0049 = 4.9 partes por mil Q.F. Carlos R. Gutiérrez Arce TERMINOS IMPORTANTES • En términos generales la exactitud supone una comparación con un valor verdadero o aceptado como tal, la precisión indica la concordancia entre las medidas que han sido realizadas de una misma forma. Q.F. Carlos R. Gutiérrez Arce Esquema gráfico para comprender la relación entre exactitud y precisión www.galeon.com/scienceducation/error00.htm En C existe buena precisión, pero no buena exactitud; en A buena exactitud y precisión, y en B mala exactitud y precisión. Q.F. Carlos R. Gutiérrez Arce Diagrama precisión y exactitud Q.F. Carlos R. Gutiérrez Arce EVALUACION DE LOS DATOS ANALITICOS • ESTUDIANTE RESULTADOS DE UNA TITULACION A 10.08 10.11 10.09 10.10 10.12 B 9.88 10.14 10.02 9.80 10.21 C 10.19 9.79 9.69 10.05 9.78 Q.F. Carlos R. Gutiérrez Arce COMENTARIO Preciso pero inexacto Exacto pero impreciso Inexacto e impreciso EVALUACION DE LOS DATOS ANALITICOS • ESTUDIANTE D RESULTADOS DE UNA TITULACION 10.04 9.98 10.02 9.97 10.04 Q.F. Carlos R. Gutiérrez Arce COMENTARIO EXACTO Y PRECISO TIPOS DE ERRORES EN DATOS EXPERIMENTALES ERRORES • Bruto Ocurre de manera Ocasional . suele ser Grandes. Dan como resultado valores atípicos que difieren mucho de los demás. Aleatorios Sistemáticos - = indeterminados - = determinados -Afectan la presicion - Afectan la exactitud o la reproducibilidad o sea la proxim al valor verdadero. - Los resultados caen - Todos los resultados a lado y lado de la X son erróneos en el mismo sentido. Q.F. Carlos R. Gutiérrez Arce ERRORES DETERMINADOS O SISTEMATICOS FUENTES DE ERRORES SISTEMÁTICOS • Errores instrumentales: Calibraciones deficientes • Errores del método: Dificiles de identificar • Errores personales: Descuido, Falta de atención Q.F. Carlos R. Gutiérrez Arce EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS • Los errores sistemáticos pueden ser constantes o proporcionales • En los errores constantes el error absoluto es invariable con el tamaño de la muestra ,mientras el error relativo cambia al modificar dicho tamaño. • Los errores proporcionales aumentan o disminuyen según el tamaño de la muestra. Con los errores proporcionales el error absoluto varia con el tamaño de la muestra, en cambio el error relativo permanece constante. Q.F. Carlos R. Gutiérrez Arce EFECTO DE LOS ERRORES SISTEMATICOS EN LOS RESULTADOS ANALITICOS • Los errores sistemáticos pueden ser constantes o proporcionales. • En los errores constantes, el error absoluto es invariable con el tamaño de la muestra, mientras en el error relativo cambia al modificar el tamaño de la muestra. • Los errores proporcionales aumentan o disminuyen según el tamaño de la muestra; con estos errores el error absoluto varia con el tamaño de la muestra en cambio el error relativo permanece constante. Q.F. Carlos R. Gutiérrez Arce EVALUACION DE METODOS ANALITICOS • Ejemplo 2. • • • • • • La N de una solución se calculo con 4 titulaciones por separado y los resultados fueron 0.2041, 0.2049, 0.2039, y 0.2043. Calcular la X, la Mediana, El rango , La S. la desviación relativa y el C.V. X = (0.2041+0.2049+0.2039+0.2043)/4 = 0.2043 Mediana M= (0.2041+0.2043)/2 = 0.2042 Rango R = 0.2049-0.2039 = 0.001 La desviación relativa= Sumatoria de (Xi-X)/4=0.0003 S= 0.0004 C.V = (0.0004/0.2043)*100 = 0.2% Q.F. Carlos R. Gutiérrez Arce Q.F. Carlos R. Gutiérrez Arce PRESENTACION DE LOS DATOS CALCULADOS • Siempre es necesario indicar el nivel de confianza de los datos. • Es un rango de valores en los que con una probabilidad determinada está un valor verdadero poblacional. • Generalmente son del 95% o 99%. • La probabilidad de equivocarnos se llama nivel de significancia y se simboliza α Q.F. Carlos R. Gutiérrez Arce PRESENTACION DE LOS DATOS CALCULADOS • Un indicador de la calidad de los datos es la utilización de las cifras significativas. • Cifras significativas: Son todos los dígitos que se conocen con certeza y el primer digito incierto. Por ejemplo 30.24 tiene 4 cifras significativas (4, el ultimo digito, es incierto) Q.F. Carlos R. Gutiérrez Arce PRESENTACION DE LOS DATOS CALCULADOS • El cero puede ser significativo o no según su ubicación en el numero. Un cero rodeado por otros dígitos siempre es significativo. • Los ceros al final pueden o no ser significativos. 2.0 tiene dos cifras significativas. 2000 tiene una cifra significativa. 2x103 tiene una. Q.F. Carlos R. Gutiérrez Arce PRESENTACION DE LOS DATOS CALCULADOS • Para las sumas y las restas el resultado debe tener el mismo numero de decimales que el numero que tiene menos decimales. • Cuando se suman o restan números con notación científica se debe expresar el resultado en la misma potencia de 10. • En la multiplicación y la división se debe expresar el resultado con las cifras significativas del numero que tenga menor cifras significativas. Q.F. Carlos R. Gutiérrez Arce PRESENTACION DE LOS DATOS CALCULADOS • Redondeo de datos: • Se debe aproximar al numero mayor si el ultimo es mayor de 5 y al menor si el ultimo es menor de 5. • 61.555 se aproxima al numero par mas cercano . Queda 61.56 • De todas maneras el resultado debe expresarse con la desviación estándar calculada. Q.F. Carlos R. Gutiérrez Arce OBJETIVOS DEL MUESTREO • Estadísticamente los objetivos del proceso de muestreo son: • 1. Obtener el valor medio • 2. Obtener una varianza que sea una estimación de la varianza poblacional con limites de confianza validos para la media. Q.F. Carlos R. Gutiérrez Arce VALIDACION DE METODOS ANALITICOS Calidad de resultados • • • • • • • Selectividad Analito en medio de interferencias Limite de detección Promedio de bcos +3(desviación) Limite de cuantificación 5 ò 10 L.D. Intervalo de trabajo Rango en que el método es exacto y preciso. Rango lineal Exactitud. Valor de referencia Precisión Desviación y CV • Sensibilidad Pendiente • % Recuperación. Adición de cantidades conocidas • GRÁFICOS DE CONTROL. Q.F. Carlos R. Gutiérrez Arce VALIDACION DE METODOS ANALITICOS • • • • • • Curvas de calibración Linealidad Pendiente Sensibilidad Residuales Coeficiente de correlación Q.F. Carlos R. Gutiérrez Arce VALIDACION DE METODOS ANALITICOS • Curvas de calibración: Cuadrados • Modelo de regresión: Y=mx+b Mínimos • Cuanto mas cercanos están los datos a la línea que se obtiene del análisis por mínimos cuadrados, menores son los residuales Q.F. Carlos R. Gutiérrez Arce VALIDACION DE METODOS ANALITICOS • Variables transformadas. • Transformaciones para linearizar las funciones. Q.F. Carlos R. Gutiérrez Arce EJERCICIOS DE APLICACIÓN Q.F. Carlos R. Gutiérrez Arce