Download aplicación de redes neuronales artificiales (rna) en la predicción y
Document related concepts
Transcript
VIII CAIQ2015 y 3 JASP APLICACIÓN DE REDES NEURONALES ARTIFICIALES (RNA) EN LA PREDICCIÓN Y MODELADO DE LA CINÉTICA DE EXTRACCIÓN DE ACEITE DE CANOLA R. J. Sánchez*1, M. B. Fernández1,2, S. M. Nolasco1. 1 Grupo TECSE – Facultad Ingeniería (Universidad Nacional del Centro de la Provincia de Buenos Aries) Av. Del Valle 5737 – Olavarría – Argentina 2 CIFICEN (Universidad Nacional del Centro de la Provincia de Buenos Aries - CONICET) Pinto 399 – Tandil – Argentina *E-mail: (ramiro.sanchez@fio.unicen.edu.ar) Resumen. En este trabajo, se utilizó una Red Neuronal Artificial (RNA) feedforward con una capa oculta y algoritmos de entrenamiento backpropagation (BP) y de ajuste de pesos Levenberg-Marquartd (LM) para la predicción de la cinética de extracción con hexano de aceite de canola. Para el entrenamiento y validación, se emplearon los datos de tiempo de extracción (5 - 1080 minutos) y temperatura de proceso (25, 40 y 60 °C) como datos de entrada y los valores de rendimiento en base seca (% b.s.) como datos de salida, los cuales se obtuvieron en un sistema de extracción batch agitado. Se estudiaron distintas arquitecturas variando el número de neuronas en la capa oculta, encontrando que la RNA con 4 neuronas brindaba el mejor ajuste de los datos experimentales. Se evaluó la efectividad de la red mediante la predicción de los rendimientos a 50°C; los cuales se contrastaron con datos experimentales. A su vez, se realizó un ajuste de estos datos con un modelo de Difusión Modificado. Con respecto a los datos experimentales, se evaluó el error cuadrado medio porcentual (ECM%) y el R2, encontrándose para la RNA valores de ECM%=2,29 y R2=0,99; mientras que el ajuste con el modelo matemático arrojó AAIQ Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP ECM%=2,24 y R2=0,99. Estos resultados muestran la eficacia y potencialidad del uso de las redes neuronales para el modelado y predicción de la cinética de extracción con solvente de aceite de canola dentro del dominio de los datos de entrenamiento. Palabras clave: REDES NEURONALES ARTIFICIALES, EXTRACCIÓN DE ACEITE, CANOLA. AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP 1. Introducción La canola es una oleaginosa con alto contenido de aceite, cuya composición de ácidos grasos y elevado contenido de compuestos bioactivos lo convierte en un aceite único para el consumo humano (Shahidi, 1990; Thiyam-Holländer y col., 2012). Industrialmente la extracción de aceite es llevada a cabo por prensado y/o extracción por solvente; siendo el hexano el solvente utilizado convencionalmente. El manejo de este tipo de solventes presenta ciertas dificultades, dada su inflamabilidad y efectos al ambiente y la salud; por lo que adquiere relevancia el desarrollo de herramientas que permitan reducir la incertidumbre sobre las variables del proceso de extracción. Las redes neuronales artificiales (RNA) son técnicas de modelado con elevada potencia inspiradas en la forma en la que las neuronas biológicas desarrollan las funciones de aprendizaje y memoria. Las RNA presentan varias ventajas sobre las técnicas de modelado convencionales ya que son capaces de modelar sin necesidad de suposiciones sobre la naturaleza de los mecanismos fenomenológicos, comprender la base matemática del problema que subyace en el proceso y ser capaces de aprender relaciones lineales y no lineales entre las variables a partir de un conjunto de ejemplos (Fathi y col., 2009). Las unidades fundamentales de las RNA son las neuronas (análogas a las neuronas biológicas) y los pesos, conexiones ponderadas comparables a las sinapsis en un sistema biológico. A partir de cálculos simultáneos en paralelo de sus elementos, una RNA es capaz de aprender a partir de ejemplos y generalizar permitiendo abordar distintos problemas; aún cuando los datos sean incompletos o contengan errores (Rafiq y col. 2001). Se han realizado estudios utilizando RNA como una herramienta de modelado útil para predecir la cinética de extracción de aceite esencial de anís, encontrando que el modelo desarrollado resulto más preciso en comparación con un modelo matemático de difusión (Shokri y col., 2011). El objetivo de este trabajo fue desarrollar una estructura de RNA que permita modelar y predecir con éxito la cinética de extracción con solvente de aceite de canola. AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP 2. Materiales y métodos 2.1. Materia Prima y acondicionamiento de las muestras Se contó con una partida de 10 kg de granos de canola suministrados por AL HIGH TECH S.R.L. (Argentina) los cuales se caracterizaron en función del contenido de aceite (IUPAC 1.122 1992) y humedad (ASAE S352.2 DEC 97, 1999). Previo a la extracción, los granos se molieron en un molino de cuchillas y se seleccionó un rango de partículas de 0,420-1,000 mm, acorde a la bibliografía (Pérez y col., 2011; Fernández y col., 2012; Zárate et al., 2015) utilizando un tamiz vibratorio (ZONYTEST, EJR 2000, Industria Argentina). 2.2. Ensayos cinéticos Los ensayos se llevaron a cabo por duplicado, a diferentes tiempos: 5, 15, 30, 60, 120, 240 y 1080 minutos, considerándose este último como tiempo infinito, a temperaturas constantes de 25, 40, 50 y 60°C. El proceso de extracción se realizó en un sistema batch agitado (agitador magnético) con un baño termostáticamente controlado. Se utilizó una relación 17 mL de solvente/g de harina, previamente al contacto se llevó a temperatura de extracción durante 5 minutos. Se mantuvo la temperatura y agitación constantes en todos los ensayos, para asegurar un buen contacto entre el solvente y la muestra. Transcurrido cada tiempo preestablecido, se centrifugó el contenido en un equipo Thermo SCIENTIFIC, SORVALL LEGEND X1 durante 5 minutos a 14069 G. Posteriormente se filtró el contenido, la micela se recogió en un balón y el solvente se evaporo en un evaporador rotatorio R-3000 Büchi (Suiza). Para eliminar el resto de hexano, los balones se colocaron en estufa de aire forzado (Drying oven DHG-9123) a 105ºC por una hora. La cantidad de aceite obtenido se determinó gravimétricamente. 2.3. Red Neuronal Artificial (RNA) Se utilizó una red perceptrón feedforward multicapa (MLP, por sus siglas en inglés) totalmente interconectada para la predicción de la cinética de extracción con hexano de aceite de canola a una temperatura constante. La estructura perceptrón multicapa es una de las más comunes (Rafiq y col. 2001; Fathi y col., 2009; Shokri y col., 2011 Ramzi y col., 2015), consta de una o más entradas que representan las variables independientes, AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP una capa de salida con neuronas que representan la variables dependientes y una o más capas ocultas (Hagan y col., 1996) que contiene neuronas para ayudar a capturar la no linealidad en el sistema. La complejidad de la red depende del número de capas y el número de neuronas en cada capa. La capa oculta correlaciona las entradas x con las salidas y, a través de una serie de pesos w interconectados matemáticamente (Shokri y col., 2011): n y i f wij xi bi j 1 (1) Donde wij es el peso de la i-ésimo vector de entrada que es conectado a la j-ésima neurona; n es el número de entradas a la neurona; bi es el umbral asociado con la neurona j-ésimo, que añade una variable extra, lo que puede mejorar la potencia con respecto a una red sin umbrales (Hagan y col., 1996) y f es la función de activación que le confiere el comportamiento no lineal a la neurona. La función de activación puede ser lineal o no lineal (tangente hiperbólica o comúnmente función sigmoide) dependiendo de la topología de la red. En este trabajo, se utilizaron las variables tiempo y temperatura como datos de entrada (x) y el rendimiento de aceite se consideró como dato de salida (y). Con el fin de asegurar un modelado exitoso, se deben considerar dos factores importantes. En primer lugar, el número de capas y en segundo lugar el número de neuronas en cada capa oculta. Puesto que muchos problemas prácticos de modelado con redes neuronales podría resolverse con una capa oculta (Rafiq y col. 2001), se utilizó una RNA con dos capas (una capa oculta y una capa de salida), tomando como función de activación tangente hiperbólica para la capa oculta, y una función lineal para la capa de salida. Por otro lado, para encontrar la mejor arquitectura, se construyeron redes con distintos números de neuronas en la capa oculta, variando de 2 a 11. Se utilizó un algoritmo de retropropagación (Backpropagation, BP) como algoritmo de entrenamiento supervisado, ya que proporciona un ajuste rápido y es fácilmente aplicable (Shokri y col., 2011). BP se centra en la búsqueda de una superficie de error (error como una función de los pesos de la red). Para el ajuste de los pesos se empleó el algoritmo Levenberg-Marquardt, el cual permite una convergencia más rápida que los métodos de gradiente descendente (Hagan y col., 1996). AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP Para el entrenamiento y validación se tomaron los rendimientos promedios correspondientes a las temperaturas 25, 40 y 60 °C para todos los tiempos ensayados (21 datos en total), los cuales fueron divididos en dos grupos. El primer grupo (datos de entrenamiento, 70% de los datos) se seleccionó de manera tal que se abarquen los datos que establece el método modificado de Jenkins’, que consiste en un “hipercubo” con datos en el centro que abarca los rango superiores e inferiores de las variables independientes; el cual se considera adecuado para modelar y predecir problemas no lineales (Rafiq y col., 2001), los datos restantes necesarios para completar el grupo de entrenamiento fueron seleccionados aleatoriamente. El segundo grupo (validación) se utilizó para evaluar la calidad de predicción de la red durante el entrenamiento (30% de los datos). El entrenamiento se realizó hasta un máximo de 50 épocas o hasta que el error de los datos de validación llegó a un mínimo, de esta forma se evitó un sobre entrenamiento de la red (Hagan y col., 1996). Finalmente, para estimar el rendimiento de predicción de la red entrenada, se utilizó un tercer grupo de datos (prueba) que no fueron utilizados durante el entrenamiento y validación (rendimientos obtenidos a 50°C) para contrastar con los valores predichos. La evaluación de la eficiencia de la red entrenada se basa en la precisión de la red para predecir las salidas correspondientes al grupo de prueba; para lo cual se utilizaron el error cuadrado medio porcentual (EMC%) y el coeficiente de determinación cuadrático (R2) calculados mediante el uso de las Ecuaciones 2 y 3 (Fathi y col., 2009). m 2 N EMC % 100 i 1 m i 1 m (2) exp i mipred exp i m 2 2 N i 1 m pred i N N R2 1 exp i p exp (3) Donde miexp representa el valor de la respuesta experimental para el i-ésimo dato, mipred representa el valor predicho para el i-ésimo dato, m p exp el valor de la respuesta promedio y N el número total de datos. A su vez estos parámetros se utilizaron para comparar el rendimiento de diferentes arquitecturas de RNA. Para el procesamiento de AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP los datos y el diseño y entrenamiento de la RNA se utilizó el software MATLAB (2013). 2.4. Pre procesamiento de los datos Es posible lograr mayor eficiencia en el entrenamiento de la red neuronal pre procesando los datos de entrada y salida antes de ingresarlos a la red. Dado que la forma en que los datos son presentados afecta el aprendizaje de la red, se recomienda normalizar los datos de entrada y de salida antes de presentarlos a la red (Rafiq y col. 2001). Los datos de entrada normalizados fueron, con valor central en cero y desviación estándar unitaria. Por otro lado, los datos de salida (rendimiento de aceite, %b.s.) fueron expresados relativos al valor obtenido a tiempo infinito para cada temperatura constante estudiada (25, 40, 50 y 60°C) obteniendo un valor máximo de 1 para cada temperatura, posibilitando el ajuste de las respuestas con el modelo matemático de difusión modificado detallado en la sección 2.5. 2.5. Modelo matemático Para modelar la cinética de extracción de aceite para los datos de la tercera partición (50°C constante) se utilizó un modelo difusivo modificado de la ley de Fick, considerando estado no estacionario y partículas de geometría esférica, suspendidas en un medio de concentración constante, en su forma simplificada, adecuada considerando largos períodos de tiempo de extracción (Fernández y col., 2012; Zárate y col., 2015). Mt 1 Ae bt M (4) Donde t es el tiempo de difusión; Mt y M∞ la masa de aceite que difunde en el tiempo t y tiempo infinito, respectivamente. A y B son los coeficientes del modelo. Se utilizó el software SigmaPlot (2011) para el ajuste y construcción de gráficos. AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP 3. Resultados 3.1. Caracterización de la muestra Los granos presentaron un contenido de aceite total de 46,34±0,31 % b.s., encontrándose dentro del rango reportado en la literatura (33-55%, Windauer y Ploschuk, 2006) y un contenido de humedad de 5,71±0,02 % b.s. 3.2. Rendimientos de extracción de aceite En la Tabla 1 se informan los rendimientos de extracción de aceite en base seca obtenidos para todos los tiempos y temperaturas ensayados. Tabla 1. Rendimientos de extracción de aceite en base seca (% b.s.), promedios y desviaciones estándar. Tiempo (min) Temperatura (°C) 25 40 50 60 5 14,49 ± 0,06 14,73 ± 0,33 15,77 ± 0,14 16,20 ± 0,01 15 15,90 ± 0,11 17,52 ± 0,13 18,54 ± 0,29 19,52 ± 0,14 30 17,87 ± 0,04 20,19 ± 0,84 20,57 ± 0,04 21,71 ± 0,38 60 20,79 ± 0,81 23,89 ± 0,74 25,35 ± 1,00 27,40 ± 0,69 120 24,02 ± 0,24 29,85 ± 0,44 28,33 ± 0,01 32,52 ± 0,01 240 29,03 ± 0,71 33,99 ± 0,19 37,85 ± 0,77 39,15 ± 0,50 1080 39,80 ± 1,46 40,89 ± 0,80 40,72 ± 0,14 41,44 ± 0,72 3.3. Optimización de la RNA La cantidad óptima de neuronas en la capa oculta se determinó mediante un proceso de prueba y error (Fathi y col., 2009; Ramzi y col., 2014), minimizando la diferencia entre los valores experimentales y los predichos por la red para el grupo de prueba. En la Tabla 2 se muestran los ECM% y R2 de las predicciones con respecto a los datos experimentales para RNA con distintos números de neuronas en la capa oculta. AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP Tabla 2. Eficiencia en la predicción de rendimientos con diferentes números de neuronas en la capa oculta. N° de neuronas R2 EMC (%) 2 0,96 4,12 3 0,99 2,33 4 0,99 2,29 5 0,98 3,18 6 0,92 6,12 7 0,94 5,56 8 0,94 5,56 9 0,27 24,47 10 0,05 22,35 11 0,08 22,61 Se encontró que la RNA con 4 neuronas en la capa oculta proporcionó la mejor predicción, la Figura 1 representa un diagrama esquemático de la estructura de la red adoptada. A su vez, en la Tabla 3 se informan los pesos (w) y umbrales (b) correspondientes a cada neurona. Tabla 3. Parámetros de la RNA óptima Capa oculta Capa de salida w b -1,2079 Neurona Tiempo Temperatura b Neurona w 1 2,3488 1,1317 -3,0160 1 0,1110 2 -2,3940 1,1601 1,1925 2 -0,1844 3 -2,8431 1,5568 -0,3058 3 0,2005 4 -2,5644 -0,0309 -2,7569 4 -2,3290 AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP Capa oculta Ca Capa de salida Ca Entrada Salida Figura 1. Diagrama esquemático del modelo óptimo de RNA feedforward multicapa encontrado. 3.4. Comparación de datos predichos, ajustados y experimentales La Figura 2 muestra los datos de rendimientos de extracción de aceite relativo (Mt/M∞) en función del tiempo obtenidos experimentalmente, la curva de ajuste del modelo matemático y los valores predichos por la RNA para una temperatura constante de 50 °C. El modelo matemático de ajuste de los datos experimentales hallado fue: Mt 1 0,6232e 0, 0075t M con R2 = 0,99 y ECM% = 2,24. Figura 2. Rendimientos relativos a tiempo infinito (Mt/M∞). Valores experimentales, predichos por la RNA y curva de ajuste con el modelo matemático. AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP Con respecto a los datos experimentales, tanto para los datos predichos como para los ajustados el R2 resultó equivalente, siendo el EMC% levemente menor en el caso del modelo de ajuste matemático (2,24) respecto al predicho por RNA (2,29). Cabe destacar que los datos predichos por la RNA presentan una elevada correspondencia con la curva de ajuste proporcionada por el modelo matemático, mostrando la capacidad de la red para captar las interacciones no lineales del fenómeno independientemente del ruido asociado a los datos experimentales, siendo ésta una característica observada por otros autores (Parlos y col., 1994). 4. Conclusiones El modelo de RNA con 4 neuronas en la capa oculta fue adecuado para la predicción de rendimientos de extracción de aceite de canola a 50 °C; este modelo mostró mayor exactitud que las otras arquitecturas estudiadas (número de neuronas de 2 a 11) Los valores de coeficiente de correlación y error cuadrado medio porcentual (R2 = 0,99 y EMC% = 2,29) muestran la alta correspondencia entre los datos predichos y experimentales; resultando un modelo adecuado para predecir rendimientos de extracción de aceite en el sistema estudiado. A su vez, se pudo observar la capacidad de la red para captar la relación existente entre las variables, demostrando la potencialidad del uso de esta herramienta de inteligencia artificial para el modelado y la predicción de procesos complejos que dependen de múltiples variables a partir de un conjunto de datos experimentales, así como su capacidad de captar el comportamiento del fenómeno aún procesando datos con ruido. Reconocimientos Los autores agradecen el financiamiento a la Facultad de Ingeniería (Universidad Nacional del Centro de la Provincia de Buenos Aires), a CONICET y a la ANPCyT (Agencia Nacional de Promoción Científica y Tecnológica). También agradecen en forma especial AL HIGH TECH S.R.L. (Argentina) por donar la canola utilizada durante este trabajo. Referencias ASAE. (1999). Standard Engineering Practices data, 46 th edn. American Society of Agricultural Engineers. St. Joseph, USA AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ VIII CAIQ 2015 y 3das JASP Fathi, M., Mohebbi, M., Razavi, S. M. A. (2011). Application of image analysis and artificial neural network to predict mass transfer kinetics and color changes of osmotically dehydrated kiwifruit. Food and Bioprocess Technology,4(8), 1357-1366.Fernández, M. B., Perez, E. E., Crapiste, G. H., Nolasco, S. M. (2012). Kinetic study of canola oil and tocopherol extraction: parameter comparison of nonlinear models. Journal of Food Engineering, 111(4), 682-689. Hagan, M. T., Demuth, H. B., Beale, M. H. Neural network design, 1996.PWS Pub, Boston, London. IUPAC. (1992). Standard Methods for the Analysis of Oils, Fats and Derivatives, 7th edn. C. Paquot and A. Hautfenne, International Union of Pure and Applied Chemistry, Blackwell Scientific. Oxford. Parlos, A. G., Chong, K. T., Atiya, A. F. (1994). Application of the recurrent multilayer perceptron in modeling complex process dynamics. Neural Networks, IEEE Transactions on, 5(2), 255-266. Perez, E. E., Carelli, A. A., Crapiste, G. H. (2011). Temperature-dependent diffusion coefficient of oil from different sunflower seeds during extraction with hexane. Journal of Food Engineering, 105(1), 180-185. Rafiq, M. Y., Bugmann, G., Easterbrook, D. J. (2001). Neural network design for engineering applications. Computers & Structures, 79(17), 1541-1552. Ramzi, M., Kashaninejad, M., Salehi, F., Mahoonak, A. R. S., Razavi, S. M. A. (2015). Modeling of rheological behavior of honey using genetic algorithm–artificial neural network and adaptive neuro-fuzzy inference system. Food Bioscience, 9, 60-67. Shahidi, F. (1990). Canola and rapeseed: production, chemistry, nutrition, and processing technology. Springer Science & Business Media. Shokri, A., Hatami, T., Khamforoush, M. (2011). Near critical carbon dioxide extraction of Anise (Pimpinella Anisum L.) seed: Mathematical and artificial neural network modeling. The Journal of Supercritical Fluids, 58(1), 49-57. Thiyam-Holländer, U., Eskin, N. M., Matthäus, B. (Eds.). (2012). Canola and Rapeseed: Production, Processing, Food Quality, and Nutrition. CRC Press. Windauer L.B., Ploschuk E.L. (2006). Cultivos productores de aceites. En de la Fuente E.B., Gil A., Gimenez P.I., Kantolic A.G., López Pereira M., Ploschuk E.L., Sorlino D.M., Vilariño P., Wassner D.F., Windauer L.B. (Eds). Cultivos Industriales. Editorial Facultad de Agronomía (UBA). Buenos Aires, Argentina. 65. Zárate, V., Perez, E. E., Crapiste, G. H., Nolasco, S. M., Fernández, M. B. (2015). Oil extraction kinetics of hydrothermally pretreated canola seeds. The Canadian Journal of Chemical Engineering, 93(5), 842-848. AAIQ, Asociación Argentina de Ingenieros Químicos - CSPQ