Download Estrategias Evolutivas para la Selección Automatizada de Polos
Document related concepts
Transcript
III Congreso Internacional sobre Métodos Numéricos en Ingeniería y Ciencias Aplicadas S. Gallegos, I. Herrera , S. Botello, F. Zárate, y G. Ayala (Editores) © ITESM, Monterrey 2004 CIMNE, Barcelona 2004 ESTRATEGIAS EVOLUTIVAS PARA LA SELECCIÓN AUTOMATIZADA DE POLOS PARA LA ESTABILIZACIÓN DE UN SISTEMA DINÁMICO A. María L. Rosas Cholula, B. Vittorio Zanella Palacios y C. Héctor S. Vargas Martínez. Universidad Popular Autónoma del Estado de Puebla 21 Sur 1103, Puebla, Pue., C.P. 72160, México. Email:mlrosasc@yahoo.com.mx, {vzanella,hsimon}@upaep.mx web page: http://www.upaep.mx Resumen. En el enfoque de ubicación de polos para el diseño de sistemas de control es necesario que el Ingeniero o experto que conoce el comportamiento del sistema defina ciertos parámetros de entrada denominados polos o raíces. Se propone entonces, un algoritmo que utiliza estrategias evolutivas para la automatización de la elección de dichos polos, con el fin de la estabilización de un robot móvil autónomo. Se realizó la comparación de los resultados obtenidos a partir de la definición de los polos por el experto con los resultados obtenidos a partir de la definición automatizada de los polos por medio de las estrategias evolutivas, y se observó que el uso de estrategias evolutivas es un método factible para la elección de polos. Palabras clave: Estrategias evolutivas, robot móvil autónomo, señal de control. 1 INTRODUCCIÓN El interés por la computación evolutiva surge a partir de la teoría de la evolución de Darwin1, lo que llamó la atención de numerosos científicos en la década de los cincuenta y sesenta. Dentro del campo de computación evolutiva se encuentran los algoritmos llamados estrategias evolutivas. En 1965, Rechenberg introdujo el concepto de estrategias evolutivas, como un método para optimizar funciones y el manejo de problemas continuos2,3,4. Por otro lado, el control ha tenido un papel muy importante en el avance de la ingeniería, ya que ha aportado gran parte de los medios para obtener un desempeño óptimo de los sistemas dinámicos, para obtener este desempeño óptimo es necesario realizar el diseño de sistemas de control que permitan satisfacer todas las especificaciones esperadas del sistema5. El presente trabajo se enfoca en la aplicación de estrategias evolutivas para la generación automatizada de los parámetros de entrada del método de ubicación de polos para la obtención de la estrategia de control del sistema dinámico. Dichos parámetros de entrada, a los que se les denomina polos o raíces, han sido definidos hasta ahora por el ingeniero o experto humano que conoce el comportamiento del sistema. Aquí, el sistema dinámico, al que se le aplicará la señal de control, describe el comportamiento de un robot móvil autónomo. A. MARÍA L. ROSAS CHOLULA, et al./Selección de parámetros de control para un robot móvil utilizando ES 2 ESTRATEGIA DE CONTROL PARA EL ROBOT MÓVIL AUTÓNOMO El robot móvil autónomo6 cuenta con tres llantas, dos activas y una pasiva, la configuración de la trayectoria sobre la pista se puede ver en la figura 1. Figura 1 – Configuración de la trayectoria sobre la pista del robot móvil autónomo y prototipo. Tiene 3 movimientos: sobre la línea recta horizontal, sobre la línea recta vertical y sobre la línea circular. El análisis del movimiento se considera únicamente para la línea recta horizontal, entonces, el sistema se obtiene – por las características del prototipo6 – como: (1) x& = Ax + Bu donde 0 .1 0 2 , B= A = 0 0 1 0 0 − 0.3922 0 0 0.1743 y x1 x = x 2 x3 (2) Debido a las restricciones mecánicas del robot, la respuesta de estado x2(t) – movimiento angular del robot – debe estar entre 0 y 0.93rads. Se puede determinar, mediante el teorema de Liapunov5, que el sistema no es asintóticamente estable, por lo cual se propone una estrategia de control, ya que el sistema es de estado completamente controlable. Entonces, en la siguiente sección se aplica la técnica de ubicación de polos para la obtención de la señal de control. 2.1 Técnica de ubicación de polos Con el fin de estabilizar el sistema, el experto humano selecciona polos o raíces del semiplano izquierdo del plano complejo, para forzar el comportamiento del sistema que sea asintóticamente estable, considerando la naturaleza del sistema dinámico. Dicho de otra forma, si elegimos la señal de control ( u = −Kx ) de tal forma que el nuevo sistema retroalimentado x& = ( A − BK) x sea asintóticamente estable, estaremos diciendo que las raíces se localizan en el semiplano izquierdo del plano complejo, y dichas raíces son las mismas que se dan por el experto humano. Entonces, el algoritmo5 de ubicación de polos o raíces es muy dependiente de esta elección. Los parámetros de entrada que se necesitan para la corrida del algoritmo son: los polos elegidos por el experto y el sistema dinámico, µ1 = −4 + j 2 5 , µ2 = −4 − j 2 5 , µ3 = −1 , x& = Ax+ Bu Los resultados que arroja son: la matriz de realimentación y la estrategia de control, K = [103 .2702 242 .1113 49.3850 ] u = −Kx = −[103.2702x1 242.1113x2 49.3850x3 ] (3) A. MARÍA L. ROSAS CHOLULA, et al./Selección de parámetros de control para un robot móvil utilizando ES 3 ESTRATEGIAS EVOLUTIVAS El objetivo del algoritmo es la generación automatizada de los parámetros de entrada del método de ubicación de polos para la obtención de la señal de control del sistema del robot móvil autónomo. El algoritmo con notación (1+1)-ES, está basado en estrategias evolutivas, donde la población inicial está formada por un solo individuo y se genera un solo individuo nuevo, entonces, la única operación evolutiva a aplicar a la población es la mutación. Antes de describir los pasos del algoritmo se definirá la población inicial, la operación de mutación, la función de aptitud y la operación de selección. Definición 1: Sea Φ el universo de polos o raíces negativas, es decir Φ = { x | x ⊆ 3, x < 0} Definición 2 [Población inicial]: Se eligen h∈X ⊂ Φ, donde h = (µ1, µ2, µ3) Definición 3 [Operación mutación] Sea h∈X ⊂ Φ, donde h = (µ1, µ2, µ3) , entonces se define la operación de mutación como sigue: para ∀µi , donde i =1,2,3 se realiza µi' = µi +ζi , tal que ζi = N(0,1) –distribución normal ' ' ' ' ' con media cero y desviación estándar 1 – y µi < 0 , entonces se define h' donde h = (µi , µ2, µ3) como el ' nuevo individuo, h = h +ζ es el resultado de aplicar la mutación al individuo original h. Definición 4 [Función de aptitud]: Sea f : X ⊂ Φ → Ψ ⊆ ℜ4, tal que f (h) = y , donde h = (µi , µ2, µ3) y y ∈Ψ donde y = (a,t0, mx, mn) , que se determinan como: sea x& = Ax+ Bu y u = − Kx , se obtiene la matriz de realimentación K (parámetro de entrada h), se define entonces x& = (A − BK)x . Si x(t)→ε, donde -0.001 ≤ ε ≤ t0 0.001 entonces,t0 = t, a = ∫ x(t)dt , mx = max[x2(t)], mn = min[x2(t)]; donde x2(t) ∈[0,0.93], –la integral de x(t) 0 es calculada para definir el grado de desviación del sistema –. Definición 5 [Operación selección] Sea f: X ⊂ Φ → Ψ ⊆ ℜ4, tal que f (h) = y y f (h' ) = f ( y' ) se define la operación de selección como: Si mx’ ≤ 0.9273 y mn’ ≥ 0 y t0’ < t0 y a’ < a, entonces, se selecciona h’, en caso contrario, se selecciona h. Los pasos del algoritmo son: 1. Inicio. 2. h ← (µ1, µ2 , µ3 ) 3 Hacer h’←Mutación ( h ) h ← Selección(h,h’) Hasta (La función de aptitud no cambie) 4. Fin 3.1 Resultados Se nota que en los pasos del algoritmo, que utiliza estrategias evolutivas, se incluyó la técnica de ubicación de polos como parte de la operación de aptitud, por lo cual, los resultados arrojados son los siguientes: Polo o raíz, generado por el algoritmo, que da la mejor estabilización del sistema: µ1 = −2.8714 + j 0.5044 , µ2 = −2.8714 − j 0.5044 y µ3 = −2.2053 . Con lo cual se obtuvo la matriz de realimentación K y la señal de control u, K = [53 .7683 116 .0457 u = − Kx = −[53 .7683 x1 116 .0457 x2 43 .3500 ] 43 .3500 x3 ] (4) A. MARÍA L. ROSAS CHOLULA, et al./Selección de parámetros de control para un robot móvil utilizando ES 4 COMPARACIONES Y SIMULACIÓN GRÁFICA La Tabla 1 muestra los valores arrojados al aplicar al sistema la señal de control definida a partir del algoritmo que utiliza estrategias evolutivas (4) y la propuesta del experto (3), cuando se alcanza la estabilización del sistema con un error de |ε| ≤ 0.001. Solución. Estrategias Evolutivas Propuesta del experto humano Area en [0,Tiempo] (unidades) 10.2786 24.5000 Tiempo. (s) 4.5340 7 Tabla 1. Valores arrojados al aplicar la señal de control definida en (3) y (4) A continuación, mediante la simulación gráfica (figura 2) se compara el comportamiento del sistema a la aplicación de la señal de control obtenida de la propuesta del experto (3) con el comportamiento del sistema a la aplicación de la señal de control definida con el algoritmo que utiliza estrategias evolutivas (4). 5 CONCLUSIONES Dado el sistema dinámico que define el comportamiento de un robot móvil se realizó el análisis de estabilidad, controlabilidad y se obtuvo la estrategia de control utilizando la elección de parámetros por el Ingeniero o experto humano. Cabe mencionar que esta elección del experto humano no sigue ningún patrón establecido o ningún procedimiento conocido para dicha elección, solamente lo realiza en base a su experiencia y en la confianza de su propia intuición. Por lo cual, se realizó una investigación acerca de estrategias evolutivas y se realizó un nuevo algoritmo basado en estos principios evolutivos para la elección automatizada de parámetros necesarios para la obtención de la estrategia de control. De acuerdo a los resultados obtenidos se observó que se obtienen mejores resultados al aplicar el algoritmo basado en estrategias evolutivas que los generados con la intervención del experto. Esto es, de alguna manera, el algoritmo logró automatizar la intuición del ingeniero por encontrar el mejor parámetro – polos o raíces – para la mejor estabilización del sistema dinámico. El trabajo futuro será la implementación del algoritmo en el robot móvil autónomo “Nanisha”, del proyecto de Robótica móvil que se realiza en el Departamento de Ingeniería en Computación de la Universidad Popular Autónoma del Estado de Puebla. A. MARÍA L. ROSAS CHOLULA, et al./Selección de parámetros de control para un robot móvil utilizando ES Figura 2 – x1(t) representa la coordenada de la velocidad angular, x2(t) representa la coordenada de la posición angular, x3(t) representa la coordenada de la posición. A. MARÍA L. ROSAS CHOLULA, et al./Selección de parámetros de control para un robot móvil utilizando ES 6. REFERENCIAS [1] Kuri, Angel y José Galaviz, Algoritmos Genéticos, UNAM-IPN-FCE. [2] Rechenberg, I., Evolutionsstrategie: Optimierung technischer Systeme nach Prinzipien der biologischen Evolution, Frommann-Holzboog Verlag, Stuttgart, 1973. [3] Thomas Bäck, Frank Hoffmeister, Hans-Paul Schwefel, A Survey of Evolution Strategies, Proceedings of the Fourth International Conference on Genetic Algorithms, 1991. [4] David Greenhalgh, Stephen Marshall,Evolutionary Programming and Evolution Strategies, Proceedings of the Second Annual Conference on Evolutionary Programming, San Diego C.A. 1993. [5] Katsuhiko Ogata., Ingeniería de Control Moderna, Tercera Edición, Prentice Hall, 1998. [6] Vargas Martínez H.S., Algoritmo de estabilización óptimo para el control del robot móvil autónomo, Tesis Doctoral, Facultad de Ciencias Físico Matemáticas BUAP, Septiembre 2002.