Download redes neuronales biológicas - Escuela Cristiana Evangélica
Document related concepts
Transcript
REDES NEURONALES ARTIFICIALES INDICE Parte I.......................................................................................................................................3 Agradecimientos......................................................................................................................4 Problema e hipótesis..............................................................................................................5 Introducción.............................................................................................................................6 Capítulo I: Redes Neuronales Biológicas...........................................................................7 Sistema nervioso............................................................................................................8 La neurona.......................................................................................................................9 Comunicación en el sistema nervioso.......................................................................10 Redes de neuronas.......................................................................................................17 Capítulo II: Redes Neuronales Artificiales....................................................................18 ¿Qué es una red neuronal? .......................................................................................19 Redes neuronales artificiales...................................................................................20 Características de redes neuronales artificiales................................................21 Funcionamiento de redes neuronales artificiales................................................23 Funciones de base y activación................................................................................24 Taxonomía de las redes neuronales artificiales..................................................25 Estructura de las redes neuronales artificiales.................................................26 Capítulo III: Modelos: Supervisado y No Supervisado...............................................28 Clasificación y aprendizaje de las redes neuronales artificiales....................29 Redes neuronales artificiales no supervisadas....................................................30 Redes neuronales artificiales supervisadas..........................................................33 Algoritmo de Kohonen................................................................................................36 Conclusión...............................................................................................................................41 Bibliografía.............................................................................................................................42 Nancy N. Sepúlveda 1 REDES NEURONALES ARTIFICIALES Parte II...................................................................................................................................43 Metodología............................................................................................................................44 Enfoque de la investigación. .....................................................................................45 Métodos de contacto..................................................................................................45 Instrumento de investigación...................................................................................45 Plan de muestreo..........................................................................................................45 Problemas metodológicos...........................................................................................46 Consideraciones generales........................................................................................46 Análisis de datos...................................................................................................................47 Profesionales en Ciencias Naturales.......................................................................48 Profesionales en Informática...................................................................................58 Conclusiones finales.............................................................................................................68 Anexo.......................................................................................................................................70 Modelo de la entrevista..............................................................................................71 Datos personales de profesionales en Ciencias Naturales................................72 Datos personales de profesionales en Informática............................................73 Bibliografía.............................................................................................................................74 Nancy N. Sepúlveda 2 REDES NEURONALES ARTIFICIALES PARTE I Materia: Seminario I Profesora: Araceli Novo Nancy N. Sepúlveda 3 REDES NEURONALES ARTIFICIALES AGRADECIMIENTOS La elaboración de este trabajo de investigación fue posible gracias a la guía brindada por mi tutor, licenciado Daniel Palazzo. También hacer un reconocimiento al ingeniero Leonardo Davico que fue la persona que me orientó en la elección del tema a desarrollar en dicha tesina. Quisiera hacer mención muy especial de la profesora Araceli Novo, quien asesoró y estimuló para que este trabajo pueda concretarse. Y agradecer a todas aquellas personas que de una u otra manera me estuvieron apoyando para que este trabajo pueda realizarse. Nancy N. Sepúlveda 4 REDES NEURONALES ARTIFICIALES PROBLEMA ¿Los sistemas de información informáticos tienen relación con los del sistema nervioso humano? HIPÓTESIS Un sistema de información informático tendría relación directa con el funcionamiento del sistema nervioso humano. Nancy N. Sepúlveda 5 REDES NEURONALES ARTIFICIALES INTRODUCCIÓN Este trabajo de investigación abordará la relación directa que tendría un sistema de información informático con el funcionamiento del sistema nervioso. En el primer capítulo se desarrollarán algunos aspectos importantes del sistema nervioso humano que servirán luego para establecer la relación que nos interesa. En le segundo capítulo se expondrá sobre los sistemas informáticos, específicamente sobre las redes neuronales artificiales. En le tercer capítulo se presentará los dos tipos de redes neuronales artificiales que encontramos en nuestra área de estudio. De ésta manera, ya expuestas estas dos ramas que nos incumben, podremos establecer la relación que podría existir entre ambas. Al finalizar este trabajo de investigación se concluirá con la fundamentación si la hipótesis planteada se corrobora o refuta. Nancy N. Sepúlveda 6 REDES NEURONALES ARTIFICIALES CAPÍTULO I REDES NEURONALES BIOLÓGICAS Nancy N. Sepúlveda 7 REDES NEURONALES ARTIFICIALES REDES NEURONALES BIOLÓGICAS SISTEMA NERVIOSO El sistema nervioso es el rector y coordinador de todas las funciones, conscientes e inconscientes del organismo, consta del sistema cerebroespinal (encéfalo y medula espinal), los nervios y el sistema vegetativo o autónomo. A menudo, se compara el sistema nervioso con una computadora, porque las unidades periféricas (órganos internos u órganos de los sentidos) aportan gran cantidad de información a través de los cables de transmisión (nervios) para que la unidad de procesamiento central (cerebro), provista de su banco de datos (memoria), la ordene, la analice, muestre y ejecute. El sistema nervioso permite la relación entre nuestro cuerpo y el exterior, además de regular y dirigir el funcionamiento de todos los órganos del cuerpo. Este sistema ejecuta tres acciones esenciales, que son la detección de estímulos, la transmisión de informaciones y la coordinación general. La unidad básica del sistema nervioso humano es la neurona, y se la analizará a continuación. Nancy N. Sepúlveda 8 REDES NEURONALES ARTIFICIALES LA NEURONA Células del sistema nervioso Todo el sistema nervioso humano está compuesto en su totalidad por células nerviosas llamadas “neuronas”. La neurona es la célula o unidad estructural y funcional del tejido nervioso, cuyas propiedades de excitabilidad y conducción son las bases de las funciones del sistema nervioso. La parte central de la célula es llamada cuerpo de la célula o "soma", de la que se proyectan numerosas extensiones en forma de raíz, las "dendritas". La neurona también está formada por una simple fibra tubular, el "axón", el cual se divide en numerosas ramificaciones. Del cuerpo neuronal emergen prolongaciones. Una de ellas son las dendritas, que forman una estructura de filamentos muy fina que rodean el cuerpo de la neurona y cuya función es conducir impulsos hacia el cuerpo celular (aferentes). La otra, es el axón, que es un tubo largo y delgado que se ramifica en su extremo en pequeños bulbos finales que casi tocan las dendritas de las células vecinas. La pequeña separación entre los bulbos finales y las dendritas se le denomina sinapsis. Su función es la conducción de impulsos desde el cuerpo neuronal Nancy N. Sepúlveda 9 REDES NEURONALES ARTIFICIALES (eferentes), es una sola prolongación larga de calibre uniforme en toda su longitud y se ramifica solo en la proximidad de su terminación. En forma esquemática, se puede decir que las dendritas actúan como antenas que reciben los contactos de otras células. En el soma se lleva a cabo la integración de toda la información obtenida en las dendritas. Finalmente el axón transmite a otras células el mensaje resultante de la integración. Existen básicamente dos tipos de neuronas: la neurona sensitiva o aferente, que es la que conduce los impulsos sólo hacia el cerebro o la médula. La neurona motora o eferente, es la que conduce los impulsos en sentido opuesto; esto es, del cerebro o la médula espinal hacia los músculos o glándulas. Pero existe un tercer tipo de neuronas, las que reciben la información desde los músculos o de los órganos sensoriales, las cuales son llamadas neuronas receptoras. Organización funcional de la neurona Las neuronas se organizan en redes y sistemas. Las neuronas, al igual que las demás células del cuerpo, funcionan a través de impulsos eléctricos y reacciones químicas. Los impulsos eléctricos que utiliza una neurona para intercambiar información con las demás, viajan por el axón que hace contacto con las dendritas de la neurona vecina mediante las sinapsis. La intensidad de la corriente transmitida depende de la eficiencia de la transmisión sináptica. Una neurona en especial transmitirá un impulso eléctrico por su axón si suficientes señales de las neuronas vecinas transmiten a través de sus dendritas en un tiempo corto. El propósito de las dendritas es de servir como elementos receptores para las señales provenientes de neuronas adyacentes. Las dendritas y el soma reciben mensajes de otras células. La información es procesada y el mensaje resultante, si lo hay, pasa a lo largo del axón a otro conjunto de neuronas, por lo que el propósito del axón es la transmisión de la Nancy N. Sepúlveda 10 REDES NEURONALES ARTIFICIALES actividad neuronal generada a otra célula nerviosa o fibra muscular. Para el caso de las células nerviosas se utiliza el término interneuronal, mientras que para las fibras musculares se emplea el nombre de neurona motora. Las neuronas tienen unas proyecciones especializadas llamadas dendritas, por un lado, y por el otro, axones. Las dendritas traen la información al cuerpo de la célula, mientras que el axón toma la información del cuerpo de la célula. En cuanto a la conexión y transmisión de impulsos, las neuronas se comunican unas a otras a través de un proceso electroquímico, forman unas conexiones especializadas llamadas "sinapsis" y producen ciertos compuestos químicos especiales llamados "neurotransmisores" que son descargados a través de la sinapsis. La información generada en un receptor sensorial, viaja por axones sensoriales hasta los centros nerviosos, a los cuales accede a través de la médula espinal. En este recorrido la vía para cada sistema sensorial es específica, cruzada y pasa por diferentes neuronas (relevos) ascendiendo hasta alcanzar centros nerviosos, también específicos. Si estos se ubican en la corteza cerebral, la información genera el proceso de percepción. Figura sinapsis. 1 1 http://www.gc.ssr.upm.es/inves/neural/ann2/images/bioneur2.gif Nancy N. Sepúlveda 11 REDES NEURONALES ARTIFICIALES COMUNICACIÓN EN EL SISTEMA NERVIOSO Al sitio de comunicación entre dos neuronas se le conoce como sinapsis. No se trata de un contacto directo, puesto que existe una separación infinitesimal entre las dos células, sino del punto en el que las dos células muestran áreas especializadas donde ocurre la transferencia de información entre dos células nerviosas. El contacto entre ellas se realiza a través de contactos funcionales altamente especializados denominados sinapsis. La mayor de parte de las sinapsis son de tipo químico, es decir, utilizan moléculas llamadas neurotransmisores para comunicarse entre sí. Existen varios tipos de sinapsis: por una parte las llamadas químicas, que son las que operan entre neuronas; y por otro lado las sinapsis eléctricas. En estas sinapsis, el impulso nervioso pasa de una célula a otra manteniendo su forma eléctrica, sin pasar por una transformación de fuerzas químicas. En este último caso, se habla de transmisión neurohumoral, en la que los impulsos nerviosos provocan respuestas por medio de la liberación de neurotransmisores químicos específicos. Anatómicamente, podemos referirnos a sinapsis axodendríticas, aquellas en las que el impulso nervioso parte del cuerpo celular y viaja hacia la periferia, para establecer comunicación al nivel de las dendritas. La sinapsis eléctrica es muy rápida, porque la corriente puede fluir en ambos sentidos y practicamente no hay retardo sináptico. En ella se produce un flujo de corriente desde una célula presináptica a otra que lo recibe (célula postsináptica). Ello ocurre cuando se produce en la célula presináptica una perturbación que cambia su estado eléctrico de reposo. Así al aplicar un estímulo hipopolarizante en la célula presináptica también aparecerá en la postsináptica una hipopolarización. La estructura a través de la cual se establece este tipo de comunicación bioeléctrica es la unión en hendidura. Es una estructura proteica Nancy N. Sepúlveda 12 REDES NEURONALES ARTIFICIALES compleja formada por el aporte de cada una de las células que participan en este tipo de comunicación. Neurotransmisión eléctrica. 2 1. Neurona presináptica 2. Neurona post-sináptica 3. Microelectrodo ubicado en la neurona presináptica. A través de él se pueden aplicar estímulos electricos (pulsos) 4. Esquema que representa un estímulo eléctrico, cuya intensidad (voltaje) está representada por su altura y cuya duración está representada por su ancho 5. Microelectrodo ubicado en la parte presináptica de la sinapsis eléctrica 6. Respuesta eléctrica que registra con 5 en la parte presináptica 7. Parte post-sináptica 8. microelectrodo que registra el potencial post-sináptico (9) 9. Potencial post-sináptico 10. Sinapsis eléctrica La información que activa a las dendritas es convertida en el soma en una señal eléctrica llamada potencial de acción. Esta señal viaja a lo largo del axón a una velocidad de centenares de metros por minuto. En la terminación del axón el potencial de acción promueve la liberación de los neurotransmisores. Estos se difunden hacia la neurona vecina (post-sináptica) donde activan receptores específicos capaces de modificar la actividad eléctrica. A su vez, esta información podrá generar un nuevo potencial de acción en la segunda neurona. 2 http://www.puc.cl/sw_educ/neurociencias/esquemas/089.gif Nancy N. Sepúlveda 13 REDES NEURONALES ARTIFICIALES Moléculas de comunicación entre neuronas. Los neurotransmisores (NTs) representan las moléculas a través de las cuales se comunican las células y especialmente las neuronas entre sí. Son varios los criterios para definir a una molécula como neurotransmisor: la molécula debe ubicarse en la célula presináptica. la molécula debe liberarse cuando se hiperpolariza la parte presináptica. en la célula post-sináptica se ubican receptores específicos para el NT. debe existir un mecanismo que termine la acción del NT. Cuando una fibra nerviosa es estimulada (despolarizada) se inicia un impulso nervioso o potencial de acción. Éste tiene dos fases: una fase inicial producida por la entrada rápida de iones de sodio al interior de la célula, a través de canales de la membrana del axón que son sensibles al voltaje de la misma. La rápida entrada de estas cargas positivas hacen que el valor negativo del interior de la célula en la región estimulada, disminuya rápidamente hacia la positividad. La segunda fase del potencial de acción ocurre por la apertura retardada de canales potásicos que hacen que este ion salga de la célula (recordemos que normalmente los iones de K+ están mucho más concentrados al interior que al exterior), contribuyendo así a una mayor despolarización (la falta de polarización significa la ausencia de una diferencia de potencial, o sea, un valor cercano o igual a cero voltios) de la membrana, pero también a una inactivación de los canales de sodio. Este último fenómeno ya anuncia la repolarización membranal. El movimiento de corriente eléctrica alrededor del sitio despolarizado hace que los canales iónicos situados en la vecindad también se activen, produciendo una cascada de excitación membranal, y de esta manera, la propagación del impulso nervioso a todo lo largo de la fibra. Nancy N. Sepúlveda 14 REDES NEURONALES ARTIFICIALES El potencial de acción: bases iónicas. Aquí se muestra el corte de una fibra nerviosa donde se ilustran las diferencias de concentración de iones dentro y fuera del citoplasma: en estado de reposo (I) el sodio (Na+) tiene mayor concentración fuera de la célula, mientras que el potasio (K +) es más abundante en el interior de la célula. Estas diferencias de concentración iónica producen un desequilibrio eléctrico: el interior de la célula es más negativo que el exterior. Esta electronegatividad, causada por la presencia de canales iónicos y bombas o transportadores (T) que mueven los iones de un lado a otro de la membrana, hace que la célula sea excitable. Cuando llega el impulso nervioso (cabeza de flecha en la porción media de la figura), la polaridad se invierte pues el Na+ entra rápidamente a la célula, al tiempo que sale el K+, produciendo una despolarización: la carga de la membrana pasa de negativa a positiva (2). La repolarización (el retorno al estado de excitabilidad previo o de reposo) se logra cuando las bombas membranales (T), las cuales funcionan por la energía proveniente de la conversión de ATP en ADP, sacan el Na+ y vuelven a introducir el K+ (de nuevo, al estadio ilustrado en I). Éste es el proceso participante en la excitación. En la inhibición el ion cloro (Cl -) desempeña un papel importante, aumentando su concentración intracelular. Nancy N. Sepúlveda 15 REDES NEURONALES ARTIFICIALES Sistema de transporte y liberación de neurotransmisores. Algunos transportadores ubicados en los terminales nerviosos cumplen un papel central en el proceso del término de la acción del neurotransmisor. Este es un proceso fundamental en la neurotransmisión química ya que exceso de neurotransmisor en el espacio sináptico llevaría al bloqueo de la sinapsis. Estos transportadores de los terminales nerviosos son capaces de secuestrar rápidamente al neurotransmisor liberado, reincorporándolo en el terminal nervioso. Algunos transportadores pueden funcionar, sin embargo, como transportadores reversos, es decir, sacan neurotransmisores desde el terminal. El neurotransmisor puede salir del terminal nervioso por mecanismos exocitósicos y no-exocitósicos. Existe una liberación espontánea del neurotransmisor, la liberación basal, que en condiciones de reposo neuronal suele ser bastante regular y estable. Esa liberación basal aumenta sustancialmente cuando el número de potenciales de acción que invaden el terminal aumentan. Los terminales nerviosos también están inervados por otros terminales liberan neurotransmisores que pueden ser excitadores o inhibidores. Los receptores y la activación de neuronas. Los receptores químicos de la membrana plasmática ubicados en el soma o en la región dendrítica son los que reciben la información que les llegan desde los terminales nerviosos que inervan la neurona. Es la naturaleza inhibidora o excitadora de esos receptores la que determinará si esa neurona será estimulada (aumento en ella de la generación de potenciales de acción o de "trenes" de potenciales) o será inhibida (disminución del número de potenciales que genera en reposo o silenciada). Los NT actúan sobre receptores excitadores provocando como respuestas locales, pequeñas hipopolarizaciones en el dominio de esos receptores. Nancy N. Sepúlveda 16 REDES NEURONALES ARTIFICIALES REDES DE NEURONAS La neurona es una plataforma de análisis, control y seguimiento neurointeligente de información, destinada a la gestión de información y ayuda a la toma de decisiones. Permite la interrelación de información de forma inteligente, en tiempo real y a medida. El sistema aprende de los procesos realizados, ajustándose a los intereses del usuario. Es una auténtica ayuda a la toma de decisiones, permite un ahorro de tiempo, esfuerzo y mejora de la eficiencia incomparable con otras herramientas. Técnicamente, la plataforma está formada por agentes inteligentes y redes neuronales, que le confieren la capacidad de entender y aprender. El cerebro humano continuamente recibe señales de entrada de muchas fuentes y las procesa a manera de crear una apropiada respuesta de salida. Nuestros cerebros cuentan con millones de neuronas que se interconectan para elaborar "Redes Neuronales". Estas redes ejecutan los millones de instrucciones necesarias para mantener una vida normal. Se estima que el cerebro humano contiene más de cien mil millones (10 11) de neuronas y 1014 sinápsis en el sistema nervioso humano. Estudios sobre la anatomía del cerebro humano concluyen que hay más de 1000 sinapsis a la entrada y a la salida de cada neurona. Es importante notar que aunque el tiempo de conmutación de la neurona ( unos pocos milisegundos) es casi un millón de veces menor que en los actuales elementos de las computadoras, ellas tienen una conectividad miles de veces superior que las actuales supercomputadoras. El objetivo principal de las redes neuronales de tipo biológico es desarrollar un elemento sintético para verificar las hipótesis que conciernen a los sistemas biológicos.3 3 http://www.gr.ssr.upm.es/inves/neural/ann2/anntutorial.html Nancy N. Sepúlveda 17 REDES NEURONALES ARTIFICIALES CAPÍTULO II REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 18 REDES NEURONALES ARTIFICIALES REDES NEURONALES ARTIFICIALES ¿QUÉ ES UNA RED NEURONAL? La industria de ordenadores ha mostrado un progreso espectacular en muy corto tiempo. El viejo modelo de tener un solo ordenador para satisfacer todas las necesidades de cálculo de una organización se está reemplazando con rapidez por otro que considera un número grande de ordenadores separados, pero interconectados, que efectúan el mismo trabajo. Estos sistemas, se conocen con el nombre de redes de ordenadores. Estas nos dan a entender una colección interconectada de ordenadores autónomos. Se dice que los ordenadores están interconectados, si son capaces de intercambiar información. La conexión no necesita hacerse a través de un hilo de cobre sino mediante el uso de láser, microondas y satélites de comunicaciones. Al indicar que los ordenadores son autónomos, excluimos los sistemas en los que un ordenador pueda forzosamente arrancar, parar o controlar a otro, éstos no se consideran autónomos. REDES NEURONALES ARTIFICIALES Las Redes Neuronales Artificiales (RNA) son dispositivos o software programado de manera tal que funcionen como las neuronas biológicas de los seres vivos. A continuación hablaremos un poco sobre ellas. Las redes de neuronas artificiales (RNA) son máquinas que poseen esa capacidad de aprendizaje. Esos artefactos han sido propuestos como modelos (extremadamente) simplificados del funcionamiento del cerebro, pues no retienen más que algunas características esenciales: Nancy N. Sepúlveda 19 REDES NEURONALES ARTIFICIALES Las neuronas no pueden encontrarse más que en dos estados posibles, activas o en reposo; Están interconectadas mediante sinapsis que pueden ser modificadas por aprendizaje; El estado de una neurona a cada instante es determinado por el de otras, información que es transmitida por las sinapsis. Las redes neuronales formadas por los perceptrones se interconectan en forma muy similar a como las neuronas humanas se disponen en la corteza cerebral humana, y lo más importante, son capaces de asociar y generalizar sin reglas. Han sido utilizadas con gran éxito para reconocer retornos de sonar bajo el agua, escritura a mano, voz, topografía de terrenos, controlar brazos de robots, evaluar datos personales, modelar fenómenos cognocitivos, y, predecir tendencias financieras. La clase de problemas que mejor se resuelven con las redes neuronales son los mismos que el ser humano resuelve mejor: Asociación, evaluación, y reconocimiento de patrones. Las redes neuronales son perfectas para problemas que son muy difíciles de calcular pero que no requieren de respuestas perfectas, sólo respuestas rápidas y buenas. Por otra parte, las redes neuronales son muy malas para cálculos precisos, procesamiento serie, y no son capaces de reconocer nada que no tenga inherentemente algún tipo de patrón. Es por esto, que no pueden predecir la lotería, ya por definición es un proceso al azar. Existen varias formas de hacer las conexiones en una RNA, así como existen varias formas de conectar neuronas biológicas en el cerebro. Cada tipo sirve para diferentes procesos, el elegir la correcta topología y sus características, es imprescindible para lograr fácilmente la solución del problema. Nancy N. Sepúlveda 20 REDES NEURONALES ARTIFICIALES CARACTERÍSTICAS DE LAS REDES NEURONALES ARTIFICIALES Las características principales de las redes neuronales artificiales son las siguientes: Auto Organización y Adaptatividad: utilizan algoritmos de aprendizaje adaptativo y auto organización, por lo que ofrecen posibilidades de procesado robusto y adaptativo. Procesado No Lineal: aumenta la capacidad de la red de aproximar, clasificar y su inmunidad frente al ruido. Procesado paralelo: normalmente se usa un gran número de células de procesado por el alto nivel de interconectividad. Estas características juegan un importante papel en las redes neuronales artificiales aplicadas al procesado de señal e imagen. Una red para una determinada aplicación presenta una arquitectura muy concreta, que comprende elementos de procesado adaptativo masivo paralelo combinadas con estructuras de interconexión de red jerárquica. A su vez, difieren entre sí por diversos aspectos: sus motivaciones biológicas, su modo de funcionamiento o su campo de aplicaciones. Algunas técnicas neuronales avanzadas son llamadas constructivas, ya que modifican la arquitectura misma de la red en un proceso antagónico de crecimiento-aprendizaje/disminución-olvido. Las RNA, por su parte, retienen y explican el procesamiento paralelo y distribuido de la actividad neuronal. Los mecanismos moleculares involucrados en el aprendizaje en los organismos dotados de sistema nervioso se manifiestan en la modificación de los coeficientes de transmisión sináptica entre neuronas conectadas en secuencia. La fuerte estructuración del sistema nervioso en los mamíferos superiores, que agrupa decenas de miles de millones (1011) de neuronas en sólo algunos cientos de láminas neuronales, agrupadas en algunas decenas de centros, e Nancy N. Sepúlveda 21 REDES NEURONALES ARTIFICIALES incluso la organización de microcircuitos neuronales como los observados en el córtex constituyendo columnas corticales, ha sido exitosamente replicada en modelos neuronales. Las áreas de aplicación de métodos conexionistas en „Ingeniería Neuronal‟ incluyen entre otras, algunas tan diversas como la búsqueda de soluciones óptimas en problemas combinatorios complejos, el reconocimiento de configuraciones en ambientes ruidosos, el análisis de señales y de imágenes, la ingeniería del conocimiento, el diagnóstico automático en medicina, el procesamiento de voz, la visión computacional y el reconocimiento invariante de objetos. Existe, sin embargo, una diferencia sustancial entre el enfoque simbólico y el enfoque neuronal. En el primer caso, la tarea principal del Ingeniero de Conocimientos que desarrolla un Sistema Experto es la extracción y comprensión de las reglas de inferencia utilizadas por un experto en la resolución de un problema. Estas reglas serán implementadas en el motor de inferencias del Sistema Experto. En el segundo enfoque, en cambio, el Ingeniero Neuronal debe tener acceso a una amplia base de datos y debe ser capaz de seleccionar en ella un conjunto de casos suficientemente representativos y confiablemente clasificados por el experto para entrenar con ellos a la red neuronal. La red así entrenada deberá operar adecuadamente sobre los casos del conjunto complemento del usado en el entrenamiento. Cuando el conocimiento declarativo del experto es fácilmente formalizable por medio de reglas, los Sistemas Expertos parecen recomendables. El conocimiento reflexivo, en cambio, es representado más fácilmente por casos debidamente clasificados, y las RNA pueden aportar aquí adecuadas soluciones. Las redes neuronales artificiales pueden tener factores de peso fijos o adaptables. Las que tienen pesos adaptables emplean leyes de aprendizaje para Nancy N. Sepúlveda 22 REDES NEURONALES ARTIFICIALES ajustar el valor de la fuerza de un interconección con otras neuronas. Si las neuronas utilizan pesos fijos, entonces su tarea deberá estar previamente definida. Los pesos serán determinados a partir de una descripción completa del problema. Por otra parte, los pesos adaptables son esenciales si no se conoce previamente cual deberá de ser su valor correcto. FUNCIONAMIENTO DE LAS REDES NEURONALES ARTIFICIALES En la siguiente figura se representa una neurona "artificial", que intenta modelar el comportamiento de la neurona biológica. Aquí el cuerpo de la neurona se representa como un sumador lineal de los estímulos externos zj, seguida de una función no lineal yj = f(zj). La función f(zj) es llamada la función de activación, y es la función que utiliza la suma de estímulos para determinar la actividad de salida de la neurona. Figura Neurona Artificial. 4 4 http://electronica.com.mx/neural/informacion/neurona_art.gif Nancy N. Sepúlveda 23 REDES NEURONALES ARTIFICIALES FUNCIONES DE BASE Y ACTIVACIÓN Una red neuronal típica se puede caracterizar por las descripciones funcionales de la red de conexión y la red de activación. Función de Base (Función de Red) Para un estudio analítico, las redes de conexión son matemáticamente representadas por la función de base (w,x), donde w es la matriz de pesos, y x el vector de entrada. La función de base tiene dos formas típicas: 1. Función Lineal de Base (LBF) es una función de tipo hiperplano. Esto es, una función de primer orden. El valor de red es una combinación lineal de las entradas. 2. Función de Base Radial (RBF) es una función de tipo hiperesférico. Esto implica una función de base de segundo orden no lineal. El valor de red representa la distancia a un determinado patrón de referencia. La función de segundo orden se puede extender a otra más general llamada función de base Elíptica. La función de Base Elíptica se basa en asumir que el espacio de características es uniformemente normalizado en todas direcciones. En la práctica, de todas formas, distintas características pueden tener distintos grados de importancia dependiendo en el modo que sean medidos. Esto lleva a la adopción de funciones discriminantes elípticas mas versátiles. La forma mas general de una función de segundo orden es la función de base hiperelíptica. Función de Activación (Función de neurona) El valor de red, expresado por la función de base, u(w,x), será inmediatamente transformada por una función de activación no lineal. Por ejemplo, las funciones de activación más comunes son la función paso, rampa o sigmoidal y gausiana. Nancy N. Sepúlveda 24 REDES NEURONALES ARTIFICIALES El conocimiento de una red neuronal artificial se encuentra en la función de activación utilizada y en los valores de sus pesos. TAXONOMÍA DE LAS REDES NEURONALES ARTIFICIALES Existen dos fases en toda aplicación de las redes neuronales: la fase de aprendizaje o entrenamiento y la fase de prueba. En la fase de entrenamiento, se usa un conjunto de datos o patrones de entrenamiento para determinar los pesos (parámetros de diseño) que definen el modelo neuronal. Una vez entrenado este modelo, se usará en la llamada fase de prueba o funcionamiento directo, en la que se procesan los patrones de prueba que constituyen la entrada habitual de la red, analizándose de esta manera las prestaciones definitivas de la red. Fase de Prueba: los parámetros de diseño de la red neuronal se han obtenido a partir de unos patrones representativos de las entradas que se denominan patrones de entrenamiento. Los resultados pueden ser tanto calculados de una vez como adaptados iterativamente, según el tipo de red neuronal, y en función de las ecuaciones dinámicas de prueba. Una vez calculados los pesos de la red, los valores de las neuronas de la última capa, se comparan con la salida deseada para determinar la validez del diseño. Fase de Aprendizaje: una característica de las redes neuronales es su capacidad de aprender. Aprenden por la actualización o cambio de los pesos sinápticos que caracterizan a las conexiones. Los pesos son adaptados de acuerdo a la información extraída de los patrones de entrenamiento nuevos que se van presentando. Normalmente, los pesos óptimos se obtienen optimizando (minimizando o maximizando) alguna "función de energía". Por ejemplo, un criterio popular en el entrenamiento supervisado es minimizar el least-square-error (error cuadrático medio) entre el valor del maestro y el valor de salida actual. Nancy N. Sepúlveda 25 REDES NEURONALES ARTIFICIALES La gran diferencia del empleo de las redes neuronales en relación con otras aplicaciones de la computación radica en que no son algorítmicas, esto es no se programan haciéndoles seguir una secuencia predefinida de instrucciones. Las redes neuronales artificiales generan por sí mismas sus propias "reglas", para asociar la respuesta a su entrada; es decir, aprende por ejemplos y de sus propios errores. Las redes neuronales artificiales adaptables tienen dos fases en su operación. 1. Entrenamiento de la red. El usuario proporciona a la red un número "adecuado" de estímulos de entrada, y de salida, la red entonces ajusta su pesos de interconección o sinápsis hasta que la salida de la red esta "lo suficientemente cerca" de la salida correcta. 2. Recuperación de lo aprendido. A la red se le presenta un conjunto de estímulos de entrada y ésta simplemente calcula su salida. Cuando la red emplea entrenamiento no supervisado, algunas veces será necesario que reajuste su sinápsis durante la fase de recuperación. ESTRUCTURAS DE LAS REDES NEURONALES ARTIFICIALES Una red neuronal se determina por la neurona y la matriz de pesos. El comportamiento de la red depende en gran medida del comportamiento de la matriz de pesos. Hay tres tipos de capas de neuronas: la de entrada, las ocultas y la de salida. Entre dos capas de neuronas existe una red de pesos de conexión, que puede ser de los siguientes tipos: hacia delante, hacia atrás, lateral y de retardo. Conexiones hacia adelante: para todos los modelos neuronales, los datos de las neuronas de una capa inferior son propagados hacia las neuronas de la capa superior por medio de las redes de conexiones hacia adelante. Nancy N. Sepúlveda 26 REDES NEURONALES ARTIFICIALES Conexiones hacia atrás: estas conexiones llevan los datos de las neuronas de una capa superior a otras de la capa inferior. Conexiones laterales. Un ejemplo típico de este tipo es el circuito "el ganador toma todo" (winner-takes-all), que cumple un papel importante en la elección del ganador. Conexiones con retardo: los elementos de retardo se incorporan en las conexiones para implementar modelos dinámicos y temporales, es decir, modelos que precisan de memoria. Las conexiones sinópticas pueden ser total o parcialmente interconectadas. También es posible que las redes sean de una capa con el modelo de pesos hacia atrás o bien el modelo multicapa hacia adelante. Es posible, así mismo, el conectar varias redes de una sola capa para dar lugar a redes más grandes. En una red multicapa de propagación hacia adelante, puede haber una o más capas ocultas entre las capas de entrada y salida. El tamaño de las redes depende del numero de capas y del número de neuronas ocultas por capa. Número de capas: en una red multicapa, hay una o más capas de neuronas ocultas entre la entrada y la salida. El número de capas se cuenta a menudo a partir del número de capas de pesos (en vez de las capas de neuronas). Número de unidades ocultas: El número de unidades ocultas está directamente relacionado con las capacidades de la red. Para que el comportamiento de la red sea correcto (esto es, generalización), se tiene que determinar apropiadamente el número de neuronas de la capa oculta.5 5 http://www.gr.ssr.upm.es/inves/neural/ann2/anntutorial.html Nancy N. Sepúlveda 27 REDES NEURONALES ARTIFICIALES CAPÍTULO III MODELOS: SUPERVISADO Y NO SUPERVISADO Nancy N. Sepúlveda 28 REDES NEURONALES ARTIFICIALES CLASIFICACIÓN Y APRENDIZAJE DE LAS REDES NEURONALES ARTIFICIALES La clasificación es la atribución de una clase específica a un objeto. Para una máquina, la clasificación de rostros, datos médicos o imágenes son tareas bastante difíciles, en tanto que para un humano son cuestiones cotidianas. Un ejemplo podría ser el reconocimiento de caracteres manuscritos, una técnica que puede ser utilizada para resolver este problema es el aprendizaje. Así, el criterio para decidir si una imagen corresponde a una letra A, B, C... consiste en comparar si es lo suficientemente similar a otras A B o C vistas anteriormente; con ese enfoque, uno no calcula la clasificación de letras, sino que se aprenden a partir de ejemplos. La capacidad de aprendizaje de las RNA les da una inmensa ventaja sobre métodos tradicionales, ya que tan sólo se requiere disponer de un conjunto de ejemplos (conjunto de aprendizaje) para que la red pueda aprender. Es por ello que las redes de neuronas son ampliamente utilizadas en aplicaciones tan variadas como la previsión, la predicción, la clasificación, el diagnóstico automático, el procesamiento de señales, el reconocimiento de formas, la comprensión de datos, la optimización combinatoria, la robótica y la búsqueda de documentos, entre otras. La capacidad de clasificación de la red neuronal depende del valor de los pesos sinápticos, que pueden ser preestablecidos o entrenados adaptativamente mediante mecanismos de aprendizaje. Las redes neuronales artificiales se pueden clasificar, atendiendo a como sean entrenados los pesos sinápticos, en dos grandes categorías: estas son los modelos supervisados y los no supervisados. El primero ocurre cuando se le proporciona a la red tanto la entrada como la salida correcta, y la red ajusta sus pesos tratando de minimizar el error de su salida calculada. Este tipo de entrenamiento se aplica, por ejemplo, en el Nancy N. Sepúlveda 29 REDES NEURONALES ARTIFICIALES reconocimiento de patrones. El entrenamiento no supervisado se presenta cuando a la red se le proporcionan únicamente los estímulos, y la red ajusta sus interconecciones basándose únicamente en sus estímulos y la salida de la propia red. Las leyes de aprendizaje determinan cómo la red ajustará sus pesos utilizando una función de error o algún otro criterio. La ley de aprendizaje adecuada se determina en base a la naturaleza del problema que se intenta resolver. REDES NEURONALES ARTIFICIALES NO SUPERVISADAS Para los modelos de entrenamiento No Supervisado, el conjunto de datos de entrenamiento consiste sólo en los patrones de entrada. Por lo tanto, la red es entrenada sin el beneficio de un maestro. La red aprende a adaptarse basada en las experiencias recogidas de los patrones de entrenamiento anteriores. Una clase de modelos de entrenamiento no supervisado son las redes de pesos fijos. Un ejemplo son las redes de Memoria Asociativa, que se usan para obtener patrones originales libres de ruido a partir de señales incompletas o distorsionadas. La principal característica de las redes asociativas de pesos fijos es que sus pesos son preestablecidos y precalculados. Los modelos de pesos fijos tienen aplicaciones limitadas ya que no se pueden adaptar a "ambientes cambiantes". Hay otra variedad de redes no supervisadas, llamadas Redes de Aprendizaje Competitivo, cuyos pesos se adaptan de acuerdo con reglas de aprendizaje no supervisadas. Estas redes pueden aprender en ausencia de un maestro. En otras palabras, el entrenamiento se basa únicamente en la información de los patrones de entrada. REDES DE MEMORIA PROASOCIATIVA Una red de asociación básica tiene una capa de neuronas de entrada y una capa de neuronas de salida. Nancy N. Sepúlveda 30 REDES NEURONALES ARTIFICIALES Memoria Asociativa Lineal (LAM) Una red de memoria asociativa es matemáticamente un mapeado de un espacio de entrada sobre uno de salida. Las redes de memoria asociativa se pueden usar tanto para las aplicaciones autoasociativas como para las heteroasociativas. En las aplicaciones autoasociativas, la dimensión del espacio de entrada es igual al de salida. Por otro lado, en la aplicación heteroasociativa, la dimensión del espacio de entrada y del espacio de salida son en general diferentes. Los valores de entrada y de salida pueden ser reales o binarios. Redes de memoria asociativa de pesos fijos. Las redes neuronales artificiales pueden tener factores de peso fijos o adaptables. Las que tienen pesos adaptables emplean leyes de aprendizaje para ajustar el valor de la fuerza de una interconección con otras neuronas. Si las neuronas utilizan pesos fijos, entonces su tarea deberá estar previamente definida. Los pesos serán determinados a partir de una descripción completa del problema. Por otra parte, los pesos adaptables son esenciales si no se conoce previamente cual deberá de ser su valor correcto. REDES DE APRENDIZAJE COMPETITIVO Una red básica de aprendizaje competitivo tiene una capa de neuronas de entrada y una capa de neuronas de salida. Un patrón de entrada x es un simple punto en el espacio real o binario de vectores n-dimensional. Los valores binarios (0 ó 1) de representación local son más usados en los nodos de salida. Esto es, hay tantas neuronas de salida como número de clases y cada nodo de salida representa una categoría de patrones. Una red de aprendizaje competitivo está formada por una(s) red(es) excitadora hacia adelante y la(s) red(es) inhibidora(s) lateral(es). La red hacia adelante normalmente implementa una regla de excitación de aprendizaje de Hebb. Esta regla consiste en que cuando una neurona participa constantemente Nancy N. Sepúlveda 31 REDES NEURONALES ARTIFICIALES en activar una neurona de salida, la influencia de la neurona de entrada es aumentada. La red lateral es inhibidora por naturaleza. Esta red realiza la misión de selecionar el ganador, normalmente por medio de un método de aprendizaje competitivo. Los procedimientos de clasificación no supervisados se basan a menudo en algunas técnicas de clasificación, que forman grupos de patrones parecidos. Esta técnica de clasificación es muy útil para la clasificación. Además, juega un papel muy importante en las redes de aprendizaje competitivo. Para un procedimiento de clasificación, es necesario definir una distancia o medida de similaridad, para evaluar el grado de semejanza de los patrones. Redes de Aprendizaje Competitivo básicas Sin la supervisión de ningún maestro, las redes no supervisadas adaptan los pesos y verifican los resultados únicamente a partir de los patrones de entrada. Un esquema que se usa mucho para la adaptación de los pesos es la regla de aprendizaje competitivo, que hace que las células compitan por el derecho a responder por ellas mismas por un determinado tipo de entrada. Esto se puede ver como un sistema muy sofisticado de clasificación, cuyo objetivo es dividir un conjunto de patrones de entrada en un número de clases tal que los patrones de la misma clase exhiben un cierto grado de similaridad. Modelo básico de Aprendizaje Un sistema de este tipo consiste en redes laterales y de propagación hacia adelante con un número fijo de nodos de salida, esto es, un número fijo de clases. Los nodos de entrada y salida tienen valores binarios únicamente. Reglas de entrenamiento basadas en pesos normalizados Con el fin de asegurar un ambiente de competición equitativo, las suma de todos los pesos que van a dar las neuronas de salida deben estar normalizados. Nancy N. Sepúlveda 32 REDES NEURONALES ARTIFICIALES Entonces, si una unidad gana la competición, cada una de sus líneas de entrada cede una proporción de su peso, y la distribuye igualmente entre las líneas de entrada activas. Una característica importante de esta regla de entrenamiento es que la normalización es incorporada en el momento de la actualización, de forma que la suma de los pesos sinápticos a cualquier salida es 1. Reglas de aprendizaje para "Leaky Learning" (aprendizaje débil) Con el fin de preveer la existencia de neuronas que no aprenden en totalidad, se usa el aprendizaje débil. Puesto que una neurona solo aprende si gana en algún momento, es posible que una célula nunca gane, y por lo tanto nunca aprenda. Una forma de solucionar este problema es que todos los pesos de la red intervengan en el entrenamiento con distintos niveles de aprendizaje. Las neuronas que pierden en la competición sufren un aprendizaje menor que las neuronas ganadoras. Este cambio tiene la propiedad de que las neuronas perdedoras se van desplazando hacia la región donde yace el estímulo actual, donde empiezan a capturar algunas unidades, superando a las técnicas dinámicas convencionales. REDES NEURONALES ARTIFICIALES SUPERVISADAS Las redes neuronales artificiales de entrenamiento supervisado constituyen la línea fundamental de desarrollo en este campo. En el entrenamiento supervisado hay dos fases a realizar: fase de prueba y fase de entrenamiento, que ya se analizaron en el capítulo anterior. En el entrenamiento supervisado, los patrones de entrenamiento se dan en forma de pares de entrada/maestro, donde M es el número de pares de entrenamiento. Dependiendo de la naturaleza de la información del maestro, hay dos aproximaciones al entrenamiento supervisado. Uno se basa en la corrección a Nancy N. Sepúlveda 33 REDES NEURONALES ARTIFICIALES partir de una decisión y la otra se basa en la optimización de un criterio de coste. De la última, la aproximación del error cuadrático medio es el más importante. Las formulaciones de decisión y aproximación difieren en la información que tienen los maestros y la forma de usarla. Redes Neuronales basadas en la decisión El perceptrón lineal se aplica sólo cuando las clases de patrones se sabe que son separables por límites de decisión lineales. En contra, el perceptrón no lineal ofrece un dominio mucho mayor de aplicaciones. Al entrenar una red compleja, la clave es el principio de asignación de créditos basado en la decisión distributiva. En la regla de entrenamiento basada en la decisión, se actualizan los pesos sólo cuando se produce un error en la clasificación. La regla de entrenamiento es localizada y distributiva. Esta comprende el aprendizaje reforzado y la subred correspondiente a la clase correcta y el entrenamiento anti reforzado en la subred ganadora. Puesto que el límite de decisión depende de la función discriminante, es natural ajustar el límite de decisión ajustando el vector de los pesos w tanto en la dirección de el gradiente de la función discriminante (es decir, entrenamiento reforzado) o en la dirección contraria (es decir, entrenamiento anti reforzado). Regla de entrenamiento basada en la decisión En esta regla de entrenamiento, el vector de pesos w se mueve a lo largo de la dirección positiva del gradiente, así que la función del valor discriminante aumentará, aumentando la posibilidad de la selección del futuro patrón. El entrenamiento anti reforzado mueve w a lo largo de la dirección negativa del gradiente, así que el valor de la función discriminante disminuirá, disminuyendo así la posibilidad de su futura elección. Nancy N. Sepúlveda 34 REDES NEURONALES ARTIFICIALES Redes Neuronales de Aproximación/Optimización Las formulaciones basadas en la aproximación se pueden ver como una aproximación/regresión para el conjunto de datos entrenados. Los datos para el entrenamiento se dan en pares de entrada/maestro (deseado), donde M es el número de patrones de entrenamiento. Los valores deseados en los nodos de salida correspondientes a los patrones de entrada los llamaremos maestros. El objetivo del entrenamiento de la red es encontrar los pesos óptimos para minimizar el error entre los valores del maestro y las salidas de respuesta actual. Un criterio popular es minimizar los errores cuadráticos medios entre el maestro y la salida actual. Para adquirir una capacidad de aproximación no lineal, se usan frecuentemente las redes multicapa. La función que representa el modelo es función de las entradas y de los pesos. En la formulación básica del modelo de aproximación, el procedimiento implica el encontrar los pesos que minimizan el least-squares-error (error cuadrático medio). En la fase de prueba, la célula que gana a la salida es la célula que da la máxima respuesta al patrón de entrada. En la formulación de optimización, la función de energía debe ser específicamente elegida. Nancy N. Sepúlveda 35 REDES NEURONALES ARTIFICIALES ALGORITMO DE KOHONEN El algoritmo SOM de Kohonen es uno de los algoritmos de redes neuronales artificiales más populares y poderosos. Está basado en aprendizaje no supervisado. Los SOMs son una clase única de red neuronal, pues construyen mapeos bidimensionales de las relaciones estadísticas de los datos de entrada que preservan su topología. Estructuralmente consiste solamente de dos capas: una capa unidimensional de neuronas de entrada y una capa de neuronas de salida llamada capa competitiva; esta última organizada en una malla bidimensional. En la figura se muestra una red con 2 neuronas de entrada y 25 neuronas en la capa competitiva. Cada neurona de entrada está conectada a cada neurona de la capa competitiva. La capa de entrada modela un vector de características, cada neurona o nodo es un modelo de una observación, y tiene la misma función que en otros tipos de redes. Las neuronas de la capa competitiva tienen una propiedad diferente pues pueden encontrar las relaciones entre los patrones de entrada que procesan. Sean el número de neuronas en la capa de entrada y x = (x 1,x2,...xn) Nancy N. Sepúlveda 36 REDES NEURONALES ARTIFICIALES en Rn el conjunto de valores de las neuronas de entrada, es decir, un patrón de entrenamiento cualquiera. Sea m el número de neuronas en la capa competitiva y u = (u 1,u2,...um) el conjunto total de neuronas en la capa competitiva. Llamamos u i a la i-ésima neurona en esta capa. Cada neurona ui de la capa competitiva recibe n conexiones (de las n neuronas de la capa de entrada), cada una con un peso asociado. El conjunto o vector de pesos que recibe ui es mi = (mi1,mi2,...,min). La malla en qué está organizada la capa competitiva puede ser rectangular o hexagonal. En la figura siguiente se presenta una malla rectangular con una neurona y su vecindad resaltados. Aquí se toma como entrada un patrón de entrenamiento seleccionado aleatoriamente. Este patrón es presentado a la capa de entrada, y la idea es encontrar una neurona competitiva cuyo vector de pesos permita que se asemeje más o esté más cercana al patrón de entrada. Una vez seleccionada la neurona competitiva ganadora, se selecciona una vecindad en la cual serán actualizados los vectores de pesos de acuerdo a una función de vecindad. El tamaño de la vecindad y la función de vecindad son decrecientes en cada paso Nancy N. Sepúlveda 37 REDES NEURONALES ARTIFICIALES convenientemente seleccionados. Se realiza este procedimiento para todos los patrones de entrada, un cierto número de pasos predefinidos. Sea x = (x1,x2,...xn) un patrón de entrada y mi = (mi1,mi2,...,min) el vector de pesos que recibe la neurona competitiva ui desde la capa de entrada. Para cada paso t=0,1,...,T, se selecciona un patrón de entrada x y se encuentra una neurona competitiva ganadora, denotada por m c, tal que || x(t) - mc(t) || =< || x(t) - mi(t) || FORALL i o bien || x(t) - mc(t) || = min i || x(t) - mi(t) || donde || . || denota la norma de x-mi, o la distancia euclidiana de la neurona ui dado un patrón de entrada x || x - mi || = SQRT(SUMj=1n(xj-mij)2) Después, se actualizan los vectores de pesos de las neuronas en la vecindad de la neurona ganadora mc mi(t+1) = mi(t) + hc,i(t)*(x(t) - mi(t)) donde hc,i(t) es la función de vecindad centrada en mc, es una función decreciente de la distancia entre las unidades i-ésima y c-ésima y del tiempo. Esta función define la región de influencia que tiene el patrón de entrada sobre el SOM. Puede definirse como la gaussiana hc,i(t) = ALPHA(t) * exp( -(||ri - rc||2)/(2* SIGMA2(t)) ) donde 0 < ALPHA(t) < 1 es el factor de aprendizaje, y es una función decreciente con t. Comúnmente se utilizan una función lineal ALPHA(t) = ALPHA(0)*(1-t/T) o una inversa ALPHA(t) = A/(t+B). ri en R2 es la localización vectorial de la unidad i en la malla. SIGMA(t) es el radio de la vecindad en el tiempo t. Es también una función decreciente y puede definirse similarmente a ALPHA. Usualmente comienza con un valor grande. Nancy N. Sepúlveda 38 REDES NEURONALES ARTIFICIALES La idea de la gaussiana es que las neuronas más cercanas a la ganadora serán más afectadas en la actualización de su vector de pesos. Una definición más sencilla de hc,i(t) es la siguiente hc,i(t) = ALPHA(t) si ||ri - rc|| < SIGMA(t) 0 en otro caso o lo que es lo mismo, es constante para las neuronas en la vecindad de radio SIGMA de la neurona ganadora en el tiempo t, y 0 para las neuronas fuera de la vecindad. Esto nos dice que solamente se actualizarán los vectores de pesos de las neuronas en la vecindad y los demás no serán afectados. En [NEUSCIENCES] se usa en lugar de la exponencial la función hc,i(t) = ALPHA(t) * sin(||ri - rc||) / (2*||ri - rc||) Este procedimiento se repite T veces. Usualmente el proceso de entrenamiento se realiza en dos fases: la primera fase con valores iniciales de ALPHA y SIGMA relativamente grandes, y la segunda fase con valores pequeños. Esto corresponde a actualizaciones mayores al principio y actualizaciones más finas al final. El algoritmo de mapas auto-organizados crea modelos o abstracciones de diferentes tipos de datos, por lo que se aplica a cualquier conjunto de datos en general. Inicialmente era para aplicaciones en la ingeniería, pero actualmente su uso va desde campos como la medicina y biología hasta la economía. La mayor utilidad del SOM es que organiza los datos (o su representación o modelo) en una malla bidimensional que permite un despliegue gráfico para la visualización. Eso lo hace ideal para la exploración de datos, con aplicaciones por ejemplo en datos socio-ecónomicos, análisis financieros, y para la recuperación de información. El SOM puede ser usado en combinación con redes supervisadas. Una red supervisada requiere un objetivo o target, lo que muchas veces no está disponible Nancy N. Sepúlveda 39 REDES NEURONALES ARTIFICIALES en los datos existentes. Una red no supervisada puede usarse para definir ese objetivo. Se entrena la red no supervisada y cada grupo posible pasa a ser un objetivo de la red supervisada. Algunos otros ejemplos de aplicaciones son: Data Cleaning. Los datos extraídos de una base de datos a analizar pueden ser agrupados y el análisis puede hacerse sobre los grupos en lugar de sobre la base de datos completa. Marketing. por ejemplo, para detectar grupos de consumidores con ciertas características para dirigir hacia ellos la nueva campaña. Descubrir anomalías. En el monitoreo del funcionamiento de una máquina, puede detectarse comportamiento anómalo clasificando el comportamiento normal en grupos de funcionalidad, cuando un resultado no cae en ningún grupo. El SOM es adecuado para el análisis y visualización de datos multidimensionales. Mapea las relaciones entre estos datos multidimensionales en relaciones geométricas simples en una malla bidimensional, preservando las relaciones topológicas y métricas de los datos originales. El SOM es especialmente adecuado para el entendimiento de los datos, y también para el modelado y la preparación de los datos. Nancy N. Sepúlveda 40 REDES NEURONALES ARTIFICIALES CONCLUSIÓN Este trabajo de investigación, el cual tenía por objeto mostrar si la hipótesis anteriormente planteada: “un sistema de información informático tendría relación directa con el funcionamiento del sistema nervioso humano”, se corroboraba o refutaba, concluye en que las redes neuronales artificiales retienen y explican el procesamiento paralelo y distribuido de la actividad neuronal. Los mecanismos moleculares involucrados en el aprendizaje en los organismos dotados del sistema nervioso se manifiestan en la modificación de los coeficientes de transmisión sináptica entre neuronas secuencialmente conectadas. El objetivo de las redes neuronales artificiales consiste en imitar la forma de comunicación entre las neuronas del sistema nervioso humano, utilizar técnicas de aprendizaje, usando algoritmos neuronales increméntales con énfasis en la clasificación de datos y el desarrollo de la teoría del aprendizaje. Las redes neuronales artificiales son un modelo muy básico, como muestra el ejemplo del algoritmo de Kohonen, y está muy lejos de imitar el complejo mecanismo biológico creado por Dios. Nancy N. Sepúlveda 41 REDES NEURONALES ARTIFICIALES BIBLIOGRAFÍA www.puc.cl/sw_educ/neurociencias/html www.monografías.com http://iibce.edu.uy/vas/neuronas/abc.htm http://uam.es/centros/psicologia/paginas/biblioteca.html http://insm.es/glosariogr/glosarionsm http://personals.iddeo.es/wintrmute/ia/neuronal.htm www.gegi.polymtl.ca/info/jmtomore/publicaciones/reportes_jm/jornada- aprendizaje.html www.e-libro.net/generos/libro.asp?id_libro=1814 www.lania.mx/nivel3/aprendizaje.html www.gc.ssc.upm.es/inves/neural/ann2/anntutorial.html http://perso.wanadoo.es/icsalud/nervio.htm www.lafacu.com/apuntes/psicologia/apren_psico/default.htm www.psicoactiva.com/intelig.htm www.picoactiva/sueño.htm http://ciberconta.unizar.es/leccion/redes/inicio.html http://biologialmango.metropoliglobal.com/snc http://salud.discoveryespanol.com/saludhome.asp http://omega.ILCE.edu.mx:3000/sites/ciencia/volumen3/130/htm/sec www.nemotix.com/ index_2.php-w=16&s=39&sa=15&a=5.htm www.geocities.com/HotSprings/Spa/ 7712/ninos/cerebro-01.html Nancy N. Sepúlveda 42 REDES NEURONALES ARTIFICIALES PARTE II Materia: Seminario II Profesora: Carolina Spitale Nancy N. Sepúlveda 43 REDES NEURONALES ARTIFICIALES METODOLOGÍA Nancy N. Sepúlveda 44 REDES NEURONALES ARTIFICIALES ENFOQUE DE LA INVESTIGACIÓN. Tipo de investigación Entrevista: método no estructurado para la recopilación de datos primarios. Tipos de datos Fuentes primarias. MÉTODOS DE CONTACTO Individuales: permiten hablar con la gente en cualquier lugar. Son muy flexibles y se usan para recabar grandes cantidades de información. Le da la posibilidad al entrevistador de explicar las preguntas complicadas. Internet: permite al entrevistador comunicarse con la gente mediante foros, chats, e-mails, teniendo la posibilidad de contactarse con personas del extranjero. INSTRUMENTO DE INVESTIGACIÓN Cuestionario (10 preguntas abiertas): permite al respondiente contestar con sus palabras. PLAN DE MUESTREO Unidad: doctores en medicina, profesores de biología, profesores y licenciados en informática, ingenieros en electrónica. Tamaño: 10 entrevistas. Procedimiento: se escogió a personas con conocimiento sobre redes neuronales. Nancy N. Sepúlveda 45 REDES NEURONALES ARTIFICIALES PROBLEMAS METODOLÓGICOS Un problema que se presentó durante el desarrollo del trabajo de investigación fue al momento de tomar la muestra, ya que el tema en cuestión al ser muy específico hacía dificultoso encontrar personas idóneas que pudieran contestar la entrevista, porque éstas debían tener conocimientos tanto en la parte natural de las redes neuronales, como en la parte informática. CONSIDERACIONES GENERALES Como se pudo apreciar anteriormente, en esta investigación de campo se trabajó con entrevistas, ya que debido a la especificidad del tema, se tornaba complicado realizar una encuesta, porque se requería una indagación profunda del tema tratado. Nancy N. Sepúlveda 46 REDES NEURONALES ARTIFICIALES ANÁLISIS DE DATOS Nancy N. Sepúlveda 47 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 48 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 49 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 50 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 51 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 52 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 53 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 54 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 55 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 56 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 57 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 58 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 59 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 60 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 61 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 62 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 63 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 64 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 65 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 66 REDES NEURONALES ARTIFICIALES Nancy N. Sepúlveda 67 REDES NEURONALES ARTIFICIALES CONCLUSIONES FINALES Nancy N. Sepúlveda 68 REDES NEURONALES ARTIFICIALES Las Redes Neuronales Artificiales son modelos matemáticos del funcionamiento cerebral de un número grande de neuronas interconectadas de alguna manera, que constituyen un sistema capaz de operar como una memoria asociativa, al igual que el cerebro. Aquí vemos que una red neuronal artificial está relacionada con el cerebro, ya que éste emprende permanentemente una gran cantidad de tareas que no son susceptibles al menos que sean formuladas en forma algorítmica. Una red neuronal artificial recibe, procesa, almacena y ordena información, lo cual permite emprender la imitación de la aptitud de ciertos organismos para modificar su conducta aprendiendo de la experiencia. El que la red neuronal artificial pueda imitar esta cualidad implica que deba disponer de la capacidad de adaptación necesaria para cambiar su estructura interna. El número de neuronas y sus conexiones le dan a la red una función superior. Si se sufren alteraciones o daños, la red sólo presentará una degradación, porque los recuerdos almacenados en la red de neuronas se encuentran dispersos en los valores sinápticos, esto le da una característica de robustez frente a las lesiones. La tecnología de las redes neuronales artificiales son una emulación pequeña del complejo sistema nervioso humano, es la programación del modelo de comunicación entre sus células. Tal vez supere al hombre en algunos aspectos, como lo es el almacenamiento de información de diversas ramas o la velocidad para realizar una tarea, pero no en su totalidad. El mismo hombre es el creador de ella, por lo tanto, es el que puede manejarla. Todo lo programado no podrá superar al hombre, porque éste es impredecible. Para finalizar, una pequeña reflexión bíblica, tomando el versículo que se encuentra en Deuteronomio 29:29, que dice: “Las cosas secretas pertenecen al Señor nuestro Dios, mas las cosas reveladas nos pertenecen a nosotros...”. en todos los tiempos el hombre busca aumentar su conocimiento para avanzar en la ciencia. Esta innovación constante lo lleva afanarse en querer superar , en nuestro caso, al propio organismo humano. Pero sabemos que Dios nos hizo a su imagen y semejanza, y por más que el hombre quiera, no va a poder igualarlo, pues somos hechura suya. Nuestro organismo es un misterio creado por Dios. Él da la sabiduría y Él permite que la ciencia avance, pero llega un momento en que ésta se ve bloqueada porque le es imposible igualar los misterios del supremo inventor. Nancy N. Sepúlveda 69 REDES NEURONALES ARTIFICIALES ANEXO Nancy N. Sepúlveda 70 REDES NEURONALES ARTIFICIALES Modelo de la entrevista Sexo: M F Edad:.............. (Marcar con una X) 1. ¿Qué entiende por Redes Neuronales Artificiales o Redes Neuronales Biológicas? 2. ¿Puede comparar al sistema nervioso con una computadora? 3. ¿Cree usted que los sistemas de información informáticos tienen relación con el sistema nervioso humano? 4. ¿En qué imitan las Redes Neuronales Artificiales al cerebro humano? 5. ¿Qué complicaciones se pueden presentar en el funcionamiento de una red neuronal? 6. ¿Qué sucede si una neurona falla durante la sinapsis? 7. ¿Están estructuradas las Redes Neuronales Artificiales de una manera determinada o pueden variar? 8. ¿De qué manera se podría conseguir una mayor velocidad para que las Redes Neuronales Artificiales realicen sus métodos de aprendizaje? 9. ¿En qué medida la tecnología de las Redes Neuronales Artificiales podría superar al hombre? 10. Para finalizar, ¿cree usted que la inteligencia artificial superará la inteligencia humana? ¿por qué? Nancy N. Sepúlveda 71 REDES NEURONALES ARTIFICIALES Datos Personales De Los Profesionales en Ciencias Naturales. 1. Nombre y Apellido: Ronald Hougham Edad: 44 años. Teléfono: 4-641-3957 (Instituto Juan Amós Comenio). Notas: Profesor en Ciencias Naturales. 2. Nombre y Apellido: Norma Villares Edad: 34 años. E-mail: Notas: Pediatra. 3. Nombre y Apellido: Vicente Lizzi. Edad: 69 años. Teléfono: 4-644-3118 (Centro Médico Evangélico). Notas: Doctor en Medicina. 4. Nombre y Apellido: Domingo Serpone. Edad: 49 años. Teléfono: 4-644-3118 (Centro Médico Evangélico). Notas: Clínica Médica y Nutrición. 5. Nombre y Apellido: Isabel Rossi. Edad: 54 años. Teléfono: 4-641-3957 (Escuela Cristiana Evangélica Argentina). Notas: Profesora en Biología. Nancy N. Sepúlveda 72 REDES NEURONALES ARTIFICIALES Datos Personales De Los Profesionales Informáticos. 6. Nombre y Apellido: Paola Sáenz. Edad: 30 años. Teléfono: 4-641-3957 (Escuela Cristiana Evangélica Argentina). Notas: Licenciada en Informática. 7. Nombre y Apellido: Marcos Palazzo. Edad: 42 años. E-mail: mpalazzo@fecea.edu.ar / mpalazzo_ar@yahoo.com.ar Notas: Graduado de la Facultad de Ciencias Exactas y Naturales. 8. Nombre y Apellido: Matías Szyszko. Edad: 23 años. E-mail: matiascisco@hotmail.com Notas: Profesor en Informática. 9. Nombre y Apellido: Leonardo Davico. Edad: 26 años. E-mail: ldavico@fecea.edu.ar Notas: Ingeniero Electrónico. 10. Nombre y Apellido: Fernando Ortiz Edad: 32 años. La entrevista se realizó vía Internet. Nancy N. Sepúlveda 73 REDES NEURONALES ARTIFICIALES BIBLIOGRAFÍA Yani, José Nicolás; “Investigación Integral de Mercados, un enfoque operativo”; Ed. MacGraw Hill; Bogotá 1994. Sabino, Carlos A.; “Cómo hacer una tesis”; Ed. Lumen Humanitas; Bs. As. 1998. Kotler, Philip; “Mercadotecnia”; Ed. Prentice- Hall Hispanoamericana, S.A.; México 1998. Nancy N. Sepúlveda 74