Download redes neuronales biológicas - Escuela Cristiana Evangélica

Document related concepts

Perceptrón wikipedia , lookup

Teoría hebbiana wikipedia , lookup

Red neuronal artificial wikipedia , lookup

Red neuronal de impulsos wikipedia , lookup

Neurona wikipedia , lookup

Transcript
REDES NEURONALES ARTIFICIALES
INDICE
Parte I.......................................................................................................................................3
Agradecimientos......................................................................................................................4
Problema e hipótesis..............................................................................................................5
Introducción.............................................................................................................................6
Capítulo I: Redes Neuronales Biológicas...........................................................................7
Sistema nervioso............................................................................................................8
La neurona.......................................................................................................................9
Comunicación en el sistema nervioso.......................................................................10
Redes de neuronas.......................................................................................................17
Capítulo II: Redes Neuronales Artificiales....................................................................18
¿Qué es una red neuronal? .......................................................................................19
Redes neuronales artificiales...................................................................................20
Características de redes neuronales artificiales................................................21
Funcionamiento de redes neuronales artificiales................................................23
Funciones de base y activación................................................................................24
Taxonomía de las redes neuronales artificiales..................................................25
Estructura de las redes neuronales artificiales.................................................26
Capítulo III: Modelos: Supervisado y No Supervisado...............................................28
Clasificación y aprendizaje de las redes neuronales artificiales....................29
Redes neuronales artificiales no supervisadas....................................................30
Redes neuronales artificiales supervisadas..........................................................33
Algoritmo de Kohonen................................................................................................36
Conclusión...............................................................................................................................41
Bibliografía.............................................................................................................................42
Nancy N. Sepúlveda
1
REDES NEURONALES ARTIFICIALES
Parte II...................................................................................................................................43
Metodología............................................................................................................................44
Enfoque de la investigación. .....................................................................................45
Métodos de contacto..................................................................................................45
Instrumento de investigación...................................................................................45
Plan de muestreo..........................................................................................................45
Problemas metodológicos...........................................................................................46
Consideraciones generales........................................................................................46
Análisis de datos...................................................................................................................47
Profesionales en Ciencias Naturales.......................................................................48
Profesionales en Informática...................................................................................58
Conclusiones finales.............................................................................................................68
Anexo.......................................................................................................................................70
Modelo de la entrevista..............................................................................................71
Datos personales de profesionales en Ciencias Naturales................................72
Datos personales de profesionales en Informática............................................73
Bibliografía.............................................................................................................................74
Nancy N. Sepúlveda
2
REDES NEURONALES ARTIFICIALES
PARTE I
Materia: Seminario I
Profesora: Araceli Novo
Nancy N. Sepúlveda
3
REDES NEURONALES ARTIFICIALES
AGRADECIMIENTOS
La elaboración de este trabajo de investigación fue posible gracias a la guía
brindada por mi tutor, licenciado Daniel Palazzo.
También hacer un reconocimiento al ingeniero Leonardo Davico que fue la
persona que me orientó en la elección del tema a desarrollar en dicha tesina.
Quisiera hacer mención muy especial de la profesora Araceli Novo, quien
asesoró y estimuló para que este trabajo pueda concretarse.
Y agradecer a todas aquellas personas que de una u otra manera me
estuvieron apoyando para que este trabajo pueda realizarse.
Nancy N. Sepúlveda
4
REDES NEURONALES ARTIFICIALES
PROBLEMA
¿Los sistemas de información informáticos tienen relación con los del
sistema nervioso humano?
HIPÓTESIS
Un sistema de información informático tendría relación directa con el
funcionamiento del sistema nervioso humano.
Nancy N. Sepúlveda
5
REDES NEURONALES ARTIFICIALES
INTRODUCCIÓN
Este trabajo de investigación abordará la relación directa que tendría un
sistema de información informático con el funcionamiento del sistema nervioso.
En el primer capítulo se desarrollarán algunos aspectos importantes del
sistema nervioso humano que servirán luego para establecer la relación que nos
interesa.
En le segundo capítulo se expondrá sobre los sistemas informáticos,
específicamente sobre las redes neuronales artificiales.
En le tercer capítulo se presentará los dos tipos de redes neuronales
artificiales que encontramos en nuestra área de estudio.
De ésta manera, ya expuestas estas dos ramas que nos incumben, podremos
establecer la relación que podría existir entre ambas.
Al finalizar este trabajo de investigación se concluirá con la fundamentación
si la hipótesis planteada se corrobora o refuta.
Nancy N. Sepúlveda
6
REDES NEURONALES ARTIFICIALES
CAPÍTULO I
REDES
NEURONALES
BIOLÓGICAS
Nancy N. Sepúlveda
7
REDES NEURONALES ARTIFICIALES
REDES NEURONALES BIOLÓGICAS
SISTEMA NERVIOSO
El sistema nervioso es el rector y coordinador de todas las funciones,
conscientes e inconscientes del organismo, consta del sistema cerebroespinal
(encéfalo y medula espinal), los nervios y el sistema vegetativo o autónomo.
A menudo, se compara el sistema nervioso con una computadora, porque las
unidades periféricas (órganos internos u órganos de los sentidos) aportan gran
cantidad de información a través de los cables de transmisión (nervios) para que
la unidad de procesamiento central (cerebro), provista de su banco de datos
(memoria), la ordene, la analice, muestre y ejecute. El sistema nervioso permite
la relación entre nuestro cuerpo y el exterior, además de regular y dirigir el
funcionamiento de todos los órganos del cuerpo. Este sistema ejecuta tres
acciones esenciales, que son la detección de estímulos, la transmisión de
informaciones y la coordinación general.
La unidad básica del sistema nervioso humano es la neurona, y se la analizará
a continuación.
Nancy N. Sepúlveda
8
REDES NEURONALES ARTIFICIALES
LA NEURONA
Células del sistema nervioso
Todo el sistema nervioso humano está compuesto en su totalidad por
células nerviosas llamadas “neuronas”.
La neurona es la célula o unidad estructural y funcional del tejido nervioso,
cuyas propiedades de excitabilidad y conducción son las bases de las funciones
del sistema nervioso.
La parte central de la célula es llamada cuerpo de la célula o "soma", de la
que se proyectan numerosas extensiones en forma de raíz, las "dendritas". La
neurona también está formada por una simple fibra tubular, el "axón", el cual se
divide en numerosas ramificaciones.
Del cuerpo neuronal emergen prolongaciones. Una de ellas son las dendritas,
que forman una estructura de filamentos muy fina que rodean el cuerpo de la
neurona y cuya función es conducir impulsos hacia el cuerpo celular (aferentes).
La otra, es el axón, que es un tubo largo y delgado que se ramifica en su extremo
en pequeños bulbos finales que casi tocan las dendritas de las células vecinas. La
pequeña separación entre los bulbos finales y las dendritas se le denomina
sinapsis. Su función es la conducción de impulsos desde el cuerpo neuronal
Nancy N. Sepúlveda
9
REDES NEURONALES ARTIFICIALES
(eferentes), es una sola prolongación larga de calibre uniforme en toda su
longitud y se ramifica solo en la proximidad de su terminación.
En forma esquemática, se puede decir que las dendritas actúan como
antenas que reciben los contactos de otras células. En el soma se lleva a cabo la
integración de toda la información obtenida en las dendritas. Finalmente el axón
transmite a otras células el mensaje resultante de la integración.
Existen básicamente dos tipos de neuronas: la neurona sensitiva o aferente,
que es la que conduce los impulsos sólo hacia el cerebro o la médula. La neurona
motora o eferente, es la que conduce los impulsos en sentido opuesto; esto es,
del cerebro o la médula espinal hacia los músculos o glándulas. Pero existe un
tercer tipo de neuronas, las que reciben la información desde los músculos o de
los órganos sensoriales, las cuales son llamadas neuronas receptoras.
Organización funcional de la neurona
Las neuronas se organizan en redes y sistemas. Las neuronas, al igual que las
demás células del cuerpo, funcionan a través de impulsos eléctricos y reacciones
químicas. Los impulsos eléctricos que utiliza una neurona para intercambiar
información con las demás, viajan por el axón que hace contacto con las dendritas
de la neurona vecina mediante las sinapsis. La intensidad de la corriente
transmitida depende de la eficiencia de la transmisión sináptica. Una neurona en
especial transmitirá un impulso eléctrico por su axón si suficientes señales de las
neuronas vecinas transmiten a través de sus dendritas en un tiempo corto.
El propósito de las dendritas es de servir como elementos receptores para
las señales provenientes de neuronas adyacentes.
Las dendritas y el soma reciben mensajes de otras células. La información
es procesada y el mensaje resultante, si lo hay, pasa a lo largo del axón a otro
conjunto de neuronas, por lo que el propósito del axón es la transmisión de la
Nancy N. Sepúlveda
10
REDES NEURONALES ARTIFICIALES
actividad neuronal generada a otra célula nerviosa o fibra muscular. Para el caso
de las células nerviosas se utiliza el término interneuronal, mientras que para las
fibras musculares se emplea el nombre de neurona motora.
Las neuronas tienen unas proyecciones especializadas llamadas dendritas,
por un lado, y por el otro, axones. Las dendritas traen la información al cuerpo
de la célula, mientras que el axón toma la información del cuerpo de la célula.
En cuanto a la conexión y transmisión de impulsos, las neuronas se comunican
unas a otras a través de un proceso electroquímico, forman unas conexiones
especializadas llamadas "sinapsis" y producen ciertos compuestos químicos
especiales llamados "neurotransmisores" que son descargados a través de la
sinapsis. La información generada en un receptor sensorial, viaja por axones
sensoriales hasta los centros nerviosos, a los cuales accede a través de la médula
espinal. En este recorrido la vía para cada sistema sensorial es específica,
cruzada y pasa por diferentes neuronas (relevos) ascendiendo hasta alcanzar
centros nerviosos, también específicos. Si estos se ubican en la corteza cerebral,
la información genera el proceso de percepción.
Figura sinapsis. 1
1
http://www.gc.ssr.upm.es/inves/neural/ann2/images/bioneur2.gif
Nancy N. Sepúlveda
11
REDES NEURONALES ARTIFICIALES
COMUNICACIÓN EN EL SISTEMA NERVIOSO
Al sitio de comunicación entre dos neuronas se le conoce como sinapsis. No
se trata de un contacto directo, puesto que existe una separación infinitesimal
entre las dos células, sino del punto en el que las dos células muestran áreas
especializadas donde ocurre la transferencia de información entre dos células
nerviosas. El contacto entre ellas se realiza a través de contactos funcionales
altamente especializados denominados sinapsis. La mayor de parte de las sinapsis
son de tipo químico, es decir, utilizan moléculas llamadas neurotransmisores para
comunicarse entre sí.
Existen varios tipos de sinapsis: por una parte las llamadas químicas, que
son las que operan entre neuronas; y por otro lado las sinapsis eléctricas.
En estas sinapsis, el impulso nervioso pasa de una célula a otra manteniendo
su forma eléctrica, sin pasar por una transformación de fuerzas químicas. En
este último caso, se habla de transmisión neurohumoral, en la que los impulsos
nerviosos provocan respuestas por medio de la liberación de neurotransmisores
químicos
específicos.
Anatómicamente,
podemos
referirnos
a
sinapsis
axodendríticas, aquellas en las que el impulso nervioso parte del cuerpo celular y
viaja hacia la periferia, para establecer comunicación al nivel de las dendritas.
La sinapsis eléctrica es muy rápida, porque la corriente puede fluir en
ambos sentidos y practicamente no hay retardo sináptico. En ella se produce un
flujo de corriente desde una célula presináptica a otra que lo recibe (célula postsináptica). Ello ocurre cuando se produce en la célula presináptica una
perturbación que cambia su estado eléctrico de reposo. Así al aplicar un estímulo
hipopolarizante en la célula presináptica también aparecerá en la postsináptica
una hipopolarización. La estructura a través de la cual se establece este tipo de
comunicación bioeléctrica es la unión en hendidura. Es una estructura proteica
Nancy N. Sepúlveda
12
REDES NEURONALES ARTIFICIALES
compleja formada por el aporte de cada una de las células que participan en este
tipo de comunicación.
Neurotransmisión eléctrica. 2
1. Neurona presináptica
2. Neurona post-sináptica
3. Microelectrodo ubicado en la
neurona presináptica. A través de él
se pueden aplicar estímulos
electricos (pulsos)
4. Esquema que representa un estímulo
eléctrico, cuya intensidad (voltaje)
está representada por su altura y
cuya duración está representada por
su ancho
5. Microelectrodo ubicado en la parte
presináptica de la sinapsis eléctrica
6. Respuesta eléctrica que registra con
5 en la parte presináptica
7. Parte post-sináptica
8. microelectrodo que registra el
potencial post-sináptico (9)
9. Potencial post-sináptico
10. Sinapsis eléctrica
La información que activa a las dendritas es convertida en el soma en una
señal eléctrica llamada potencial de acción. Esta señal viaja a lo largo del axón a
una velocidad de centenares de metros por minuto.
En la terminación del axón el potencial de acción promueve la liberación de
los neurotransmisores. Estos se difunden hacia la neurona vecina (post-sináptica)
donde activan receptores específicos capaces de modificar la actividad eléctrica.
A su vez, esta información podrá generar un nuevo potencial de acción en la
segunda neurona.
2
http://www.puc.cl/sw_educ/neurociencias/esquemas/089.gif
Nancy N. Sepúlveda
13
REDES NEURONALES ARTIFICIALES
Moléculas de comunicación entre neuronas.
Los neurotransmisores (NTs) representan las moléculas a través de las
cuales se comunican las células y especialmente las neuronas entre sí. Son varios
los criterios para definir a una molécula como neurotransmisor:
 la molécula debe ubicarse en la célula presináptica.
 la molécula debe liberarse cuando se hiperpolariza la parte presináptica.
 en la célula post-sináptica se ubican receptores específicos para el NT.
 debe existir un mecanismo que termine la acción del NT.
Cuando una fibra nerviosa es estimulada (despolarizada) se inicia un impulso
nervioso o potencial de acción. Éste tiene dos fases: una fase inicial producida
por la entrada rápida de iones de sodio al interior de la célula, a través de
canales de la membrana del axón que son sensibles al voltaje de la misma. La
rápida entrada de estas cargas positivas hacen que el valor negativo del interior
de la célula en la región estimulada, disminuya rápidamente hacia la positividad.
La segunda fase del potencial de acción ocurre por la apertura retardada de
canales potásicos que hacen que este ion salga de la célula (recordemos que
normalmente los iones de K+ están mucho más concentrados al interior que al
exterior), contribuyendo así a una mayor despolarización (la falta de polarización
significa la ausencia de una diferencia de potencial, o sea, un valor cercano o igual
a cero voltios) de la membrana, pero también a una inactivación de los canales de
sodio. Este último fenómeno ya anuncia la repolarización membranal.
El movimiento de corriente eléctrica alrededor del sitio despolarizado hace
que los canales iónicos situados en la vecindad también se activen, produciendo
una cascada de excitación membranal, y de esta manera, la propagación del
impulso nervioso a todo lo largo de la fibra.
Nancy N. Sepúlveda
14
REDES NEURONALES ARTIFICIALES
El potencial de acción: bases iónicas. Aquí se muestra el corte de una fibra
nerviosa donde se ilustran las diferencias de concentración de iones dentro y
fuera del citoplasma: en estado de reposo (I) el sodio (Na+) tiene mayor
concentración fuera de la célula, mientras que el potasio (K +) es más abundante
en el interior de la célula. Estas diferencias de concentración iónica producen
un desequilibrio eléctrico: el interior de la célula es más negativo que el
exterior. Esta electronegatividad, causada por la presencia de canales iónicos
y bombas o transportadores (T) que mueven los iones de un lado a otro de la
membrana, hace que la célula sea excitable. Cuando llega el impulso nervioso
(cabeza de flecha en la porción media de la figura), la polaridad se invierte
pues el Na+ entra rápidamente a la célula, al tiempo que sale el K+, produciendo
una despolarización: la carga de la membrana pasa de negativa a positiva (2).
La repolarización (el retorno al estado de excitabilidad previo o de reposo) se
logra cuando las bombas membranales (T), las cuales funcionan por la energía
proveniente de la conversión de ATP en ADP, sacan el Na+ y vuelven a
introducir el K+ (de nuevo, al estadio ilustrado en I). Éste es el proceso
participante en la excitación. En la inhibición el ion cloro (Cl -) desempeña un
papel importante, aumentando su concentración intracelular.
Nancy N. Sepúlveda
15
REDES NEURONALES ARTIFICIALES
Sistema de transporte y liberación de neurotransmisores.
Algunos transportadores ubicados en los terminales nerviosos cumplen un
papel central en el proceso del término de la acción del neurotransmisor. Este es
un proceso fundamental en la neurotransmisión química ya que exceso de
neurotransmisor en el espacio sináptico llevaría al bloqueo de la sinapsis. Estos
transportadores de los terminales nerviosos son capaces de secuestrar
rápidamente al neurotransmisor liberado, reincorporándolo en el terminal
nervioso. Algunos transportadores pueden funcionar, sin embargo, como
transportadores reversos, es decir, sacan neurotransmisores desde el terminal.
El neurotransmisor puede salir del terminal nervioso por mecanismos
exocitósicos
y
no-exocitósicos.
Existe
una
liberación
espontánea
del
neurotransmisor, la liberación basal, que en condiciones de reposo neuronal suele
ser bastante regular y estable. Esa liberación basal aumenta sustancialmente
cuando el número de potenciales de acción que invaden el terminal aumentan.
Los terminales nerviosos también están inervados por otros terminales
liberan neurotransmisores que pueden ser excitadores o inhibidores.
Los receptores y la activación de neuronas.
Los receptores químicos de la membrana plasmática ubicados en el soma o
en la región dendrítica son los que reciben la información que les llegan desde los
terminales nerviosos que inervan la neurona. Es la naturaleza inhibidora o
excitadora de esos receptores la que determinará si esa neurona será estimulada
(aumento en ella de la generación de potenciales de acción o de "trenes" de
potenciales) o será inhibida (disminución del número de potenciales que genera en
reposo o silenciada).
Los NT actúan sobre receptores excitadores provocando como respuestas
locales, pequeñas hipopolarizaciones en el dominio de esos receptores.
Nancy N. Sepúlveda
16
REDES NEURONALES ARTIFICIALES
REDES DE NEURONAS
La
neurona
es una
plataforma
de análisis,
control
y seguimiento
neurointeligente de información, destinada a la gestión de información y ayuda a
la toma de decisiones. Permite la interrelación de información de forma
inteligente, en tiempo real y a medida. El sistema aprende de los procesos
realizados, ajustándose a los intereses del usuario. Es una auténtica ayuda a la
toma de decisiones, permite un ahorro de tiempo, esfuerzo y mejora de la
eficiencia incomparable con otras herramientas.
Técnicamente, la plataforma está formada por agentes inteligentes y redes
neuronales, que le confieren la capacidad de entender y aprender. El cerebro
humano continuamente recibe señales de entrada de muchas fuentes y las
procesa a manera de crear una apropiada respuesta de salida. Nuestros cerebros
cuentan con millones de neuronas que se interconectan para elaborar "Redes
Neuronales". Estas redes ejecutan los millones de instrucciones necesarias para
mantener una vida normal.
Se estima que el cerebro humano contiene más de cien mil millones (10 11) de
neuronas y 1014 sinápsis en el sistema nervioso humano. Estudios sobre la
anatomía del cerebro humano concluyen que hay más de 1000 sinapsis a la
entrada y a la salida de cada neurona. Es importante notar que aunque el tiempo
de conmutación de la neurona ( unos pocos milisegundos) es casi un millón de
veces menor que en los actuales elementos de las computadoras, ellas tienen una
conectividad miles de veces superior que las actuales supercomputadoras.
El objetivo principal de las redes neuronales de tipo biológico es desarrollar
un elemento sintético para verificar las hipótesis que conciernen a los sistemas
biológicos.3
3
http://www.gr.ssr.upm.es/inves/neural/ann2/anntutorial.html
Nancy N. Sepúlveda
17
REDES NEURONALES ARTIFICIALES
CAPÍTULO II
REDES
NEURONALES
ARTIFICIALES
Nancy N. Sepúlveda
18
REDES NEURONALES ARTIFICIALES
REDES NEURONALES ARTIFICIALES
¿QUÉ ES UNA RED NEURONAL?
La industria de ordenadores ha mostrado un progreso espectacular en muy
corto tiempo. El viejo modelo de tener un solo ordenador para satisfacer todas
las necesidades de cálculo de una organización se está reemplazando con rapidez
por otro que considera un número grande de ordenadores separados, pero
interconectados, que efectúan el mismo trabajo. Estos sistemas, se conocen con
el nombre de redes de ordenadores. Estas nos dan a entender una colección
interconectada de ordenadores autónomos. Se dice que los ordenadores están
interconectados, si son capaces de intercambiar información. La conexión no
necesita hacerse a través de un hilo de cobre sino mediante el uso de láser,
microondas y satélites de comunicaciones. Al indicar que los ordenadores son
autónomos, excluimos los sistemas en los que un ordenador pueda forzosamente
arrancar, parar o controlar a otro, éstos no se consideran autónomos.
REDES NEURONALES ARTIFICIALES
Las Redes Neuronales Artificiales (RNA) son dispositivos o software
programado de manera tal que funcionen como las neuronas biológicas de los
seres vivos. A continuación hablaremos un poco sobre ellas.
Las redes de neuronas artificiales (RNA) son máquinas que poseen esa
capacidad de aprendizaje. Esos artefactos han sido propuestos como modelos
(extremadamente) simplificados del funcionamiento del cerebro, pues no
retienen más que algunas características esenciales:
Nancy N. Sepúlveda
19
REDES NEURONALES ARTIFICIALES
 Las neuronas no pueden encontrarse más que en dos estados posibles,
activas o en reposo;
 Están interconectadas mediante sinapsis que pueden ser modificadas por
aprendizaje;
 El estado de una neurona a cada instante es determinado por el de otras,
información que es transmitida por las sinapsis.
Las redes neuronales formadas por los perceptrones se interconectan en
forma muy similar a como las neuronas humanas se disponen en la corteza
cerebral humana, y lo más importante, son capaces de asociar y generalizar sin
reglas. Han sido utilizadas con gran éxito para reconocer retornos de sonar bajo
el agua, escritura a mano, voz, topografía de terrenos, controlar brazos de
robots, evaluar datos personales, modelar fenómenos cognocitivos, y, predecir
tendencias financieras.
La clase de problemas que mejor se resuelven con las redes neuronales son
los mismos que el ser humano resuelve mejor: Asociación, evaluación, y
reconocimiento de patrones. Las redes neuronales son perfectas para problemas
que son muy difíciles de calcular pero que no requieren de respuestas perfectas,
sólo respuestas rápidas y buenas.
Por otra parte, las redes neuronales son muy malas para cálculos precisos,
procesamiento serie, y no son capaces de reconocer nada que no tenga
inherentemente algún tipo de patrón. Es por esto, que no pueden predecir la
lotería, ya por definición es un proceso al azar.
Existen varias formas de hacer las conexiones en una RNA, así como existen
varias formas de conectar neuronas biológicas en el cerebro. Cada tipo sirve para
diferentes procesos, el elegir la correcta topología y sus características, es
imprescindible para lograr fácilmente la solución del problema.
Nancy N. Sepúlveda
20
REDES NEURONALES ARTIFICIALES
CARACTERÍSTICAS DE LAS REDES NEURONALES ARTIFICIALES
Las características principales de las redes neuronales artificiales son las
siguientes:

Auto Organización y Adaptatividad: utilizan algoritmos de aprendizaje
adaptativo y auto organización, por lo que ofrecen posibilidades de procesado
robusto y adaptativo.

Procesado No Lineal: aumenta la capacidad de la red de aproximar,
clasificar y su inmunidad frente al ruido.

Procesado paralelo: normalmente se usa un gran número de células de
procesado por el alto nivel de interconectividad.
Estas características juegan un importante papel en las redes neuronales
artificiales aplicadas al procesado de señal e imagen. Una red para una
determinada aplicación presenta una arquitectura muy concreta, que comprende
elementos de procesado adaptativo masivo paralelo combinadas con estructuras
de interconexión de red jerárquica. A su vez, difieren entre sí por diversos
aspectos: sus motivaciones biológicas, su modo de funcionamiento o su campo de
aplicaciones. Algunas técnicas neuronales avanzadas son llamadas constructivas,
ya que modifican la arquitectura misma de la red en un proceso antagónico de
crecimiento-aprendizaje/disminución-olvido.
Las RNA, por su parte, retienen y explican el procesamiento paralelo y
distribuido de la actividad neuronal.
Los mecanismos moleculares involucrados en el aprendizaje en los
organismos dotados de sistema nervioso se manifiestan en la modificación de los
coeficientes de transmisión sináptica entre neuronas conectadas en secuencia.
La fuerte estructuración del sistema nervioso en los mamíferos superiores,
que agrupa decenas de miles de millones (1011) de neuronas en sólo algunos
cientos de láminas neuronales, agrupadas en algunas decenas de centros, e
Nancy N. Sepúlveda
21
REDES NEURONALES ARTIFICIALES
incluso la organización de microcircuitos neuronales como los observados en el
córtex constituyendo columnas corticales, ha sido exitosamente replicada en
modelos neuronales.
Las áreas de aplicación de métodos conexionistas en „Ingeniería Neuronal‟
incluyen entre otras, algunas tan diversas como la búsqueda de soluciones
óptimas
en
problemas
combinatorios
complejos,
el
reconocimiento
de
configuraciones en ambientes ruidosos, el análisis de señales y de imágenes, la
ingeniería
del
conocimiento,
el
diagnóstico
automático
en
medicina,
el
procesamiento de voz, la visión computacional y el reconocimiento invariante de
objetos.
Existe, sin embargo, una diferencia sustancial entre el enfoque simbólico y
el enfoque neuronal. En el primer caso, la tarea principal del Ingeniero de
Conocimientos que desarrolla un Sistema Experto es la extracción y comprensión
de las reglas de inferencia utilizadas por un experto en la resolución de un
problema. Estas reglas serán implementadas en el motor de inferencias del
Sistema Experto. En el segundo enfoque, en cambio, el Ingeniero Neuronal debe
tener acceso a una amplia base de datos y debe ser capaz de seleccionar en ella
un conjunto de casos suficientemente representativos y confiablemente
clasificados por el experto para entrenar con ellos a la red neuronal. La red así
entrenada deberá operar adecuadamente sobre los casos del conjunto
complemento del usado en el entrenamiento. Cuando el conocimiento declarativo
del experto es fácilmente formalizable por medio de reglas, los Sistemas
Expertos parecen recomendables. El conocimiento reflexivo, en cambio, es
representado más fácilmente por casos debidamente clasificados, y las RNA
pueden aportar aquí adecuadas soluciones.
Las redes neuronales artificiales pueden tener factores de peso fijos o
adaptables. Las que tienen pesos adaptables emplean leyes de aprendizaje para
Nancy N. Sepúlveda
22
REDES NEURONALES ARTIFICIALES
ajustar el valor de la fuerza de un interconección con otras neuronas. Si las
neuronas utilizan pesos fijos, entonces su tarea deberá estar previamente
definida. Los pesos serán determinados a partir de una descripción completa del
problema. Por otra parte, los pesos adaptables son esenciales si no se conoce
previamente cual deberá de ser su valor correcto.
FUNCIONAMIENTO DE LAS REDES NEURONALES ARTIFICIALES
En la siguiente figura se representa una neurona "artificial", que intenta
modelar el comportamiento de la neurona biológica. Aquí el cuerpo de la neurona
se representa como un sumador lineal de los estímulos externos zj, seguida de
una función no lineal yj = f(zj). La función f(zj) es llamada la función de
activación, y es la función que utiliza la suma de estímulos para determinar la
actividad de salida de la neurona.
Figura Neurona Artificial. 4
4
http://electronica.com.mx/neural/informacion/neurona_art.gif
Nancy N. Sepúlveda
23
REDES NEURONALES ARTIFICIALES
FUNCIONES DE BASE Y ACTIVACIÓN
Una red neuronal típica se puede caracterizar por las descripciones
funcionales de la red de conexión y la red de activación.
Función de Base (Función de Red)
Para un estudio analítico, las redes de conexión son matemáticamente
representadas por la función de base (w,x), donde w es la matriz de pesos, y x el
vector de entrada. La función de base tiene dos formas típicas:
1. Función Lineal de Base (LBF) es una función de tipo hiperplano. Esto es, una
función de primer orden. El valor de red es una combinación lineal de las
entradas.
2. Función de Base Radial (RBF) es una función de tipo hiperesférico. Esto implica una función de base de segundo orden no lineal. El valor de red representa
la distancia a un determinado patrón de referencia. La función de segundo
orden se puede extender a otra más general llamada función de base Elíptica.
La función de Base Elíptica se basa en asumir que el espacio de
características es uniformemente normalizado en todas direcciones. En la
práctica, de todas formas, distintas características pueden tener distintos
grados de importancia dependiendo en el modo que sean medidos. Esto lleva a la
adopción de funciones discriminantes elípticas mas versátiles. La forma mas
general de una función de segundo orden es la función de base hiperelíptica.
Función de Activación (Función de neurona)
El valor de red, expresado por la función de base, u(w,x), será
inmediatamente transformada por una función de activación no lineal. Por
ejemplo, las funciones de activación más comunes son la función paso, rampa o
sigmoidal y gausiana.
Nancy N. Sepúlveda
24
REDES NEURONALES ARTIFICIALES
El conocimiento de una red neuronal artificial se encuentra en la función de
activación utilizada y en los valores de sus pesos.
TAXONOMÍA DE LAS REDES NEURONALES ARTIFICIALES
Existen dos fases en toda aplicación de las redes neuronales: la fase de
aprendizaje o entrenamiento y la fase de prueba. En la fase de entrenamiento, se
usa un conjunto de datos o patrones de entrenamiento para determinar los pesos
(parámetros de diseño) que definen el modelo neuronal. Una vez entrenado este
modelo, se usará en la llamada fase de prueba o funcionamiento directo, en la que
se procesan los patrones de prueba que constituyen la entrada habitual de la red,
analizándose de esta manera las prestaciones definitivas de la red.
 Fase de Prueba: los parámetros de diseño de la red neuronal se han
obtenido a partir de unos patrones representativos de las entradas que se
denominan patrones de entrenamiento. Los resultados pueden ser tanto
calculados de una vez como adaptados iterativamente, según el tipo de red
neuronal, y en función de las ecuaciones dinámicas de prueba. Una vez
calculados los pesos de la red, los valores de las neuronas de la última capa, se
comparan con la salida deseada para determinar la validez del diseño.
 Fase de Aprendizaje: una característica de las redes neuronales es su
capacidad de aprender. Aprenden por la actualización o cambio de los pesos
sinápticos que caracterizan a las conexiones. Los pesos son adaptados de
acuerdo a la información extraída de los patrones de entrenamiento nuevos
que se van presentando. Normalmente, los pesos óptimos se obtienen
optimizando (minimizando o maximizando) alguna "función de energía". Por
ejemplo, un criterio popular en el entrenamiento supervisado es minimizar
el least-square-error (error cuadrático medio) entre el valor del maestro y el
valor de salida actual.
Nancy N. Sepúlveda
25
REDES NEURONALES ARTIFICIALES
La gran diferencia del empleo de las redes neuronales en relación con otras
aplicaciones de la computación radica en que no son algorítmicas, esto es no se
programan haciéndoles seguir una secuencia predefinida de instrucciones. Las
redes neuronales artificiales generan por sí mismas sus propias "reglas", para
asociar la respuesta a su entrada; es decir, aprende por ejemplos y de sus
propios errores.
Las redes neuronales artificiales adaptables tienen dos fases en su
operación.
1. Entrenamiento de la red. El usuario proporciona a la red un número
"adecuado" de estímulos de entrada, y de salida, la red entonces ajusta su
pesos de interconección o sinápsis hasta que la salida de la red esta "lo
suficientemente cerca" de la salida correcta.
2. Recuperación de lo aprendido. A la red se le presenta un conjunto de
estímulos de entrada y ésta simplemente calcula su salida. Cuando la red
emplea entrenamiento no supervisado, algunas veces será necesario que
reajuste su sinápsis durante la fase de recuperación.
ESTRUCTURAS DE LAS REDES NEURONALES ARTIFICIALES
Una red neuronal se determina por la neurona y la matriz de pesos. El
comportamiento de la red depende en gran medida del comportamiento de la
matriz de pesos. Hay tres tipos de capas de neuronas: la de entrada, las ocultas y
la de salida. Entre dos capas de neuronas existe una red de pesos de conexión,
que puede ser de los siguientes tipos: hacia delante, hacia atrás, lateral y de
retardo.

Conexiones hacia adelante: para todos los modelos neuronales, los datos de
las neuronas de una capa inferior son propagados hacia las neuronas de la capa
superior por medio de las redes de conexiones hacia adelante.
Nancy N. Sepúlveda
26
REDES NEURONALES ARTIFICIALES

Conexiones hacia atrás: estas conexiones llevan los datos de las neuronas
de una capa superior a otras de la capa inferior.

Conexiones laterales. Un ejemplo típico de este tipo es el circuito "el
ganador toma todo" (winner-takes-all), que cumple un papel importante en la
elección del ganador.

Conexiones con retardo: los elementos de retardo se incorporan en las
conexiones para implementar modelos dinámicos y temporales, es decir,
modelos que precisan de memoria.
Las conexiones sinópticas pueden ser total o parcialmente interconectadas.
También es posible que las redes sean de una capa con el modelo de pesos hacia
atrás o bien el modelo multicapa hacia adelante. Es posible, así mismo, el
conectar varias redes de una sola capa para dar lugar a redes más grandes.
En una red multicapa de propagación hacia adelante, puede haber una o más
capas ocultas entre las capas de entrada y salida. El tamaño de las redes depende
del numero de capas y del número de neuronas ocultas por capa.

Número de capas: en una red multicapa, hay una o más capas de
neuronas ocultas entre la entrada y la salida. El número de capas se cuenta a
menudo a partir del número de capas de pesos (en vez de las capas de
neuronas).

Número de unidades ocultas: El número de unidades ocultas está
directamente relacionado con las capacidades de la red. Para que el
comportamiento de la red sea correcto (esto es, generalización), se tiene que
determinar apropiadamente el número de neuronas de la capa oculta.5
5
http://www.gr.ssr.upm.es/inves/neural/ann2/anntutorial.html
Nancy N. Sepúlveda
27
REDES NEURONALES ARTIFICIALES
CAPÍTULO III
MODELOS:
SUPERVISADO Y
NO SUPERVISADO
Nancy N. Sepúlveda
28
REDES NEURONALES ARTIFICIALES
CLASIFICACIÓN Y APRENDIZAJE DE LAS REDES NEURONALES
ARTIFICIALES
La clasificación es la atribución de una clase específica a un objeto. Para una
máquina, la clasificación de rostros, datos médicos o imágenes son tareas
bastante difíciles, en tanto que para un humano son cuestiones cotidianas. Un
ejemplo podría ser el reconocimiento de caracteres manuscritos, una técnica que
puede ser utilizada para resolver este problema es el aprendizaje. Así, el criterio
para decidir si una imagen corresponde a una letra A, B, C... consiste en comparar
si es lo suficientemente similar a otras A B o C vistas anteriormente; con ese
enfoque, uno no calcula la clasificación de letras, sino que se aprenden a partir de
ejemplos.
La capacidad de aprendizaje de las RNA les da una inmensa ventaja sobre
métodos tradicionales, ya que tan sólo se requiere disponer de un conjunto de
ejemplos (conjunto de aprendizaje) para que la red pueda aprender. Es por ello
que las redes de neuronas son ampliamente utilizadas en aplicaciones tan variadas
como la previsión, la predicción, la clasificación, el diagnóstico automático, el
procesamiento de señales, el reconocimiento de formas, la comprensión de datos,
la optimización combinatoria, la robótica y la búsqueda de documentos, entre
otras.
La capacidad de clasificación de la red neuronal depende del valor de los
pesos sinápticos, que pueden ser preestablecidos o entrenados adaptativamente
mediante mecanismos de aprendizaje. Las redes neuronales artificiales se
pueden clasificar, atendiendo a como sean entrenados los pesos sinápticos, en
dos grandes categorías: estas son los modelos supervisados y los no supervisados.
El primero ocurre cuando se le proporciona a la red tanto la entrada como la
salida correcta, y la red ajusta sus pesos tratando de minimizar el error de su
salida calculada. Este tipo de entrenamiento se aplica, por ejemplo, en el
Nancy N. Sepúlveda
29
REDES NEURONALES ARTIFICIALES
reconocimiento de patrones. El entrenamiento no supervisado se presenta cuando
a la red se le proporcionan únicamente los estímulos, y la red ajusta sus
interconecciones basándose únicamente en sus estímulos y la salida de la propia
red. Las leyes de aprendizaje determinan cómo la red ajustará sus pesos
utilizando una función de error o algún otro criterio. La ley de aprendizaje
adecuada se determina en base a la naturaleza del problema que se intenta
resolver.
REDES NEURONALES ARTIFICIALES NO SUPERVISADAS
Para los modelos de entrenamiento No Supervisado, el conjunto de datos de
entrenamiento consiste sólo en los patrones de entrada. Por lo tanto, la red es
entrenada sin el beneficio de un maestro. La red aprende a adaptarse basada en
las experiencias recogidas de los patrones de entrenamiento anteriores.
Una clase de modelos de entrenamiento no supervisado son las redes de
pesos fijos. Un ejemplo son las redes de Memoria Asociativa, que se usan para
obtener patrones originales libres de ruido a partir de señales incompletas o
distorsionadas. La principal característica de las redes asociativas de pesos fijos
es que sus pesos son preestablecidos y precalculados.
Los modelos de pesos fijos tienen aplicaciones limitadas ya que no se pueden
adaptar a "ambientes cambiantes". Hay otra variedad de redes no supervisadas,
llamadas Redes de Aprendizaje Competitivo, cuyos pesos se adaptan de acuerdo
con reglas de aprendizaje no supervisadas. Estas redes pueden aprender en
ausencia de un maestro. En otras palabras, el entrenamiento se basa únicamente
en la información de los patrones de entrada.
REDES DE MEMORIA PROASOCIATIVA
Una red de asociación básica tiene una capa de neuronas de entrada y una
capa de neuronas de salida.
Nancy N. Sepúlveda
30
REDES NEURONALES ARTIFICIALES
 Memoria Asociativa Lineal (LAM)
Una red de memoria asociativa es matemáticamente un mapeado de un
espacio de entrada sobre uno de salida. Las redes de memoria asociativa se
pueden usar tanto para las aplicaciones autoasociativas como para las
heteroasociativas. En las aplicaciones autoasociativas, la dimensión del espacio de
entrada es igual al de salida. Por otro lado, en la aplicación heteroasociativa, la
dimensión del espacio de entrada y del espacio de salida son en general
diferentes. Los valores de entrada y de salida pueden ser reales o binarios.
 Redes de memoria asociativa de pesos fijos.
Las redes neuronales artificiales pueden tener factores de peso fijos o
adaptables. Las que tienen pesos adaptables emplean leyes de aprendizaje para
ajustar el valor de la fuerza de una interconección con otras neuronas. Si las
neuronas utilizan pesos fijos, entonces su tarea deberá estar previamente
definida. Los pesos serán determinados a partir de una descripción completa del
problema. Por otra parte, los pesos adaptables son esenciales si no se conoce
previamente cual deberá de ser su valor correcto.
REDES DE APRENDIZAJE COMPETITIVO
Una red básica de aprendizaje competitivo tiene una capa de neuronas de
entrada y una capa de neuronas de salida. Un patrón de entrada x es un simple
punto en el espacio real o binario de vectores n-dimensional. Los valores binarios
(0 ó 1) de representación local son más usados en los nodos de salida. Esto es,
hay tantas neuronas de salida como número de clases y cada nodo de salida
representa una categoría de patrones.
Una red de aprendizaje competitivo está formada por una(s) red(es)
excitadora hacia adelante y la(s) red(es) inhibidora(s) lateral(es). La red hacia
adelante normalmente implementa una regla de excitación de aprendizaje de
Hebb. Esta regla consiste en que cuando una neurona participa constantemente
Nancy N. Sepúlveda
31
REDES NEURONALES ARTIFICIALES
en activar una neurona de salida, la influencia de la neurona de entrada es
aumentada. La red lateral es inhibidora por naturaleza. Esta red realiza la misión
de selecionar el ganador, normalmente por medio de un método de aprendizaje
competitivo.
Los procedimientos de clasificación no supervisados se basan a menudo en
algunas técnicas de clasificación, que forman grupos de patrones parecidos. Esta
técnica de clasificación es muy útil para la clasificación. Además, juega un papel
muy importante en las redes de aprendizaje competitivo. Para un procedimiento
de clasificación, es necesario definir una distancia o medida de similaridad, para
evaluar el grado de semejanza de los patrones.
 Redes de Aprendizaje Competitivo básicas
Sin la supervisión de ningún maestro, las redes no supervisadas adaptan los
pesos y verifican los resultados únicamente a partir de los patrones de entrada.
Un esquema que se usa mucho para la adaptación de los pesos es la regla de
aprendizaje competitivo, que hace que las células compitan por el derecho a
responder por ellas mismas por un determinado tipo de entrada. Esto se puede
ver como un sistema muy sofisticado de clasificación, cuyo objetivo es dividir un
conjunto de patrones de entrada en un número de clases tal que los patrones de
la misma clase exhiben un cierto grado de similaridad.
 Modelo básico de Aprendizaje
Un sistema de este tipo consiste en redes laterales y de propagación hacia
adelante con un número fijo de nodos de salida, esto es, un número fijo de clases.
Los nodos de entrada y salida tienen valores binarios únicamente.
 Reglas de entrenamiento basadas en pesos normalizados
Con el fin de asegurar un ambiente de competición equitativo, las suma de
todos los pesos que van a dar las neuronas de salida deben estar normalizados.
Nancy N. Sepúlveda
32
REDES NEURONALES ARTIFICIALES
Entonces, si una unidad gana la competición, cada una de sus líneas de
entrada cede una proporción de su peso, y la distribuye igualmente entre las
líneas de entrada activas.
Una característica importante de esta regla de entrenamiento es que la
normalización es incorporada en el momento de la actualización, de forma que la
suma de los pesos sinápticos a cualquier salida es 1.
 Reglas de aprendizaje para "Leaky Learning" (aprendizaje débil)
Con el fin de preveer la existencia de neuronas que no aprenden en
totalidad, se usa el aprendizaje débil. Puesto que una neurona solo aprende si
gana en algún momento, es posible que una célula nunca gane, y por lo tanto nunca
aprenda. Una forma de solucionar este problema es que todos los pesos de la red
intervengan en el entrenamiento con distintos niveles de aprendizaje.
Las neuronas que pierden en la competición sufren un aprendizaje menor que
las neuronas ganadoras. Este cambio tiene la propiedad de que las neuronas
perdedoras se van desplazando hacia la región donde yace el estímulo actual,
donde empiezan a capturar algunas unidades, superando a las técnicas dinámicas
convencionales.
REDES NEURONALES ARTIFICIALES SUPERVISADAS
Las redes neuronales artificiales de entrenamiento supervisado constituyen
la línea fundamental de desarrollo en este campo. En el entrenamiento
supervisado hay dos fases a realizar: fase de prueba y fase de entrenamiento,
que ya se analizaron en el capítulo anterior.
En el entrenamiento supervisado, los patrones de entrenamiento se dan en
forma de pares de entrada/maestro, donde M es el número de pares de
entrenamiento. Dependiendo de la naturaleza de la información del maestro, hay
dos aproximaciones al entrenamiento supervisado. Uno se basa en la corrección a
Nancy N. Sepúlveda
33
REDES NEURONALES ARTIFICIALES
partir de una decisión y la otra se basa en la optimización de un criterio de coste.
De la última, la aproximación del error cuadrático medio es el más importante.
Las formulaciones de decisión y aproximación difieren en la información que
tienen los maestros y la forma de usarla.
 Redes Neuronales basadas en la decisión
El perceptrón lineal se aplica sólo cuando las clases de patrones se sabe que
son separables por límites de decisión lineales. En contra, el perceptrón no lineal
ofrece un dominio mucho mayor de aplicaciones. Al entrenar una red compleja, la
clave es el principio de asignación de créditos basado en la decisión distributiva.
En la regla de entrenamiento basada en la decisión, se actualizan los pesos
sólo cuando se produce un error en la clasificación. La regla de entrenamiento es
localizada y distributiva. Esta comprende el aprendizaje reforzado y la subred
correspondiente a la clase correcta y el entrenamiento anti reforzado en la
subred ganadora. Puesto que el límite de decisión depende de la función
discriminante, es natural ajustar el límite de decisión ajustando el vector de los
pesos w tanto en la dirección de el gradiente de la función discriminante (es
decir, entrenamiento reforzado) o en la dirección contraria (es decir,
entrenamiento anti reforzado).
 Regla de entrenamiento basada en la decisión
En esta regla de entrenamiento, el vector de pesos w se mueve a lo largo de
la dirección positiva del gradiente, así que la función del valor discriminante
aumentará, aumentando la posibilidad de la selección del futuro patrón. El
entrenamiento anti reforzado mueve w a lo largo de la dirección negativa del
gradiente, así que el valor de la función discriminante disminuirá, disminuyendo
así la posibilidad de su futura elección.
Nancy N. Sepúlveda
34
REDES NEURONALES ARTIFICIALES
 Redes Neuronales de Aproximación/Optimización
Las formulaciones basadas en la aproximación se pueden ver como una
aproximación/regresión para el conjunto de datos entrenados. Los datos para el
entrenamiento se dan en pares de entrada/maestro (deseado), donde M es el
número de patrones de entrenamiento. Los valores deseados en los nodos de
salida correspondientes a los patrones de entrada los llamaremos maestros. El
objetivo del entrenamiento de la red es encontrar los pesos óptimos para
minimizar el error entre los valores del maestro y las salidas de respuesta actual.
Un criterio popular es minimizar los errores cuadráticos medios entre el maestro
y la salida actual. Para adquirir una capacidad de aproximación no lineal, se usan
frecuentemente las redes multicapa.
La función que representa el modelo es función de las entradas y de los
pesos. En la formulación básica del modelo de aproximación, el procedimiento
implica el encontrar los pesos que minimizan el least-squares-error (error
cuadrático medio).
En la fase de prueba, la célula que gana a la salida es la célula que da la
máxima respuesta al patrón de entrada.
En la formulación de optimización, la función de energía debe ser
específicamente elegida.
Nancy N. Sepúlveda
35
REDES NEURONALES ARTIFICIALES
ALGORITMO DE KOHONEN
El algoritmo SOM de Kohonen es uno de los algoritmos de redes neuronales
artificiales más populares y poderosos. Está basado en aprendizaje no
supervisado. Los SOMs son una clase única de red neuronal, pues construyen
mapeos bidimensionales de las relaciones estadísticas de los datos de entrada
que preservan su topología.
Estructuralmente consiste solamente de dos capas: una capa unidimensional
de neuronas de entrada y una capa de neuronas de salida llamada capa
competitiva; esta última organizada en una malla bidimensional. En la figura se
muestra una red con 2 neuronas de entrada y 25 neuronas en la capa competitiva.
Cada neurona de entrada está conectada a cada neurona de la capa
competitiva. La capa de entrada modela un vector de características, cada
neurona o nodo es un modelo de una observación, y tiene la misma función que en
otros tipos de redes. Las neuronas de la capa competitiva tienen una propiedad
diferente pues pueden encontrar las relaciones entre los patrones de entrada
que procesan. Sean el número de neuronas en la capa de entrada y x = (x 1,x2,...xn)
Nancy N. Sepúlveda
36
REDES NEURONALES ARTIFICIALES
en Rn el conjunto de valores de las neuronas de entrada, es decir, un patrón de
entrenamiento cualquiera.
Sea m el número de neuronas en la capa competitiva y u = (u 1,u2,...um) el
conjunto total de neuronas en la capa competitiva. Llamamos u i a la i-ésima
neurona en esta capa.
Cada neurona ui de la capa competitiva recibe n conexiones (de las n
neuronas de la capa de entrada), cada una con un peso asociado. El conjunto o
vector de pesos que recibe ui es mi = (mi1,mi2,...,min).
La malla en qué está organizada la capa competitiva puede ser rectangular o
hexagonal. En la figura siguiente se presenta una malla rectangular con una
neurona y su vecindad resaltados.
Aquí se toma como entrada un patrón de entrenamiento seleccionado
aleatoriamente. Este patrón es presentado a la capa de entrada, y la idea es
encontrar una neurona competitiva cuyo vector de pesos permita que se asemeje
más o esté más cercana al patrón de entrada. Una vez seleccionada la neurona
competitiva ganadora, se selecciona una vecindad en la cual serán actualizados los
vectores de pesos de acuerdo a una función de vecindad. El tamaño de la
vecindad
y
la
función
de
vecindad
son
decrecientes
en
cada
paso
Nancy N. Sepúlveda
37
REDES NEURONALES ARTIFICIALES
convenientemente seleccionados. Se realiza este procedimiento para todos los
patrones de entrada, un cierto número de pasos predefinidos.
Sea x = (x1,x2,...xn) un patrón de entrada y mi = (mi1,mi2,...,min) el vector de
pesos que recibe la neurona competitiva ui desde la capa de entrada.
Para cada paso t=0,1,...,T, se selecciona un patrón de entrada x y se
encuentra una neurona competitiva ganadora, denotada por m c, tal que
|| x(t) - mc(t) || =< || x(t) - mi(t) || FORALL i
o bien
|| x(t) - mc(t) || = min i || x(t) - mi(t) ||
donde || . || denota la norma de x-mi, o la distancia euclidiana de la neurona
ui dado un patrón de entrada x
|| x - mi || = SQRT(SUMj=1n(xj-mij)2)
Después, se actualizan los vectores de pesos de las neuronas en la vecindad
de la neurona ganadora mc
mi(t+1) = mi(t) + hc,i(t)*(x(t) - mi(t))
donde hc,i(t) es la función de vecindad centrada en mc, es una función
decreciente de la distancia entre las unidades i-ésima y c-ésima y del tiempo.
Esta función define la región de influencia que tiene el patrón de entrada sobre
el SOM. Puede definirse como la gaussiana
hc,i(t) = ALPHA(t) * exp( -(||ri - rc||2)/(2* SIGMA2(t)) )
donde 0 < ALPHA(t) < 1 es el factor de aprendizaje, y es una función
decreciente con t. Comúnmente se utilizan una función lineal ALPHA(t) =
ALPHA(0)*(1-t/T) o una inversa ALPHA(t) = A/(t+B).
ri en R2 es la localización vectorial de la unidad i en la malla.
SIGMA(t) es el radio de la vecindad en el tiempo t. Es también una función
decreciente y puede definirse similarmente a ALPHA. Usualmente comienza con
un valor grande.
Nancy N. Sepúlveda
38
REDES NEURONALES ARTIFICIALES
La idea de la gaussiana es que las neuronas más cercanas a la ganadora serán
más afectadas en la actualización de su vector de pesos.
Una definición más sencilla de hc,i(t) es la siguiente
hc,i(t) = ALPHA(t) si ||ri - rc|| < SIGMA(t)
0
en otro caso
o lo que es lo mismo, es constante para las neuronas en la vecindad de radio
SIGMA de la neurona ganadora en el tiempo t, y 0 para las neuronas fuera de la
vecindad. Esto nos dice que solamente se actualizarán los vectores de pesos de
las neuronas en la vecindad y los demás no serán afectados.
En [NEUSCIENCES] se usa en lugar de la exponencial la función
hc,i(t) = ALPHA(t) * sin(||ri - rc||) / (2*||ri - rc||)
Este procedimiento se repite T veces.
Usualmente el proceso de entrenamiento se realiza en dos fases: la primera
fase con valores iniciales de ALPHA y SIGMA relativamente grandes, y la
segunda fase con valores pequeños. Esto corresponde a actualizaciones mayores
al principio y actualizaciones más finas al final.
El algoritmo de mapas auto-organizados crea modelos o abstracciones de
diferentes tipos de datos, por lo que se aplica a cualquier conjunto de datos en
general. Inicialmente era para aplicaciones en la ingeniería, pero actualmente su
uso va desde campos como la medicina y biología hasta la economía.
La mayor utilidad del SOM es que organiza los datos (o su representación o
modelo) en una malla bidimensional que permite un despliegue gráfico para la
visualización. Eso lo hace ideal para la exploración de datos, con aplicaciones por
ejemplo en datos socio-ecónomicos, análisis financieros, y para la recuperación de
información.
El SOM puede ser usado en combinación con redes supervisadas. Una red
supervisada requiere un objetivo o target, lo que muchas veces no está disponible
Nancy N. Sepúlveda
39
REDES NEURONALES ARTIFICIALES
en los datos existentes. Una red no supervisada puede usarse para definir ese
objetivo. Se entrena la red no supervisada y cada grupo posible pasa a ser un
objetivo de la red supervisada.
Algunos otros ejemplos de aplicaciones son:
 Data Cleaning. Los datos extraídos de una base de datos a analizar pueden
ser agrupados y el análisis puede hacerse sobre los grupos en lugar de sobre
la base de datos completa.
 Marketing. por ejemplo, para detectar grupos de consumidores con ciertas
características para dirigir hacia ellos la nueva campaña.
 Descubrir anomalías. En el monitoreo del funcionamiento de una máquina,
puede detectarse comportamiento anómalo clasificando el comportamiento
normal en grupos de funcionalidad, cuando un resultado no cae en ningún
grupo.
El
SOM
es
adecuado
para
el
análisis
y
visualización
de
datos
multidimensionales. Mapea las relaciones entre estos datos multidimensionales en
relaciones geométricas simples en una malla bidimensional, preservando las
relaciones topológicas y métricas de los datos originales.
El SOM es especialmente adecuado para el entendimiento de los datos, y
también para el modelado y la preparación de los datos.
Nancy N. Sepúlveda
40
REDES NEURONALES ARTIFICIALES
CONCLUSIÓN
Este trabajo de investigación, el cual tenía por objeto mostrar si la
hipótesis anteriormente planteada: “un sistema de información informático
tendría relación directa con el funcionamiento del sistema nervioso humano”, se
corroboraba o refutaba, concluye en que las redes neuronales artificiales
retienen y explican el procesamiento paralelo y distribuido de la actividad
neuronal.
Los mecanismos moleculares involucrados en el aprendizaje en los
organismos dotados del sistema nervioso se manifiestan en la modificación de los
coeficientes
de
transmisión
sináptica
entre
neuronas
secuencialmente
conectadas.
El objetivo de las redes neuronales artificiales consiste en imitar la forma
de comunicación entre las neuronas del sistema nervioso humano, utilizar
técnicas de aprendizaje, usando algoritmos neuronales increméntales con énfasis
en la clasificación de datos y el desarrollo de la teoría del aprendizaje.
Las redes neuronales artificiales son un modelo muy básico, como muestra el
ejemplo del algoritmo de Kohonen, y está muy lejos de imitar el complejo
mecanismo biológico creado por Dios.
Nancy N. Sepúlveda
41
REDES NEURONALES ARTIFICIALES
BIBLIOGRAFÍA
 www.puc.cl/sw_educ/neurociencias/html
 www.monografías.com
 http://iibce.edu.uy/vas/neuronas/abc.htm
 http://uam.es/centros/psicologia/paginas/biblioteca.html
 http://insm.es/glosariogr/glosarionsm
 http://personals.iddeo.es/wintrmute/ia/neuronal.htm
 www.gegi.polymtl.ca/info/jmtomore/publicaciones/reportes_jm/jornada-
aprendizaje.html
 www.e-libro.net/generos/libro.asp?id_libro=1814
 www.lania.mx/nivel3/aprendizaje.html
 www.gc.ssc.upm.es/inves/neural/ann2/anntutorial.html
 http://perso.wanadoo.es/icsalud/nervio.htm
 www.lafacu.com/apuntes/psicologia/apren_psico/default.htm
 www.psicoactiva.com/intelig.htm
 www.picoactiva/sueño.htm
 http://ciberconta.unizar.es/leccion/redes/inicio.html
 http://biologialmango.metropoliglobal.com/snc
 http://salud.discoveryespanol.com/saludhome.asp
 http://omega.ILCE.edu.mx:3000/sites/ciencia/volumen3/130/htm/sec
 www.nemotix.com/ index_2.php-w=16&s=39&sa=15&a=5.htm
 www.geocities.com/HotSprings/Spa/ 7712/ninos/cerebro-01.html
Nancy N. Sepúlveda
42
REDES NEURONALES ARTIFICIALES
PARTE II
Materia: Seminario II
Profesora: Carolina Spitale
Nancy N. Sepúlveda
43
REDES NEURONALES ARTIFICIALES
METODOLOGÍA
Nancy N. Sepúlveda
44
REDES NEURONALES ARTIFICIALES
ENFOQUE DE LA INVESTIGACIÓN.
Tipo de investigación
Entrevista: método no estructurado para la recopilación de datos primarios.
Tipos de datos
Fuentes primarias.
MÉTODOS DE CONTACTO
Individuales: permiten hablar con la gente en cualquier lugar. Son muy
flexibles y se usan para recabar grandes cantidades de información. Le da la
posibilidad al entrevistador de explicar las preguntas complicadas.
Internet: permite al entrevistador comunicarse con la gente mediante foros,
chats, e-mails, teniendo la posibilidad de contactarse con personas del
extranjero.
INSTRUMENTO DE INVESTIGACIÓN
Cuestionario (10 preguntas abiertas): permite al respondiente contestar con
sus palabras.
PLAN DE MUESTREO
Unidad: doctores en medicina, profesores de biología, profesores y
licenciados en informática, ingenieros en electrónica.
Tamaño: 10 entrevistas.
Procedimiento: se escogió a personas con conocimiento sobre redes
neuronales.
Nancy N. Sepúlveda
45
REDES NEURONALES ARTIFICIALES
PROBLEMAS METODOLÓGICOS
Un problema que se presentó durante el desarrollo del trabajo de
investigación fue al momento de tomar la muestra, ya que el tema en cuestión
al ser muy específico hacía dificultoso encontrar personas idóneas que
pudieran contestar la entrevista, porque éstas debían tener conocimientos
tanto en la parte natural de las redes neuronales, como en la parte
informática.
CONSIDERACIONES GENERALES
Como se pudo apreciar anteriormente, en esta investigación de campo se
trabajó con entrevistas, ya que debido a la especificidad del tema, se tornaba
complicado realizar una encuesta, porque se requería una indagación profunda
del tema tratado.
Nancy N. Sepúlveda
46
REDES NEURONALES ARTIFICIALES
ANÁLISIS
DE
DATOS
Nancy N. Sepúlveda
47
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
48
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
49
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
50
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
51
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
52
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
53
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
54
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
55
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
56
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
57
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
58
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
59
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
60
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
61
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
62
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
63
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
64
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
65
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
66
REDES NEURONALES ARTIFICIALES
Nancy N. Sepúlveda
67
REDES NEURONALES ARTIFICIALES
CONCLUSIONES
FINALES
Nancy N. Sepúlveda
68
REDES NEURONALES ARTIFICIALES
Las Redes Neuronales Artificiales son modelos matemáticos del funcionamiento cerebral de un número grande de neuronas interconectadas de alguna
manera, que constituyen un sistema capaz de operar como una memoria
asociativa, al igual que el cerebro.
Aquí vemos que una red neuronal artificial está relacionada con el cerebro, ya
que éste emprende permanentemente una gran cantidad de tareas que no son
susceptibles al menos que sean formuladas en forma algorítmica.
Una red neuronal artificial recibe, procesa, almacena y ordena información, lo
cual permite emprender la imitación de la aptitud de ciertos organismos para modificar su conducta aprendiendo de la experiencia. El que la red neuronal artificial pueda imitar esta cualidad implica que deba disponer de la capacidad de
adaptación necesaria para cambiar su estructura interna.
El número de neuronas y sus conexiones le dan a la red una función superior.
Si se sufren alteraciones o daños, la red sólo presentará una degradación, porque
los recuerdos almacenados en la red de neuronas se encuentran dispersos en los
valores sinápticos, esto le da una característica de robustez frente a las
lesiones.
La tecnología de las redes neuronales artificiales son una emulación pequeña
del complejo sistema nervioso humano, es la programación del modelo de comunicación entre sus células. Tal vez supere al hombre en algunos aspectos, como lo
es el almacenamiento de información de diversas ramas o la velocidad para realizar una tarea, pero no en su totalidad. El mismo hombre es el creador de ella,
por lo tanto, es el que puede manejarla.
Todo lo programado no podrá superar al hombre, porque éste es impredecible.
Para finalizar, una pequeña reflexión bíblica, tomando el versículo que se
encuentra en Deuteronomio 29:29, que dice: “Las cosas secretas pertenecen al
Señor nuestro Dios, mas las cosas reveladas nos pertenecen a nosotros...”. en
todos los tiempos el hombre busca aumentar su conocimiento para avanzar en la
ciencia. Esta innovación constante lo lleva afanarse en querer superar , en
nuestro caso, al propio organismo humano. Pero sabemos que Dios nos hizo a su
imagen y semejanza, y por más que el hombre quiera, no va a poder igualarlo, pues
somos hechura suya.
Nuestro organismo es un misterio creado por Dios. Él da la sabiduría y Él
permite que la ciencia avance, pero llega un momento en que ésta se ve bloqueada
porque le es imposible igualar los misterios del supremo inventor.
Nancy N. Sepúlveda
69
REDES NEURONALES ARTIFICIALES
ANEXO
Nancy N. Sepúlveda
70
REDES NEURONALES ARTIFICIALES
Modelo de la entrevista
Sexo:
M
F
Edad:..............
(Marcar con una X)
1. ¿Qué entiende por Redes Neuronales Artificiales o Redes Neuronales
Biológicas?
2. ¿Puede comparar al sistema nervioso con una computadora?
3. ¿Cree usted que los sistemas de información informáticos tienen relación con
el sistema nervioso humano?
4. ¿En qué imitan las Redes Neuronales Artificiales al cerebro humano?
5. ¿Qué complicaciones se pueden presentar en el funcionamiento de una red
neuronal?
6. ¿Qué sucede si una neurona falla durante la sinapsis?
7. ¿Están estructuradas las Redes Neuronales Artificiales de una manera
determinada o pueden variar?
8. ¿De qué manera se podría conseguir una mayor velocidad para que las Redes
Neuronales Artificiales realicen sus métodos de aprendizaje?
9. ¿En qué medida la tecnología de las Redes Neuronales Artificiales podría
superar al hombre?
10. Para finalizar, ¿cree usted que la inteligencia artificial superará la
inteligencia humana? ¿por qué?
Nancy N. Sepúlveda
71
REDES NEURONALES ARTIFICIALES
Datos Personales De Los Profesionales en Ciencias Naturales.
1.
Nombre y Apellido: Ronald Hougham
Edad: 44 años.
Teléfono: 4-641-3957 (Instituto Juan Amós Comenio).
Notas: Profesor en Ciencias Naturales.
2.
Nombre y Apellido: Norma Villares
Edad: 34 años.
E-mail: Notas: Pediatra.
3.
Nombre y Apellido: Vicente Lizzi.
Edad: 69 años.
Teléfono: 4-644-3118 (Centro Médico Evangélico).
Notas: Doctor en Medicina.
4.
Nombre y Apellido: Domingo Serpone.
Edad: 49 años.
Teléfono: 4-644-3118 (Centro Médico Evangélico).
Notas: Clínica Médica y Nutrición.
5.
Nombre y Apellido: Isabel Rossi.
Edad: 54 años.
Teléfono: 4-641-3957 (Escuela Cristiana Evangélica Argentina).
Notas: Profesora en Biología.
Nancy N. Sepúlveda
72
REDES NEURONALES ARTIFICIALES
Datos Personales De Los Profesionales Informáticos.
6.
Nombre y Apellido: Paola Sáenz.
Edad: 30 años.
Teléfono: 4-641-3957 (Escuela Cristiana Evangélica Argentina).
Notas: Licenciada en Informática.
7.
Nombre y Apellido: Marcos Palazzo.
Edad: 42 años.
E-mail: mpalazzo@fecea.edu.ar / mpalazzo_ar@yahoo.com.ar
Notas: Graduado de la Facultad de Ciencias Exactas y Naturales.
8.
Nombre y Apellido: Matías Szyszko.
Edad: 23 años.
E-mail: matiascisco@hotmail.com
Notas: Profesor en Informática.
9.
Nombre y Apellido: Leonardo Davico.
Edad: 26 años.
E-mail: ldavico@fecea.edu.ar
Notas: Ingeniero Electrónico.
10. Nombre y Apellido: Fernando Ortiz
Edad: 32 años.
La entrevista se realizó vía Internet.
Nancy N. Sepúlveda
73
REDES NEURONALES ARTIFICIALES
BIBLIOGRAFÍA
Yani, José Nicolás; “Investigación Integral de Mercados, un enfoque
operativo”; Ed. MacGraw Hill; Bogotá 1994.
Sabino, Carlos A.; “Cómo hacer una tesis”; Ed. Lumen Humanitas; Bs. As. 1998.
Kotler, Philip; “Mercadotecnia”; Ed. Prentice- Hall Hispanoamericana, S.A.;
México 1998.
Nancy N. Sepúlveda
74