Download Backtracking

Document related concepts
no text concepts found
Transcript
Algoritmos de Búsqueda
“Backtracking y Branch and Bound”
Antonio Paredes Risueño
Índice





Introducción
Backtracking
Backtracking en paralelo
Branch and Bound
Branch and Bound paralelo
Introducción



Los algoritmos de Backtracking y Branch and Bound se suelen
aplicar en la resolución de un gran número de problemas,
muy especialmente en los de optimización.
Estos algoritmos realizan una búsqueda exhaustiva y
sistemática en el espacio de soluciones del problema.
Suelen ser muy ineficientes.
Introducción


Se utilizan para resolver problemas para los que no existe un
algoritmo eficiente para resolverlos.
Mediante la programación paralela se intentará reducir el
tiempo de ejecución de estos algoritmos
Índice





Introducción
Backtracking
Backtracking en paralelo
Branch and Bound
Branch and Bound paralelo
Backtracking



Técnica general de resolución de problemas, que suele
aplicarse sobre todo a juegos y problemas de óptimización.
Realiza una búsqueda exhaustiva y sistemática en el espacio
de soluciones del problema.
La solución de un problema de backtracking se puede
expresar como una tupla (x1,x2,…,xn), que satisface una
restricciones R(x1,x2,…,xn) y a veces optimizando una función
objetivo.
Backtracking

En cada momento el algoritmo se encontrará en un cierto
nivel k, con una solución parcial (x1,x2,…,xk) (con k<=n).




Si puede añadirse un elemento xk+1 a la solución parcial se avanza
al nivel k+1.
Si no se prueban otros valores válidos para xk.
Si no existe ningún valor que sea válido por probar, se retrocede al
nivel anterior k-1.
Se continua con este proceso hasta que la solución parcial sea una
solución del problema o hasta que no queden más posibilidades por
probar (en el caso de que no se encuentre ninguna solución o se
busquen todas las soluciones del problema).
Backtracking

x1
x2
x3
En definitiva, el algoritmo realiza una búsqueda en
profundidad en el árbol de soluciones del problema.
Backtracking

En definitiva, el algoritmo realiza una búsqueda en
profundidad en el árbol de soluciones del problema.
1
x1
2
x2
x3
3
4
10
6
5
7
8
11
9
14
12
13
15
16
17
18
Backtracking. Complejidad



Por realizar una búsqueda exhaustiva en el espacio de
soluciones del problema, los algoritmos de backtracking son
bastante ineficientes.
En general, se tienen tiempos con órdenes de complejidad
factoriales o exponenciales.
Por esto, los algoritmos de backtracking se utilizan en
problemas para los que no existen un algoritmo eficiente
que los resuelva.
Backtracking. Ejemplo
Problema N-Reinas



El problema de las N-Reinas consiste en colocar n reinas en
un tablero de ajedrez de tamaño n*n de forma la reinas no se
amenacen según las normas del ajedrez. Se busca encontrar
una solución o todas las soluciones posibles.
Este problema puede resolverse utilizando un esquema de
backtracking.
Cualquier solución del problema estará formada por una
n-tupla (x1,x2,…,xn), dónde cada xi indica la columna donde
la reina de la fila i-ésima es colocada.
Backtracking. Ejemplo
Problema N-Reinas


Las restricciones para este problema consisten en que dos
reinas no pueden colocarse en la misma fila, ni en la misma
columna ni en la misma diagonal.
Por ejemplo, el problema de las 4-Reinas tiene dos posibles
soluciones: [2,4,1,3] y [3,1,4,2].
Backtracking. Ejemplo
Problema N-Reinas
Backtracking. Ejemplo
Problema N-Reinas
1
2
6
3
4
5
7
8
9
10
14
15
17
11
12
13
Soluciones
16
Índice





Introducción
Backtracking
Backtracking paralelo
Branch and Bound
Branch and Bound paralelo
Backtracking paralelo





Esquema no puramente paralelo, es un esquema utilizado en
programación secuencial que se intenta paralelizar.
Esto supone que la ganancia de tiempo no sea tan elevada
como se pudiera esperar a priori.
Se intenta distribuir el espacio de búsqueda entre los distintos
procesadores, de forma que cada uno busque la solución del
problema en un subespacio de soluciones distinto.
Así se exploran varias ramas del árbol de soluciones al mismo
tiempo por distintos procesadores.
Aumentan las posibilidades de encontrar la solución del
problema en menor tiempo.
Backtracking paralelo
Backtracking paralelo
P0
P1
Backtracking paralelo


Un factor crítico a la hora de formular un algoritmo de
backtracking en paralelo es cómo se realizará la distribución
del espacio de búsqueda entre los distintos procesadores.
Dos alternativas:


Asignación estática
Asignación dinámica
Backtracking Paralelo
Asignación estática





Un procesador expande el nodo raíz y genera varios nodos.
A cada procesador se le asigna un número de estos nodos.
Así se divide el espacio de búsqueda global entre los distintos
procesadores.
Cada procesador comienza a buscar la solución en el espacio
de búsqueda que le corresponda, siguiendo el proceso normal
de backtracking.
No se necesitan comunicaciones entre procesos.
Backtracking Paralelo
Asignación estática



Problema: No se sabe a priori si se divide el espacio de
búsqueda equitativamente entre los distintos
procesadores.
Puede haber desequilibrio entre la carga de trabajo de los
procesadores.
A un procesador puede que se le asigne poco trabajo y
este la mayor parte de tiempo inactivo.
Backtracking Paralelo
Asignación estática
P0
P1
Backtracking Paralelo
Asignación estática
P0
P1
Backtracking Paralelo
Asignación dinámica



Cada procesador trabaja en una parte del espacio de
búsqueda.
Cuando un procesador termina de trabajar, solicita más
trabajo a otro procesador que tiene más trabajo.
Proceso:



Cada procesador dispone una pila en su espacio local para
guardar nodos no expandidos.
Cuando un procesador expande un nodo, los nuevos nodos
que se crean se introducen en la pila.
Cuando la pila de un procesador esta vacía, el procesador
solicita nodos de la pila de otro procesador.
Backtracking Paralelo
Asignación dinámica



Al principio, el espacio total de búsqueda es asignado a un
procesador y a los demás procesadores no se les asigna
ningún trabajo.
Ese procesador será el encargado de distribuir inicialmente
el trabajo cuando los demás procesadores se lo soliciten.
A los procesos que envían trabajo se les denomina
donadores y a los que lo solicitan y lo reciben se les
denomina receptores.
Backtracking Paralelo
Asignación dinámica

Un procesador puede estar en 2 estados:



Activo: Esta realizando algún trabajo.
Inactivo: Al procesador no le queda ningún nodo por explorar
en su pila y esta solicitando trabajo a otros procesadores.
Estado inactivo:



El procesador selecciona un procesador donador y le envía una
petición de trabajo.
Si recibe trabajo del donador, se activa y comienza a trabajar.
Si recibe un mensaje de reject (el procesador donador esta
inactivo), selecciona a otro procesador donador para enviarle
una petición de trabajo.
Backtracking Paralelo
Asignación dinámica

Estado inactivo:

Este proceso se repite hasta que el procesador recibe trabajo
del donador o hasta que todos los procesadores entran en
estado inactivo.
Backtracking Paralelo
Asignación dinámica

Estado activo:




El procesador realiza una cantidad de trabajo fijo (expande un
nº determinado de nodos).
Cuando termina de realizar el trabajo, chequea si existen
peticiones de trabajo a cargo de los demás procesadores.
Si recibe alguna petición de trabajo, el procesador donador
particiona en dos partes su pila de nodos, y envía una parte al
procesador que realizo la petición.
Cuando el procesador ha recorrido todo su espacio de
búsqueda (su pila esta vacía), entra en estado inactivo.
Backtracking Paralelo
Asignación dinámica
Servicio pendiente de
recibir mensajes
Procesador
Activo
Procesador
Inactivo
Termina el
trabajo
disponible
Realizar una cantidad
de trabajo fija
Seleccionar un
procesador y solicitarle
trabajo
Comienza a
trabajar
Servicio pendiente de
recibir mensajes
No existe trabajo
disponible
Enviar una petición
Backtracking Paralelo
Asignación dinámica


Cuando un procesador encuentra la solución, envía un
mensaje de broadcast a todos procesadores para estos
paren la búsqueda.
Si no se recibe este mensaje, el algoritmo terminará cuando
todos los procesos estén en estado inactivo.
Backtracking Paralelo

Los algoritmos paralelos de búsqueda en un árbol de
soluciones tienen 2 características fundamentales que
determinan su rendimiento:


La estrategia utilizada para dividir el trabajo de un procesador
cuando éste recibe una petición de trabajo.
El esquema usado para determinar el procesador donador
cuando un procesador entra en estado inactivo.
Estrategia de División del trabajo




Cuando un procesador donador recibe una petición de
trabajo de otro procesador y tiene nodos su pila, el
procesador donador divide su pila en dos y una de ellas se
envía al proceso que realizo la petición.
Si se envía poco trabajo, el receptor rápidamente pasa a
estar en estado inactivo.
Si se envía demasiado trabajo, el donador entrará
rápidamente en estado inactivo.
Lo ideal sería dividir la pila en dos partes iguales de modo
que el espacio de búsqueda representado por cada una sea
el mismo.
Backtracking Paralelo
Estrategia división de trabajo




A este método se le llama “División por la mitad”.
Pero la dificultad reside en estimar el tamaño que tendrán
los subarboles asociados a cada uno de los nodos que se
encuentran en la pila.
Normalmente los nodos cercanos al fondo de la pila (nodos
con profundidad cercana al nodo raíz del procesador) tienen
más posibilidades de generar árboles de mayor tamaño.
Los nodos más cercanos al tope de la pila (nodos que están
a mayor profundidad) tienen más posibilidades de generar
árboles de menor tamaño.
Backtracking Paralelo
Estrategia división de trabajo



Para evitar mandar cantidades pequeñas de trabajo, los
nodos de la pila que están más allá de una determinada
profundidad no son enviados.
A esta profundidad se le llama “cota de profundidad”.
Algunas estrategias posible para la división del trabajo son:




Enviar nodos cercanos al fondo de la pila
Enviar nodos cercanos a la cota de profundidad.
Enviar la mitad de los nodos que están entre el fondo de la
pila y la cota de profundidad.
La idoneidad de una estrategia u otra dependerá de la
naturalidad del espacio de búsqueda.
Backtracking Paralelo
Estrategia división de trabajo
1
2
4
Pila
3
5
3
5
7
6
8
10
12
13
7
11
9
11
14
9
Cota de
profundidad
13
14
Backtracking Paralelo
Esquemas de balanceo de carga


Los esquemas de balanceo de carga se utilizan para decidir
que procesador donador se elige cuando un procesador
entra en estado inactivo.
Algunos esquemas posibles son los siguientes:



Round Robin Asíncrono
Round Robin Global
Selección aleatoria
Round Robin Asíncrono




Cada procesador mantiene una variable local llamada
“target”.
Cuando un procesador termina de trabajar, usa el valor de
su variable “target” para determinar el procesador donador
al que enviar la petición de trabajo.
Cada vez que se envía una petición, se incrementa en una
unidad el valor de la variable “target” del procesador:
target = ((target+1) modulo p)
El valor inicial de target será:
target0 = ((nº procesador+1) modulo p)
Round Robin Global




Existe una única variable “target” almacenada en el
procesador P0.
Cuando un procesador necesita trabajo, solicita y recibe el
valor de la variable target de P0.
Una vez que se sabe cual es el procesador donador, el
procesador le envía una petición de trabajo.
Luego, P0 incrementa la variable target antes de responder a
otra petición.
target = ((target+1) modulo p)
Round Robin Global


Este esquema garantiza que sucesivas peticiones de trabajo
se distribuyen uniformemente entre todos los procesadores.
La desventaja principal de este esquema es que el
procesador P0 debe gestionar todas las peticiones de acceso
a la variable target, y esto puede convertirse en un cuello
de botella.
Selección aleatoria




Es el esquema más simple de todos
Cuando un procesador entra en estado inactivo, se elige un
procesador al azar.
Cada procesador tiene la misma probabilidad de ser
seleccionado como donador.
Así se asegura que las peticiones se distribuyan
uniformemente.
Backtracking Paralelo
Detección de terminación



Cuando un procesador encuentra una solución del problema
se envía un mensaje de broadcast a todos los procesadores
para indicarle que terminen.
Pero cuando no se encuentra ninguna solución. ¿Cómo
detectar cuando termina el proceso de búsqueda?
A continuación se describen dos algoritmos para detectar la
terminación de la búsqueda.


Algoritmo de terminación de Dijkstra´s.
Algoritmo de terminación basado en árbol.
Algoritmo de terminación de Dijkstra´s




Los procesadores se organizan en un anillo lógico y se irán
pasando un token.
Un procesador puede estar en dos estados: blanco o negro.
Un token también puede estar en dos estados: blanco o
negro.
Inicialmente todos los procesadores están en estado blanco.
Algoritmo de terminación de Dijkstra´s

El algoritmo es el siguiente:





Cuando P0 esta inactivo, el procesador crea un token y envía
un token blanco al procesador P1.
Si el procesador Pi envía trabajo al procesador Pj (i>j), el
procesador Pi cambia a estado negro.
Si el procesador Pi tiene el token y esta inactivo, pasa el token
al Pi+1. Si Pi está en estado negro, el color del token se
establecerá a negro antes de pasarlo a Pi+1. Si Pi esta en
estado blanco, el token se pasa sin cambiarlo.
Cuando Pi pasa el token a Pi+1 pasa a estado blanco.
El algoritmo termina cuando a P0 le llega un token blanco.
Algoritmo de terminación basado en árbol





Se asocia un peso a cada procesador.
Inicialmente, P0 tiene todo el trabajo y se le asocia un peso
de 1.
Cuando Pi particiona y manda trabajo a otro procesador, Pi
se queda con la mitad del peso y la otra mitad se la envía al
otro procesador.
Cuando un procesador termina su trabajo, se devuelve el
peso al procesador del que se recibió el trabajo.
El algoritmo termina cuando el peso del procesador P0
vuelve a ser 1.
Algoritmo de terminación basado en árbol
w0=0.5
w1=0.5
Algoritmo de terminación basado en árbol
w0=0.5
w1=0.5
w0=0.5
w1=0.25
w2=0.25
Algoritmo de terminación basado en árbol
w0=0.5
w1=0.5
w0=0.5
w1=0.25
w2=0.25
w0=0.25
w1=0.25
w2=0.25
w3=0.25
Algoritmo de terminación basado en árbol
w0=0.5
w0=0.5
w1=0.5
w1=0.25
w2=0.25
w0=0.25
w1=0.5
w3=0.25
w0=0.25
w1=0.25
w2=0.25
w3=0.25
Algoritmo de terminación basado en árbol
w0=0.5
w0=0.5
w1=0.5
w1=0.25
w2=0.25
w0=0.25
w1=0.5
w1=0.25
w2=0.25
w0=0.5
w3=0.25
w0=0.25
w1=0.5
w3=0.25
Algoritmo de terminación basado en árbol
w0=0.5
w0=0.5
w1=0.5
w1=0.25
w2=0.25
w0=0.25
w1=0.5
w1=0.25
w2=0.25
w0=0.5
w3=0.25
w0=0.25
w1=0.5
w0=1
w3=0.25
Índice





Introducción
Backtracking
Backtracking paralelo
Branch and Bound
Branch and Bound paralelo
Branch and Bound




Técnica similar a Backtracking
Suele utilizarse en problemas de optimización.
Este esquema puede verse como una mejora del esquema de
backtracking.
Al igual que en backtracking, el algoritmo realiza una
búsqueda sistemática en un árbol de soluciones.
Branch and Bound

Pero Branch and Bound añade dos características nuevas:



Estrategia de ramificación: La búsqueda se guiará por
estimaciones de beneficio que se harán en cada nodo.
Estrategia de poda: Para eliminar nodos que no lleven a a la
solución óptima. Estimación de cotas de beneficio en cada
nodo.
Para cada nodo tendremos la siguiente información:


Cota inferior (CI) y cota superior (CS) de beneficio que se
puede obtener a partir del nodo. Determinan cuando se puede
realizar una poda.
Estimación del beneficio que se puede encontrar a partir del
nodo. Ayuda a decidir el orden de evaluación de los nodos.
Estrategia de poda

Suponemos un problema de maximización. Se han recorrido
varios nodos y ha estimado la cota inferior y superior de cada
uno de ellos.
1
3
9
2
3
2
15
4
5
12
25
Estrategia de poda

El nodo 2 puede podarse, ya que el nodo 5 tiene una cota
inferior mayor que la cota superior del nodo 2.
1
3
9
x
2
2
3
15
4
5
12
25
Estrategia de ramificación



Se pueden utilizar distintas estrategias para recorrer el árbol
de soluciones. Puede recorrerse en profundidad, en anchura,
según el beneficio estimado,…
Se utiliza una lista de nodos vivos (contiene nodos generados
y aún no explorados).
Algoritmo:



Sacar un nodo de la lista de nodos vivos
Generar sus descendientes
Si no se podan, se introducen en la lista de nodos vivos.
Estrategia de ramificación

¿Qué criterio se utiliza para seleccionar el nodo que se saca
de la lista de nodos vivos?



Estrategia FIFO
Estrategia LIFO
Estrategia del menor costo
Complejidad

El tiempo de ejecución depende:





Número de nodos recorridos.
Tiempo gastado en cada nodo.
En el caso promedio se suelen obtener mejoras respecto al
algoritmo de backtracking.
Pero en el pero caso, el tiempo puede ser peor.
Se debe buscar un compromiso entre la exactitud de las cotas
y el tiempo utilizado en calcularlas.
Conclusiones


En general, el esquema de branch and bound suele obtener
mejores resultados que el de backtracking.
Sigue siendo muy ineficiente.
Índice





Introducción
Backtracking
Backtracking paralelo
Branch and Bound
Branch and Bound parelelo
Branch and Bound paralelo




Al igual que sucedía con backtracking, no es un esquema
puramente paralelo.
En el proceso secuencial, se necesita información global
para poder hacer la poda de nodos.
Se puede paralelizar distintos tipos de niveles.
Tipos de niveles:

Búsqueda paralela ejecutando el algoritmo con distintos
parámetros sobre el espacio global de búsqueda en varios
procesadores. Cálculo de cotas, de estimaciones, y criterio selec.
Branch and Bound paralelo

Tipos de nivel.


Se paralelizan partes del algoritmo.
La estructura del algoritmo no cambia.
Por ejemplo, se expanden en paralelo los nodos.
Se divide el espacio de búsqueda entre los procesadores.
De la lista de nodos vivos se asignan nodos distintos a cada
procesador.
La distribución del trabajo puede ser estática o dinámica, del
mismo modo que sucedía con backtracking.
Asignación estática


A cada procesador se le asigna un número fijo de nodos de la
lista de nodos vivos.
Los procesos pueden comunicarse la cotas o no.

Si no se comunican las cotas:



Si se comunican las cotas:



Se necesitan pocas comunicaciones entre procesos.
Puede que se estudien nodos que se podían haber podado.
Se evita que los procesadores estudien nodos innecesarios.
Se necesitan bastantes comunicaciones entre los procesos.
Además, al asignar los nodos estáticamente puede darse un
desbalanceo de carga de trabajo entre los procesadores.
Asignación dinámica




Puede utilizarse una bolsa de tareas para asignar los nodos
a los procesos de forma dinámica, como se hacía con
backtracking.
Pero ahora tenemos la opción de comunicar las cotas.
Los procesadores toman los nodos y los exploran y
depositan los descendientes de los nodos explorados en la
bolsa de trabajo.
Existen dos estrategias para depositar los nodos: inmediata
o pospuesta.
Asignación dinámica

Actualización inmediata



Cuando se generan los descendientes de un nodo se introducen
de inmediato en la bolsa.
Muchas comunicaciones.
Actualización pospuesta


Cuando se generan los descendientes de un nodo no se
introducen de inmediato en la bolsa, se sigue generado
descendientes a partir de estos. Cada cierto tiempo se
introducen en la bolsa.
Ventajas: Pueden podarse algunos nodos y no se accede tanto a
la bolsa de tareas.
Asignación dinámica

Sistema de memoria compartida


Se tiene una estructura centralizada de donde los
procesadores toman e introducen tareas.
Sistema de memoria distribuida




Se tienen bolsas de trabajo en uno o en varios procesadores.
Las peticiones y el depósito de los trabajos conllevan
comunicaciones.
Se descentraliza la bolsa de tareas.
Actualización inmediata o pospuesta.
Asignación dinámica

Comunicación de cotas:
 Si se comunican las cotas con mucha frecuencia, se podrán
podar más nodos pero puede pederse eficiencia al realizar
tantas comunicaciones.
 Si no se comunican con mucha frecuencia, no se podarán
tantos nodos pero no habrá tantas comunicaciones.
Asignación dinámica

Una única bolsa de trabajos



Varias bolsas de trabajos


Mayor contención.
La bolsa puede convertirse en un cuello de botella.
Aumenta el desbalanceo de las tareas
Se trata de buscar un compromiso entre el desbalanceo y la
contención.