Download 8-GrafosNuevo

Document related concepts

Heap Binomial wikipedia , lookup

Montículo de Fibonacci wikipedia , lookup

Estructura de datos para conjuntos disjuntos wikipedia , lookup

Grafo (tipo de dato abstracto) wikipedia , lookup

Lista de adyacencia wikipedia , lookup

Transcript
Ejemplos de Grafos:
•
•
•
•
Red de tráfico con caminos y cruces.
Redes de cañerías
Flujos: grafos dirigidos
Redes de computadores (transmisión de datos)
Largos o costos y capacidades de los arcos se
representan por pesos, y/o valores en los arcos.
1
Problemas importantes en la
teoría de grafos
• Calcular la distancia mínima desde un nodo de salida
hasta todos los otros nodos.
• Calcular un árbol cobertor (el subgrafo que tiene la
menor menor suma de la cantidad/costo/largo de los
arcos que une a todos los nodos).
• Encontrar un elemento en el grafo, determinar si hay
ciclos.
• Cálculo de un camino que pasa justo una sola vez por
todos los arcos/nodos.
• Coloracion de grafos.
• Centralidades en grafos: ej. ¿Cual es el nodo mas
„central“ ?, ¿ bajo qué criterios ?.
2
Representación de grafos (1)
4
5
1.
5
Se asocian los nodos a los índices
de las filas y columnas de la
matriz. Un arco del i-esimo al jesimo nodo se representa por una
marca en el elemento (i,j) de
lamatriz.
*
Para grafos no dirigidos basta una
mitad de la matriz.
1
3
2
1
1
2
3
2
3
*
*
*
*
*
4
5
4
Matriz de adjacencia:
*
*
3
Representación de grafos (2)
4
5
1
3
2
1
2
4
2
4
1
3
3
5
4
5
5
3
2. Lista de Adjacencia:
Los sucesores de un nodo se
ponen en una misma lista
enlazada, una asiciada a cada
nodo. (arreglo de listas, o lista
de listas)
4
Representación de grafos (3)
4
3
3. Matriz de Incidencia...
2
5
1
6
1
1
2
1
1
2
3
3
1
4
5
1
1
... de un Grafo no dirigido
G=(V,E) es una matriz |V|  |E|,
con i(j,k) = 0, cuando el arco k
no incide en el nodo j (no
llega/sale), bzw. i(j,k)=1,2,
cuando el arco k incide una o
dos veces (Loops) con el nodo j.
1
4
1
5
1
6
2
1
1
5
Costo de las representaciones
1. Matriz de adjacencia
Memoria: O(|V|²)
costo de saber si hay un arco (v,w): O(1).
2. Lista de adjacencia
Memoria: O(|V|+|E|)
costo de saber si hay un arco (v,w): O(|E|).
3. Matriz de incidencia
Memoria: O(|V| • |E|)
costo de saber si hay un arco (v,w):
6
Búsqueda (recorrido) en
profundidad o en amplitud
La expansión de un grafo dirigido desde un nodo v
se representa por un árbol X(v) donde:
• X(v) = (v), si v no tiene sucesores,
• X(v) = (v, X(v1), …, X(vp)), si v1,…,vp son los
sucesores de v.
Cuando el grafo tiene ciclos la expansión es
infinitamente.
7
Ejemplo de Expansion
4
5
1
2
3
8
Dos algoritmos de búsqueda
En profundidad: en un grafo dirigido G hacer un recorrido
similar al de preorden (primero los hijos luego el padre)
pero se detiene la recursividad cuando se alcanza un
nodo ya visitado
Profundidad(v)
si v no ha sido visitado:
procesar v;
marcar v como visitado;
para todo sucesor de N(v) de v (de izquierda a
derecha) invocar (N(v)).
costo: O(|V| + |E|).
Estructura de datos usada: Stack.
9
Búsqueda en amplitud
Amplitud(v)
primero la raíz v,
luego los nodos vecinos a v (nivel 1),
luego los nodos vecinos a los de nivel 1 (nivel 2),
usw.
costo: O(|V| + |E|).
Estructura de datos usada: Queue
10
Algoritmo Búsqueda en amplitud
Amplitud(v) {
print(v)
Mark(v)
p = new Queue()
put all neighbors of root in q and mark them
while(!empty(q)) {
o = dequeue(q)
print(o)
put all not marked neighbors of o in q
and mark them
}
}
11
Ejemplo búsqueda en
profundidad y en amplitud
4
5
1
2
3
12
Algoritmos de Prim y de Kruskal
Recordemos: un grafo conexo (no dirigido ) sin ciclos es
un árbol.
Características:
• Tiene n nodos y exactamente n-1 arcos.
• Si se le pone un arco más entonces se crea un ciclo en
el grafo.
Objetivo: Calcular el spanning tree de minimo costo para
un grafo conexo no dirigido (un árbol que es subgrafo
del original que contiene todos los nodos y la suma de
los costos de sus arcos es mínima).
13
Algoritmo de Kruskal
Descripción:
• Descomponer el grafo y su conjunto de nodos en
componentes unitarias en una particion P de una
estructura tipño Find-and-Merge.
• Los arcos se ordenan segun sus costos de menor a
mayor usando una cola de prioridad Q:
Si el arco de menor costo une dos componentes de la
estructura se usa para la construcción del spanning tree
minimal T. Las componentes que une se funden
entonces en una sola.
Si no se ignora.
• Cuando la estructura quede con una componente
entonces esta corresponde al spanning tree T de G.
14
C
D
6
C
D
6
5
5
5
A
B
5
3
5
A
2
B
5
3
2
7
7
4
4
F
E
3
F
E
3
3
1
3
1
2
2
2
2
G
G
C
D
6
C
5
5
A
3
5
B
5
D
6
5
A
2
B
5
3
2
7
7
4
4
F
E
3
F
E
3
3
1
2
3
1
2
2
G
2
G
15
C
D
6
C
5
5
A
3
5
B
5
D
6
5
A
2
B
5
3
2
7
7
4
4
F
E
3
F
E
3
3
1
3
2
1
2
2
2
G
C
G
D
6
5
5
A
B
5
3
2
7
4
F
E
3
3
1
2
2
G
Sea G=(V,E,d) un grafo conexto con n nodos.
Sea e := |E|.
Algorithmus Kruskal (G)
//Computa el spanning tree minimal de G
Inicializar la partición P de modo que cada nodo V es una componente # O(n)
Sea T = (V, { });
Construir una cola de prioridad (Heap) Q con los arco
# O(e log e)
ncomp := n;
while ncomp > 1 do
# máximo e iteraciones
(Q, (v,w)) := deletemin(Q);
# O(log e)
a:= find (P, v);
# O(log n)
b:= find (P, w);
# O(log n)
if a!=b
{insert(T,(v,w)) ; P:= merge(P,a,b); dec(ncomp); }
# O(1)
end {Kruskal}.
Particion en una estructura de tipo Find-and-Merge o Union-Find: con ella se
construye el spanning tree.
Costo total : O(e log e)
(Notar: e >= n-1, ya que el grafo es conexo).
17
Correctitud del algoritmo de
Kruskal:
Por probar: el árbol construido T es minimal.
Prueba por contradicción.
Suposición: no es el caso.
Sea H otro árbol cobertor minimal, que tiene los arcos casi todos
coincidentes con T.
Sea ei el primer arco considerado por el algoritmo que solo pertenece a
E(T) o solo pertenece a E(H), pero no está está en ambos. Dado el
algoritmo, el segundo caso (esta en E(H), pero no en E(T)) es
imposible. Por lo tanto, ei esta en E(T), pero no en E(H).
Si uno pone ei en el árbol H entonces se tiene en „H con ei “ un ciclo.
En este ciclo hay un arco em, que no pertenece a T. Si lo sacamos
entonces tenemos un nuevo árbol cobertor H‚ que tiene a lo más el
mismo peso que H. Según la definición de ei éste se considera
antes que em por el algoritmo, o sea puede tener a lo más el mismo
peso que em. Con esto es H´ también un árbol cobertor mínimo y
tiene un un arco más en común con T
18
Algoritmo de Prim
Sea G=(V,E,d) un grafo conexo con pesos.
Objetivo: calcular el árbol cobertor mínimo T.
Breve:
Construir el árbol T por pasos:
Partir con un vértico (nodo) cualquiera.
incorporar siempre el arco con menor peso (costo) que tiene
un extremo en el árbol construido y otro fuera de él hasta
que todos los nodos hayan sido incorporados al árbol.
19
Beispiel
C
C
D
6
D
6
5
5
5
5
A
3
A
B
5
B
5
3
2
2
7
7
4
4
F
E
3
F
E
3
3
1
2
3
1
2
2
G
2
G
20
C
C
D
6
D
6
5
5
5
5
A
A
B
5
3
B
5
3
2
2
7
7
4
4
3
3
3
1
F
E
F
E
3
1
2
2
2
2
G
G
C
D
6
5
A -> B -> E
-> {G->F, D, C}
5
A
B
5
3
2
7
4
F
E
3
3
1
2
2
G
21
Algoritmo de Prim - detallado
Construir:
• Lista de n vértices, en la que se especifican sus respectivos arcos con sus
pesos y su posición en el heap (de los arcos),
• Lista de arcos con sus vértices.

Inicializar dos conjuntos de nodos M = { } y N=V \ M así como el árbol cobertor
T = (V, { }).
 Escoger un vértice y0 de V, poner M:={y0} y adaptar N.
 Definir s(y) := d(y,y0), donde d(y) = maxInteger, si es que no hay un arco entre
y0 a y.
 Se construye un Heap (según la función: s(y)) de todos los arcos que salen de
N se guarda su posición en el Heap en la lista de vértices.
WHILE N <> { } DO BEGIN
 Sea y1 el nodo con el s(y1) mínimo. Se inserta el arco de M a y1 en T, se
saca y1 del Heap y se pone y1 en M.
 Redefinir s(y) := min {s(y), d(y1,y)} para todo y de N.
 Ahora debe adecuarse el heap para todos los sucesores de y1. Esto puede
ser realizado con la informacion de la posición en el Heap con un costo de
O(log n).
END # While
22
Costo del Algoritmo de Prim:
• Construir la lista de vértices y el primer Heap: O(|E| + |V| log |V|) (O
usando la idea de que un heap puede construirse en tiempo lineal:
O(|E| + |V|) = O(|E|) ).
• La actualización del heap requiere que se itere sobre la lista de los
sucesores de un vértice: costo = O(|E| log |V|), es decir O(log |V|)
por cada sucesor.
• La readecuación del Heap se tiene que hacer la cantidad de
vértices que hayan |V|-veces, cada vez que se extrae el mínimo.
costo: O(|V| log |V|).
Costo total: O(|E| log|V|)
(ya que |E|  |V|-1)
23
Bases para el Algoritmo de Prim:
Observación: Los árboles de cobertura mínimos tienen
siempre un arco con el peso mínimo.
Demostración: Si no fuera así se puede introducir este arco
y se creará un ciclo. Como dos vértices pueden
alcanzarse uno a otro por dos caminos distintos, basta
borrar uno sin que deje de ser un árbol conexo. De esta
manera se puede lograr otro árbol que tiene al menos el
mismo peso que el original (sino menor).
24
Esta característica es válida en forma más general aún.
Sean U y W una partición del conjunto de vértices de G
en dos subconjuntos disjuntivos y (u,w) un arco de costo
mínimo que une estos dos conjuntos. Entonces existe
un árboil de costo mínimo que contiene este arco.
Demostración: aquí también se podria incluir (u,w) y borrar
otro arco (u',w') que une U con W .
La correctitud del algoritmo se demuestra ya que la última
observación se aplica en cada iteración del algoritmo
para unir los conjuntos de los nodos que están en el
árbol construido hasta ahora con los nodos del conjunto
de vértices que aún no están
25
Distancias mínimas en Grafos
„Single source shortest path problem“
Dado:
• Grafo dirigido con pesos (todos 0),
• Un vértice („punto de partida“) v0 en el grafo.
Buscar: camino más corto de v0 a todos los otros
nodos (suponiendo que hay camino a ellos).
26
Der Dijkstra-Algorithmus
• La idea del algoritmo es mantener un conjunto A de nodos
"alcanzables" desde el nodo origen s,e ir extendiendo este conjunto en
cada iteración.
• Los nodos alcanzables son aquellos para los cuales ya se ha
encontrado su camino óptimo desde el nodo origen. Para esos nodos
su distancia óptima al origen es conocida. Inicialmente A={s}.
• Para los nodos que no están en A se puede conocer el camino óptimo
desde s que pasa sólo por nodos de A. Esto es, caminos en que todos
los nodos intermedios son nodos de A. Llamemos a esto su camino
óptimo tentativo.
• En cada iteración, el algoritmo encuentra el nodo que no está en A y
cuyo camino óptimo tentativo tiene largo mínimo. Este nodo se agrega
a A y su camino óptimo tentativo se convierte en su camino óptimo.
Luego se actualizan los caminos óptimos tentativos para los demás
nodos.
27
Dijkstra-Algorithmus
A={s}; D[s]=0;
D[v]=cost(s,v) para todo v en V-A; // infinito si el arco no existe
while(A!=V) {
Encontrar v en V-A tal que D[v] es mínimo;
Agregar v a A;
for(todo w tal que (v,w) está en E)
D[w]=min(D[w],D[v]+cost(v,w));
}
Implementaciones:
• Usando una cola de prioridad para la tabla D el tiempo es O(m log n).
• Usando un arreglo con búsqueda secuencial del mínimo el tiempo
es O(n2).
28
Ejemplo
C
D
40
30
40
10
A
B
30
10
100
90
F
E
20
Distancias más cortas desade A
29
Descripción:
Idea: Hacer crecer el subárbol construido hasta ahora por
los caminos más cortos.
Nodos verdes:
nodos cuyos sucesores ya hab sido considerados.
= nodos a los cuales ya se les ha calculado la distancia
mínima .
Nodos amarillos: los sucesores de los nodos verdes que
no son verdes
Arcos rojos: arcos sobre los cuales pasa al menos una ruta
óptima de las calculadas hasta el momento.
Arcos amarillo: arcos que han sido reconocidos como no
optimales.
30
Ciclo
Un ciclo del algoritmo:
• De todos los nodos amarillos, colorear verde el
w el que tiene menor distancia a v0.
• Colorear amarillo todos los sucesores de w.
• Registrar o corregir los los caminos más cortos
desde v0 a cada uno de los sucesores de w, asi
como su longitud (con esto arcos no coloreados
pueden tornarse rojos y arcos rojos pueden
tornarse amarillos).
31
Ejemplo (2)
C
D
C
D
30
A
B
A
100
B
100
90
E
40
10
30
F
90
E
F
32
Ejemplo(3)
C
40
40
D
40
10
C
40
30
D
40
10
30
A
B
A
B
10
100
10
100
90
E
40
F
90
F
E
50
20
33
Ejemplo (4)
C
40
D
C
40
D
70
40
70
40
10
40
30
30
A
30
30
B
B 30
A
10
100
40
10
10
100
90
90
F
E
50
20
70
F
E
20
70
34
50
Computing „on the paper“
A
5
B
7
5
6
D
2
F
3
2
E
4
3
1
2
5
C
3
G
35
Computing „on the paper“
A
5
B
7
5
6
D
2
F
2
2
E
3
1
G
3
4
3
Primero se ponen las distancias desde A en la primera fila correspondientes a
los arcos que salen de A. De estos se escoge el menor (5) y se anota en la
primera columna de la segunda fila. Ademas se anota el nodo (B) y las
distancias de A a los vecinos pasando por B (10 a C, 10 a D y 9 a E). De aquí
notamos que hay un camino menor de A a D sin pasar por B (directo 6). El
siguiente más cercano a A es D (6) por lo que se anota en la tercera fila y se
hace el mismo proceso.
36
5
C
8.4.2 Implementación del Algoritmo
a) Implementación con una matriz de adjacencia
Sea V={1,...,n} y sea cost(i,j) la matriz de distancias donde
se registra un infinito donde no hay camino directo entre
dos nodos. Además usaremos:
double dist[] = new double[n];
node father[] = new node[n];
boolean green[] = new boolean[n];
El arreglo father representa el árbol de los arcos rojos, en
el cual cada nodo apunta a su nodo padre.
Los nodos amarillo no se representan explícitamente.
37
Ciclo
Cada iteración consta de los siguientes pasos:
• El arreglo dist se recorre completo, para encontrar el w
amarillo con la menor distancia.
costo: O(n).
• Las lineas cost(w,*) de la matriz son recorridas para
corregir (en caso necesario) las distancias de los
sucesores de w.
costo: O(n).
Costo total: O(n²), ya que hay n iteraciones.
Inefficiente, salvo cuando n es muy chico o e cercano a n² !
38
b) Implemntaciòn con listas de adyacencia y
Heap
Grafo: dado con listas de adjacencia.
Como antes:
• Array dist
• Array father
Además:
• Heap (implementado cmo arreglo) de todos los nodos
amarillos, ordenados según distancia al nodo de origen,
• Array heapaddress, que contiene para cada nodo
amarillo su posición en el Heap.
39
Iteración
Cada iteraci+on consta de los siguientes pasos:
1. Sacar el nodo amarillo w con la distancia mínima del Heap
Aufwand: O(log n).
2. Encontrar en la lista de adyacencia m(w) sucesor de w.
Aufwand: O(m(w)).
(i) para cada nodo sucesor amarillo ,,nuevo" ponero en el heap
(ii) para cada nodo sucesor ,,antiguo" corregir en caso necesario su
distancia y su posiciòn en el heap. Su posiciòn se puede encontrar en el
heapaddress. Dado que su distancia al nodo de origen disminuye (o no se
correige) puede ser necesario elevarlo a la parte superior. Las posiciones
en el heap de este nodo pueden modificarse en O(1).
Costo para (i) y (ii): en total O(m(w) log n).
Costo total para 2: O( log n • {Knoten w} m(w)) = O( e log n).
Costo total para 1: O(min{n,e} log n), ya que un elemento se puede sacar del
heap solo si antes se haia puesto.
Costo total: O(e log n)
(costo total de memoria: O(n+e))
40
Prueba de correctitud:
Aseveración: en todo momento se cumple para todo nodo
verde:
• Existe un camino mínimo de v0 hasta u, que solo
contiene nodos verdes.
• Su longitud es dist(u).
Prueba: por Induccion. Se debe mostrar esta aseveración
para los nodos que pasan de amarillo a verde.
De esta aseveración se desprende la correctitud del
algoritmo.
41
Algoritmo de Floyd para todas
las distancias más cortas
• Numerar nodos arbitrariamente 1,2,...n.
• Al comenzar la iteración k-ésima una
matriz D[i,j] contiene la distancia mínima entre i y j por
caminos que pasen sólo por nodos intermedios de
numeración <k.
• Estas distancias se comparan con las que se obtendrían
si se pasara una vez por el nodo k
• Si de esta manera se obtendría un camino más corto
entonces se prefiere este nuevo camino, de lo contrario
nos quedamos con el nodo antiguo.
42
Iteración
• Al terminar esta iteración, las distancias calculadas
ahora incluyen la posibilidad de pasar por nodos
intermedios de numeración <=k, con lo cual estamos
listos para ir a la iteración siguiente.
• Para inicializar la matriz de distancias, se utilizan las
distancias obtenidas a través de un arco directo entre
los pares de nodos (o infinito si no existe tal arco).
• La distancia inicial entre un nodo y sí mismo es cero.
43
Pseudocódigo
for(1<=i,j<=n)
D[i,j]=cost(i,j);
// infinito si no hay arco entre i y j
for(1<=i<=n)
D[i,i]=0;
for(k=1,...,n)
for(1<=i,j<=n)
D[i,j]=min(D[i,j], D[i,k]+D[k,j]);
• El tiempo total que demora este algoritmo es O(n3).
44
Algoritmo de Warshall para
cerradura transitiva
• Dada la matriz de adyacencia de un grafo (con D[i,j]=1 si
hay un arco entre i y j, y 0 si no), l calcular la matriz de
conectividad, en que el casillero respectivo contiene
un 1 si y sólo si existe un camino (de largo >=0)
entre i y j.
• Esta se llama la cerradura transitiva de la matriz original.
• La matriz de conectividad se puede construir de la
siguiente manera:
• Primero calcular la matriz de distancias mínimas usando
Floyd.
• Luego sustituir cada valor infinito por 0 y cada valor no
infinito por 1.
45
Optimización
• Mejor todavía, podríamos modificar el algoritmo de Floyd
para que vaya calculando con ceros y unos
directamente, usando las correspondencias siguientes:
46
Algoritmo de Warshall:
for(1<=i,j<=n)
D[i,j]=adyacente(i,j);
// 1 si existe, 0 si no
for(1<=i<=n)
D[i,i]=1;
for(k=1,...,n)
for(1<=i,j<=n)
D[i,j]=D[i,j] or (D[i,k] and D[k,j]);
47