최단 거리
개요
위와 같은 그래프가 있다. 그래프는 노드(동그라미)와 간선(선)으로 구성된다.
혹시 한 눈에 안들어온다면 그냥 마을과 마을을 잇는 지도라고 생각하고 봐도 좋다.
1에서 출발해 다른 노드로 가는 최단 거리를 구하려면 어떻게해야할끼? 간선에 표시된 숫자는 거리를 의미한다.
1과 직접적으로 연결된 2, 3, 4노드로가는 최단 거리(비용)은 각각 2, 5, 1이 된다.
그런 다음 4를 기준으로 생각해보면 4에서 3으로 가는 최단 거리는 3이 된다.
이렇게 보니 1에서 3으로 직접 가는 비용은 5지만 1에서 4를 거쳐서 3으로 가는 비용은 4로 직접 가는 것 보다 1에서 4를 거쳐서 3으로 가는 것이 최단 거리라는 것을 알 수 있다.
이런식으로 새롭게 거리를 계산해서 최단 경로를 갱신한다면??
특정 노드에서 각 노드로 가는 최단 거리를 구할 수 있다. 이 것이 바로 다익스트라 알고리즘이다.
다익스트라 알고리즘은 그리디 알고리즘의 성격을 띈다.
하나의 라우터에서 다른 라우터로 가는 최단 경로를 찾는 OSPF라우팅 방식에 쓰이는 알고리즘으로 간략하게 설명하면 다음과 같다.
- 출발 노드를 정한다.
- 출발 노드를 기준으로 각 노드의 최소 비용을 기록한다.
- 방문하지 않은 노드 중에서 가장 비용이 적게 드는 노드를 선택한다.
- 해당 노드를 거쳐서 특정 노드로 가는 경우를 고려해서 최소 비용을 갱신한다.
- 3 ~ 4번 과정을 반복한다.
예를 들어 위의 그래프의 1번 노드에서 각 노드로 가는 최단 거리를 구해보면…
1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|
0 | 2 | 5 | 1 | 무한 | 무한 |
이렇게 된다. 1번 노드와 직접적으로 연결된 노드를 제외한 노드는 거리를 무한대로 설정한다.
다음으로 방문하지 않은 노드 중에서 가장 비용이 적게드는 노드를 선택해본다. 이 경우 4가 된다.
4를 선택했다는 것은 4를 중간 경유지로 설정한다는 의미이며 1에서 출발하여 4를 거쳐 다른 노드로 가는 최단거리를 갱신하기 위함이다.
그래프를 보고 4에서 연결된 노드들과 그 비용을 확인한다.
4번 노드는 2번, 3번, 5번과 직접적으로 연결되어있다. 4번에서 2번으로 가는 비용은 2로 기존 1 -> 2 보다 비용이 많이 든다. 따라서 최단 거리가 아니니 기록하지 않는다.
다음으론 3번 노드를 확인해보자. 비용은 총 4로 기존 5인 것과 비교했을 때 보다 짧은 거리를 찾았다. 따라서 비용을 4로 갱신해준다.
1에서 바로 5로 갈 수 없어서 무한으로 설정되어있었지만 4번을 거쳐 5번으로 갈 경우 비용은 2가 된다.
이렇게 갱신한 최단거리 테이블은 다음과 같다.
1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|
0 | 2 | 4 | 1 | 2 | 무한 |
다음으로 비용이 적게 드는 노드는 2번 노드이다.
이제 2번 노드를 선택하여 1 -> 2번을 거쳐 다른 노드로 가는 최단 거리를 갱신하면 된다.
2번 노드에서 4번 노드로 가는 비용은 4로 기존 1과 비교해 봤을 때 최단 거리가 아니다. 따라서 갱신하지 않는다. 또한 3번으로 가는 경우도 기존 4와 비교해 최단 거리가 아니다. 따라서 갱신하지 않는다.
그 다음 방문하지 않은 노드 중에서 가장 적은 비용이 드는 노드는 5번 노드로
1번에서 4번 5번을 거쳐 3으로 가는 경우 비용은 3으로 기존의 비용 4보다 비용이 적다.
따라서 노드 3으로 가는데 드는 비용을 3으로 갱신한다.
5를 거쳐서 6으로 가는 경우 비용이 기존의 비용인 무한보다 적다. 따라서 노드 6으로 가는 비용을 4로 갱신한다.
1 | 2 | 3 | 4 | 5 | 6 |
---|---|---|---|---|---|
0 | 2 | 3 | 1 | 2 | 4 |
이후 방문하지 않은 노드 중 가장 비용이 저렴한 노드는 3으로 기존 기록된 비용보다 더 많은 비용이 든다. 따라서 갱신하지 않는다.
마지막으로 노드 6을 방문해도 최단 경로는 갱신되지 않는다.
이렇게 1번 노드에서 각 노드로 가는 최단 경로를 찾았다.
한가지 눈여겨볼 점은 어떤 노드를 선택한 뒤 탐색했을 때 더 이상 해당 노드에 대한 최단 경로는 갱신되지 않는다는 점이다.
생각해보면 노드를 바꾸어 새롭게 탐색을 하는 기준은 비용이 가장 저렴한 노드임으로 이미 해당 노드에 대해서 최단 경로가 설정된 것이다.
따라서 다익스트라 알고리즘은 한 단계당 하나의 노드에 대한 최단 거리를 확실히 찾는 알고리즘인 것이다.
마지막 노드인 6번을 선택하여 탐색했을 때도 더 이상 갱신이 일어나지 않는데 6번 노드를 탐색할 순서에서는 이미 각 노드에 대한 최단 경로가 확정되어있는 상태이기 때문이다.
import sys
input = sys.stdin.readline
# 무한
INF = int(1e9)
# 노드와 간선의 갯수를 입력받는다.
n, m = map(int, input().split())
# 문제에서 주어진 시작 노드로 초기화한다.
start = int(input())
# 노드에 연결되어있는 노드에 대한 정보를 담는 2차원 배열을 생성한다.
# 방문 여부를 체크하는 배열을 만들고 초기화시킨다.
graph = [[] for i in range(n + 1)]
visited = [False] * (n + 1)
# 최단 거리 테이블을 모두 무한으로 초기화한다.
distance = [INF] * (n + 1)
for _ in range(m):
a, b, c = map(int, input().split())
# a 번 노드에서 b번 노드로 가는 비용이 c라는 의미
# 보통 가중치(거리, 비용)가 있는 그래프를 표현할 때 이렇게 한다.
graph[a].append((b, c))
def get_smallest_node() {
min_value = INF
# 가장 거리가 짧은 노드의 인덱스
index = 0
for i in range(1, n+1):
if dijkstra[i] < min_value and not visited[i]:
min_value = dijkstra[i]
index = i
return index
}
def dijkstra(start):
# 시작 노드에 대해 자기 자신에서 자기 자신으로 가는 비용을 0으로 초기화한다.
distance[start] = 0
visited[start] = True
for j in graph[start]:
distance[j[0]] = j[1]
# 시작 노드를 제외한 n-1개의 노드에 대해 반복한다.
for i in range(n - 1):
# 현재 최단 거리가 가장 짧은 노드를 꺼내서 방문 처리한다.
now = get_smallest_node()
visited[now] = True
# 현재 노드와 연결된 다른 노드를 확인한다.
for j in graph[now]:
cost = distance[now] + j[1]
# 만약 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우 최단 거리로 갱신한다.
if cost < distance[j[0]]:
distance[j[0]] = cost
dijkstra(start)
for i in range(1, n + 1):
if distance[i] == INF:
print("INFINITY")
else:
print(distance[i])
기본 코드는 이렇고 다익스트라의 시간 복잡도는 알고리즘을 수행하며 각각의 노드를 순회하며 연결된 노드를 선형탐색하기 때문에 O(V)에 걸쳐 확인해야하고 현재 노드와 연결된 노드를 확인하기 때문에 시간 복잡도는 O(V^2)다.
노드가 100개라면 시간 복잡도는 1만인 것이다.
만약 노드가 10000개라면 시간복잡도는 100000000가 되니 노드의 갯수가 많아진다면 문제를 해결하기 어렵다.
좀 더 개선된 코드는 없을까?
기존의 다익스트라는 최단 거리 테이블을 하나씩 탐색해야했고 이로 인해 O(V)의 시간복잡도를 가지게된다.
개선된 다익스트라 구현
힙이란 우선순위 큐를 구현하기 위한 자료구조로 여러 개의 값들 중에서 최댓값이나 최솟값을 빠르게 찾아내도록 만들어진 자료구조다. 이진 트리의 일종이라고 생각하면 된다.
우선순위 큐는 우선 순위가 가장 높은 데이터를 가장 먼저 삭제한다는 특징이 있다. 예를 들어 여러 개의 물건을 넣었다가 우선순위가 높은 물건부터 꺼내어 사용하고 싶을 때 우선순위 큐 자료구조를 사용한다.
그럼 이 우선순위 큐를 어떻게 적용할 수 있을 지 생각해보자.
개선된 다익스트라 방식의 코드는 모든 원소를 저장한 뒤 우선순위에 맞게 꺼낸다. 위에서 본 대로 리스트를 사용할 경우 데이터 삽입시간은 O(1)이며 삭제시간은 O(N)이 되고 힙을 사용할 경우 삽입시간과 삭제시간은 모두 O(logN)의 시간복잡도를 가진다.
위에서 살펴본 그래프를 살펴보자.
1번 노드에서 시작하여 모든 노드의 비용을 무한으로 설정한다. 그리고 우선순위 큐에 1번 노드를 넣는다.
우선순위 큐에 들어간 데이터는 (거리, 노드)로 (0, 1)이 된다. 거리가 가장 짧은 노드는 우선순위 큐를 사용하기 때문에 바로 꺼내면 된다.
만약 노드를 처리한 적이 있다면 무시하고 방문하지 않은 노드만 처리하면 된다.
1번 노드를 걸쳐 2, 3, 4번 노드로 가는 최소 비용은 0 + 2, 0 + 5, 0 + 1로 계산된다.
위와 같은 과정을 반복한다.
6 11 // 노드의 개수와 간선의 개수
1 // 시작점
1 2 2
1 3 5
1 4 1
2 3 3
...
import heapq
import sys
input = sys.stdin.readline
INF = int(le9)
n, m = map(int, input.split())
start = int(input())
graph = [[] for i in range(n + 1)]
distance = [INF] * (n + 1)
for _ in range(m):
a, b, c = map(int, input.split())
# 문제에서 주어진 노드끼리의 비용 저장
# a노드에서 b로 가는 비용이 c라는 의미다.
graph[a].append((b, c))
def dijkstra(start):
q = []
# 시작 노드로 가기 위한 최단 경로는 0으로 설정하여 큐에 삽입
heapq.heappush(q, (0, start))
distance[start] = 0
# 큐가 모두 빌 때까지 반복
while q:
# 가장 최단 거리가 짧은 노드에 대한 정보 꺼내기
dist, now = heapq.heappop(q)
# 현재 노드가 이미 처리된 적 있는 노드라면 패스
if distance[now] < dist:
continue
# 현재 노드와 연결된 인접 노드 확인
for i in graph[now]:
cost = dist + i[1]
# 현재 노드를 거쳐서 다른 노드로 이동하는 거리가 더 짧은 경우
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost, i[0]))
dijkstra(start)
for i in range(1, n + 1):
if distance[i] == INF:
print("INFINITY")
else:
print(distance[i])
플로이드 워셜 알고리즘
플로이드 워셜 알고리즘은 다익스트라 알고리즘과는 달리 모든 지점에서 다른 모든 지점까지의 최단 경로를 구해야할 때 사용할 수 있는 알고리즘이다.
다익스트라는 단계마다 최단 거리를 가지는 노드를 하나씩 반복적으로 선택한다. 그리고 해당 노드를 거쳐 가는 경로를 확인하고 최단 거리 테이블을 갱신하는 방식으로 동작한다.
플로이드 워셜도 마찬가지로 거쳐가는 노드를 기준으로 알고리즘을 수행한다는 점은 다익스트라와 동일하지만 매번 방문하지 않은 최단 거리를 갖는 노드를 찾을 필요가 없다는 차이점이 있다.
노드의 갯수가 N개일 경우 알고리즘상 N번의 단계를 수행하고 단계마다 O(N^2)의 연산을 통해 현재 노드를 거쳐가는 모든 경로를 고려한다. 따라서 플로이드 워셜 알고리즘의 총 시간 복잡도는 O(N^3)이 된다.
플로이드 워셜 알고리즘은 모든 노드에 대하여 다른 모든 노드로 가는 거리를 저장해야하기 때문에 2차원 리스트에 최단거리 정보를 저장한다.
다익스트라 알고리즘은 그리디 알고리즘에 속하지만 플로이드 워셜 알고리즘은 다이내믹 프로그래밍이라는 특징이 있다. 노드의 갯수가 N개라고 하면 N번만큼의 단계를 반복하고 점화식에 맞게 2차원 리스트를 갱신하기 때문에 다이나믹 프로그래밍에 속한다.
예를 들어 1번 노드에 대해 확인할 때는 중간에 1번 노드를 거쳐가는 모든 경우를 고려하면 된다.
A -> 1번 노드 -> B로 가는 비용을 확인한 후에 최단 거리를 갱신하는 식이다.
기존 비용이 5로 기록이 되어있고 위와 같이 확인했을 때 비용이 3이라면 A에서 B로 이동하는 비용을 2로 갱신한다.
점화식은 다음과 같이 간략하게 나타낼 수 있다.
D(A에서 B로 가는 비용) = min(기존 비용, A에서 1을 거쳐 B로 가는 비용)
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)
n, m = map(int, input().split())
start = int(input())
graph = [[]for _ in range(n + 1)]
distance = [INF] * (n + 1)
# 문제에서 주어진 간선 정보 입력받기
for _ in range(m):
a, b, c = map(int, input().split())
# A번 노드에서 B번 노드로 가는 비용이 C
graph[a].append((b, c))
def dijkstra(start):
q = []
heapq.heappush(q, (0, start))
distance[start] = 0
while q:
dist, now = heapq.heappop(0)
if distance[now] < dist:
continue
for i in graph[now]:
cost = dist + i[1]
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost, i[0]))
dijkstra(start)
for i in range(1, n+1):
if distance[i] == INF:
print("INFINITY")
else:
print(distance[i])
문제 풀이
미래도시
도시에는 1번부터 N번까지의 회사가 있고 특정 회사끼리는 도로로 연결되어 있다. 판매원 A는 현재 1번 회사에 위치해 있으며 X번 회사에 방문해 물건을 판매하려한다.
연결된 회사는 양방향으로 이동할 수 있고 회사끼리 도로로 연결되어있다면 비용은 1이 된다.
판매원 A는 소개팅 일정도 소화하려하고 상대는 K번 회사에 존재한다. A는 X번 회사에 가서 물건을 판매하기 전에 먼저 소개팅을 할 예정이다.
A가 1번 회사에서 출발하여 K번째 회사를 방문한 뒤 X번 회사를 가는 게 목표고 가능한 빠르게 이동해야한다. 이 때 최소 시간을 계산하는 프로그램을 작성하시오.
(1, 2), (1, 3), (1, 4), (2, 4), (3, 4), (3, 5), (4, 5)
예를 들어 위와 같이 도로가 놓여있다고 할 때 A가 4번 회사에 가능 경로를 1, 3, 5, 4로 설정한다면 소개팅에도 참석할 수 있고 총 3의 비용을 들여 이동할 수 있다.
따라서 답은 3이다.
전형적인 플로이드 워셜 알고리즘 문제다.
INF = int(1e9) # 무한대
# 노드와 간선의 갯수 입력받기
n, m = map(int, input().split())
# 2차원 그래프를 만들고 거리를 무한으로 초기화 시킴
graph = [[INF] * (n+1) for _ in range(n+1)]
# 자기 자신에서 자기 자신으로 가는 비용을 0으로 갱신함
for a in range(1, n+1):
for b in range(1, n+1):
if a == b:
graph[a[b] = 0
# 간선에 대한 정보를 입력받아 그 값으로 초기화
for _ in range(m):
a, b = map(int, input().split())
graph[a][b] = 1
graph[b][a] = 1
# 거쳐갈 노드와 최종 목적지 노드를 입력받음
x, k = map(int, input().split())
# 플로이드 워셜 알고리즘 실행
for k in range(1, n+1):
for a in range(1, n+1):
for b in range(1, n+1):
graph[a][b] = min(graph[a][b], graph[a][k] + graph[k][b])
# 결과 추출
distance = graph[1][k] + graph[k][x]
# 문제의 조건에 따라 도달할 수 없다면 -1을 출력한다.
if distance < INF:
print("-1")
else:
print(distance)
전보
N개의 나라가 있고 각 도시는 보내고싶은 메시지가 있는 경우 다른 도시로 전보를 보낼 수 있다. 하지만 X도시에서 Y도시로 전보를 보내려고한다면 X에서 Y로 향하는 통로가 있어야한다.
예를 들어 X에서 Y로 통하는 통로는 있지만 Y에서 X로 향하는 통로가 없다면 Y는 X로 메시지를 보낼 수 없다. 또한 메시지를 보낼 때 일정시간이 소화된다.
어느 날 C 도시에 응급상황이 발생하여 최대한 많은 도시로 메시지를 보내려고 한다. 최대한 많은 메시지를 보냈을 때 C도시의 메시지를 받은 도시의 개수와 메시지를 받는 데까지 걸리는 시간을 구하라.
입력 예시
3 2 1
1 2 4
1 3 2
결국 다익스트라 알고리즘을 사용하라는 말이다.
import heapq
import sys
input = sys.stdin.readline
INF = int(1e9)
n, m, start = map(int, input().split())
graph = [[] for i in range(n + 1)]
distance = [INF] * (n + 1)
for _ in range(m):
x, y, z = map(int, input().split())
graph[x].append((y, z))
def dijkstra(start):
q = []
heapq.heappush(q, (0, start))
distance[start] = 0
wile q:
dist, now = heapq.heappop(q)
if distance[now] < dist:
continue
for i in graph[now]:
cost = dist + i[1]
if cost < distance[i[0]]:
distance[i[0]] = cost
heapq.heappush(q, (cost, i[0]))
dijkstra(start)
count = 0
max_distance = 0
for d in distance:
if d != INF:
count += 1
max_distance = max(max_distance, d)
print(count - 1, max_distance)