Toolofv 님의 블로그

[Python] 백준 - 11066 파일 합치기 본문

Algorithm

[Python] 백준 - 11066 파일 합치기

Toolofv 2024. 10. 21. 18:32

문제

소설가인 김대전은 소설을 여러 장(chapter)으로 나누어 쓰는데, 각 장은 각각 다른 파일에 저장하곤 한다. 소설의 모든 장을 쓰고 나서는 각 장이 쓰여진 파일을 합쳐서 최종적으로 소설의 완성본이 들어있는 한 개의 파일을 만든다. 이 과정에서 두 개의 파일을 합쳐서 하나의 임시파일을 만들고, 이 임시파일이나 원래의 파일을 계속 두 개씩 합쳐서 소설의 여러 장들이 연속이 되도록 파일을 합쳐나가고, 최종적으로는 하나의 파일로 합친다.

 

두 개의 파일을 합칠 때 필요한 비용(시간 등)이 두 파일 크기의 합이라고 가정할 때, 최종적인 한 개의 파일을 완성하는데 필요한 비용의 총 합을 계산하시오.

 

예를 들어, C1, C2, C3, C4가 연속적인 네 개의 장을 수록하고 있는 파일이고, 파일 크기가 각각 40, 30, 30, 50 이라고 하자. 이 파일들을 합치는 과정에서, 먼저 C2와 C3를 합쳐서 임시파일 X1을 만든다. 이때 비용 60이 필요하다. 그 다음으로 C1과 X1을 합쳐 임시파일 X2를 만들면 비용 100이 필요하다.

 

최종적으로 X2와 C4를 합쳐 최종파일을 만들면 비용 150이 필요하다. 따라서, 최종의 한 파일을 만드는데 필요한 비용의 합은 60+100+150=310 이다. 다른 방법으로 파일을 합치면 비용을 줄일 수 있다. 먼저 C1과 C2를 합쳐 임시파일 Y1을 만들고, C3와 C4를 합쳐 임시파일 Y2를 만들고, 최종적으로 Y1과 Y2를 합쳐 최종파일을 만들 수 있다. 이때 필요한 총 비용은 70+80+150=300 이다.

 

소설의 각 장들이 수록되어 있는 파일의 크기가 주어졌을 때, 이 파일들을 하나의 파일로 합칠 때 필요한 최소비용을 계산하는 프로그램을 작성하시오.

입력

프로그램은 표준 입력에서 입력 데이터를 받는다. 프로그램의 입력은 T개의 테스트 데이터로 이루어져 있는데, T는 입력의 맨 첫 줄에 주어진다.각 테스트 데이터는 두 개의 행으로 주어지는데, 첫 행에는 소설을 구성하는 장의 수를 나타내는 양의 정수 K (3 ≤ K ≤ 500)가 주어진다. 두 번째 행에는 1장부터 K장까지 수록한 파일의 크기를 나타내는 양의 정수 K개가 주어진다. 파일의 크기는 10,000을 초과하지 않는다.

출력

프로그램은 표준 출력에 출력한다. 각 테스트 데이터마다 정확히 한 행에 출력하는데, 모든 장을 합치는데 필요한 최소비용을 출력한다.

 

 

필요한 도구

 

1. 누적합 리스트 : 

1) 파일을 합치는 비용은 토너먼트식으로 누적되어 반영되는데, 그 중에서 최소값의 경우를 찾아야 한다.

2) 합치는 비용이 누적되어 결국 마지막에는 전체 더해주는 비용까지 더해야 한다. 누적합을 이용할 수 있다.

 

2. DP or 재귀함수

3. PyPy3

 

문제해결방법

 

 

1. 토너먼트 방식인데, 어떤 대진표를 거치냐에 따라 파일을 합치는 비용이 달라진다. 

 

1) 토너먼트를 거치면서 DP에 합친 비용을 반영해준다. DP는 DP[시작파일][합칠파일]이 된다. 

 

 

2. for문이나 재귀함수의 방법이 있다. 이 부분은 떠올리기 쉽지 않을 것 같다.

 

for m in range(1, k):    # 1   2   3
    for l in range(k-m): # 012 01  0
        r = l + m        # 123 23  3
        ans = sys.maxsize
        for i in range(l, r):
            ans = min(ans, dp[l][i] + dp[i+1][r] + (pre[r+1]-pre[l]))
        dp[l][r] = ans

 

1) 첫 for문은 m은 파일간의 간격이다. 먼저 파일[0][1]파일[1][2], 파일[2][3]을 합친 값을 구하고 DP에 반영한다. 이후 m이 늘어나면서 파일[0][2], 파일[1][3]의 비용을 구해주고, DP에 반영한다. 마지막에는 파일[0][3]의 비용이 반영되고, 합칠 비용의 최소값이 들어있게 된다.

 

최소값이 들어가는 과정은 i의 변화에 따라 달라진다. 예를 들어 파일[1][3]의 경우, a와 b중 최소값이 들어가게 된다. 첫 for문 m을 통해 간격이 늘어나면서 DP가 반영되간다.

 

a. 파일[1][2]   +   파일[3][3](0)   +   파일[1][3]의 누적합

b. 파일[1][1](0)   +   파일[2][3]   +   파일[1][3]의 누적합

 

def sol(l, r):
    if dp[l][r] != 0:
        return dp[l][r]
    if l == r:
        return 0
    ans = sys.maxsize
    for i in range(l, r):
        ans = min(ans, sol(l, i) + sol(i+1, r) + (pre[r+1]-pre[l]))
    dp[l][r] = ans
    return dp[l][r]

 

2) 재귀함수의 방법도 원리는 같은데, 변수 lr이 for문이 아니라 재귀함수의 인자로 최소값을 구하는 과정에서 sol(l, i), sol(i+1, r)로 간격이 1일 때까지 파고들어가 DP를 반영해가는 구조다. 

 

마찬가지로 l과 r의 간격이 벌어질수록 i가 변화하여 최소값을 찾는다. 파일[1][3]의 경우, 다음과 같이 최소값을 반영한다.

 

a. sol(1, 2)   +   sol(3, 3)(0)   +   파일[1][3]의 누적합

b. sol(1, 1)(0)   +   sol(2, 3)   +   파일[1][3]의 누적합

 

 

- 코드

 

1. for문

import sys
input = sys.stdin.readline

for _ in range(int(input())):
    k = int(input())
    p = list(map(int, input().split()))
    dp = [[0 for _ in range(k)] for _ in range(k)]
    t, pre = 0, [0]
    for i in range(k):
        t += p[i]
        pre.append(t)
    for m in range(1, k):    # 1   2   3
        for l in range(k-m): # 012 01  0
            r = l + m        # 123 23  3
            ans = sys.maxsize
            for i in range(l, r):
                ans = min(ans, dp[l][i] + dp[i+1][r] + (pre[r+1]-pre[l]))
            dp[l][r] = ans
    print(dp[0][k-1])

 

 

2. 재귀함수

import sys
input = sys.stdin.readline

def sol(l, r):
    if dp[l][r] != 0:
        return dp[l][r]
    if l == r:
        return 0
    ans = sys.maxsize
    for i in range(l, r):
        ans = min(ans, sol(l, i) + sol(i+1, r) + (pre[r+1]-pre[l]))
    dp[l][r] = ans
    return dp[l][r]

for _ in range(int(input())):
    k = int(input())
    p = list(map(int, input().split()))
    dp = [[0 for _ in range(k)] for _ in range(k)]
    t, pre = 0, [0]
    for i in range(k):
        t += p[i]
        pre.append(t)
    sol(0, k-1)
    print(dp[0][k-1])

 

반응형