반응형

민교네 전자 매장에는 부품이 N개 있다. 각 부품은 정수 형태의 고유한 번호가 있다. 어느 날 손님이 M개 종류의 부품을 대량으로 구매하겠다며 당일 날 견적서를 요청했다. 민교는 때를 놓치지 않고 손님이 문의한 부품 M개 종류를 모두 확인해서 견적서를 작성해야 한다.
이때 가게 안에 부품이 모두 있는지 확인하는 프로그램을 작성해보자.
예를 들어 가게의 부품이 총 5개일 때 부품 번호가 다음과 같다고 하자.

N = 5

[8, 3, 7, 9, 2]

손님은 총 3개의 부품이 있는지 확인 요청했는데 부품 번호는 다음과 같다.

M = 3
[5, 7, 9]

이때 손님이 요청한 부품 번호의 순서대로 부품을 확인해 부품이 있으면 yes를 , 없으면 no를 출력한다. 구분은 공백으로 한다.
[입력 조건]

  • 첫째 줄에 정수 N이 주어진다. (1 <= N <= 1,000,000)
  • 둘째 줄에는 공백으로 구분하여 N개의 정수가 주어진다. 이때 정수는 1보다 크고 1,000,000 이하이다.
  • 셋째 줄에는 정수 M이 주어진다. (1 <= M <= 100,000)
  • 넷째 줄에는 공백으로 구분하여 M개의 정수가 주어진다. 이때 정수는 1보다 크고, 1,000,000 이하이다.

[출력 조건]

  • 첫째 줄에 공백으로 구분하여 각 부품이 존재하면 yes를, 없으면 no를 출력한다.

[입력 예시]

5
8 3 7 9 2
3 
5 7 9

[출력 예시]

no yes yes

문제 해설

이 문제는 여러 방법으로 해결할 수 있다. 여기서는 가장 먼저 이진 탐색 알고리즘으로 풀이할 텐데, 이처럼 다량의 데이터 검색은 이진 탐색 알고리즘을 이용해 효과적으로 처리할 수 있다.
먼저 매낭 내 N개의 부품을 번호로 기준으로 정렬하자. 그 이후에 M개의 찾고자 하는 부품이 각각 매장에 존재하는지 검사하면 된다. 이때 매장의 부품들은 정렬이 되어 있기 때문에 이진 탐색을 수행하여 찾을 수 있다.
따라서 이렇게 문제를 풀면, 부품을 찾는 과정에서 최악의 경우 시간 복잡도 O(M * logN)의 연산이 필요하므로 이론상 최대 약 200만 번의 연산이 이루어진다고 분석할 수 있다. 오히려 N개의 부품을 정렬하기 위해서 요구되는 시간 복잡도 O(N * logN)이 이론적으로 최대 약 2,000만으로 더욱더 많은 연산이 필요한 것을 알 수 있다(log(아래2)1,000,000 ≈ 20). 결과적으로 이진 탐색을 사용하는데 문제 풀이 방법의 경우 시간 복잡도는 O((M + N) * logN)이다.
우리가 지금까지 배운 이진 탐색 알고리즘을 이용한 풀이는 다음 소스코드와 같다.
[7-5.py] 답안 예시 (이진 탐색)

# 7-5.py  답안 예시(이진 탐색)

# 이진 탐색 소스코드 구현(반복문)
def binary_search(array, target, start, end):
    while start <= end:
        mid = (start + end) // 2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
            return mid
        # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
        elif array[mid] > target:
            end = mid - 1
        # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
        else:
            start = mid + 1
    return None

# N(가게의 부품 개수) 입력
n = int(input())
# 가게에 있는 전체 부품 번호를 공백으로 구분하여 입력
array = list(map(int, input().split()))
array.sort()    # 이진 탐색을 수행하기 위해 사전에 정렬 수행
# M(손님이 확인 요청한 부품 개수 입력)
m = int(input())
# 손님이 확인 요청한 전체 부품 번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))

# 손님이 확인 요청한 부품 번호를 하나씩 확인
for i in x:
    # 해당 부품이 존재하는지 확인
    result = binary_search(array, i, 0, n-1)
    if result != None:
        print('yes', end=' ')
    else:
        print('no', end=' ')

이진 탐색 말고도 계수 정렬의 개념을 이용하여 문제를 풀 수도 있다. 모든 원소의 번호를 포함할 수 있는 크기의 리스트를 만든 뒤에, 리스트의 인덱스에 직접 접근하여 특정한 번호의 부품이 매장에 존재하는지 확인하면 된다.
[7-6.py] 답안 예시 (계수 정렬)

# 7-6.py 답안 예시(계수 정렬)

# N(가게의 부품 개수)을 입력받기
n = int(input())
array = [0] * 1000001

# # 가게에 있는 전체 부품 번호를 입력받아서 기록 (방식1)
# n2 = list(map(int, input().split()))
# for i in n2:
#     array[i] = 1

# # 가게에 있는 전체 부품 번호를 입력받아서 기록 (방식2)
for i in input().split():
    array[int(i)]=1


# M(손님이 확인 요청한 부품 개수)을 입력받기
m = int(input())
# 손님이 확인 요청한 전체 부품 번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))

# 손님이 확인 요청한 부품 번호를 하나씩 확인
for i in x:
    if array[i] == 1:
        print('yes', end = ' ')
    else:
        print("no", end = ' ')

또는 이 문제는 단순히 특정한 수가 한 번이라도 등장했는지를 검사하면 되므로 집합 자료형을 이용해서 문제를 해결할 수 있다.
set() 함수는 집합 자료형을 초기화할 때 사용한다. 이러한 집합 자료형은 단순히 특정한 데이터가 존재하는지 검사할 때에 매우 효과적으로 사용할 수 있다. 다음의 소스코드가 간결한 측면에서는 가장 우수하다.
[7-7.py] 답안 예시(집합 자료형 이용)

# 7-7.py 답안 예시(집합 자료형 이용)

# N(가게의 부품 개수)을 입력받기
n = int(input())
# 가게에 있는 전체 부품 번호를 입력받아서 집합(set) 자료형에 기록
array = set(map(int, input().split()))

# M(손님이 확인 요청한 부품 개수)을 입력받기
m = int(input())
# 손님이 확인 요청한 전체 부품 번호를 공백으로 구분하여 입력
x = list(map(int, input().split()))

# 손님이 확인 요청한 부품 번호를 하나씩 확인
for i in x:
    # 해당 부품이 존재하는지 확인
    if i in array:
        print('yes', end = ' ')
    else:
        print('no', end = ' ')

하지만 이진 탐색으로도 충분히 풀 수 있으며, 경험이 많지 않으면 이진 탐색을 이용한 해법보다 집합 자료형을 이용한 해법을 떠올리기 어려울 수 있고, 혹은 그 반대일 수도 있다. 따라서 동일한 문제를 여러 가지 방법으로 풀 수 있으며, 이 문제는 3가지 방법을 이용해 모두 효과적으로 풀 수 있다는 점을 기억하자.


반응형