[이코테] APPENDIX - A / 코딩 테스트 주요 라이브러리 문법과 유의점(내장함수, itertools, heapq, bisect, collections, math)
파이썬에서 지원하는 표준 라이브러리는 굉장히 다양하지만, 코딩 테스트를 준비하며 반드시 알아야 하는 라이브러리는 6가지 정도이다. (이 6가지 라이브러리의 가장 중요하고 알아두어야 할 핵심 내용만 요약하여 설명하고자 함)
- 내장함수 : print(), input()과 같은 기본 입출력 기능부터 sorted()와 같은 정렬 기능을 포함한 기본 내장 라이브러리
- itertools : 파이썬에서 반복되는 형태의 데이터를 처리하는 기능을 제공하는 라이브러리 (순열과 조합 라이브러리)
- heapq : 힙(Heap) 기능을 제공하는 라이브러리,. 우선순위 큐 기능을 구현하기 위해 사용
- bisect : 이진 탐색(Binary Search) 기능을 제공하는 라이브러리
- collections : 덱(deque), 카운터(Counter) 등의 유용한 자료구조를 포함하고 있는 라이브러리
- math : 필수적인 수학적 기능을 제공하는 라이브러리, 팩토리얼, 제곱근, 최대공약수(GCD),삼각함수 관련 함수 포함
내장함수
파이썬에는 별도의 import 명령어 없이 바로 사용할 수 있는 재아 함수가 존재한다.
- sum()
sum() 함수는 리스트와 같은 iterable객체(ex 반복가능한 객체로 리스트, 사전 자료형, 튜플자료형 등이 해당)가 입력으로 주어졌을 때, 모든 원소의 합을 반환한다.
리스트 [1, 2, 3, 4, 5]의 모든 원소의 값을 더하는 예시를 확인해보자.
result = sum([1, 2, 3, 4, 5])
print(result)
15
- min()
min() 함수는 파라미터가 2개 이상 들어왔을 때 가장 작은 값을 반환한다.
예를 들어 특정한 4개의 정수 중에서 가장 작은 수를 출력하는 예시를 확인해보자.
result = min(7, 3, 5, 2)
print(result)
2
- max()
max() 함수는 파라미터가 2개 이상 들어왔을 때 가장 큰 값을 반환한다.
마찬가지로 4개의 정수 중에서 가장 큰 수를 출력하는 예시를 확인해보자.
result = max(7, 3, 5, 2)
print(result)
7
- eval()
eval() 함수는 수학 수식이 문자열 형식으로 들어오면 해당 수식을 계산한 결과를 반환한다.
예를 들어 무낮열 형태로 주어진 수식(3+5)*7을 계산하는 소스코드는 다음과 같다.
result = eval("(3+5) * 7")
print(result)
56
- sorted()
sorted() 함수는 iterable 객체가 들어왔을 때, 정렬된 결과를 반환한다.
key 속성으로 정렬 기준을 명시할 수 있으며, reverse 속성으로 정렬된 리스트를 뒤집을지의 여부를 설정할 수 있다.
리스트 [9, 1, 8, 5, 4]를 오름차순으로 정렬하는 예시와 내림차순으로 정렬하는 예시는 다음과 같다.
result = sorted([9, 1, 8, 5, 4])
print(result)
result = sorted([9, 1, 8, 5, 4], reverse = True)
print(result)
[1, 4, 5, 8, 9]
[9, 8, 5, 4, 1]
파이썬에서는 리스트의 원소로 리스트나 튜플이 존재할 때 특정한 기준에 따라서 정렬을 수행할 수 있다
정렬 기준은 key 속성을 이용해 명시할 수 있다.
예를 들어 리스트 [('홍길동', 35), ('이순신', 75), ('아무개', 50)]이 있을 때, 원소를 튜플의 두 번째 원소(수)를 기준으로 내림차순으로 정렬하고자 한다면 다음과 같이 사용할 수 있다.
result = sorted([('홍길동', 35), ('이순신', 75), ('아무개', 50)], key = lambda x:x[1], reverse = True)
print(result)
result = sorted([('홍길동', 35), ('이순신', 75), ('아무개', 50)], key = lambda x:x[0], reverse = True)
print(result)
[('이순신', 75), ('아무개', 50), ('홍길동', 35)]
[('홍길동', 35), ('이순신', 75), ('아무개', 50)]
리스트와 같은 iterable 객체는 기본으로 sort() 함수를 내장하고 있어서 굳이 sorted() 함수를 사용하지 않고도 sort() 함수를 사용해서 정렬할 수 있다.
이 경우 리스트 객체의 내부 값이 정렬된 값으로 바로 변경된다.
리스트 [9, 1, 8, 5, 4]를 오름차순으로 정렬하는 예시는 다음과 같다.
data = [9, 1, 8, 5, 4]
data.sort()
print(data)
[1, 4, 5, 8, 9]
itertools
itertools는 파이썬에서 반복되는 데이터를 처리하는 기능을 포함하고 있는 라이브러리이다.
코딩 테스트에서 가장 유용하게 사용할 수 있는 클래스는 permutations, combinations 이다.
- permutations()
permutations는 리스트와 같은 itertable 객체에서 r개의 데이터를 뽑아 일렬로 나열하는 모든 경우(순열)을 계산해준다.
permutations는 클래스이므로 객체 초기화 이후에는 리스트 자료형으로 변환하여 사용한다.
리스트 ['A', 'B', 'C']에서 3개(r=3)를 뽑아 나열하는 모든 경우를 출력하는 예시는 다음과 같다.
from itertools import permutations
data = ['A', 'B', 'C'] # 데이터 분비
result = list(permutations(data, 3)) #모든 순열 구하기
print(result)
[('A', 'B', 'C'), ('A', 'C', 'B'), ('B', 'A', 'C'), ('B', 'C', 'A'), ('C', 'A', 'B'), ('C', 'B', 'A')]
- combinations()
combinations는 리스트와 같은 iterable 객체에서 r개의 데이터를 뽑아 순서를 고려하지 않고 나열하는 모든 경우(조합)를 계산한다.
combinations는 클래스이므로 객체 초기화 이후에는 리스트 자료형으로 변환하여 사용한다.
리스트 ['A', 'B', 'C']에서 2개(r=2)를 뽑아 순서에 상관없이 나열하는 모든 경우를 출력하는 예시는 다음과 같다.
from itertools import combinations
data = ['A', 'B', 'C'] #데이터 준비
result = list(combinations(data, 2)) # 2개를 뽑는 모든 조합 구하기
print(result)
[('A', 'B'), ('A', 'C'), ('B', 'C')]
- product()
product는 permutations와 같이 리스트와 같은 iterable 객체에서 r개의 데이터를 뽑아 일렬로 나열하는 모든 경우(순열)를 계산한다.
다만, 원소를 중복하여 뽑는다. product 객체를 초기화 할 때는 뽑고자 하는 데이터의 수를 repeat 속성값으로 넣어준다.
product는 클래스이므로 객체 초기화 이후에는 리스트 자료형으로 변환하여 사용한다.
리스트 ['A', 'B', 'C']에서 중복을 포함하여 2개(r = 2)를 뽑아 순서에 상관없이 나열하는 모든 경우를 출력하는 예시는 다음과 같다.
from itertools import product
data = ['A', 'B', 'C'] # 데이터 준비
result = list(product(data, repeat = 2)) # 2개를 뽑는 모든 순열 구하기 (중복 허용)
print(result)
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'A'), ('B', 'B'), ('B', 'C'), ('C', 'A'), ('C', 'B'), ('C', 'C')]
- combinations_with_replacement
combinations_with_replacement 는 combinations와 같이 리스트와 같은 iterable 객체에서 r개의 데이터를 뽑아 순서를 고려하지 않고 나열하는 모든 경우(조합)를 계산한다.
다만 원소를 중복해서 뽑는다.
combinations_with_replcaement는 클래스이므로 객체 초기화 이후에는 리스트 자료형으로 변환하여 사용해야 한다.
리스트 ['A', 'B', 'C']에서 중복을 포함하여 2개(r = 2)를 뽑아 순서에 상관없이 나열하는 모든 경우를 출력하는 예시는 다음과 같다.
from itertools import combinations_with_replacement
data = ['A', 'B', 'C']
result = list(combinations_with_replacement(data, 2))
print(result)
[('A', 'A'), ('A', 'B'), ('A', 'C'), ('B', 'B'), ('B', 'C'), ('C', 'C')]
heapq
파이썬에서는 힙(Heap) 기능을 위해 heapq 라이브러리를 제공한다.
heapq는 다익스트라 최단 경로 알고리즘을 포함해 여러 알고리즘에서 우선순위 큐 기능을 구현하고자 할 때 사용된다.
heapq외에도 PriorityQueue 라이브러리를 사용할 수 있지만, 코딩 테스트 환경에서는 보통 heapq가 더 빠르게 동작하므로 heapq를 이용하도록 하자.
파이썬의 힙은 최소 힙(Min Heap)으로 구성되어 있으므로 단순히 원소를 힙에 전부 넣었다가 빼는 것만으로도 시간 복잡도 O(NlogN)에 오름차순 정렬이 완료된다.
보통 최소 힙 자료구조의 최상단 원소는 항상 '가장 작은'원소이기 때문이다.
힙에 원소를 삽입할 때는 heapq.heappush() 메서드를 이용하고, 힙에서 원소를 꺼내고자 할 때는 heapq.heppop() 메서드를 이용한다.
힙 정렬(Heap Sort)을 heapq로 구현하는 예제를 통해 heapq의 사용방법을 알아보자.
import heapq
def heapsort(iterable):
h = []
result = []
# 모든 원소를 차례대로 힙에 삽입
for value in iterable:
heapq.heappush(h, value)
# 힙에 삽입된 모든 원소를 차례대로 꺼내어 답기
for i in range(len(h)):
result.append(heapq.heappop(h))
return result
result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(result)
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
또한 파이썬에서는 최대 힙(Max Heap)을 제공하지 않는다.
따라서 heapq 라이브러리를 이용하여 최대 힙을 구현해야 할 때는 원소의 부호를 임시로 변경하는 방식을 사용한다.
힙에 원소를 삽입하기 전에 잠시 부호를 반대로 바꾸었다가, 힙에서 원소를 꺼낸 뒤에 다시 원소의 부호를 바꾸면 된다.
이러한 방식으로 최대 힙을 구현하여 내림차순 힙 정렬을 구현하는 예시는 다음과 같다.
import heapq
def heapsort(iterable):
h = []
result = []
# 모든 원소를 차례대로 힙에 삽입
for value in iterable:
heapq.heappush(h, -value)
# 힙에 삽입된 모든 원소를 차례대로 꺼내어 담기
for i in range(len(h)):
result.append(-heapq.heappop(h))
return result
result = heapsort([1, 3, 5, 7, 9, 2, 4, 6, 8, 0])
print(result)
[9, 8, 7, 6, 5, 4, 3, 2, 1, 0]
bisect
파이썬에서는 이진 탐색을 쉽게 구현할 수 있도록 bisect 라이브러리를 제공한다.
bisect 라이브러리는 "정렬된 배열"에서 특정한 원소를 찾아야 할 때 매우 효과적으로 사용된다.
bisect 라이브러리에서는 bisect_left() 함수와 bisect_right() 함수가 가장 중요하게 사용되며, 이 두 함수는 시간복잡도 O(logN)에 동작한다.
- bisect_left(a, x) : 정렬된 순서를 유지하면서 리스트 a에 데이터 x를 삽입할 가장 왼쪽 인덱스를 찾는 메서드
- bisect_right(a, x) : 정렬된 순서를 유지하도록 리스트 a에 데이터 x를 삽입할 가장 오른쪽 인덱스를 찾는 메서드
예를 들어 정렬된 리스트 [1, 2, 4, 4, 8]이 있을 때, 새롭게 데이터 4를 삽입하려 한다고 가정하자.
이때 bisect_left(a, 4)와 bisect_right(a, 4)는 각각 인덱스 값으로 2와 4를 반환한다.
※◀는 bisect_left(a, 4) , ▶는 bisect_right(a, 4) 일 때,
1 2 ◀ 4 4 ▶ 8 이므로 각각 인덱스값 2와 4를 반환한다.
이를 소스코드로 구현하면 다음과 같다.
from bisect import bisect_left, bisect_right
a = [1, 2, 4, 4, 8]
x = 4
print(bisect_left(a, x))
print(bisect_right(a, x))
2
4
또한 bisect_left() 함수와 bisect_right() 함수는 '정렬된 리스트'에서 '값이 특정 범위에 속하는 원소의 개수'를 구하고자 할 때, 효과적으로 사용될 수 있다.
아래의 count_by range(a, left_value, right_value) 함수를 확인해 보자.
이는 정렬된 리스트에서 값이 [left_value, right_value]에 속하는 데이터의 개수를 반환한다.
다시 말해 원소의 값을 x라고 할 때, left_value <= x <= right_value인 우너소의 개수를 O(logN)으로 빠르게 계산할 수 있다.
from bisect import bisect_left, bisect_right
# r값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(a, left_value, right_value):
right_index = bisect_right(a, right_value)
left_index = bisect_left(a, left_value)
return right_index - left_index
# 리스트 선언
a = [1, 2, 3, 3, 3, 3, 4, 4, 8, 9]
# 값이 4인 데이터 개수 출력
print(count_by_range(a, 4, 4))
# 값이 [-1, 3]범위에 있는 데이터 개수 출력
print(count_by_range(a, -1, 3))
2
6
collections
파이썬의 collections 라이브러리는 유용한 자료구조를 제공하는 표준 라이브러리다.
collections 라이브러리의 기능 중에서 코딩 테스트에서 유용하게 사용되는 클래스는 deque와 Counter이다.
보통 파이썬에서는 deque를 사용해 큐를 구현한다.
별도로 제공되는 Queue 라이브러리가 있는데 일반적인 큐 자료구조를 구현하는 라이브러리는 아니다.
따라서 deque를 이용해 큐를 구현해야 한다는 점을 기억하자.
기본 리스트 자료형은 데이터 삽입, 삭제 등의 다양한 기능을 제공한다.
리스트가 있을 때 중간에 특정 원소를 삽입하는 것도 가능하다.
하지만, 리스트 자료형은 append() 메서드로 데이터를 추가 하거나, pop() 메서드로 데이터를 삭제할 때 ' 가장 뒤쪽 원소'를 기준으로 수행된다.
따라서 앞쪽에 있는 원소를 처리할 때에는 리스트에 포함된 데이터의 개수에 따라 많은 시간이 소요될 수 있다.
리스트 앞쪽에 있는 원소를 삭제하거나 앞쪽에 새 원소를 삽입할 때의 시간 복잡도는 O(N)이다. 이를 비교하면 다음의 표와 같다.
리스트 | deque | |
가장 앞쪽에 원소 추가 | O(N) | O(1) |
가장 뒤쪽에 원소 추가 | O(1) | O(1) |
가장 앞쪽에 있는 원소 제거 | O(N) | O(1) |
가장 뒤쪽에 있는 원소 제거 | O(1) | O(1) |
deque에서는 리스트 자료형과 다르게 인덱싱, 슬라이싱 등의 기능은 사용할 수 없다.
다만, 연속적으로 나열된 데이터의 시작 부분이나 끝 부분에 데이터를 삽입하거나 삭제할 때는 매우 효과적으로 사용될 수 있다.
deque는 스택이나 큐의 기능을 모두 포함한다고도 볼 수 있기 때문에 스택 혹은 큐 자료구조의 대용으로 사용될 수 있다.
deque는 첫 번째 원소를 제거할 때 popleft()를 사용하며, 마지막 원소를 제거할 때 pop()를 사용한다.
또한 첫 번째 인덱스에 원소 x를 삽입할 때 appendleft(x)를 사용하며, 마지막 인덱스에 원소를 삽입할 때 append(x)를 사용한다.
따라서 deque를 큐 자료구조로 이용할 때, 원소를 삽입할 때에는 append()를 사용하고 원소를 삭제할 때는 popleft()를 사용하면 된다.
그러면 먼저 들어온 원소가 항상 먼저 나가게 된다.
리스트 [2, 3, 4]의 가장 앞쪽과 뒤쪽에 원소를 삽입하는 예시는 다음과 같다.
from collections import deque
data = deque([2, 3, 4])
data.appendleft(1)
data.append(5)
print(data)
print(list(data)) # 리스트 자료형으로 변환
deque([1, 2, 3, 4, 5])
[1, 2, 3, 4, 5]
파이썬 collections 라이브러리의 Counter는 등장 횟수를 세는 기능을 제공한다.
구체적으로 리스트와 같은 iterable 객체가 주어졌을 때, 해당 객체 내부의 원소가 몇 번씩 등장했는지를 알려준다.
따라서 원소별 등장 횟수를 세는 기능이 필요할 때 짧은 소스코드로 이를 구현할 수 있다.
from collections import Counter
counter = Counter(['red', 'blue', 'red', 'green', 'blue', 'blue'])
print(counter['blue']) # 'blue'가 등장한 횟수 출력
print(counter['green']) # 'green'가 등장한 횟수 출력
print(counter['red']) # 'red'가 등장한 횟수 출력
print(dict(counter)) #t 사전 자료형으로 변환
3
1
2
{'red': 2, 'blue': 3, 'green': 1}
math
math 라이브러리는 자주 사용되는 수학정인 기능을 포함하고 있는 라이브러리이다.
팩토리얼, 제곱근, 최대공약수(GCD) 등을 계산해주는 기능을 포함하고 있으므로, 수학 계산을 요구하는 문제를 만났을 때 효과적으로 사용될 수 있다.
간단히 사용 예시를 확인해 보도록 하겠다.
먼저 math 라이브러리의 factorial(x) 함수는 x! 값을 반환한다.
예를 들어 5!를 출력하는 예시는 다음과 같다.
import math
print(math.factorial(5))
120
그리고 math 라이브러리의 sqrt(x) 함수는 x의 제곱근을 반환한다.
7의 제곱근을 출력하는 예시 코드는 다음과 같다.
import math
print(math.sqrt(7)) # 7의 제곱근을 출력
2.6457513110645907
최대 공약수를 구해야 할 때는 math 라이브러리의 gcd(a, b)함수를 이용할 수 있다.
※ GCD= greatest common denomiator(최대 공약수)
이 함수는 a와 b의 최대 공약수를 반환한다.
예시로 21과 14의 최대 공약수를 출력하는 코드는 다음과 같다.
import math
print(math.gcd(21, 14))
7
수학 공식에서 자주 등장하는 상수가 필요할 때에도 math 라이브러리를 사용할 수 있다.
math 라이브러리는 파이(pi)나 자연상수 e를 제공한다.
import math
print(math.pi)
print(math.e)
3.141592653589793
2.718281828459045
https://github.com/mgkim-developer/Algorithm-interview/blob/main/Python_Grammar.py
'Algorithm' 카테고리의 다른 글
시간초과를 대비하는 빠른 입력 받기 방법 sys.stdin.readline(), strip() (0) | 2021.11.27 |
---|---|
알고리즘 인터뷰 공부하며 Python Class 상속에 대해 추가로 정리한 것 (0) | 2021.11.24 |
[이코테] Chapter2-1~2 / 코딩 테스트 기출문제 유형 분석 (0) | 2021.10.28 |
[이코테] Chapter1-3 / 복잡도 (0) | 2021.10.28 |
[이코테] 알고리즘 인터뷰 공부 (0) | 2021.10.26 |
댓글
이 글 공유하기
다른 글
-
시간초과를 대비하는 빠른 입력 받기 방법 sys.stdin.readline(), strip()
시간초과를 대비하는 빠른 입력 받기 방법 sys.stdin.readline(), strip()
2021.11.27 -
알고리즘 인터뷰 공부하며 Python Class 상속에 대해 추가로 정리한 것
알고리즘 인터뷰 공부하며 Python Class 상속에 대해 추가로 정리한 것
2021.11.24 -
[이코테] Chapter2-1~2 / 코딩 테스트 기출문제 유형 분석
[이코테] Chapter2-1~2 / 코딩 테스트 기출문제 유형 분석
2021.10.28 -
[이코테] Chapter1-3 / 복잡도
[이코테] Chapter1-3 / 복잡도
2021.10.28