YongWook's Notes

<파이썬> generator & yield 본문

-software/python

<파이썬> generator & yield

글로벌한량 2018. 12. 7. 11:06

이번 포스트에서는 이 generator와 yield에 대해서 알아보자.

본 포스트는 Simeon Visser’s blog의 내용을 참조하여 작성되었음을 미리 밝힌다.

generator의 필요성

def not_a_generator():
	result = []
	for i in range(1000):
		result.append(expensive_computation(i))
	return result

위의 코드는 일반적인 함수이다. 이 함수가 호출된다면 expensive_computation이라는 매우 비싼 작업이 1000번 연속해서 실행되고 그 결과가 모조리 리턴될 것이다. 이러한 함수는 expensive_computation의 결과가 특정 값이 되었을 때 break해야하는 상황이라면 비효율적일 수 있다.

아래의 코드처럼 generator를 사용한다면 이러한 경우의 효율성 문제를 해결 가능하다.

def generator():
	for i in range(1000):
		yield expensive_computation(i)

generator는 호출이 된 후에 for문이 돌아가면서 yield가 한번 실행될때마다 iterator로 현재 작업을 저장하고 값을 리턴한 뒤 작동을 멈춘다.

generator의 사용

우리는 다음과 같이 generator를 활용할 수 있다.

def generator():
	for i in range(5):
		yield i
		
# Using generator
g = generator()
print(g)       # <generator object>
print(next(g)) # 0
print(next(g)) # 1
print(next(g)) # 2
print(next(g)) # 3
print(next(g)) # 4
print(next(g)) # <StopIteration> error occurs

generator는 처음 한번 호출되면, next()를 통해 다음 iteration을 수행하고 반환한 뒤, 기다리게 된다.

for문과의 조합

일반적인 함수와 generator를 비교해보자.

def not_a_generator():
	result = []
	for i in range(1000):
		result.append(expensive_computation(i))
	return result

def generator():
	for i in range(1000):
		yield expensive_computation(i)

for x in not_a_generator():  # type1
	print(x)

for x in generator():        # type2 
	print(x)

type1과 type2는 같은 값을 출력하겠지만 차이가 있다. type1은 먼저 expensive_computation을 모두 연산하고 빠르게 print를 하겠지만 type2는 expensive_computation의 연산을 한번 끝내면 바로 그 값을 하나씩 출력하게 될 것이다.

그렇다. 결국 generator는 메모리를 케어해야하는 상황에서 좋은 선택지가 될 수 있을 것이다.

이번 포스팅에서는 generator의 기초에 대해 간단히 정리해보았다. 다음 포스팅에서는 yield from이라는 generator를 위해 태어난 Python 문법에 대해 알아보도록 하자.

Comments