[Python]Multiprocessing을 이용한 데이터 병렬 처리

Date:     Updated:

카테고리:

Multiprocessing

  • 대용량 데이터를 효율적으로 처리하기 위해서는 병렬 처리를 활용하는 것이 좋다.
  • Pytorch같은 Framework는 함수 내부에서 병렬 처리를 지원
  • 하지만 데이터 가공 모듈인 numpy나 pandas같은 경우는 별도의 병렬처리가 가능하도록 코딩해야 한다.
  • Pool은 병렬 연산을 지원하는 함수이다.
def f(x):
    return x*x

if __name__ == '__main__':
    with Pool(5) as p:
        print(p.map(f, [1, 2, 3]))

out: [1,4,9]

py 카테고리 내 다른 글 보러가기

댓글 남기기