Dask 소개 및 자주 사용하는 함수
안녕하세요 coconut입니다. 이번에는 유명한 Pandas 외에 Dask라는 오픈소스를 소개합니다. 기존의 pandas는 읽어들이는 모든 데이터를 메모리에 적재하여, 연산하는 방식이어서 거대한 규모의 데이터를 pandas에 적재할 시에 메모리가 부족해 …
안녕하세요 coconut입니다. 이번에는 유명한 Pandas 외에 Dask라는 오픈소스를 소개합니다. 기존의 pandas는 읽어들이는 모든 데이터를 메모리에 적재하여, 연산하는 방식이어서 거대한 규모의 데이터를 pandas에 적재할 시에 메모리가 부족해 …
Pandas DataFrame에 저장된 데이터셋을 파일로 저장하고 로드하면 좋겠다는 생각이 들어서 여러모로 검색을 하여서 조금씩 정보를 찾았다. 일단 csv로 저장하는 방법이다. 매우 간단하다. import pandas as pd time_pd = pd…