Python/Time Series with Python

TimeSeries with Python _ Pandas 2 _ resample

MINSU KANG 2019. 12. 23. 21:19

이번 포스팅에서는 파이썬의 Pandas 모듈에 있는 resample 메소드에 관하여 살펴본다

 

보통 파이썬으로 데이터를 다룰 때, 판다스로 데이터를 불러온 다음에 함수를 만들어 데이터를 재그룹하는 경우가 많다

 

하지만 resample를 이용하면, 인덱스가 datetime일 경우, 일, 월 혹은 년 기준으로 데이터를 재그룹 할 수 있고, 그에 맞는 평균, 최대, 최소, 표준편차 등 다양한 것들을 조사해 볼 수 있다.

 

예를들어 '월' 기준으로, 5월에 가장 방문자수가 높은 수 혹은 일? 이러한 것들은 resample라는 메소드를 통해 쉽게 수할 수 있다.

 

 

  
  
#여기서 특변한 규칙(예를들어 1달기준, 일주일 기준 등)으로 데이터를 재구성해본다

#rule = 'A' -> 일별 데이터를 년별로
df.resample(rule='A').mean()

df['Close'].resample(rule='A').mean().plot.bar()

title = 'Monthly Max Closing Price'
df['Close'].resample('M').max().plot.bar(figsize=(16,7), title=title, color='#1f77b4')