본문 바로가기

Python/Time Series with Python

TimeSeries with Python _ Pandas 4 _plot 이번 포스팅에서는 Pandas로 그림을 그리는 메소드인 plot에 대해서 살펴본다. plot을 이용해 Pandas의 그림을 그리고, 다양한 변수들을 이용해 그림을 꾸미는것을 살펴본다 df = pd.read_csv(path, index_col = "Date", parse_dates=True) #%% Plot Formatting title = "Starbucks Closing Stock Prices" ylabel = 'Closing Price' xlabel = 'Closing Date' ax = df['Close'].plot(figsize=(12,5)) # ax로 변수를 선언해도 plot이 실행된다 ax.autoscale(axis='x', tight=True) ax.set(xlabel = xlabel, yl.. 더보기
TimeSeries with Python _ Pandas 3 _Shift, Rolling, Expanding 이번 포스팅에서는 Pandas의 메소드중 데이터 분석에서(특히나 금융 데이터 분석)에서 유용하게 사용되는 Shift, Rolling, Expanding의 사례를 적어본다 #%% Shift of Pandas df = pd.read_csv(path, index_col = "Date", parse_dates=True) df.head() df.tail() df.shift(1).head() #뒤의 날짜의 데이티를 앞으로 한칸 땡긴다 (forward) df.shift(-1).head() # 앞의 날짜의 데이터를 뒤로 한칸 땡긴다 (backwards) df.shift(periods=1, freq='M').head() #한달 기준으로 앞으로 땡긴다 #%% Rolling and Expanding #Rolling df =.. 더보기
TimeSeries with Python _ Pandas 2 _ resample 이번 포스팅에서는 파이썬의 Pandas 모듈에 있는 resample 메소드에 관하여 살펴본다 보통 파이썬으로 데이터를 다룰 때, 판다스로 데이터를 불러온 다음에 함수를 만들어 데이터를 재그룹하는 경우가 많다 하지만 resample를 이용하면, 인덱스가 datetime일 경우, 일, 월 혹은 년 기준으로 데이터를 재그룹 할 수 있고, 그에 맞는 평균, 최대, 최소, 표준편차 등 다양한 것들을 조사해 볼 수 있다. 예를들어 '월' 기준으로, 5월에 가장 방문자수가 높은 수 혹은 일? 이러한 것들은 resample라는 메소드를 통해 쉽게 수할 수 있다. #여기서 특변한 규칙(예를들어 1달기준, 일주일 기준 등)으로 데이터를 재구성해본다 #rule = 'A' -> 일별 데이터를 년별로 df.resample(ru.. 더보기
TimeSeries with Python _ Pandas 1 _ DateTime 이번 포스팅은 파이썬을 이용해 TimeSeries Data를 본격적으로 다뤄보기 전에, Pandas 및 여러 메소드를 이용해서 DateTime을 어떻게 다루는지 알아보는 포스팅이다 파이썬이나 R로 데이터를 다뤄분들은 아시겠지만, 시간을 어떻게 설정하고, 이것을 인덱스로 표현하는데 있어 난감한 경우가 많았다 그렇기에 이번 포스팅에서는 파이썬으로 DateTime을 표현하는데 있어서 다양한 방법들과 그것들을 활용하는 방법까지 살펴보는 예제를 포스팅한다 #%% datetime, Numpy 그리고 Pandas를 이용해 시간을 표현하는 방법들을 살펴보자 from datetime import datetime import numpy as np import pandas as pd #%% DateTime 모듈을 이용해서 .. 더보기