Python 썸네일형 리스트형 Pandas _ 이상치 제외 방법 df_list = [] for i in range(2015, 2018): df_list.append( pd.read_csv("{}.csv".format(i)) ) df = pd.concat(df_list) df = df.dropna() df['rtn'] = df['price2']/df['price'] - 1 # 이상치 제거 for col in df.columns: if col not in ['ticker', 'price2', 'price', 'trn']: mu = df[col].mean() std = df[col].std() cond1 = mu - 2*std 더보기 Seaborn _ basic import pandas as pd import matplotlib.pyplot as plt import seaborn as sns import datetime as dt df = pd.read_csv() df.head() median_df = df.groupby(['date']).agg({'시가총액 (보통)(평균)(원)' : 'median'}) median_df.columns = ['median_시가총액'] median_df.head() df = df.join(median_df, on='date') df.loc[df['시가총액 (보통)(평균)(원)']=df['median_시가총액'], 'size'] = "big" # About CountPlot matplotlib vs seaborn df['size'].. 더보기 Matplotlib _ basic (OOP Method & Multi Plot & Font & Minus) Matplotlib의 대한 기본적인 방식이다. 사용하는데 있어 시작하는 포맷이고, 아마 여기서 추가로 업데이트를 하면 될 것 같다. 추가로 판다스를 이용해서도 심플하게 그리는 방법도 첨부했다 그리고 폰트 관련 이슈와 마이너스 부호도 첨부했다 import numpy as np import pandas as pd from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" pd.set_option('display.float_format', lambda x: '%.3f' % x) pd.set_option('max_columns', None) #%% example1 import ma.. 더보기 Pandas _ 데이터 병합 예시 #%% import numpy as np import pandas as pd #%% product_df = pd.read_csv() review_df = pd.read_csv() flipkart_df = pd.merge( product_df, review_df, left_on="id", right_on='product__id', how='right', # Review에 있는 id, 즉 product__id를 기준으로 데이터를 생성합니다. 만약 "product" 정보가 반드시 존재하는 review들로만 데이터를 구성하고 싶으면 "left"로 하시면 됩니다. ) flipkart_df = flipkart_df.drop(['id', 'product__id', 'author'], axis=1) flipkart_d.. 더보기 Pandas _ join & merge 저번 포스팅에서 concat을 다루었지만, 데이터 프레임을 병합하는데 있어 가장 많이 사용되는 두 메소드인 join과 merge를 소개한다. 이 또한 많이 사용되며 분명 concat과는 다른 방식으로 사용되기에 알아두면 좋다 #%% import numpy as np import pandas as pd from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" pd.set_option('display.float_format', lambda x: '%.3f' % x) pd.set_option('max_columns', None) #%% # 1. Join (2개의 Index가 다.. 더보기 Pandas _ concat & pivot 파이썬 Pandas 메소드 중에서 concat & pivot의 예제를 살펴본다. 판다스에서 데이터를 합치거나 가공할때 주로 사용되며, 이것 또한 알아두면 좋을것 같아 포스팅한다. """ 1. concat 2. pivot """ #%% import numpy as np import pandas as pd from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" pd.set_option('display.float_format', lambda x: '%.3f' % x) pd.set_option('max_columns', None) import FinanceDataReader a.. 더보기 Pandas _ row 추가하기 (loc & append) 파이썬 판다스에서 행을 추가하는 경우가 많았다. 어떻게 해야될지 참 난감했다. 그래서 주로 사용했던 방법은 업데이트가 될 때마다 새로운 dataFrame을 계속해서 만드는 방법을 사용했었는데, 오늘 포스팅하는 방법을 이용한다면 번거롭게 코딩할 필요가 없어질것 같다. #%% import numpy as np import pandas as pd from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" pd.set_option('display.float_format', lambda x: '%.3f' % x) pd.set_option('max_columns', None) #%% .. 더보기 Pandas _ qcut(균할분등) & groupby() 이번 포스팅은 Pandas를 이용한 데이터 분석을 할 때, 균할분등 혹은 그러한 작업 또 다른 그룹을 생성할 때 많이 사용되는 메소드를 소개한다. #%% import numpy as np import pandas as pd from IPython.core.interactiveshell import InteractiveShell InteractiveShell.ast_node_interactivity = "all" pd.set_option('display.float_format', lambda x: '%.3f' % x) pd.set_option('max_columns', None) df = pd.read_csv() #%% #1. qcut 더보기 이전 1 2 3 4 ··· 8 다음