본문 바로가기

회귀

4 - Penalty(About Overfitting) 지난번 포스팅까지 해서 선형(다중)회귀분석 부터 Ridge Regression까지 회귀분석의 대한 방법과 독립변수들의 계수(Coefficient)를 어떻게 선별할 것이며, 어떻게 구하는지를 Python을 이용해 구하보았다 실례로 많은 데이터를 접하고 분석하면서 많은 고민들을 하는데 그 중 하나가 바로 Overfitting다. 과거의 사건이 미래의 그대로 일어난다는 보장도 없고, 실례로 최근 금융시장을 관찰해 보면 과거에는 관찰할 수 없었던 현상들이 빈번하게 반복되고 있다. 지금도 채권 운용과 관련된 전략들을 구현하면서 저 주제에 대해서 '과적합도(Overfitting)'의 대해서 많은 고민을 한다. 전략을 구현할 때 Sample 기간을 어떻게 설정할 것이며 너무 과거의 결과에만 집중되서 전략을 구현하면 .. 더보기
TimeSeries with Python _ 예측값 평가 및 Stationary & Non_Stationary Process 이번 시간에서 다룰 주제는 우선 두가지다. 첫번째: 지난 포스팅에서 예측한 값들을 평가하는 방법(즉, 얼마나 잘 예측했나)들을 소개한다. (Mean-Absolute-Error, Mean-Squared-Error, RMSE) 두번째: Stationary Process & Non - Stationary Process 세가지 주제 다 시계열에서 다루는 가장 기초적인 주제이지만, 앞으로도 계속 활용될 것이며 이것들을 명확히 알아야 앞으로의 모델링에서 어떠한 목표를 가지고 설계하는지 명확히 알 수 있기 때문에 포스팅을 한다. 첫번쨰. 예측값을 평가하는 방법 예측값을 평가하는 방법은 크게 3가지 이고, 첫번째는 예측한 모델의 값과 실제 값의 차이의 절대값의 합을 나타낸 MAE(Mean Absolute Error)인.. 더보기