Time Series

  • 시계열 데이터 분석은 시간을 독립변수로 활용
  • 시계열 분석은 시계열 데이터의 확률적 특성이 시간이 지나도 그대로 유지될 것(정상성)을 가정
  • AR Model: 자기 회귀 모델, 과거 시점의 자신의 데이터가 현 시점의 자신에게 영향을 미침
  • MA Model: 이동 평균 모델, 이전 항의 에러를 현 시점에 반영해 변화율에 맞춰 추정
  • ARMA Model: AR과 MA 모델을 합친 모델, 과거 시점의 자신과 추세까지 전부 반영
  • ARIMA Model: 현재 상태에서 바로 이전 상태를 빼주는 차분을 적용

ARIMA Model

  • 미래를 예측하기 위해 자신의 시차로 이루어진 선형 조합과 지연된 예측 오차의 선형조합에 기반
  • $AR(1):Y_t=\alpha+\beta_1Y_{t-1}+\epsilon_t,where|\beta_1|<1$
  • $MA(2):Y_t=\alpha+\phi_1\epsilon_{t-1}+\phi_2\epsilon_{t-2}+\epsilon_t,where|\phi_1|,|\phi_2|<1$
  • AR(1)은 Y_t가 알려진 Y_t-1 값으로부터 얻어졌다는 것을 의미
  • 자기상관함수(ACF)와 부분자기상관함수(PACF)를 사용해 AR과 MA항의 차수를 결정
  • ACF: Lag에 따른 관측치들 사이의 관련성을 측정하는 함수
  • PACF: k 이외의 모든 다른 시점 관측치의 영향력을 배제하고 y_t와 y_t-k 두 관측치의 관련성을 측정하는 함수