빅데이터분석준전문가자격증

ADsP. PART.3 - 데이터 분석 - 통계분석 - 시계열(time series)분석

theblack0 2022. 6. 28. 14:35
반응형

시계열 자료(time series) 16,18,22,23*2회 출제

시계열 자료

  • 시간의 흐름에 따라 관측된 데이터
  • 시계열 분석을 위해서는 정상성을 만족해야함

정상성(stationary)

  • 시계열의 수중과 분산에 체계적인 변화가 없고, 주기적 변동이 없다는 것
  • 미래는 확률적으로 과거와 돌일하다는 것

정상 시계열의 조건

  • 평균은 모든 시점(시간 t)에 일정하다
  • 분산은 모든 시점(시간 t)에 일정하다
  • 공분산은 모든 시점(시간 t)에 의존하지 않고, 단지 시차에만 의존한다

 

정상시계열 전환  16,18,22,23*2,33회 출제

정상시계열로 전환하는 방법

  • 비정상시계열자료는 정상성을 만족하도록 데이터를 정상시계열로 만든 후 시계열 분석을 수행한다
  • 평균이 일정하지 않은 경우 : 원계열에 차분 사용
  • 계절성을 갖는 비정상시계열 : 계절 차분 사용
  • 분산이 일정하지 않은 경우 : 원계열에 자연로그(변환)사용

차분

  • 현 시점의 자료 값에서 전 시점의 자료값을 빼주는 것을 의미함

 

시계열 모형   19,22회 출제

AR모형 자기회귀모형

  • AR(p) : 현 시점의 자료가 p시점 전의 유한 개의 과거 자료로 설명될 수 있음
  • 현 시점의 시계열 자료에 과거 1시점 이전의 자료만 영향을 주는 이를 1차 자기회귀모형이라고 하고 AR(1)라고 함

MA모형 이동평균모형

  • 최근 데이터의 평균을 예측치로 사용하는 방법, 각 과거치는 동일 가중치가 주어짐
  • 현시점의 자료가 유한 개의 백색잠음(정상시계열)의 선형결합으로 표현되었기 때문에 항상 정상성을 만족함
  • MA(p) : 과거 p시점 이전 오차들에서 현재항의 상태를 추론한다

ARIMA모형 자기회귀 누정 이동평균모형

  • 현재와 추세간의 관계를 정의한 것, 많은 시계열 자료가 ARIMA모형을 따름
  • ARIMA모형은 비정상시계열 모형이며 차분이나 변환을 통해 AR, MA, ARMA 모형으로 정상화 할 수 있다
    • ARIMA(p,d,q) -> p:AR모형 차수, d : 차분, q:MA모형 차수

ACF, PACF, White Noise

자기 상관함수 ACF

  • Auto-Correlation Function, 시계열 데이터의 자기 상관성을 파악하기 위한 함수
  • 시계열의 관측치 Yt와 Yt-k간 상관계수를 k의 함수 형태로 표시한 것, k:시간단위
  • -1 ≤ autocorr(Yv,Yt-k) ≤ 1,k가 커질수록 ACF는 0으로 수행함

부분자기상관함수 PACF(Partial ACF)

  • Yt와 Yt-k 중간에 있는 값들의 영향을 제외시킨 Yt와 Yt-k사이의 직접적 상관관계를 파악하기 위한 함수

백색잡음(White Noise)

  • 시계열 자료 중 자기상관이 전혀없는 특별한 경우
  • 시계열의 평균이 0, 분산이 일정한 값, 자기공산성이 0인 경우
  • 현재 값이 미래 예측에 전혀 도움이 되지 못함, 회귀분석의 오차항과 비슷한 개념

시계열 모형

  자기회귀(AR) 이동평균(MA) 자기회귀이동평균(ARMA)
자기 상관 함수 지수적 감소 q+1차항부터 절단 모양 q+1차항부터 절단 모양
부분 자기 상관 함수 p+1차항부터 절단 모양 지수적 감소 p+1차항부터 절단 모양

 

분해시계열  16,18,19,23,33*2회 출제

분해시계열

  • 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법

분해시계열 분해 요인(종류 반드시 암기)

추세요인 Trend Factor 자료의 그림을 그렸을 때 그 형태가 오르거나 내리는 등 자료가 어떤 특정한 형태를 취했을 때
계절요인 Seasonal Factor 계절에 따라, 고정된 주기에 따라 자료가 변화하는 경우
순환요인 Cyclical Factor 물가상승률, 급격한 인구 증가 등의 이유로 알려지지 않은 주기를 가지고 자료가 변화는 경우
불규칙 요인 Iregular Factor 위 세가지 요인으로 셜명할 수 없는 회귀분석에서 오차에 해당하는 요인에 의해 발생하는 경우

 

 

반응형