A time series (시계열) is a series of data points indexed (or listed or graphed) in time order. Most commonly, a time series is a sequence taken at successive equally spaced points in time. Thus it is a sequence of discrete-time data. (https://en.wikipedia.org/wiki/Time_series)
시계열 데이터 분석에 많이 쓰이는 3가지 수학 모델이 있다.
- Autoregress (AR) 모델
- Integrated (I) 모델
- Moving average (MA) 모델
시계열 자료의 구분
- Continuous time series (연속시계열)
- Discrete time series (이산시계열)
- 참고: Time lag (시차) - 관측시점 사이의 간격
시계열자료 분석의 목적
- 미래에 대한 예측(forecast)
- 추세분석(trend analysis)
- 평활법(smoothing method)
- 분해법(decomposition method)
- 자기회귀누적이동평균(Autoregressive Integrated Moving Average: ARIMA) 모형
- 이분산자기회귀모형(Autoregressive Conditional Heterskedasticity)
- 시스템 또는 확률과정의 이해와 제어(control)
- 스펙트럼분석(spectral analysis)
- 개입분석(intervention analysis)
- 전이함수모형(transfer function model)
- 자기상관오차를 갖는 회귀모형(autoregressive error model)
적용분야에 따른 두가지 접근법
- 진동수영역(frequency domain)에서의 분석법
- 푸리에분석(Fourier analysis)
- 스펙트럼 밀도함수(spectral density function)의 추정 - 생성되는 시계열이 일정한 패턴을 따르는 정상적(stationary)인 경우에 많이 사용됨
- 파엽분석(Wavelet analysis)
- 시간영역(time domain)에서의 분석법
- 자기상관함수(autocorrelation function) 등을 이용한 시간에 따른 상관 정도를 파악
- 추세분석, 평활법, 분해법, ARIMA 모형, 전이함수모형, 자기상관오차를 갖는 회귀 모형 등
- 이분산 모형(GARCH), long memory process 등
모형적합의 3단계 및 예측 시스템
- 모형의 식별(model identification) 단계: 시계열 그림, 자기상관함수, 부분자기상관함수 등을 이용. 차분의 필요 여부와 모형의 차수를 잠정적으로 결정
- 모형의 추정(model estimation) 단계: 최소제곱법, 최대가능도방법, 비선형최소제곱법 등을 이용하여 모수들을 추정
- 모형의 진단(model diagnostic checking) 단계: 잔차의 시계열그림, 잔차의 자기상관함수와 부분자기상관함수, 포트맨토(portmanteau) 통계량을 이용한 잔차분석과 과대적합에 의하여 모형의 적합정도를 진단. AIC (Akaike information criterion) 또는 SBC (Schwartz bayesian criterion) 통계값 등을 이용하여 가장 설명렬 높은 모형을 선택
시계열 모형
- 단변량 모형
- ARIMA: Autoregressive integrated moving average model, 자기회귀이동평균모형 - 자기상관함수 및 편자기상관함수 추정
- 다변량 모형
- VAR: Vector autoregression model, 벡터자기회귀모형 - 변수간 Granger causality 분석 필요, 시차 결정을 위해 LR, AIC, SC 활용
- BVAR: Bayesian VAR: 베이지안 VAR - 과모수화, 과적합 극복 - 사전 제약을 더함
- Litterman/Minnesota Prior
- Normal-Wishart Prior
- Sims-Zha Prior
- Normal-Wishart
- Normal-Flat
시계열 모형 검정
- 단위근 검정 (안정성, stationary 확인)
- ADF (Augmented Dickey-Fuller)
- PP (Phillips-Perron)
관련자료
관련논문
- 머신 러닝 방법과 시계열 분석 모형을 이용한 부동산 가격지수 예측
- 시계열 데이터 전처리와 특징 선택을 활용한 기계 학습 기반의 주가 예측 모델
- 기상 데이터를 이용한 산불 피해규모의 예측방법 연구
관련포스트
- 머신러닝은 장기 시계열 데이터를 처리하지 못한다 : Machine learning의 한계
- Time Series Analysis in Python – A Comprehensive Guide with Examples
- An End-to-End Project on Time Series Analysis and Forecasting with Python
Incoming Links #
Related Articles (Article 0) #
Related Codes (Code 1) #
Suggested Pages #
- 0.485 InfluxDB
- 0.025 Hyungyong Kim
- 0.025 October 17
- 0.024 KPSS
- 0.024
- 0.024 SciPy
- 0.024 August 22
- 0.023 November 11
- 0.022 R
- 0.022 Scipy
- More suggestions...