핵심 요약
2020년부터 2025년까지의 주요 기술주 데이터를 활용해 ARIMA와 LSTM 모델의 예측 성능을 MAPE와 방향 정확도 측면에서 비교 분석했다.
배경
TSLA, AAPL, AMZN, GOOGL, MSFT 등 5개 주요 기술주의 5개년 데이터를 활용하여 데이터 누수 없는 엄격한 시계열 검증 파이프라인을 구축하고 모델별 성능을 측정했다.
커뮤니티 반응
작성자가 공유한 ARIMA(0,0,0)의 선택 결과에 대해 시계열 분석의 전형적인 특징이라는 반응이 예상되며, 지표 선택의 중요성에 대한 논의가 이루어졌다.
주요 논점
01중립다수
예측 모델의 목적이 오차 최소화인지 방향성 적중인지에 따라 최적 모델 선택이 달라져야 한다.
합의점 vs 논쟁점
합의점
- 시계열 데이터 예측에서 데이터 누수 방지는 모델의 신뢰성을 결정하는 핵심 요소이다.
- 주가 예측에서 단순 오차 지표(MAPE)만으로는 모델의 실질적 유용성을 판단하기 어렵다.
실용적 조언
- 주가 예측 모델 평가 시 MAPE와 함께 방향 정확도(Directional Accuracy)를 반드시 병행하여 측정해야 한다.
- auto_arima가 (0,0,0)을 선택한다면 해당 데이터가 모델 수준에서 화이트 노이즈로 간주되고 있음을 인지해야 한다.
언급된 도구
auto_arima중립
시계열 데이터의 최적 ARIMA 파라미터 자동 탐색
LSTM추천
딥러닝 기반 시계열 예측 모델 구현
섹션별 상세
데이터 누수(Data Leakage)를 방지하기 위해 엄격한 시계열 검증(Temporal Validation)을 적용한 파이프라인을 설계했다. 2020년부터 2025년까지의 데이터를 사용했으며, 과거 데이터가 미래 예측에 포함되지 않도록 철저히 분리하여 실험의 신뢰성을 확보했다. 네 가지 평가 지표를 통해 모델의 다각적인 성능을 검증하여 단순 오차 이상의 통찰을 얻고자 했다.
auto_arima 모델이 테슬라(TSLA) 주가에 대해 (0,0,0) 차수를 선택하는 흥미로운 결과가 나타났다. 이는 모델이 주가 데이터를 패턴이 없는 화이트 노이즈(White Noise)로 판단하여 매일 0의 수익률을 예측하는 것이 오차율을 최소화하는 최적의 전략이라고 판단했음을 의미한다. 결과적으로 이 모델은 MAPE 지표에서 1.50%를 기록하며 수치상으로는 가장 우수한 성과를 냈다.
평가 지표에 따라 우수 모델이 다르게 나타나는 현상이 관찰됐다. ARIMA(0,0,0) 모델은 평균 MAPE 측면에서 가장 우수했으나, 주가의 상승 및 하락 방향을 맞히는 방향 정확도(Directional Accuracy)에서는 LSTM이 55.5%로 가장 높은 성능을 보였다. 이는 단순 오차 최소화와 실제 투자에 유용한 방향성 예측 사이의 간극을 명확히 보여주는 사례이다.
실무 Takeaway
- 주가 데이터는 화이트 노이즈 특성이 강해 ARIMA 모델이 단순 평균값을 예측하는 (0,0,0) 차수를 최적으로 선택할 수 있다.
- MAPE가 낮다고 해서 반드시 실제 투자에 유용한 방향성 정보를 제공하는 것은 아님을 확인했다.
- LSTM은 오차율(MAPE 1.90%)은 ARIMA보다 소폭 높았으나 방향 정확도 측면에서 55.5%를 기록하며 상대적 우위를 점했다.
AI 분석 전체 내용 보기
AI 요약 · 북마크 · 개인 피드 설정 — 무료