시계열 이상탐지 (1) 배경 지식
- 목차
RNN
RNN(Recurrent Neural Network): 시계열 데이터와 같은 순차적인 입력 데이터를 처리하기 위해 고안된 신경망 모델로, 이전 시점의 출력값을 현재 시점의 입력값으로 사용하여 연속적인 정보를 처리할 수 있는 모델
LSTM
LSTM(Long Short-Term Memory): 기존의 순환 신경망(RNN)에 기억 셀(memory cell)과 게이트(gate)를 추가하여 시계열 데이터를 더 잘 처리할 수 있는 모델
AutoEncoder
AutoEncoder: Encoder로 데이터를 잠재 벡터(latent vector)로 압축하고 Decoder로 복원하는 모델로 데이터의 노이즈 제거, 차원 축소 등에 사용
GAN
GAN(Generative Adversarial Networks): 생성적 적대 신경망으로, 생성자(Generator)와 판별자(Discriminator)가 서로 적대하며 데이터를 생성해가는 모델. 생성자는 무작위 노이즈 벡터를 입력받아 데이터를 생성하고, 판별자는 생성자가 만든 데이터와 실제 데이터 중 가짜와 진짜를 구별한다. 생성자의 목표는 판별자가 데이터를 구분하지 못하게 하는 것이며 판별자의 목표는 가짜와 진짜를 더 잘 구별하는 것으로 이런 경쟁으로 진짜 같은 가짜 데이터를 생성해낼 수 있게 된다.
Prediction-based Methods
- 시계열 데이터에 대한 모델을 학습시켜 미래를 예측
- 예측된 값과 실제 값을 비교하여 이상 징후를 감지
- 예측값과 실제값의 차이가 특정 threshold보다 크면 해당 data point는 이상치로 간주
- ARIMA, LSTM-DT 등
Reconstruction-based Methods
- 시계열 데이터를 재구축하도록 모델을 학습
- 재구축 오차를 사용하여 이상 징후를 식별
- 정상적인 data point는 모델에서 쉽게 재구성할 수 있지만, anomaly는 재구축 오차가 커진다는 개념
- LSTM-AE, TadGAN 등
이미지 참조
- https://glee1228.tistory.com/3
- https://ckm4514.github.io/nlp/AutoEncoder/
- https://kim6394.tistory.com/73
'데이터 분석 > 이상탐지' 카테고리의 다른 글
시계열 이상탐지 (4) - 딥러닝의 시대 (0) | 2024.03.25 |
---|---|
시계열 이상탐지 (3) - VAE, TadGAN (0) | 2024.03.22 |
시계열 이상탐지 (2) - LSTM-DT, LSTM-AE, AER (0) | 2024.03.20 |
이상탐지 알고리즘 - ECOD 논문 읽기 (0) | 2024.02.20 |