시계열 이상탐지 (1) 배경 지식

    목차
반응형

RNN

RNN(Recurrent Neural Network): 시계열 데이터와 같은 순차적인 입력 데이터를 처리하기 위해 고안된 신경망 모델로, 이전 시점의 출력값을 현재 시점의 입력값으로 사용하여 연속적인 정보를 처리할 수 있는 모델

 

LSTM

LSTM(Long Short-Term Memory): 기존의 순환 신경망(RNN)에 기억 셀(memory cell)과 게이트(gate)를 추가하여 시계열 데이터를 더 잘 처리할 수 있는 모델

 

 

AutoEncoder

AutoEncoder: Encoder로 데이터를 잠재 벡터(latent vector)로 압축하고 Decoder로 복원하는 모델로 데이터의 노이즈 제거, 차원 축소 등에 사용

 

GAN

GAN(Generative Adversarial Networks): 생성적 적대 신경망으로, 생성자(Generator)와 판별자(Discriminator)가 서로 적대하며 데이터를 생성해가는 모델. 생성자는 무작위 노이즈 벡터를 입력받아 데이터를 생성하고, 판별자는 생성자가 만든 데이터와 실제 데이터 중 가짜와 진짜를 구별한다. 생성자의 목표는 판별자가 데이터를 구분하지 못하게 하는 것이며 판별자의 목표는 가짜와 진짜를 더 잘 구별하는 것으로 이런 경쟁으로 진짜 같은 가짜 데이터를 생성해낼 수 있게 된다.

Prediction-based Methods

- 시계열 데이터에 대한 모델을 학습시켜 미래를 예측
- 예측된 값과 실제 값을 비교하여 이상 징후를 감지
- 예측값과 실제값의 차이가 특정 threshold보다 크면 해당 data point는 이상치로 간주
- ARIMA, LSTM-DT 등

 

Reconstruction-based Methods

- 시계열 데이터를 재구축하도록 모델을 학습
- 재구축 오차를 사용하여 이상 징후를 식별
- 정상적인 data point는 모델에서 쉽게 재구성할 수 있지만, anomaly는 재구축 오차가 커진다는 개념
- LSTM-AE, TadGAN 등

 

 

 

이미지 참조

- https://glee1228.tistory.com/3

- https://ckm4514.github.io/nlp/AutoEncoder/

- https://kim6394.tistory.com/73

 

728x90
반응형