목록seq2seq (1)
코딩딩딩

1. 재귀 신경망 ((Recurrent Neural Network, RNN))- 기본 설명재귀 신경망은 순차적 데이터나 시계열 데이터를 처리하기 위해 설계된 신경망 모델이다. 입력층, 은닉층, 출력층으로 구성되며, 은닉층에서는 이전 데이터와 현재 데이터를 저장하여 순차적인 관계를 학습한다. ⦁ 단방향 RNN: 과거정보에만 접근하여 다음에 출력할 토큰을 예측한다. ⦁ 양방향 RNN: 과거 정보와 미래 정보를 모두 활용하여 예측 정확도를 높인다. - 문제점재귀신경망은 다음과 같은 한계를 갖는다. ⦁ 장기적 의존성 문제: 긴 시퀀스에서 정보를 유지하기 어려워 학습이 불안정하다.⦁ Gradient 소실 및 폭발: 역전파 시 기울기가 너무 작거나 커지는 문제가 발생한다. 이를 해결하기 위해 다음과 같은 대안 모델..
인공지능/개념
2024. 12. 4. 18:00