LSTM과 GRU
댓글수 ·
2025.09.11
RNN의 Long Term Dependency (장기 의존성)반복 구조 핵심 이해입력 시퀀스: $x1,x2,…,x_{t}t$은닉 상태: $h1,h2,…,h_{t}$설명 요약$x_1 \sim x_{t-1}$ → $h_{t-1}$**에 인코딩됨과거 입력들의 정보가 은닉 상태 $h_{t-1}$에 압축됨즉, 지금까지 본 내용 전체가 벡터 하나로 요약$h_{t-1}$는 과거 정보를 담고 있음모델이 필요로 하는 중요한 특징(예: 단어, 문맥 등)이 이 벡터 안에 담겨야 함$h_{t}$는 현재 입력 $x_t$를 처리하는 데 필요한 문맥 정보결국 $x_t$를 해석할 때 $h_{t-1}$의 정보가 필요하단 그림 설명시계열 데이터 흐름 구조입력 시퀀스: $x_1, x_2, x_3, x_4, x_5$RNN..