본문 바로가기

LSTM2

Mini-batch sample selection strategies for deep learning based speech recognitio 논문 출처 : Y Dokuz, Z Tufekci - Applied Acoustics, 2021 - Elsevier1. 요약 RNN 은 순환 신경망이라고 부르며, 자연어 처리나 음성 인식처럼 순서가 있는 데이터를 처리하는데 강점이 있는 신경망이다. 앞 단계에 입력된 값에 대해 처리한 결과를 다음 단계에서 참조해 나가는 형태로 처리하며 이를 통해 입력된 순서에 따라 단계별로 출력을 발생시킨다. 그러나 이 단계가 길어지는 경우 맨 앞의 정보에 대해 맨 뒤에서 기억하지 못하는 한계가 발생하게 되는데 이러한 한계를 보완한 것이 LSTM 이다. 또한 음성 데이터를 입력 받았을 때 어디서부터 어디까지가 하나의 음소인지 각각 라벨링 처리를 진행해주지 않으면 인식률이 떨어지게 되기 때문에 라벨링을 진행해 줘야 하나 MF.. 2023. 5. 2.
LSTM LSTM( Long Short-Term Memory )은 순환 신경망(recurrent neural network)의 일종으로, 시계열 데이터를 처리하는데 특화된 네트워크이다. 시계열 데이터는 각각의 입력이 시간에 따라 변화하는 데이터를 의미한다. 예를 들어, 주식 가격, 기온, 음성 데이터 등이 시계열 데이터에 속한다. LSTM은 이러한 데이터의 장기적인 의존성(long-term dependency)을 학습할 수 있도록 고안되었다. 기존의 순환 신경망에서는 일정 시간 이상의 의존성을 갖는 데이터를 처리하는 것이 어려운 경우가 있었다. 이에 비해 LSTM은 cell state라는 기억 상태를 사용하여 데이터의 장기적인 의존성을 기억할 수 있으며 이를 통해, 긴 시퀀스 데이터를 처리하는데 우수한 성능을 보.. 2023. 2. 21.