On the difficulty of training recurrent neural networks



Подробная статья про затухающие и взрывающиеся градиенты в RNN.



http://proceedings.mlr.press/v28/pascanu13.pdf