RNN如何知道如何将过去的信息应用到当前的输入?网络有两组权值,一组权值用于隐藏状态向量,另一组权值用于输入。在训练过程中,网络学习输入和隐藏状态的权值。当实现时,输出基于当前输入,以及基于先前输入的隐藏状态。
LSTM
在实践中,简单的rnn在学习长期依赖时遇到了问题。rnn通常通过反向传播进行训练,在这种情况下,它们可以经历“消失”或“爆炸”梯度问题。这些问题导致网络权重要么变得非常小,要么变得非常大,限制了学习长期关系的有效性。
一种克服这个问题的特殊类型的经常性神经网络是长时间的短期记忆(LSTM)网络。LSTM网络使用额外的门来控制隐藏单元中的信息输出和下一个隐藏状态。这使得网络能够更有效地了解数据中的长期关系。lstm是RNN的一种常用实现类型。
MATLAB®拥有完整的功能和功能,可以使用文本,图像,信号和时间序列数据培训和实现LSTM网络。下一节将探讨RNN和一些示例的应用程序使用MATLAB。
应用RNNs
自然语言处理
语言是自然顺序的,文本的长度变化。这使得RNN是一个很好的工具来解决这一领域的问题,因为它们可以学会在句子中的语境中展示文字。一个例子包括情绪分析,一种对单词和短语的意义进行分类的方法。机器翻译,或使用算法在语言之间进行翻译,是另一个常见的应用。单词首先需要从文本数据转换为数字序列。一个有效的方法是字嵌入层。Word Embeddings地图单词转为数字向量。当例子下面使用Word Embeddings培训一个词情绪分类器,并使用MATLAB WordCloud功能显示结果。