LSTM从入门到精通（形象的图解，详细的代码和注释，完美的数学推导过程）

1天前 • 人工智能

先附上这篇文章的一个思维导图

什么是RNN

按照八股文来说：RNN实际上就是一个带有
记忆的时间序列的预测模型

RNN的细胞结构图如下：

softmax激活函数只是我举的一个例子，实际上得到y也可以通过其他的激活函数得到

其中a代表t-1时刻隐藏状态，a代表经过X这一t时刻的输入之后，得到的新的隐藏状态。公式主要是a = tanh(Waa * a + Wax * X + b1) ；大白话解释一下就是，X是今天的吊针，a是昨天的发烧度数39，经过今天这一针之后，a变成38度。这里的记忆体现在今天的38度是在前一天的基础上，通过打吊针来达到第二天的降温状态。

1.1 RNN的应用

由于RNN的记忆性，我们最容易想到的就是RNN在自然语言处理方面的应用，譬如下面这张图，提前预测出下一个字。

除此之外，RNN的应用还包括下面的方向：

语言模型：RNN被广泛应用于语言模型的建模中，例如自然语言处理、机器翻译、语音识别等领域。

时间序列预测：RNN可以用于时间序列预测，例如股票价格预测、气象预测、心电图信号预测等。

生成模型：RNN可以用于生成模型，例如文本生成、音乐生成、艺术创作等。

强化学习：RNN可以用于强化学习中，例如在游戏、机器人控制和决策制定等领域。

1.2 RNN的缺陷

想必大家一定听说过LSTM，没错，就是由于RNN的尿性，所以才出现LSTM这一更精妙的时间序列预测模型的设计。但是我们知己知彼才能百战百胜，因此我还是决定详细分析一下RNN的缺陷，看过一些资料，但是只是肤浅的提到了梯度消失和梯度爆炸，没有实际的数学推导，这可不是一个求学之人应该有的态度！

主要的缺陷是两个：

长期依赖问题导致的梯度消失：众所周知RNN模型是一个具有记忆的模型，每一次的预测都和当前输入以及之前的状态有关，但是我们试想，如果我们的句子很长，他在第1000个记忆细胞还能记住并很好的利用第1个细胞的记忆状态吗？答案显然是否定的

梯度爆炸

本文来自网络，不代表协通编程立场，如若转载，请注明出处：https://net2asp.com/fbd6dc5804.html

lstm Powered by 金山文档人工智能机器学习深度学习

赞 (0)

MySQL 5.7详细下载安装配置教程

« 上一篇 1天前

【Python】爬虫练习-爬取豆瓣网电影评论用户的观影习惯数据

下一篇 » 1天前

后端

解决The injection point has the following annotations:@org.springframework.beans.factory.annotation错误~

错误描述如下所示：错误原因：未将com.reggie.service.EmployeeService类型的bean进行自动装配我的错误原因是忘记给EmployeeService…

1天前
logback-spring.xml 的配置及详解（直接复制粘贴可用）

logback-spring.xml 的配置及详解一、注意实现二、配置及详解一、注意实现 logback-spring.xml 中有三处需要根据实际业务进行修改，直接查找“（…

后端 1天前
后端

码银送书第五期《互联网广告系统：架构、算法与智能化》

广告平台的建设和完善是一项长期工程。例如，谷歌早于2003年通过收购Applied Semantics开展Google AdSense 项目，而直到20年后的今天，谷歌展示广告平台…

1天前
后端

集群与分布式：区别与联系

人不走空 &#x1f3…

1天前
编程语言

C语言中基本数据类型所占字节数

一、 C语言基本数据类型 short、int、long、char、float、double 这六个关键字代表C 语言里的六种基本数据类型。在不同的系统上，这些类型占据的字节长度是…

1天前
后端

二蛋赠书七期：《云原生数据中台：架构、方法论与实践》

前言大家好！我是二蛋，一个热爱技术、乐于分享的工程师。在过去的几年里，我一直通过各种渠道与大家分享技术知识和经验。我深知，每一位技术人员都对自己的技能提升和职业发展有着热切的期待…

1天前
【华为OD机试真题 Python语言】448、结对编程 | 机试真题+思路参考+代码解析（C卷）

文章目录一、题目 ?题目描述 ?输入输出 ?样例1 ?样例2 二、思路参考三、代码参考作者：KJ.JK ?个人博客首页： KJ.JK ?专栏介绍：华为OD机试真题汇总，…

编程语言 1天前
编程语言

【C++】右值引用（极详细版）

在讲右值引用之前，我们要了解什么是右值？那提到右值，就会想到左值，那左值又是什么呢？我们接下来一起学习！目录 1.左值引用和右值引用 1.左值和右值的概念 2.左值引用和右…

1天前
编程语言

【单例模式】保证线程安全实现单例模式

📄前言：本文是对经典设计模式之一——单例模式的介绍并讨论单例模式的具体实现方法。文章目录一. 什么是单例模式二. 实现单例模式 1. 饿汉式 2. 懒汉式 2…

1天前
编程语言

C语言之网络编程（必背知识点）

一、认识网络 1、网络发展史网络的来历_百度知道 ARPnetA–Internet–移动互联网–物联网 2、局域网和广域网局域网（LAN）…

1天前