使用前馈卷积神经网络(convnets)来解决计算机视觉问题,是深度学习最广为人知的成果,但少数公众的注意力已经投入到使用递归神经网络来对时间关系进行建模。而根据深度学习三大牛的阐述,lstm网络已被证明比传统的rnns更加有效。本文由加州大学圣迭戈分校(ucsd)研究机器学习理论和应用的博士生zachary chase lipton撰写,用浅显的语言解释了卷积网络的基本知识,并介绍长短期记忆(lstm)模型。
鉴于深度学习在现实任务中的广泛适用性,它已经吸引了众多技术专家、投资者和非专业人员的关注。尽管深度学习最著名的成果是使用前馈卷积神经网络(convnets)来解决计算机视觉问题,少数公众的注意力已经投入到使用递归神经网络来对时间关系进行建模。
(注:为了帮助你开始体验lstm递归网络,我附上了一个简单的微实例,预装了numpy、theano和一个jonathan raiman的lstm样例git克隆)
在最近的文章《学习阅读递归神经网络》中,我解释了为什么尽管前馈网络有难以置信的成功,它们受制于无法明确模拟时间关系,以及所有数据点都是由固定长度的向量组成的假设。在那篇文章的结论部分,我承诺写一篇的文章,解释卷积网络的基本知识,并介绍长短期记忆(lstm)模型。
首先,介绍一下神经网络的基本知识。一个神经网络可以表示为一个人工神经元的图,或者说节点和有向边,用来对突触建模。每个神经元是一个处理单元,它将连接到它的节点的输出作为输入。在发出输出之前,每个神经元会先应用一个非线性激活函数。正是由于这个激活函数,神经网络具有对非线性关系进行建模的能力。
现在,考虑这个最近的著名论文playing atari with deep reinforcement learning,结合convnets和强化学习来训练电脑玩视频游戏。该系统在某些游戏上有超越人类的表现,比如breakout!,这种游戏在任意时候的合适的策略,都可以通过查看屏幕推断出来。但是,当优化策略是需要在长时间跨度规划时,系统就和人的表现相差甚远,例如太空侵略者(space invaders)。
因此, 我们引入递归神经网络(rnn),一个赋予神经网络对时间进行显式建模的能力,通过添加跨越时间点的自连接隐藏层。换句话说,隐藏层的反馈,不仅仅进入输出端,而且还进入了下一时间步骤隐藏层。在本文中,我将使用递归网络的一些示意图,从我即将审查的这一主题的文献中摘录。
现在,我们可以通过通过两个时间步来展开这个网络,将连接以无环的形式可视化。注意权重(从输入到隐藏和隐藏到输出)在每个时间步是相同的。递归网络有时被描述为深度网络,其深度不仅仅发生在输入和输出之间,而且还发生在跨时间步,每个时间步可以被认为是一个层。
一旦被展开,这些网络可以使用反向传播,进行端到端的训练。这种跨时间步的反向传播扩展,被称为沿时间反向传播(backpropagation through time)。
然而有一个问题,在yoshua bengio经常被引用的论文(learning long-term dependencies with gradient descent is difficult)中提到,那就是消失的梯度。换句话说,后面时间步的错误信号,往往并不能回到足够远的过去,像更早的时间步一样,去影响网络。这使它很难以学习远距离的影响,比如放过的那只小卒会在12步后回来将你。
补救这一问题的措施是1997年首先被sepp hochreiter和jurgen schmidhuber提出的长短期记忆(lstm)模型。在这个模型中,常规的神经元,即一个将s型激活应用于其输入线性组合的单位,被存储单元所代替。每个存储单元是与一个输入门,一个输出门和一个跨越时间步骤无干扰送入自身的内部状态相关联。
在该模型中,对于每个存储单元,三套权重从输入训练而得,包括先前时间步中完整的隐藏状态。一个馈送到输入节点,在上图的底部。一个馈送到输入门,在最右侧的单元格底部显示。另一个馈送到输出门,在顶部最右侧的显示。每个蓝色节点与一个激活函数相关联,典型情况是s型函数,以及表示乘法的pi节点。单元中最中央的节点称为内部状态,并且以1的权重跨越时间步,反馈回本身。内部状态的自连接边,被称为恒定误差传送带或cec。
就前传递而言,输入门学习来决定何时让激活传入存储单元,而输出门学习何时让激活传出存储单元。相应的,关于后传递,输出门是在学习何时让错误流入存储单元,而输入门学习何时让它流出存储单元,并传到网络的其余部分。这些模型已被证明在多种多样的手写识别和图像加字幕任务上非常成功。也许得到多一些关爱,它们能在太空侵略者上获胜。
给大家普及一些CBB电容器的常识
工业触摸屏的属性以及工作原理分析
鲁大师发布2019年上半年PC处理器排行榜 AMD完全压制Intel
无线数传信号的发射和解调
车路协同与自动驾驶封闭测试场地测试
深入浅出LSTM神经网络
小米5c数据图片曝光:堪称史上最惊艳小米 十二月亮相水立方
5G网络成为国内云计算市场发展的新动力
LED显示屏模组出现偏色现象的原因都在这里
长安汽车发布2019年业绩快报,预计一季度扭亏为盈
改变微结构可改善基于有机的固态锂 EV 电池
电磁炉输出功率测试及调整
你不了解的LED显示屏 常见无线控制盘点详细介绍讲解
脉冲触发是什么意思?脉冲触发方式的特点 怎么判断脉冲触发和边沿触发?
强化学习和监督式学习, 非监督式学习的区别
自调零仪表放大器MAX4208/4209H的功能特点及应用
抢先看,CES2017带来的既新奇又独特的产品
电动牙刷防水透气膜可实现牙刷IPX7级防水与压力平衡
物联网时代来临,谁将称霸5G世界?
RISC-V软件生态崛起在即?大厂联合成立RISE项目