从神经网络到深度学习-AI视野.ppt

  1. 1、本文档共41页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络结构: A deep and big LSTM network Google神经网络翻译 基于注意力的神经机器翻译 降低了ML应用的门槛 降低了ML应用的门槛 从神经网络到深度学习 ——大数据催生的新智慧物种 自然语言处理 怎样用神经网络处理离散(符号)数据? 嵌入(Embedding) * 怎样学习词嵌入? Neural Language Model word2vec * word2vec词嵌入的性质 向量空间中的距离 = 词义相似性 * word2vec词嵌入的性质 捕获语言的某些规律 * 嵌入空间可视化 * 从单词到句子 CNN * 序列学习问题 序列识别和生成 语音、时间序列、文本... 注意控制 按顺序决定下一时刻注意什么 运动控制、玩游戏 。。。 共同模式 历史状态(可变长度)- 内部状态表示(短时记忆) - 下一步动作 传统序列学习模型 “无记忆” Autoregressive models Feed-forward NN “简单记忆” Linear dynamical systems (LDS) Hidden Markov Models (HMM) FNN - RNN Forward propagation RNN for 语言模型/序列生成 常用的训练目标:预测下一时刻的输入 训练RNN:Backpropagation through time (BPTT) 优化目标 最大对数似然(在整个序列上累加) A toy problem for RNN:二进制加法 问题 train a neural net to do binary addition by giving it many 01 string as examples 方案1:FNN 需要预先确定最大位数 对不同的位使用不同的权重 泛化能力差 二进制加法的算法 方案2:RNN 网络结构 2 ins, 3 hiddens, 1 out h(t) = f(Wihx(t) + Whhh(t-1)) (前一时刻的隐状态, 当前时刻的输入) - 下一时刻的隐状态 2个时间步的延迟 输入-隐单元 隐单元-输出 网络学到了什么? 自动学习出3个隐单元的4种不同的激活模式,用以完成加法运算 模拟有限状态自动机,但能力更强 N个隐单元,2N种激活模式,N2个参数(权重) 对比HMM RNN训练的难题:梯度爆炸与消失 if for all m: gradient explode if for all m: gradient vanish 在包含长时关联(dt 10)的序列上很难有效训练RNN Long Short-Term Memory (LSTM) Two types of memory in RNN Short-term memory: encoded in activity patterns of hidden units Long-term memory: encoded in weights 不同类型的记忆 LSTM cell Input gate: scales input to cell (write) Output gate: scales output from cell (read) Forget gate: scales old cell value (reset) Cell Cell output LSTM怎样保持梯度信息 (works like a mini-computer with read/write units) LSTM学到了什么? 例子:字符级语言模型 RNN vs LSTM:一个核心区别 隐状态更新方式:替换 -- 累加 更加稳健的动力学特性,减轻梯度爆炸和消失 端到端的机器翻译 将源句子的编码为向量表示,然后将向量解码为目标 句子 网络学到了什么? 源语言和目标语言的词法、语法、短语搭配、语义。。。 基于短语的统计机器翻译 降低了ML应用的门槛 降低了ML应用的门槛

文档评论(0)

知识的天空 + 关注
实名认证
内容提供者

电子工程技术工程师持证人

推荐自动化、电气、仪表、工程、医学等精品培训教程

领域认证该用户于2023年06月07日上传了电子工程技术工程师

1亿VIP精品文档

相关文档