- 1、本文档共41页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
网络结构:A deep and big LSTM network Google神经网络翻译 基于注意力的神经机器翻译 降低了ML应用的门槛 降低了ML应用的门槛 从神经网络到深度学习——大数据催生的新智慧物种 自然语言处理 怎样用神经网络处理离散(符号)数据? 嵌入(Embedding) * 怎样学习词嵌入? Neural Language Model word2vec * word2vec词嵌入的性质 向量空间中的距离 = 词义相似性 * word2vec词嵌入的性质 捕获语言的某些规律 * 嵌入空间可视化 * 从单词到句子 CNN * 序列学习问题 序列识别和生成 语音、时间序列、文本... 注意控制 按顺序决定下一时刻注意什么 运动控制、玩游戏 。。。 共同模式 历史状态(可变长度)- 内部状态表示(短时记忆) - 下一步动作 传统序列学习模型 “无记忆” Autoregressive models Feed-forward NN “简单记忆” Linear dynamical systems (LDS) Hidden Markov Models (HMM) FNN - RNN Forward propagation RNN for 语言模型/序列生成 常用的训练目标:预测下一时刻的输入 训练RNN:Backpropagation through time (BPTT) 优化目标 最大对数似然(在整个序列上累加) A toy problem for RNN:二进制加法 问题 train a neural net to do binary addition by giving it many 01 string as examples 方案1:FNN 需要预先确定最大位数 对不同的位使用不同的权重 泛化能力差 二进制加法的算法 方案2:RNN 网络结构 2 ins, 3 hiddens, 1 out h(t) = f(Wihx(t) + Whhh(t-1))(前一时刻的隐状态,当前时刻的输入) - 下一时刻的隐状态 2个时间步的延迟 输入-隐单元 隐单元-输出 网络学到了什么? 自动学习出3个隐单元的4种不同的激活模式,用以完成加法运算 模拟有限状态自动机,但能力更强 N个隐单元,2N种激活模式,N2个参数(权重) 对比HMM RNN训练的难题:梯度爆炸与消失 if for all m: gradient explode if for all m: gradient vanish 在包含长时关联(dt 10)的序列上很难有效训练RNN Long Short-Term Memory (LSTM) Two types of memory in RNN Short-term memory: encoded in activity patterns of hidden units Long-term memory: encoded in weights 不同类型的记忆 LSTM cell Input gate: scales input to cell (write) Output gate: scales output from cell (read) Forget gate: scales old cell value (reset) Cell Cell output LSTM怎样保持梯度信息(works like a mini-computer with read/write units) LSTM学到了什么?例子:字符级语言模型 RNN vs LSTM:一个核心区别 隐状态更新方式:替换 -- 累加 更加稳健的动力学特性,减轻梯度爆炸和消失 端到端的机器翻译 将源句子的编码为向量表示,然后将向量解码为目标 句子 网络学到了什么? 源语言和目标语言的词法、语法、短语搭配、语义。。。 基于短语的统计机器翻译 降低了ML应用的门槛 降低了ML应用的门槛
您可能关注的文档
- 《中国石拱桥》检测.ppt
- 大数据语义分析与应用实践-张华平.pptx
- 基于AI技术构建的讯飞DMP平台及应用-谭昶.pptx
- Qunar网高可用之QMHA-黄勇.pptx
- 人工智能基础施工管理物联云平台.pptx
- 我国城市地下空间开发利用现状评价与展望.pptx
- 施工现场临时用电安全(PPT).pptx
- 严防粉尘爆炸五项规定.ppt
- PMHV与行人安全分享.ppt
- 南京金牛湖两山产业投资开发有限公司招聘笔试题库2024.pdf
- 重庆新速达物业服务集团股份凯里公司招聘笔试题库2024.pdf
- 浙江杭州千岛湖泰众肉类食品有限公司招聘笔试题库2024.pdf
- 陕西新华出版传媒集团新华书店分公司招聘笔试题库2024.pdf
- 宁夏海原县肉牛产业发展集团有限公司招聘笔试题库2024.pdf
- 浙江温岭市化工轻工建筑材料有限公司招聘笔试题库2024.pdf
- 中航飞机汉中航空零组件制造有限公司招聘笔试题库2024.pdf
- 山东海阳市海昇矿产资源开发有限公司招聘笔试题库2024.pdf
- 山东潍坊寿光市公共交通运输有限公司招聘笔试题库2024.pdf
- 内蒙古察右前旗农业投资开发有限公司招聘笔试题库2024.pdf
- 线上清明祭英烈活动策划.pptx
文档评论(0)