第十二章词嵌入与语言模型 - 神经网络与深度学习.pdf

第十二章词嵌入与语言模型 - 神经网络与深度学习.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第十二章词嵌入与语言模型 - 神经网络与深度学习

第十二章 词嵌入与语言模型 在深度学习的应用中,数据的形式多种多样。像图像、声音之类的数据很 自然地可以表示为一个连续的向量。比如图像直接将像素的颜色值(灰度值或 值)组成一个连续向量。而对于语言的表示则很难找到合适的表示方式。 语言可以看作是一个符号序列,每个字或词都看成是离散的符号。特别是计算 机内部,每个字都是表示为无意义的编码。以颜色表示为例,我们有很多词来 形容颜色的词,除了基本的“红”、“蓝”、“绿”、“白”、“黑”等之外,很有很多 比如红色、 白色、黑色、绿色,还有以地区或物品命名的,比如“中 国红”、“普鲁士蓝”、“咖啡色”、“奶油色”等等。据不完全统计,现有的颜色 命名已经有 多种 。假设我们有一组神经元,我们可以有两种方式来表示 这些颜色名字。 一种方式是用一个神经元来表示一个特定的颜色,即神经元和颜色名字是 : “一对一”关系。我们把这种表示方式叫做局部表示 ( 间 时 )。假设有 中颜色,我们就需要有 个神经元。局部表示有两 译 个不足之处:()需要神经元数量很多,且不能扩展。如果有一个新的颜 编 色,我们就需要增加一个神经元来表示;( )不同颜色之间的相似度都为 ,即我们无法知道“红色”和“中国红”的相似度要比“红色”和“黑 色”的相似度要高。 另一种方式是用一组神经元来表示一个特定的颜色,即神经元和颜色名

文档评论(0)

magui + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

版权声明书
用户编号:8140007116000003

1亿VIP精品文档

相关文档