词嵌入与语言模型.PDFVIP

  • 51
  • 0
  • 约6.7万字
  • 约 31页
  • 2017-10-14 发布于天津
  • 举报
词嵌入与语言模型.PDF

第十五章 词嵌入与语言模型 在深度学习的应用中,数据的形式多种多样。像图像、声音之类的数据很 自然地可以表示为一个连续的向量。比如图像直接将像素的颜色值(灰度值或 值)组成一个连续向量。而对于语言的表示则很难找到合适的表示方式。 语言可以看作是一个符号序列,每个字或词都看成是离散的符号。特别是计算 机内部,每个字都是表示为无意义的编码。以颜色表示为例,我们有很多词来 形容颜色的词,除了基本的“红”、“蓝”、“绿”、“白”、“黑”等之外,很有很多 比如红色、 白色、黑色、绿色,还有以地区或物品命名的,比如“中 国红”、“普鲁士蓝”、“咖啡色”、“奶油色”等等。据不完全统计,现有的颜色 命名已经有 多种 。假设我们有一组神经元,我们可以有两种方式来表示 这些颜色名字。 一种方式是用一个神经元来表示一个特定的颜色,即神经元和颜

文档评论(0)

1亿VIP精品文档

相关文档