ACVOOV语境含义的词向量生成模型.PDFVIP

  • 2
  • 0
  • 约4.21万字
  • 约 6页
  • 2019-05-31 发布于天津
  • 举报
ACVOOV语境含义的词向量生成模型.PDF

第36卷第6期 计 算 机 应 用 研 究 Vol.36No.6 2019年6月  ApplicationResearchofComputers Jun.2019 word2vecACV:OOV语境含义的词向量生成模型  王永贵,郑 泽 ,李 癑 (辽宁工程技术大学软件学院,辽宁 葫芦岛125105) 摘 要:针对word2vec模型生成的词向量缺乏语境的多义性以及无法创建集外词(OOV)词向量的问题,引入 相似信息与word2vec模型相结合,提出word2vecACV模型。该模型首先基于连续词袋(CBOW)和 Hierarchical softmax的word2vec模型训练出词向量矩阵即权重矩阵;然后将共现矩阵进行归一化处理得到平均上下文词向 量,再将词向量组成平均上下文词向量矩阵;最后将平均上下文词向量矩阵与权重矩阵相乘得到词向量矩阵。 为了能同时解决集外词及多义性问题,将平均上下文词向量分为全局平均上下文词向量(globalACV)和局部平 均上下文词向量(localACV)两种,并对两者取权值组成新的平均上下文词向量矩阵,并将word2vecACV模型和 word2vec模型分别进行类比任务实验和命名实体识别任务实验。实验结果表明,word2vecACV模型同时解决了 语境多义性以及创建集外词词向量的问题,降低了时间消耗,提升了词向量表达的准确性和对海量词汇的处理 能力。 关键词:word2vec模型;词向量;共现矩阵;平均上下文词向量 中图分类号:TP391.1   文献标志码:A   文章编号:10013695(2019)06005162306 doi:10.19734/j.issn.10013695.2017.12.0800 word2vecACV:wordvectorgenerationmodelofOOVcontextmeaning  WangYonggui,ZhengZe,LiYue (CollegeofSoftware,LiaoningTechnicalUniversity,HuludaoLiaoning125105,China) Abstract:Theword2vecmodelisaneuralnetworkmodel(NNLM)thatconvertswordsintextintoawordvector.Itiswidely usedinnaturallanguageprocessingtaskssuchasemotionalanalysis,questionansweringrobotandsoon.Wordvectorsgener atedfortheword2vecmodellackedtheambiguityofcontextandtheinabilitytocreateOOVwordvectors.Basedonthesimi larityinformationofdocumentcontextandword2vecmodel,thispaperproposedawordvectorgenerationmodelcalledthe word2vecACVmodelwhichconformedtothemeaningofOOVcontext.Themodelwassimilartotheprocessofthewordvector generatedbytheword2vecmodel.Firstofall,baseonthecontinuouswordbag(CBOW)andtheHierarchicalsoftmax,t

文档评论(0)

1亿VIP精品文档

相关文档