条件随机场论文:条件随机场 语义标注 中文商品查询 特征模板 平均感知器算法.docVIP

条件随机场论文:条件随机场 语义标注 中文商品查询 特征模板 平均感知器算法.doc

  1. 1、本文档共5页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
条件随机场论文:条件随机场 语义标注 中文商品查询 特征模板 平均感知器算法

【关键词】条件随机场 语义标注 中文商品查询 特征模板 平均感知器算法 【英文关键词】Conditional Random Fields Semantic Tagging Chinese Product Query Feature Templates Averaged Perceptron Algorithm 条件随机场论文:基于条件随机场的中文商品查询语义标注问题研究 【中文摘要】用户通常利用购物搜索引擎寻找自己想要的产品,对比搜索结果列表中的产品信息,例如价格、销量、买家评价等,点击列表项就进入相应的商品详情页,可以查看更详细的信商品息。理解这些商品查询的意图,既能增强用户的搜索体验,又能促进页面广告带来的收益。为了更好的实现这个目标,我们研究商品查询语义标注问题,即为商品查询中的每一项(词项或字)标注上预先定义的语义类别标签。已有的研究表明,利用序列标注模型可以解决商品查询语义标注问题,例如条件随机场模型,在此类问题中能取得较好的效果。商品查询具有如下三个特点:查询简短,特征稀少;不同类查询差异明显;商品查询词可以较好地划分语义类别,且上下文相关。区别于已有的英文商品查询语义标注的研究,本文研究的数据对象是以中文为主的商品查询。为此,本文首先组合多种类型的特征函数与特征模板丰富特征,能有效提高中文商品查询语义标注效果,同时使用基于商品标题构造语义词典的方法,标注效果进一步提高,特别是在训练样本较少时效果提升显著;其次,据文献调研,本文首次将平均感知器算法应用于语义标注模型中的参数学习过程,在保证标注效果较优的同时大幅缩短了模型训练时间,这将有助于研究成果的现实应用。此外,本文就不同模型、分词与未分词、不同特征模板、不同参数估计算法、语义词典使用前后等多种情况进行对比实验,实验结果与分析为中文商品查询语义标注这一研究主题提供了许多有价值的参考。 【英文摘要】Users usually use shopping search engine to find products they like, to compareproduct information in search results, such as price, sales and buyers’ reviews. Whenclick one product item on the listing, they will get more detail information on productdetail pages. Understanding the intents of these product queries can not only improvea user抯 search experience, but also boost a site抯 advertising profits. As one steptoward this goal, we study the problem of semantic tagging of product query, which isto assign each query segment/word to a pre-defined semantic category. Usingstatistical sequence labeling models to tag product queries has been shown to performwell. For instance, Conditional Random Fields (CRFs) model has achievedstate-of-the-art performance on such research topic.Product query has the following three aspects: short and lack of features; productqueries of different categories are significantly different; the words in product queryare context-sensitive and can be conveniently divided into semantic categories.Different from many other studies on semantic tagging of product query, this paperfocuses on Chinese-based product query, but not English-based. T

您可能关注的文档

文档评论(0)

zhengshumian + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档