基于Bootstrapping的领域多词串自动获取研究.pdfVIP

  • 1
  • 0
  • 约1.2万字
  • 约 7页
  • 2017-12-27 发布于广东
  • 举报

基于Bootstrapping的领域多词串自动获取研究.pdf

i 基于Bootstrappng的领域多词串自动获取 郑妍肖桐朱靖波 东北大学信息学院自然语言处理实验室沈阳l10004 E-mail:cindy.zhengyanffa),163.com 摘要:在构建领域知识库过程中。领域多词串比词携带了更多的语义信息,对于文本的主题分析和文本的内容 分析明显的效果。本文首先利用C-Value方法从大规模无标注的真实语料中获取大量的多词串,然后采用 Bootstrapping的机器学习技术,自动获取多词串的领域特征。实验结果表明,该方法有较好的性能,可以大大 减轻人工构建的代价。 关键词:领域知识,机器学习,Bootstrapping,C-Value DomanMuI t Term i Si ti on i i i-WordAcqu byBootstrappng ZhengYanXiaoTongZhuJingbo

文档评论(0)

1亿VIP精品文档

相关文档