- 1
- 0
- 约1.2万字
- 约 7页
- 2017-12-27 发布于广东
- 举报
i
基于Bootstrappng的领域多词串自动获取
郑妍肖桐朱靖波
东北大学信息学院自然语言处理实验室沈阳l10004
E-mail:cindy.zhengyanffa),163.com
摘要:在构建领域知识库过程中。领域多词串比词携带了更多的语义信息,对于文本的主题分析和文本的内容
分析明显的效果。本文首先利用C-Value方法从大规模无标注的真实语料中获取大量的多词串,然后采用
Bootstrapping的机器学习技术,自动获取多词串的领域特征。实验结果表明,该方法有较好的性能,可以大大
减轻人工构建的代价。
关键词:领域知识,机器学习,Bootstrapping,C-Value
DomanMuI t Term i Si ti on i
i i-WordAcqu byBootstrappng
ZhengYanXiaoTongZhuJingbo
原创力文档

文档评论(0)