基于语言无关性语义Kernel学习的短文本分类.pdfVIP

  • 9
  • 0
  • 约2.25万字
  • 约 5页
  • 2016-02-02 发布于天津
  • 举报

基于语言无关性语义Kernel学习的短文本分类.pdf

基于语言无关性语义Kernel学习的短文本分类.pdf

第32卷第7期 计算机应用与软件 V01.32 No.7 2015年 7月 ComputerApplicationsandSoftware Ju1.2015 基于语言无关性语义 Kernel学习的短文本分类 易 欣 郭武士 (1~JllI程职业技术学院计算机科学技术系 l~IJfI德阳618000) 摘 要 针对传统的短文本分类方法大量使用语法标签和词库导致产生语言依赖的问题,提 出一种基于语言无关性语义核学习 的短文本分类方法。首先,利用短文本的语义信息从文档 中提取模式;然后,以三个标注层(词、文档和类别)标注提取出的每个模 式;最后,根据三个标注层次计算文档之间的相似度,并根据相似度完成分类。在英语和汉语数据集上的实验验证了该方法的有效 性。实验结果表明,相比其他几种核方法,该方法取得了更好的分类性能。 关键词 短文本分类 语义核学习 相似性度量 语言无关性 标注层 模式语义标注

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档