结合语义知识的藏文网页主题句抽取算法研究.pdfVIP

  • 6
  • 0
  • 约2.07万字
  • 约 6页
  • 2018-02-04 发布于湖北
  • 举报

结合语义知识的藏文网页主题句抽取算法研究.pdf

信息管理与信息学 结合语义知识的藏文网页主题句抽取算法研究 艾金勇 (西藏民族大学图书馆) : ,提出了结合语义信息的藏 摘 要 通过分析总结藏文网页的结构特征,在借鉴汉语主题句抽取方法的基础上 文网页主题句抽取算法。该方法根据藏文文本特征实现了网页内容的智能识别,同时,在对识别的文本块进行 自动分词后, 利用改进TF-IDF方法结合主题词的语义相关性确定了网页文本的主题词,并据此构建了候选主题 句集,再通过候选主题句的重要度和分布度计算得到了候选主题句的权值。最后对所有候选主题句按权值大小 排序并确定了文本的主题句。 : ;主题句;抽取 关键词 藏文网页;语义信息 中图分类号:G254.2;G255.76 文献标志码:A 文章编号:1005-8214(2017)08-0039-05 ResearchontheMethodofExtractingTopicSentences

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档