基于特征短语的网页在线聚类方法研究.pdfVIP

  • 6
  • 0
  • 约1.59万字
  • 约 9页
  • 2018-01-07 发布于广东
  • 举报

基于特征短语的网页在线聚类方法研究.pdf

基于特征短语的网页在线聚类方法★ 刘之涛,陈清才4,孟宪军,王晓龙 哈尔滨工业大学深圳研究生院,深圳,518055 E·mail:qingcai.chen@hitsz.edu.cn 摘要:随着互联网的迅速发展,越来越多的人通过搜索引擎来获取想要得到的信息。但是搜索引擎返回 的结果成百上千,如何从中发现所需的信息就成了一个特别现实的问题。通过对查询结果进行在线聚类就 可以解决这个问题,网页聚类能帮助用户快速准确地定位信息。但对聚类算法的复杂度有严格限制,许多 传统的聚类算法并适合网页在线聚类。为此,本文提出了一种基于特征短语的快速网页在线聚类算法,该 方法利用后缀数组提取网页特征短语,在此基础上进行快速聚类以及类别标注,提供清晰、易于理解的类 别内容概括,并对聚类结果进行了类问以及类内排序。最后,通过实验验证了该在线聚类算法类别标注的 可读性、算法效率以及聚类准确性等方面的有效性,并指出了未来研究工作的重点。 关键词:搜索引擎:在线聚类:特征短语 AFeature—PhraseBasedOnI i DeSearchResuI ts

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档