一种基于LCS相似网页检测算法.PDFVIP

  • 19
  • 0
  • 约2.5万字
  • 约 15页
  • 2017-06-15 发布于北京
  • 举报
一种基于 LCS 的相似网页检测算法 黄连恩, 王磊, 李晓明 北京大学 网络与分布式系统实验室, 100871 报告编号 PKU_CS_NCIS_TR2007012 提交时间 2007-12-20 北京大学 信息科学技术学院 网络与信息系统研究所,100871 北京大学信息科学技术学院 • 网络与信息系统研究所: PKU_CS_NCIS_TR2007012 一种基于 LCS 的相似网页检测算法∗ 黄连恩, 王磊, 李晓明 (北京大学信息科学与技术学院, 100871 ) 摘要:网页的相似性检测长期以来是一个研究的热点,shingling 和 simhash 被认为是当前最好的两个算法,然而

文档评论(0)

1亿VIP精品文档

相关文档