- 19
- 0
- 约2.5万字
- 约 15页
- 2017-06-15 发布于北京
- 举报
一种基于 LCS 的相似网页检测算法
黄连恩, 王磊, 李晓明
北京大学 网络与分布式系统实验室, 100871
报告编号 PKU_CS_NCIS_TR2007012
提交时间 2007-12-20
北京大学 信息科学技术学院
网络与信息系统研究所,100871
北京大学信息科学技术学院 • 网络与信息系统研究所: PKU_CS_NCIS_TR2007012
一种基于 LCS 的相似网页检测算法∗
黄连恩, 王磊, 李晓明
(北京大学信息科学与技术学院, 100871 )
摘要:网页的相似性检测长期以来是一个研究的热点,shingling 和 simhash 被认为是当前最好的两个算法,然而
您可能关注的文档
最近下载
- 《城市轨道交通 数据分类分级指南》.pdf VIP
- 国内外压裂新技术.pptx VIP
- LNG气化站安全检查表(气站).docx VIP
- 2026年党群部笔试题目及答案.docx VIP
- 《电气机械制图》课件——项目五 绘制与识读零件图.pptx
- CN119595896A 基于超顺磁纳米粒子交流磁化响应的全液相大肠杆菌免疫分析方法、系统、装置、介质 (沈阳工业大学).docx VIP
- 银行劳务外包服务投标方案.doc
- 2025年甘肃省甘南藏族自治州卓尼县小升初总复习数学精选精练含解析.doc VIP
- 2025年公安辅警招聘知识考试题(含答案).docx VIP
- 广东省广州市广大附中教育集团2022-2023学年九年级上学期自主招生数学试题(答案).docx VIP
原创力文档

文档评论(0)