基于VSM模型的文本相似度的比较.docVIP

  • 12
  • 0
  • 约2.63万字
  • 约 35页
  • 2019-01-02 发布于湖北
  • 举报
毕业设计(论文)专用纸 PAGE 9 PAGE \* MERGEFORMAT0 毕 业 设 计(论 文) 题 目:基于VSM模型的文本相似性的比较 姓 名 X X X X X 学 号 A A A A A 所在学院 B B B B B 专业班级 C C C C C 指导教师 D D D D D 日 期 摘 要 在互联网迅速发展的时代,网络上的信息数量越来越多,种类也比较纷杂。虽然能在我们查询相关信息是提供大量选择,但是靠人工浏览的方式在浩瀚的信息库中找到自己最需要最相关的信息,无疑给用户带来了麻烦,而且效率也十分低下。为了解决这一个问题,关于判断文本相似度的技术应运而生,目前广泛运用于计算机,电信等行业。本文着重阐述了计算文本相似度的过程中会遇到的难题,以及解决这些难题需要用到的相应算法,最后利用VSM模型进行简单的设计与运用,完成基于web的相似网页检测程序 关键字:文本相似度;相似网页检测;VSM模型 ABSTRACT With the Internet developing rapidly,there are more and more Information on the Internet,and the varieties of Information is becoming more complex.Although we have a bigger chance to use the Information,it is very difficult and inefficient for users to find the Information which they are most needed in the Information Database.To solve this problem,the relevant technology is invented and now widely used in Computer and Telecom field.This passage is mainly demonstrated the problems we may meet when we calculate the text similarity and the relevant algorithm solving the problems above .In the end,we use VSM model to design and complete the Project-Similar Web detection Based On Web Key Words:text similarity;similar web detection;VSM model 目 录 TOC \o 1-4 \h \z \u HYPERLINK \l _Toc389686222 摘 要 PAGEREF _Toc389686222 \h - 1 - HYPERLINK \l _Toc389686223 ABSTRACT PAGEREF _Toc389686223 \h - 2 - HYPERLINK \l _Toc389686224 目 录 PAGEREF _Toc389686224 \h - 3 - HYPERLINK \l _Toc389686225 第一章 绪论 PAGEREF _Toc389686225 \h - 6 - HYPERLINK \l _Toc389686226 1.1选题背景 PAGEREF _Toc389686226 \h - 6 - HYPERLINK \l _Toc389686227 1.2研究意义 PAGEREF _Toc389686227 \h - 6 - HYPERLINK \l _Toc389686228 1.3国内外研究现状 PAGEREF _Toc389686228 \h - 6 - HYPERLINK \l _Toc389686229 1.3.1国外文本相似度研究状况 PAGEREF _Toc389686229 \h - 6 - HYPERLINK \l _Toc389686230 1.3.2国内文本相似度研究情况 PAGEREF _Toc389686230 \h - 7 - HYPERLINK \l _Toc389686231 1.4开发语言 PAGEREF _Toc389686231 \h - 8 - HYPERLINK \l _Toc38

文档评论(0)

1亿VIP精品文档

相关文档