面向文本分类的k近邻查询方法研究计算机软件与理论专业毕业论文.docxVIP

下载本文档

1
0
约5.44万字
约 62页
2019-05-26 发布于上海
举报
版权申诉

面向文本分类的k近邻查询方法研究计算机软件与理论专业毕业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

山东科技大学硕士学位论文摘要山东科技大学硕士学位论文摘要摘要随着互联网上信息量的爆炸式增长和空间信息科学的发展，在很多应用中都需要求给定对象的 kNN 和 RkNN，如在文本分类、智能导航、现代通讯、交通控制、气象预报等各个领域都有着广泛的需求。 kNN 查询在文本分类研究等领域有十分重要的应用。kNN 问题不仅研究得较早，而且对于它们的商业应用已经相当的广泛和成熟。目前比较常用的文本分类技术主要有：向量空间模型、k 最近邻法、神经网络、支持向量机和贝叶斯算法等。而 kNN 算法是一种有效地文本分类算法。针对传统 kNN 算法存在计算量过大的缺点，论文引入了生成代表样本集的方法，对原始训练集进行裁剪并予以取代，从而减少了分类系统的计算量，有效地提高了系统的效率。近年来，移动设备和无线网络的广泛应用带来了基于位置服务应用(LBS)的快速发展，RkNN 查询在 LBS 中扮演了极为重要的角色。然而现有的 RkNN 算法一般都是近似的解法或者仅仅适用于某种特定的情况，因此在一定程度上存在以下的不足和缺陷：仅适用于二维空间数据的求解；对 k 的值有限制；支持静态数据而不支持数据库的动态更新，尤其移动对象数据库；仅能得到近似不能得到精确的结果。为解决这些问题，本文给出了一种能够有效解决多维移动对象 RkNN 查询的新算法——基于半空间修剪的移动对象 RkNN 连续监测算法。该算法为每一查询点目标分配一个安全矩形区域，对原有的半空间修剪策略进行改进，使其性能优化，并采用过滤、提炼这两个处理步骤来获取查询点的反向 k 最近邻，实现了对查询点的 RkNN 连续监测。关键词：kNN，RkNN，文本分类，类倾斜，移动对象山东科技大学硕士学位论文Ab 山东科技大学硕士学位论文 Abstract Abstract As the explosive growth of information on the Internet and the development of spatial information technology, given object k-Nearest Neighbors (kNN) and Reverse k-Nearest Neighbors (RkNN) are required in many applications, they are popular in text classification, intelligent navigation, modern communications, traffic control, weather forecasting and other areas. Great importance has been attached to kNN query in text classification research. kNN issues is easy to achieve, not only because it’s studied earlier, but also it has formed relative mature theory and algorithm. Widely used text classification methods include: Vector Space Model (VSM), k-Nearest Neighbors (kNN), Neuron Network (NNet), Support Vector Machines (SVM) and Bayes. Compared with other algorithms, kNN method is relatively simple and more effective, which has been widely used. In view of the traditional kNN algorithm has the disadvantages of large quantities of computation, the paper introduces the generating representative sample collection method, the original training set was cut and replaced, thereby reducing the calculation amount of the classification system, effectively improve the efficiency of the system. In recent years, mob