大数据的全文检究.pdfVIP

  • 11
  • 0
  • 约6.4万字
  • 约 62页
  • 2016-01-21 发布于四川
  • 举报
大数据的全文检究

大数据譬}?索研究//Ⅲllll/I///I//I/ll/H川III////ll//lll/16l//i//i8/l/ll/ 摘要 ~!? 随着互联网技术的持续快速发展,人类社会进入了一个前所未有的信息化时代,那 就是大数据时代。在大数据时代,人们掌握的数据在以爆炸性的速度增长,因而大数据 的存储和分析方法成为处理大数据的关键。大数据不仅仅是数据量的增长,数据的形态 也在发生着根本性的变化。据统计,目前互联网上80%以上的数据都是非结构化数据。 因此,研究如何处理大规模非结构化数据,成为解决人们在大数据时代如何快速获取有 效信息的必由之路。 全文检索是信息检索领域一个非常重要的研究方向,它在非结构化数据处理方面具 有无可比拟的优势,它的核心就是索引技术。本文着重介绍了两种不同索引结构的索引 模型,分别是基于外存的B+树索引模型和基于外存的线性散列索引模型,并对两种索 引模型的性能进行了比较实验研究。 首先,本文介绍了本课题的研究背景和研究意义,以及国内外对大数据和全文检索 系统的研究现状,并结合国内外研究进展情况提出了本文的研究内容、研究目标和拟解 决的关键问题。对大数据

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档