内蒙古科技大学-计算机技术-开题-技术分析.pptVIP

下载本文档

3
0
约9.98千字
约 31页
2016-04-24 发布于湖北
举报
版权申诉

内蒙古科技大学-计算机技术-开题-技术分析.ppt

1、本文档共31页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

[37] Zhang YX, Zhou YZ. Transparent Computing: A new paradigm for pervasive computing. In:Ma JH, Yang LT,Tsai JJP, eds.Proc. of the 3rd Int’l Conf. on Ubiquitous Intelligence and Computing (UIC 2006). Berlin, Heidelberg: Springer-Verlag, 2006.1-11. [38] Robert Leaman, Graciela Gonzalez. “BANNER: an executable survey of advances inbiomedical named entity recognition”, Pacific Symposium on Biocomputing 13:652-663(2008). [39] Adomavicius G., Tuzhilin A. Toward the next generation of recommender systems: A survey ofthe state-of-the-art andpossible extensions. IEEE Trans. on Knowledge and Data Engineering,2005, 17(6): 734-749. 六、参考文献内蒙古科技大学信息工程学院第*页敬请各位老师批评指正内蒙古科技大学信息工程学院第*页 * * * * * * * * * * Company Logo LOGO 班级：工硕2013B7班学生：XXX 学号：201303371 信息工程学院计算机技术学位论文开题日期：2015年06月27日论文题目：基于Hadoop数据挖掘算法的研究提纲一、文献综述 1.Hadoop的概述与发展历史 2.Hadoop的国内外研究背景 3.Hadoop的发展趋势二、选题依据及方案 1.选题依据 2.研究方案三、课题研究的可行性及技术路线 1.课题研究的可行性 2.技术路线四、主要研究内容及创新点 1.主要研究内容 2.创新点五、进度安排六、参考文献内蒙古科技大学信息工程学院第*页 2、Hadoop的国内外研究背景 3、Hadoop的应用现状和发展趋势内蒙古科技大学信息工程学院第*页 1、Hadoop的概述与发展历史 Hadoop系统最初的源头来自于Apache Lucene项目下的搜索引擎子项目Nutch，该项目的负责人是Doug Cutting。2003年，Google公司为了解决其搜索引擎中大规模Web网页数据的处理，研究发明了一套称为MapReduce的大规模数据并行处理技术，并于2004年在著名的OSDI国际会议上发表了一篇题为“MapReduce:Simplified Data Processing on Large Clusters”的论文，简要介绍MapReduce的基本设计思想。论文发表后，Doug Cutting受到了很大启发，他发现Google MapReduce所解决的大规模搜索引擎数据处理问题，正是他同样面临并急需解决的问题。因而，他尝试依据Google MapReduce的设计思想，模仿Google MapReduce框架的设计思路，用Java设计实现出了一套新的MapReduce并行处理软件系统，并将其与Nutch分布式文件系统NDFS结合，用以支持Nutch搜索引擎的数据处理。2006年，他们把NDFS和MapReduce从Nutch项目中分离出来，成为一套独立的大规模数据处理软件系统，并使用Doug Cutting小儿子当时呀呀学语称呼自己的玩具小象的名字“Hadoop”命名了这个系统。2008年他们把Hadoop贡献出来，成为Apache最大的一个开源项目，并逐步发展成熟，成为一个包含了HDFS、MapReduce、HBase、Hive、Zookeeper等一系列相关子项目的大数据处理平台和生态系统。第*页 2、Hadoop的国内外研究背景 3、Hadoop的应用现状和发展趋势内蒙古科技大学信息工程学院第*页 2、Hadoop的国内外研究背景 MapReduce编程模型的思想来源于函数式编程语言Lisp，由Google公司于2004年提出并首先应用于大型集群。同时，Google也发表了GFS、BigTable等底层系统以应用MapReduce模型。在2007年，Google’s MapReduce Programming Mode