- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
NOSQL在WEB日志分析中应用
NOSQL在WEB日志分析中应用
摘要:本文主要分析NOSQL在WEB日志分析中的应用,使用MongoDB数据库和HadOOP进行系统架构,使用Map Reduce方法处理分析WEB日志数据。在WEB前台显示中,本文将WEB日志统计分为若干个核心模块,并使用jQuery技术进行WEB UI的设计。
关键词:NOSQL;Map Reduce;MongoDB;jQuery
NOSQL in WEB log analysis
Xu JuanJuan2Zhu ChengLiang
(1.Computer Science, Anhui University of Science and Technology,Huainan 232001,China;
2. Computer Science, Anhui University of Science and Technology,Huainan 232001,China)
Abstract: The article analyzes the application of NOSQL in WEB log analysis, usesMongoDB and HadOOP for system architecture, and Map Reduce methods are used to process and analyze WEB log data. In front display of WEB, the article divides WEB log statistics into a number of core modules, and uses jQuery technology to design WEB UI.
Key words:NOSQL;Map Reduce;MongoDB;jQuery
1、引言
随着互联网web2.0网站的兴起,非关系型的数据库现在成了一个极其热门的新领域,非关系数据库产品的发展非常迅速。而传统的关系数据库在应付web2.0网站,特别是超大规模和高并发的SNS类型的web2.0纯动态网站已经显得力不从心,暴露了很多难以克服的问题:对数据库高并发读写的需求,对海量数据的高效率存储和访问的需求,对数据库的高可扩展性和高可用性的需求。
NoSQL是非关系型数据存储的广义定义。它打破了长久以来关系型数据库与ACID理论大一统的局面。NoSQL数据存储不需要固定的表结构,通常也不存在连接操作。在大数据存取上具备关系型数据库无法比拟的性能优势。当今的应用体系结构需要数据存储在横向伸缩性上能够满足需求。而NoSQL存储就是为了实现这个需求。目前Google的 BigTable、Facebook的Cassandra、Apache的HBase 和Amazon 的Dynamo等使用的就是NoSQL型数据库。
2、系统整体架构
本文研究的WEB日志分析系统主要由两部分组成,Nosql数据库的部署和WEB前台显示,系统整体架构图如图1所示。
在Nosql数据库的部署中,本文使用Hadoop(Hadoop是apache下面的一个分布式并行计算框架)计算框架中的核心思想MaReduce来处理日志数据,将处理后的数据保存至Nosql数据库Mongo DB中。
在WEB前台显示中,jQuery框架库和Mongo DB都采用JSON数据格式,使得jQuery和Mongo DB之间交互数据很方便,而且jQuery在WEB UI中具有强大的表现功能,因此本文采用jQuery框架技术进行WEB UI前台显示的设计。
3、日志数据的处理
本文主要是使用Hadoop的MapReduce思想来进行日志数据的处理。本文使用Hadoop对日志数据进行处理的过程如下:
1) 读取所有的日志信息;2) 根据我们的key,value来划分日志数据;3) 过滤掉一些我们不需要的记录;4) 检查日志数据是否正确;5) 将处理后的数据存储到MongDB数据库中。
MapReduce是Google提出的一个软件架构,用于大规模数据集(大于1TB)的并行运算。Map和reduce是分开处理的,map是将一个任务分解为多个任务执行,reduce是将多个任务汇总起来得到想要的结果。把一个 list拆解为多个放到线程池中启动多个线程计算list中值,然后把多个任务返回的结果合并为一个总的结果其实就是一个简单的MapReduce的应用。
在实际应用中,由于我们处理的是非常庞大的日志数据,所以我们使用Hadoop并行算法来同时进行多个MapReduce处理。单个MapReduc
您可能关注的文档
- MTT法检测纤维蛋白胶对人脂肪源干细胞增殖影响.doc
- Mtwo根管预备系统在磨牙根管预备中效果分析.doc
- MUCI在子宫内膜癌中研究进展.doc
- MUC2蛋白在胃癌组织中表达研究.doc
- Mucin4在百里醌抑制肝癌生长中作用.doc
- MUDS在地市村村通工程中应用.doc
- MUDS村村通无线数字电视实践.doc
- Mulitisim10.0软件在数字电子技术课程教学中应用.doc
- MultiAgent技术在元搜索引擎中应用研究.doc
- MultiGen CreatorVega在高速列车运行视景仿真系统中应用.doc
- NoSQL非关系型数据库发展和应用研究.doc
- Notch1Notch2 Notch3跨膜受体蛋白在淋巴瘤组织中表达及意义.doc
- notch―1p16在宫颈癌中表达及临床意义.doc
- Notch信号通路在结直肠肿瘤干细胞中作用.doc
- Notch信号通路在组织血管化中作用.doc
- Notes数据库与关系型数据库之间整合在办公自动化系统中应用.doc
- Nova4130MN型氢氧分析仪在钢带炉系统中应用.doc
- NovaChip超薄磨耗层在连霍高速洛三灵段专项养护上应用研究.doc
- Novachip超薄磨耗层在高速公路养护维修工程中应用.doc
- Novachip超薄磨耗层技术在韶赣高速养护工程中应用.doc
最近下载
- 精神 信仰 力量 情感动——走进新时代课件 - 2024—2025学年湘艺版(2024)初中音乐七年级上册.pptx VIP
- 水务招聘考试真题及答案.doc VIP
- 油气作业安全操作.pptx VIP
- 煤矿防突细则培训课件.pptx VIP
- 风电机组电气元件讲解(原版).ppt VIP
- 2023年秋江苏开放大学大学英语(B)(2)过程性考核作业3(无作文).pdf VIP
- 《给动画添加背景》优教课件.ppt VIP
- 2024沪教版初中英语单词表汇总(七~九年级)中考复习必背 .pdf VIP
- 最新2024版《法典中华人民共和国职业规范大典》 .pdf VIP
- 人工智能设计伦理智慧树知到答案2024年浙江大学.docx VIP
文档评论(0)