- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
学术讲座报告
学 号:
姓 名:
报告题目:
指导教师:
所属学院:
成绩评定
导师签名
桂林电子科技大学研究生院
年 月 日
学术讲座,它是研究生的一种 \t /a/201312/_blank 学习途径。利用课外学习时间,学校和学院给我们安排了一系列学术讲座,在我看来,旨在丰富研究生学期生活,积累专业知识,拓宽视野。这些讲座与我们专业知识紧密相关,但是却不单一,涉及不同课题观摩聆听名师讲座,?名师神采飞扬,?听者亦有心得。一千个读者的心中有一千个哈姆雷特。而面对着鲜活的教学对象,智慧的教师必然没有相同的课堂。听学术讲座过程中,不仅可以领略各行各业专家的口才艺术,还可以开阔视野,学到课堂上学不到的知识。
在进入研究生院一年多的时间里我参加了各种各样的学术讲座,我既了解到了各领域多层次的发展前沿,使自己能够跟上科学发展的步伐;同时充实了多方面的知识,提升了我们的理论水平;同时也看到了知名学者成功人士的人格魅力。而这也激发并且加强了我们对于所在学科领域的探索之心。在参加的学术讲座中我印象最深的是中国人民大学杜小勇教授“大数据时代的数据管理技术”这个讲座,因为他所讲的内容是我特别感兴趣的方面,拓宽了我的视野。
该讲座的主要内容有大数据的定义、3V、管理技术等。
大数据(big data)的3V
大数据,或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。大数据有3个V,一是大量化(Volume),数据量是持续快速增加的,从 TB级别,跃升到 PB 级别;二是多样化(Variety),数据类型多样化,结构化数据已被视为小菜一碟,图片、音频、视频等非结构化数据正以传统结构化数据增长的两倍速快速创建;三是快速化(Velocity),数据生成速度快,也就需要快速的处理能力,因此,产生了“1 秒定律”,就是说一般要在秒级时间范围内给出分析结果,时间太长就失去价值了,这个速度要求是大数据处理技术和传统的数据挖掘技术最大的区别。
二、数据库管理技术
目前数据库可分为关系数据库和 noSQL数据库,根据数据应用的要求,再结合目前数据库的种类,所以目前数据库管理方式主要有以下 4 类。
(1)面向操作型的关系数据库技术。
首先,传统数据库厂商提供的基于行存储的关系数据库系统,如DB2、Oracle、SQL Server 等,以其高度的一致性、精确性、系统可恢复性,在事务处理方面仍然是核心引擎。其次,面向实时计算的内存数据库系统,如Hana、Timesten、Altibase 等通过把对数据并发控制、查询和恢复等操作控制在内存内部进行,所以获得了非常高的性能,在很多特定领域如电信、证券、网管等得到普遍应用。另外,以VoltDB、Clustrix 和NuoDB 为代表的new SQL 宣称能够在保持ACDI 特性的同时提高了事务处理性能 50 倍 ~60 倍。
(2)面向分析型的关系数据库技术。
首先,TeraData 是数据仓库领域的领头羊,Teradata 在整体上是按Shared Nothing 架构体系进行组织的,定位就是大型数据仓库系统,支持较高的扩展性。其次,面向分析型应用,列存储数据库的研究形成了另一个重要的潮流。列存储数据库以其高效的压缩、更高的I/O 效率等特点,在分析型应用领域获得了比行存储数据库高得多的性能。如:MonetDB 和Vertica是一个典型的基于列存储技术的数据库系统。
(3)面向操作型的noSQL 技术。
有些操作型应用不受ACID 高度一致性约束,但对大数据处理需要处理的数据量非常大,对速度性能要求也非常高,这样就必须依靠大规模集群的并行处理能力来实现数据处理,弱一致性或最终一致性就可以了。这时,操作型noSQL 数据库的优点就可以发挥的淋漓尽致了。如Hbase 一天就可以有超过 200 亿个到达硬盘的读写操作,实现对大数据的处理。另外,noSQL 数据库是一个数据模型灵活、支持多样数据类型,如对图数据建模、存储和分析,其性能、扩展性是关系数据库无法比拟的。
(4)面向分析型的noSQL 技术。
面向分析型应用的noSQL 技术主要依赖于Hadoop分
原创力文档


文档评论(0)