- 1、本文档共25页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
课时4数据管理与安全、数据与大数据
课时目标
1.能选择合适的方法管理数据,理解文件的基本属性。2.了解数据保护的一般方法,提高数据安全意识。3.了解大数据的概念,理解大数据的特征。4.了解大数据对人类思维方式的影响,能正确面对大数据。
一、数据管理与安全
1.数据管理是利用计算机硬件和软件技术对数据进行有效收集、存储、处理和应用的过程,其目的在于充分、有效地发挥数据的作用。
2.在大数据出现之前,计算机数据的管理已经经历了人工管理、文件管理和数据库管理三个阶段。
3.数据一般以文件的形式存储。根据编码规则的不同,文件的格式也不相同,可以用文件扩展名来表示某些特定的文件类型,如网页文件的文件扩展名为.htm或.html,而JPEG图像文件扩展名为.jpg等,以区分不同类型的存储数据,如文本、图像、音频等。
常见数据文件格式
类型
扩展名
说明
打开该类型文件软件
文本文件
.txt
纯文本文件
记事本
.docx
Word文档
MicrosoftWord
.wps
WPS文档
金山WPS
.html
网页文件htm或html
记事本、FrontPage、Dreamweaver
电子图书文档
AdobeAcrobat、AdobeReader
图像文件
.bmp
位图,以像素的颜色值存取(未压缩)
ACDSee、画图程序、Photoshop
.jpg
JPEG静态图像压缩标准形成格式
.gif
图形交换文件格式,最多只能支持256种颜色,占用计算机存储空间小,常被用于网页制作
.png
可移植网络位图格式文件,图片具有高保真性,透明性及文件体积小等特征
.tif
标签图像文件格式(TagImageFileFormat,简写为TIFF)
声音文件
.wav
波形文件格式,是实际声音的采样和编码,文件的容量很大(未压缩)
录音机程序、GoldWave
.mp3
是一种数据压缩格式(有损压缩),占用磁盘空间小
.mid
是记录MIDI信息的标准格式,是一个由乐器数字接口指令组成的计算机乐谱,所占存储空间较小
.wma
WMA(WindowsMediaAudio),是微软公司的音频格式
视频文件
.avi
Windows的标准视频格式
WindowsMediaPlayer、暴风影音
4.计算机一般采用树形目录结构来管理文件。在Windows系统中,则采用了更为形象的文件夹来管理文件。
5.传统数据库技术基于结构化数据进行开发,凭借其数据独立性、数据可共享等特点,已经成为现代社会数据管理的主要方式,在安全性、易使用、可靠性等方面都取得了令人瞩目的成绩。
6.数据管理技术不断发生着变化,目前借助云计算、大数据等技术来管理大量半结构化、非结构化数据。
7.威胁数据安全的因素有很多,如硬盘驱动器损坏、操作失误、黑客入侵、感染计算机病毒、遭受自然灾害等
8.目前主要是采用主动防护的手段保护政府部门或企业的数据安全,如通过磁盘阵列、数据备份、异地容灾等手段,来保证数据的安全。
9.对于数据安全,不仅要做好防护上的安全,还应提高数据本身的安全,如通过数据加密、数据校验等方法,可以提高数据的保密性和完整性。
10.所谓数据加密,是指通过加密算法和加密密钥将明文转变为密文,而解密则是通过解密算法和解密密钥将密文恢复为明文。
11.所谓数据校验是为保证数据的完整性进行的一种验证操作,通常用一种指定的算法对原始数据计算一个校验值,接收方用同样的算法计算一个校验值,如果两次计算得到的检验值相同,则说明数据是完整的。常见的数据校验方法有MD5、CRC、SHA-1等。
二、数据与大数据
1.20世纪90年代末,“大数据”的概念首次由美国硅图公司(SGI)的一位科学家正式提出。
2.大数据代表着信息量大、速度快、种类繁多的信息资产,需要特定的技术和分析方法将其转化为价值。
3.大数据之“大”,不仅指规模、速度和种类的特征,还意味着它超出以往常用的数据采集、组织、管理和加工等软件的处理能力,要求新型集成技术从多元、复杂和巨量规模的数据集里洞察规律。
4.符合大数据概念的数据一般具有数据规模大、处理速度快、数据类型多、价值密度低四个特征,可以用4个V来概括,即数量(Volume)、速度(Velocity)、多样(Variety)和价值(Value)。
①数据体量巨大。大数据的数据量庞大,其存储单位需要用到EB、ZB级别,且时刻在增长中。
②速度快。速度快不仅是指数据产生的速度快,还指数据处理速度快。
③数据类型多。大数据来源多样,其数据往往是多种形式共存。
④价值密度低。尽管大数据有很高的价值,但与其海量的数据量相比,则显得密度较低。
5.大数据是一场变革,改变的不仅是数据,还有人们的思维。
①大数据采用全样本数据分析,而不是抽样数据。
②
您可能关注的文档
- 第一章 课时2 数据采集与编码(一) 课件(共56张ppt)浙教版(2019)必修1.pptx
- 第一章 课时3 数据采集与编码(二) 课件(共70张ppt)浙教版(2019)必修1.pptx
- 第一章 课时4 数据管理与安全、数据与大数据 课件(共78张ppt)浙教版(2019)必修1.pptx
- 第一章 验收卷(一) 数据与信息 课件(共27张ppt)浙教版(2019)必修1.pptx
- 课时1 Python程序设计语言基础 课件(共64张ppt)浙教版(2019)必修1.pptx
- 课时1 人工智能的概念与发展 课件(共49张ppt)浙教版(2019)必修1.pptx
- 课时1 数据整理与计算 课件(共41张ppt)浙教版(2019)必修1.pptx
- 课时1 算法的概念及描述 课件(共42张ppt)浙教版(2019)必修1.pptx
- 课时2 Python基本数据结构 课件(共74张ppt)浙教版(2019)必修1.pptx
- 课时2 大数据处理的基本思想与架构 课件(共42张ppt)浙教版(2019)必修1.pptx
- 第18讲 第17课 西晋的短暂统一和北方各族的内迁.docx
- 第15讲 第14课 沟通中外文明的“丝绸之路”.docx
- 第13课时 中东 欧洲西部.doc
- 第17讲 第16 课三国鼎立.docx
- 第17讲 第16课 三国鼎立 带解析.docx
- 2024_2025年新教材高中历史课时检测9近代西方的法律与教化含解析新人教版选择性必修1.doc
- 2024_2025学年高二数学下学期期末备考试卷文含解析.docx
- 山西版2024高考政治一轮复习第二单元生产劳动与经营第5课时企业与劳动者教案.docx
- 第16讲 第15课 两汉的科技和文化 带解析.docx
- 第13课 宋元时期的科技与中外交通.docx
文档评论(0)