- 1、本文档共33页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据在信息安全领域价值
教育资源个性化推送技术 利用GPU进行大数据并行计算和匹配 引入“有效信息量”的概念 同一资源对于不同的人,有效信息量不同 “因材施教”:资源与大量学生之间的匹配 大数据压缩与混沌加密核心引擎 核心压缩算法自主研发,支持GB级数据字典 实测性能指标达到先进水平 压缩率、压缩速度全面超越WinRAR 压缩速度超过7-zip,压缩率各有千秋 能够进行“蝴蝶效应”加密 谢谢! 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 大数据在信息安全领域的价值 华南理工大学 电子与信息学院 覃健诚 博士 自我介绍 覃健诚 北京邮电大学 信息安全中心 博士毕业 目前在:华南理工大学 电子与信息学院 研究方向:网络安全,云计算 著作 《网络安全基础》,科学出版社,2011 内容列表 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 大数据时代来临 抽象:大数据是什么 云计算、物联网等新技术催生大数据 涉及数据仓库、数据分析、数据挖掘等技术 大数据的特点 数据量大:TB级以上 种类多:文本、多媒体、数据库等 价值密度低:有效信息分散在海量数据中 处理速度快:要求实时、准实时获得结果 具体:大数据价值的实例 从美钞轨迹到流感预测 趣味网站:让大家输入手上美钞的序列号 积累了十年数据,能跟踪美钞流通轨迹 大量数据积累的意义 形成美钞在世界各地流动的规律 也就是世界上人群、病毒流动的规律 2009年利用数据来预测H1N1流感传播趋势 成功预测首要爆发热点在纽约、加州、德州 虚拟案例:利用大数据 跟踪现金钞票流动情况:记录钞票序号 利用大量收银台验钞机、ATM机 发现现金异常流动情况 追查洗钱源头 银行劫案与恐怖袭击的相关性分析 某地数据:银行抢劫与恐怖袭击高度相关 业务分析:暴力手段获得恐怖活动财源 破案兼预防:发生抢劫案之后提高警惕 对大数据的理解 象提炼稀土矿一样提取大数据中的价值 有价值的信息量密度很低,蕴藏总量很大 要有足够的技术条件才能提取出来 硬件条件:足够的存储容量、并行运算性能 要求能够快速获得计算结果 时间:流感爆发之后才算出结果就晚了 软件条件:算法技术水平、具体业务水平 大数据分析必须技术与业务结合在一起 大数据体现的价值高低 与数据源有关,也和信息提炼水平有关 要把有价值的信息从大量数据中分离出来 信息提炼水平不够,大数据只是无用的垃圾 提炼水平越高,能够提取出的价值越高 类比:铀矿浓缩技术 天然铀矿:约0.7% 核电站用低浓缩铀:3% 核武器用高浓缩铀:90% 内容列表 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 有效利用大数据中的价值 棱镜门:监听有价值的信息 数据来源:电信部门、网络设备 关键问题:如何筛选出有价值的信息 背景噪音:大量无关的数据 相关技术举例:要求速度快 模式匹配算法:找出敏感词、句之类 概率分析算法:发现异常(小概率事件) 相关性分析算法:找到高度相关情况 棱镜门的延伸:网络信息监控 寻找特定领域的网络信息 查案:筛选特定目标人物的相关信息 整理线索:收集与线索相关的网上信息 为特定目的监测网络信息 反恐、防侵略:监控异常动向 防腐败、反洗钱:监控账务信息 防欺诈、防盗刷:监控交易信息 虚拟案例:利用大数据的网络诈骗 股票走势预测:发送大量垃圾邮件、短信 8万邮件,4万说升,4万说跌,总有一半对 说对的继续下一轮:2万说升,2万说跌 有1250人连续收到6次邮件,次次猜中 收网:针对剩下的1250人 声称有内幕消息,要求付费购买 部分人信以为真,付款 类似手法可用在球赛结果预测等其他方面 内容列表 大数据的现实意义 攻:利用大数据为信息安全服务 防:对大数据的信息安全保护 华南理工大学的相关研究工作 大数据的信息安全 大数据本身的安全 大数据存储、计算、传输过程中的安全 防止故障,防止数据差错 设备可靠性:技术保障 信息内容的安全 防范大数据中可能蕴含的敏感信息泄露 利用大数据来隐藏秘密信息 高性能计算的技术要求:又快又好 超级计算机并不是简单的硬件堆积 数据带宽要求 随着节点数增长,带宽以平方级增长 要求有先进的高速传输技术 系统可靠性要求 随着节点数增长,故障率以指数级增长 要求有高超的系统可靠性控制技术 可靠性保障技术 基本原理 冗余、备份、恢复 衍生出编码技术、存储技术、架构设计等 典型技术 存储:磁盘阵列、ECC内存、数据备份 架构:集群 编码:纠错码、校验码
文档评论(0)