- 1
- 0
- 约9.63千字
- 约 48页
- 2019-06-07 发布于河南
- 举报
* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * b n 大数据的处理 X: Y: Z: 当矩阵很大时,可用MapReduce 实现矩阵运算。对于分块乘: 1. Map任务计算两块的乘,用结 果在Z中的位置作为键 2. Reduce任务按键值来分别累加 Map任务的结果 b n 大数据的处理 X: Y: Z: 当矩阵很大时,可用MapReduce 实现矩阵运算。对于分块乘: 1. Map任务计算两块的乘,用结 果在Z中的位置作为键 2. Reduce任务按键值来分别累加 Map任务的结果 当矩阵很大时,可用MapReduce 实现矩阵运算。对于分块乘: 1. Map任务计算两块的乘,用结 果在Z中的位置作为键 2. Reduce任务按键值来分别累加 Map任务的结果 b n 大数据的处理 X: Y: Z: b n 大数据的处理 X: Y: Z: 当矩阵很大时,可用MapReduce 实现矩阵运算。对于分块乘: 1. Map任务计算两块的乘,用结 果在Z中的位置作为键 2. Reduce任务按键值来分别累加 Map任务的结果 b n 大数据的处理 X: Y: Z: 当矩阵很大时,可用MapReduce 实现矩阵运算。对于分块乘: 1. Map任务计算两块的乘,用结 果在Z中的位置作为键 2. Reduce任务按键值来分别累加 Map任务的结果 大数据分析的关键技术 要挖掘大数据的大价值,必须对大数据进行内容 上的分析与计算 深度学习 大数据的出现提供了使用复杂 (而不是简单或浅层) 的模型来有效地表征和解释数据的机会,深度学习就是利用层次化的架构学习出对象在不同层次上的表达 (例:降低语音识别错误率) 知识计算 要对大数据进行高端分析,就需要从大数据中抽取出有价值的知识,并将其构建成可支持查询、分析和计算的知识库,涉及知识库的构建、多源知识的融合和知识库的更新 大数据的分析 大数据的分析 大数据分析的关键技术 社会计算 是现代计算技术与社会科学之间的交叉学科, 它是指面向社会活动、社会过程、社会结构、社会组织和社会功能的计算理论和方法。在线社会计算包括在线社会网络的结构分析、信息传播模型以及信息内容的分析、建模与挖掘等 可视化 不同于传统的信息可视化,大数据可视化的最大挑战源自其数据规模:如何提出新的可视化方法,它能够帮助人们分析大规模、高维度、多来源、动态演化的信息,并辅助作出实时的决策 大数据的分析 PageRank初步 PageRank(网页排名)通过对网络浩瀚的超链接关系的分析来确定一个页面的等级 Google把从A页面到B页面的链接解释为A页面给B页面投票,B页面从A页面的投票能得多少分还与A页面的等级有关 一个页面的PageRank,由所有给它投票的页面的数量和重要性,经过迭代计算得到 这项技术使得Google成为第一个能够战胜作弊者的搜索引擎。当然,与作弊者之间的斗争永远不会停止 大数据的分析 PageRank初步 1. 早期搜索引擎与词项作弊 搜索引擎:词项出现在网页头部比在普通正文的得分高、词项在网页中出现的次数越多得分越高 作弊者:在自己的网页上增加热门词项, 如movie, 并重复很多次,以提高与movie的相关性。词项movie在该网页上的颜色与背景色一样,以掩盖作弊者的不道德行为 大数据的分析 PageRank初步 2. Google的对策 使用PageRank技术来模拟Web漫游者的行为:他们从随机页面出发,每次从当前网页随机地选择出链前行,该过程可以迭代多次。最终,较多漫游者访问的网页则重要性较高。在决定查询应答顺序时,Google把重要页面放在前面 在判断网页内容时, 不仅考虑网页上出现的词项,还考虑有链接指向该网页的网页中所使用的词项 大数据的分析 PageRank初步 3. 最简单的PageRank举例 PageRank:网页集?实数,值越大则网页越重要 定义网页的Web迁移矩阵M来描述随机漫游者的下一步访问行为 例:从A出发,以1/3的概率 访问B、C和 D,访问A的 概率为0 0 1/2 1 0 1/3 0 0 1/2 1/3 0 0 1/2 1/3 1/2 0 0 A B C D M = A B C D 大数据的分析 PageRank初步 3. 最简单的PageRank举例 随机漫游者位置的概率分布可通过一个n维向量v来描述,每个分量表示处于相应网页的概率
您可能关注的文档
- 大数据、云计算与移动应用(第1讲)大数据现象与机遇33.ppt
- 大数据、云计算与移动应用(第5讲)云计算应用实例119.ppt
- 大数据:银行的机遇与挑战20.ppt
- 大数据_BigData-MapReduce-新生态系统101.ppt
- 大数据处理技术研究24.docx
- 大数据处理引擎.ppt
- 大数据处理与分析相关平台简介49.ppt
- 大数据存储与处理-推荐系统.ppt
- 大数据-大数据技术177.ppt
- 大数据的介绍及案例分享.docx
- 剪纸“多层套色”对色彩层次感感知提升实验_2026年1月.docx
- 民乐“五声音阶”在现代歌曲改编中接受度评估_2026年3月.docx
- 2025年高效执行力课件.pptx
- 基于虚拟现实技术的孤独症儿童社交技能干预方案开发与效果评估_2026年1月.docx
- 轻量化StyleGAN在校园情侣照风格迁移中的手机端推理速度测试_2026年1月.docx
- 个人事项报告制度培训课件.pptx
- 某无人机配送在山区试运行中噪音扰民投诉案例分析_2026年5月.docx
- 虚拟校园的空间认知与物理校园映射_2026年1月.docx
- 智能教育资源配置决策PPT.pptx
- 某3D打印房屋在梅雨季墙体渗水问题的技术复盘_2026年5月.docx
最近下载
- 肝癌介入治疗.pdf VIP
- FTM-400XDR_中文使用说明书.pdf
- 2025年苏州健雄职业技术学院单招笔试职业技能考核试题库含答案解析.docx VIP
- (正式版)DB33∕T 1072-2019 《泡沫玻璃外墙外保温系统应用技术规程》.docx VIP
- 第一单元1 珍稀动物课件2026春湘美版美术三年级下册.pptx VIP
- 人教版六年级数学下册第二单元《百分数(二)——成数问题》专项练习(含答案).docx VIP
- DB61_T 1560.2-2022 公路钢结构梁桥制造安装与质量检验规范 第2部分:安装要求.docx VIP
- 03分布式光伏发电工程可行性研究设计导则.docx VIP
- 2026春统编版(五四制)(新教材)小学道德与法治三年级下册《一切靠劳动》课时练习及答案.docx VIP
- 宽QRS波群心动过速的鉴别诊断课件.ppt VIP
原创力文档

文档评论(0)