- 38
- 0
- 约1.09万字
- 约 19页
- 2019-04-18 发布于江西
- 举报
PAGE 17/ NUMPAGES 19
基于mapreduce的稀疏矩阵乘法算法
组长:吴建堃 组员:白野 朵宝宝
目录
一、课题研究目的
二、稀疏矩阵介绍
稀疏矩阵乘法介绍(三元组)……………………… 2
Mapreduce介绍 …………………………………4
实验环境配置 …………………………………7
创建代码(来自网络的代码) ………………………10
组员总结 ……………………………………………16
TOC \o 1-3 \h \z \u
一、课题研究目的。
矩阵乘法运算是一种基本运算。而扩大矩阵乘法的运算规模并降低其运算时间,将有利于满足机器学习算法处理大规模数据的要求。将MapReduce并行框架用于分块矩阵乘法,实现一种用于大规模矩阵乘法运算的方法。理论分析和实验结果表明该方法在处理大规模矩阵乘法上具有极大的潜能,并且随着计算节点的增加从而获得较好的加速比。
二、稀疏矩阵介绍。
人们无法给出稀疏矩阵的确切定义,一般都只是凭个人的直觉来理解这个概念,即矩阵中非零元素的个数远远小于矩阵元素的总数,并且非零元素没有分布规律。
对于那些零元素数目远远多于非零元素数目,并且非零元素的分布没有规律的矩阵称为稀疏矩阵
稀疏矩阵乘法介绍(三元组)
当矩阵M、N是稀疏矩阵时,我们可以采用三元组表的表示形式来实现矩阵的乘。
采用三元组表的方法来实现时,因为三元组只对矩阵的非零元素做存储所以可以采用固定三元组表a中的元素(i,k,Mik)(1≤i≤m1,1≤k≤n1),在三元组表b中找所有行号为k的的对应元素(k,j, Nkj)(1≤k≤m2,1≤j≤n2)进行相乘、 累加,从而得到Q[i][j],即以三元组表a中的元素为基准, 依次求出其与三元组表b的有效乘积。
算法中附设两个向量num[ ]、first[ ],其中num[row]表示三元组表b中第row行非零元素个数(1≤row≤m2), first[row]表示三元组表b中第row行第一个非零元素所在的位置。显然,first[row+1]-1指向三元组表b中第row行最后一个非零元素的位置。
first[1]=1;
first[row]=first[row-1]+num[row-1], 2≤row≤m2+1。
这里,first[m2+1]-1表示最后一行最后一个非零元素的存储位置。当三元组表a中第i行非零元素的列号等于三元组表b中非零元素的行号时,则元素相乘并将结果累加。
Mapreduce介绍
1、MapReduce是一种编程模型,用于大规模数据集(大于1TB)的并行运算。
2、特点:具有接口简单,健壮容错的特点。
3、关于map函数和reduce函数
MapReduce 的整体架构主要由map 和reduce 这两个函数组。其含义是:Map(映射)和Reduce(化简)。
图 SEQ 图 \* ARABIC 1 Mapreduce模式工作过程
用户输入一组键/值对,首先由map函数生成一批中间的键/值对,然后由reduce 函数将具有相同键的中间值合并,产生最后的结果。在这一过程中,由于MapReduce的数据本地化特性,计算都是在本地节点完成。用户在使MapReduce 开发时,只需要关注于应用本身,而不必关心底层的任务分发、并发控制、资源管理、容错等复杂细节。极大地方便了编程人员在不会分布式并行编程的情况下,将自己的程序运行在HYPERLINK /view/991489.htm分布式系统上。因此,可以有效地将大规模矩阵乘法运算引入到MapReduce 并行框架中。
MapReduce 与传统并行编程模型的比较:
在传统并行编程过程中,程序员必须花大量的精力去处理进程间通信。WordCount被用来统计输入数据中各单词出现的次数。以WordCount 为例,MPI 的一种实现方式为:在各个MPI 进程完成各自的统计任务后,将结果汇总给某一个进程,然后由该进程进行最终统计。该实现方式很容易在完成最终统计任务的进程处形成通信瓶颈,而最终统计任务是以顺序方式完成,会导致统计效率低下。采用并行分类统计能提升效率,即收集各个进程获得的关于某个相同单词的局部统计信息,并将这些信息汇总给某个进程处进行分类统计。然而由于这种实现方式仅确定能产生某个单词统计信息的进程范
您可能关注的文档
- 机械设计规范.docx
- 机械设计基础课后习题与答案.doc
- 机械设计课程设计--V带式输送机传动系统设计(完整图纸).doc
- 机械设计课程设计二级同轴式圆柱齿轮减速器.doc
- 机械设计课程设计-设计一用于卷扬机卷筒的传动装置.doc
- 机械设计课程设计说明书模板.doc
- 机械设计制造及其自动化毕业论文-1.doc
- 机械设计制造及其自动化发展方向的研究毕业论文.doc
- 机械设计制造及其自动化专业课程设计.doc
- 机械手分拣大小球课程设计.doc
- 统编版2025年春季新版七年级下册历史 第21课 明清时期的科技与文化 教案.docx
- 雅安雨城法院书记员招聘考试真题库2025.docx
- 2026届安徽合肥市高考一模高考语文试卷试题(含答案详解).pdf
- 【专题研究】国内外城市更新研究的最新进展.pdf
- 【专题研究】老旧城区改造居民满意度影响因素研究——以遂宁市老旧城区改造为例.pdf
- 【专题研究】关于旧城空间改造理论与创意设计案例的几点思考.pdf
- 西藏拉萨市高三下学期期末物理备考重点详解.docx
- 泾县法院书记员招聘笔试真题2025.pdf
- 2026年春【苏教版】-六年级数学下册-面积的变化.pptx
- 2026年春【苏教版】-六年级数学下册-7.pptx
原创力文档

文档评论(0)