- 67
- 0
- 约6.63万字
- 约 8页
- 2017-01-03 发布于贵州
- 举报
厦门大学计算机科学系研究生课程
《》
上机练习
MapReduce编程初级实践
主讲教师:林子雨
二零一年九月
目录
1 1
2 作业目的 1
3 作业性质 1
4 作业考核方法 1
5 作业提交日期与方式 1
6 实验平台 1
7 实验内容和要求 1
8 实验报告 4
附录1:任课教师介绍 4
附录2:课程教材介绍 5
《》
上机练习说明
主讲教师:林子雨
E-mail: ziyulin@ 个人主页:/linziyu
作业题目作业目的作业性质作业考核方法作业提交日期与方式实验平台
实验内容和要求
x
y
x
y
z x
输入文件B的样例如下: y y x z y
根据输入文件A和B合并得到的输出文件C的样例如下: x y y x y z y
z x
2. 编写程序实现对输入文件的排序
现在有多个输入文件,每个文件中的每行内容均为一个整数。要求读取所有文件中的整数,进行升序排序后,输出到一个新的文件中,输出的数据格式为每行两个整数,第一个数字为第二个整数的排序位次,第二个整数为原待排列的整数。下面是输入文件和输出文件的一个样例供参考。
输入文件1的样例如下:
33
37
12
40
输入文件2的样例如下:
4
16
39
5
输入文件3的样例如下:
1
45
25
根据输入文件1、2和3得到的输出文件如下:
1 1
2 4
3 5
4 12
5 16
6 25
7 33
8 37
9 39
10 40
11 45
3. 对给定的表格进行信息挖掘
下面给出一个child-parent的表格,要求挖掘其中的父子辈关系,给出祖孙辈关系的表格。
输入文件内容如下:
child parent
Steven Lucy
Steven Jack
Jone Lucy
Jone Jack
Lucy Mary
Lucy Frank
Jack Alice
Jack Jesse
David Alice
David Jesse
Philip David
Philip Alma
Mark David
Mark Alma
输出文件内容如下:
grandchild grandparent
Steven Alice
Steven Jesse
Jone Alice
Jone Jesse
Steven Mary
Steven Frank
Jone Mary
Jone Frank
Philip Alice
Philip Jesse
Mark Alice
Mark Jesse
实验报告
厦门大学计算机系研究生课程《大数据技术原理与应用》实验报告 题目: 姓名 日期 实验环境: 实验内容与完成情况: 出现的问题: 解决方案(列出遇到的问题和解决办法,列出没有解决的问题):
附录1:任课教师介绍
林子雨(1978-),男,博士,厦门大学计算机科学系助理教授,主要研究领域为数据库,实时主动数据仓库,数据挖掘.
主讲课程:《》
办公地点:厦门大学海韵园科研2号楼
E-mail: ziyulin@
个人页:/linziyu
《大数据技术原理与应用——概念、存储、处理、分析与应用》,由厦门大学计算机科学系教师林子雨博士编著,是中国高校第一本系统介绍大数据知识的专业教材。本书定位为大数据技术入门教材,为读者搭建起通向“大数据知识空间”的桥梁和纽带,以“构建知识体系、阐明基本原理、引导初级实践、了解相关应用”
您可能关注的文档
最近下载
- 瓦斯抽采管路与电缆及通信电缆交叉点岔门处同侧悬挂安全技术措施2.docx VIP
- 2025至2030中国CMP抛光材料行业发展趋势分析及投资前景预测报告.docx VIP
- 2025年山东省高职院校综合评价招生考试(素质测试)历年参考题库含答案详解.docx VIP
- 2025年南京机电职业技术学院单招语文测试题库标准卷.docx VIP
- Altium Designer电路设计与制作(第三版)教案全套 陈学平 项目1--6 Altium Designer 20.1 的简介---交通信号灯的设计与制作 .docx
- 整套教学课件《植物病虫害防治》ppt.pptx VIP
- 2026年党支部在学习贯彻党的创新理论等“对照五个方面”存在的问题及整改措施4280字范文.docx VIP
- GB50169-2016 电气装置安装工程接地装置施工及验收规范附条文.docx VIP
- 2022年度组织生活会全套资料(方案、对照检查材料、报告、批评意见1).docx VIP
- gb51348-2019民用建筑电气设计标准.docx VIP
原创力文档

文档评论(0)