- 13
- 0
- 约9.67千字
- 约 57页
- 2017-04-10 发布于上海
- 举报
大數据的处理和分析计算机科学导论第十讲
大数据的处理和分析计算机科学导论第十讲
计算机科学技术学院
陈意云
0551 yiyun@
/~yiyun/
课 程 内 容
课程内容
围绕学科理论体系中的模型理论, 程序理论和计算理论
1. 模型理论关心的问题
给定模型M,哪些问题可以由模型M解决;如何比较模型的表达能力
2. 程序理论关心的问题
给定模型M,如何用模型M解决问题
包括程序设计范型、程序设计语言、程序设计、形式语义、类型论、程序验证、程序分析等
3. 计算理论关心的问题
给定模型M和一类问题, 解决该类问题需多少资源
2
本次讲座与这些内容关系不大
讲 座 提 纲
大数据的魅力
数据挖掘、大数据、大数据案例、大数据的特点
大数据时代的思维变革
样本和全体、精确性和混杂性、因果关系和相关关系
大数据的处理
几种主要处理方式、MapReduce编程模型
大数据的分析
关键技术概述、PageRank初步
3
数据挖掘
数据挖掘的定义
1. 从数据中提取出隐含的、过去未知的、有价值
的潜在信息
2. 从大量数据或者数据库中提取有用信息的科学
相关概念:知识发现
1. 数据挖掘是知识发现过程中的一步
2. 粗略看:数据预处理?数据挖掘?数据后处理
预处理: 将未加工输入数据转换为适合处理的形式
后处理: 如可视化, 便于从不同视角探查挖掘结果
大数据的魅力
4
数据挖掘
典
原创力文档

文档评论(0)