大數据的处理和分析计算机科学导论第十讲.pptVIP

  • 13
  • 0
  • 约9.67千字
  • 约 57页
  • 2017-04-10 发布于上海
  • 举报

大數据的处理和分析计算机科学导论第十讲.ppt

大數据的处理和分析计算机科学导论第十讲

大数据的处理和分析 计算机科学导论第十讲 计算机科学技术学院 陈意云 0551 yiyun@ /~yiyun/ 课 程 内 容 课程内容 围绕学科理论体系中的模型理论, 程序理论和计算理论 1. 模型理论关心的问题 给定模型M,哪些问题可以由模型M解决;如何比较模型的表达能力 2. 程序理论关心的问题 给定模型M,如何用模型M解决问题 包括程序设计范型、程序设计语言、程序设计、形式语义、类型论、程序验证、程序分析等 3. 计算理论关心的问题 给定模型M和一类问题, 解决该类问题需多少资源 2 本次讲座与这些内容关系不大 讲 座 提 纲 大数据的魅力 数据挖掘、大数据、大数据案例、大数据的特点 大数据时代的思维变革 样本和全体、精确性和混杂性、因果关系和相关关系 大数据的处理 几种主要处理方式、MapReduce编程模型 大数据的分析 关键技术概述、PageRank初步 3 数据挖掘 数据挖掘的定义 1. 从数据中提取出隐含的、过去未知的、有价值 的潜在信息 2. 从大量数据或者数据库中提取有用信息的科学 相关概念:知识发现 1. 数据挖掘是知识发现过程中的一步 2. 粗略看:数据预处理?数据挖掘?数据后处理 预处理: 将未加工输入数据转换为适合处理的形式 后处理: 如可视化, 便于从不同视角探查挖掘结果 大数据的魅力 4 数据挖掘 典

文档评论(0)

1亿VIP精品文档

相关文档