- 1、本文档共19页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
(1)数据收集 要对来自收集的数据去伪存真, 尽可能收集异源异构的数据,必要时还与历史数据 对照,多角度验证数据的全面性和可信性。 (2)数据存储。要达到低成本、低能耗、高可靠 性目标,通常要用到冗余配置、分布化和云计算技 术,在存储时要按照一定规则对数据进行分类,通 过过滤和去重,减少存储量,同时加入便于日后检 索的标签。 (3)数据处理。有些行业的数据涉及上百个参数, 其复杂性不仅体现在数据样本本身,更体现在多源 Page 36
异构、多实体和多空间之间的交互动态性,难以用 传统的方法描述与度量,处理的复杂度很大,需要 将高维图像等多媒体数据降维后度量与处理,利用 上下文关联进行语义分析,从大量动态而且可能是 模棱两可的数据中综合信息,并导出可理解的内容。 (4)可视化呈现。使结果更直观以便于洞察。目 前,尽管计算机智能化有了很大进步,但还只能针 对小规模、有结构或类结构的数据进行分析,谈不 上深层次的数据挖掘,现有的数据挖掘算法在不同 行业中难以通用。 Page 37
Thanks!!! Page 38
您可能关注的文档
- 【图文】大学生培养职业素质.doc
- 【图文】大学生就业创业素质训练沙盘系统说明ppt.doc
- 【图文】大学生心理健康与自我意识.doc
- 【图文】大学生心理健康 第二讲 自我认识.doc
- 【图文】大学生心理素质拓展.doc
- 【图文】大学生心理学之自我意识.doc
- 【图文】大学生求职自我介绍.doc
- 【图文】大学生职业生涯规划之认识自我.doc
- 【图文】大学生职业生涯规划课程-第一讲(绪论、自我探索与认知).doc
- 【图文】大学生职业规划大赛(下载给同学们看了赛前辅导).doc
- 一病一品护理汇报(手工精品图文).ppt
- 国家义务教育质量监测四年级心理健康测试卷3+问卷(通用版附答案).docx
- 国家义务教育质量监测四年级心理健康测试卷2+问卷(通用版附答案).docx
- 国家义务教育质量监测四年级心理健康测试卷5+问卷(通用版附答案).docx
- 国家义务教育质量监测四年级心理健康测试卷1+问卷(通用版附答案).docx
- 国家义务教育质量监测四年级心理健康测试卷4+问卷(通用版附答案).docx
- 13(猫)第3课时 课件+公开课一等奖创新教学设计.docx
- 孙权劝学 (同步公开课一等奖创新教学设计).docx
- 第17课 要是你在野外迷了路 公开课一等奖创新教学设计.docx
- 统编版(五四制)11古诗二首 池上 公开课一等奖创新教学设计.docx
文档评论(0)