- 1、本文档共40页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
不飞则已,一飞冲天;不鸣则已,一鸣惊人。——《韩非子》word
数据分析与挖掘习题
第一章作业
1.1什么是数据挖掘?在你的回答中,强调以下问题:(a)它是又一个骗局吗?
数据挖掘,在人工智能领域,习惯上又称为数据库中知识发现(KnowledgeDiscoveryin
Database,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个根本步骤。数据挖
掘可以与用户或知识库交互。并非所有的信息发现任务都被视为数据挖掘。例如,使用
数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面,如此是
信息检索〔informationretrieval〕领域的任务。虽然这些任务是重要的,可能涉与使用复杂
的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引
结构,从而有效地组织和检索信息。尽管如此,数据挖掘技术也已用来增强信息检索系统的
能力。(b)它是一种从数据库,统计学和机器学习开展的技术的简单转换吗?
硬要去区分DataMining和Statistics的差异其实是没有太大意义的。一般将之定义为
DataMining技术的CART、CHAID或模糊计算等等理论方法,也都是由统计学者根据统计
理论所开展衍生,换另一个角度看,DataMining有相当大的比重是由高等统计学中的多变
量分析所支撑。但是为什么DataMining的出现会引发各领域的广泛注意呢?主要原因在相
较于传统统计分析而言,DataMining有如下几项特性:
1.处理大量实际数据更强势,且无须太专业的统计背景去使用DataMining的工具
2.数据分析趋势为从大型数据库抓取所需数据并使用专属计算机分析软件,DataMining
的工具更符合企业需求;
3.纯就理论的根底点来看,DataMining和统计分析有应用上的差异,毕竟DataMining
目的是方便企业终端用户使用而非给统计学家检测用的。
(c)解释数据库技术开展如何导致数据挖掘
近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以
广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛
用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。数据
挖掘利用了来自如下一些领域的思想:(1)来自统计学的抽样、估计和假设检验,(2)人工
智能、模式识别和机器学习的搜索算法、建模技术和学习理论。数据挖掘也迅速地接纳了来
自其他领域的思想,这些领域包括最优化、进化计算、信息论、信号处理、可视化和信息检
索。一些其他领域也起到重要的支撑作用。特别地,需要数据库系统提供有效的存储、索引
和查询处理支持。源于高性能〔并行〕计算的技术在处理海量数据集方面常常是重要的。分
布式技术也能帮助处理海量数据,并且当数据不能集中到一起处理时更是至关重要。
(d)当把数据挖掘看作知识发现过程时,描述数据挖掘所涉与的步骤。
知识发现过程以下三个阶段组成:〔1〕数据准备,〔2〕数据挖掘,〔3〕结果表达和解释。
1.2给出一个例子,其中数据挖掘对于一种商务的成功至关重要的。这种商务需要什么数据
挖掘功能?他们能够由数据查询处理或简单的统计分析来实现吗?
由于统计学根底的建立在计算机的发明和开展之前,所以常用的统计学工具包含很多可
以手工实现的方法。因此,对于很多统计学家来说,1000个数据就已经是很大的了。但这
个“大〞对于英国大的信用卡公司每年350,000,000笔业务或AT
您可能关注的文档
- 2023-2024年辽宁省法库县《执业药师之西药学综合知识与技能》资格考试必刷200题题库大全含答案.docx
- 2023-2024年红云烟草有限责任公司招聘1人公开引进高层次人才笔试参考题库答案真题附答案(培优A.docx
- 2023-2024年石家庄三鹿集团股份有限公司春季招聘24人高频100题难、易错点模拟试题附带答案题.docx
- 2023-2024年牡丹江恒丰纸业集团有限责任公司应届高校毕业生招聘重点基础提升模拟试题附带答案题库.docx
- 山东省大联考2024-2025学年高一年级上册12月模拟选课走班调考试政治试题(含解析).pdf
- 小说标题的含义和作用(试题专练)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 2024年吉林省高职院校单招《职业技能测试》参考试题库(含答案).pdf
- 富强与创新(练习)-中考道德与法治一轮复习(解析版).pdf
- 实验:探究小车速度随时间变化的规律(人教版必修第一册)(解析版).pdf
- 人教版数学五年级下册期末复习《应用题》专项练习卷(能力提升).pdf
- 书面表达之建议信(讲义)-中考英语一轮复习(含答案).pdf
- 中考历史复习小众题型类:填空题、改错题、判断题(70题).pdf
- 2024年吉林省县乡教师选调考试《教育学》真题汇编带解析必背【基础题】.pdf
- 2025年中考语文备考之《朝花夕拾》名著导读及考题.pdf
- 小说标题的含义和作用(模拟突破)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 阅读理解之应用文(练习)-中考英语一轮复习(含答案).pdf
- 小说情节作用(模拟突破)-2025年中考语文考点突破之小说阅读(原卷版).pdf
- 小说段落作用(模拟突破)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 小说段落作用(试题专练)-2025年中考语文考点突破之小说阅读(解析版).pdf
- 2025年上海市16区初三语文一模试题汇编之现代文阅读二(记叙文)学生版.pdf
文档评论(0)