- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
The Applications In Social Sciences 法律 心理学(测慌) 经济学 社会学 人口学 管理科学 文学 考古 …… The Applications In Social Sciences(法律之一) The Applications In Social Sciences(法律之二) The Applications In Social Sciences(法律之二) The Applications In Social Sciences(文学—红楼梦) 在IT业中的应用 分类、搜索 图像或模式识别 网络完全(数字签名) 统计在医药卫生中的应用 Biostatistics 制药业(比对试验) 疾病的诊断(Bayes方法,图模型等) 病理分析 疾病的控制 The Applications In Bioinformation Data Mining (一) 99:8179,7954, 76269,8406,9405, 7918934,1.91817. 舅舅:不要吃酒,吃酒误事, 吃了二两酒,不是动怒,就是动武, 吃酒要被酒杀死,一点酒也不要吃。 Data Mining(二) 7 ÷2 2≦x≦3 40 ÷ 6 二四六八 1 × 1 = 1 10002 =100×100×100 7/8 687 3x 不三不四 接二连三 陆续不断 无独有偶 一成不变 千方百计 七上八下 了不起 thanks 数据挖掘的定义 数据挖掘:从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 原始数据可以是结构化的也可以是半结构化的。 发现知识的方法可以是数学的,也可以是非数学的;可以是演绎的,也可以是归纳的。 Data Mining(三) Data Mining(四) 统计方法 计算机的应用 计算方法 Data Mining(五) (啤酒与尿布) 有一次,美国沃尔玛公司的分店经理发现:一段时期以来,每逢周末店内啤酒和尿布的销量 都会同比攀升。 ... 分析还发现:原来这些人习惯晚上边看球赛、边喝啤酒,对于要照顾 的孩子,为了图省事就用一次性尿布。于是沃尔玛决定:把这两种商品集中摆在一起。 数据挖掘(Data mining, DM)技术是一门综合性的技术领域,主要涉及数据库、人工智能和数理统计3个技术领域。 数据挖掘的产生 产生的前提:从大量数据中找出隐藏在其中的、有用的信息和规律;计算机技术和信息技术的发展使其有能力处理这样大量的数据。 数据挖掘的应用价值 应用数据挖掘从大量数据中所发现的规律并不是“放置四海而皆准”的规律,而是面向某一应用的规律,具有具体的指导意义。 成功例子: 零售业的沃尔马“啤酒与尿布”规律 Google 中国宝山钢铁公司1995年开始利用数据挖掘技术提高热轧产品质量、合理配矿 中国铁道部1998年开始利用数据挖掘技术分析春运期间的铁路客流量,挖掘影响铁路客运总量的关键因素 …… 数据挖掘的发展过程 八十年代人工智能(AI)研究项目失败后,转入实际应用时提出的。 1989年国际上第一次关于数据挖掘与知识发现的研讨会在美国的底特律召开,在此次会议上第一次提出了知识发现(Knowledge Discovery in Database, KDD)一词。 1995年,在加拿大召开了第一届KDD和DM国际学术会议。会议对KDD做了确切的定义 。 从九十年代中后期开始,KDD和DM已成为研究的热点和焦点。 4.3 正态性检验 正态分布是最常用的分布,用来判断总体分布是否为正态分布的检验方法称为正态性检验,它在实际问题中大量使用。 一、 正态概率纸 正态概率纸可用来作正态性检验,方法如下:利用样本数据在概率纸上描点,用目测方法看这些点是否在一条直线附近,若是的话,可以认为该数据来自正态总体,若明显不在一条直线附近,则认为该数据来自非正态总体。 例4.4 随机选取10个零件,测得其直径与标 准尺寸的偏差如下:(单位:丝) 9.4 8.8 9.6 10.2 10.1 7.2 11.1 8.2 8.6 9.6 在正态概率纸上作图步骤如下: (1) 首先将数据排序: 7.2 8.2 8.6 8.8 9.4 9.6 9.8 10.1 10.2 11.1; (2) 对每一个i,计算修正频率 (i-0.375)/(n+0.25), i=1,2,…,n, (3) 将
您可能关注的文档
最近下载
- 最新初中地理新课程标准考试题七套(含答案).docx VIP
- 掺镱光纤预制棒、掺镱有源光纤及其制备方法.pdf VIP
- 2025年辽宁省事业单位招聘考试公共基础知识考试试题库及一套完整答案详解.docx VIP
- 人教版四年级上册数学第三单元《角的度量》测试卷推荐.docx VIP
- 党志愿书空白表格.doc VIP
- 强直性脊柱炎的护理查房PPT课件.pptx VIP
- 项目提成管理制度.docx VIP
- 2025中国南水北调集团新能源投资有限公司第二批社会招聘笔试备考题库及答案解析.docx VIP
- 新外研版高中英语选择性必修2Unit5课文翻译.pdf VIP
- 广西示范性高中2024-2025学年高二上学期期中调研测试数学试题(解析版).docx VIP
文档评论(0)