- 1、本文档共104页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息系统与信息资源管理第4章 数据处理
(1) 数据仓库(Data Warehouse) W.H.Inmon:数据仓库是面向主题的、集成的、稳定的、随时间变化的数据集合,用以支持管理决策的过程。 数据仓库用来保存从多个数据库或其它信息源选取的数据, 并为上层应用提供统一的用户接口,完成数据查询和分析。 (2) 数据挖掘(Data Mining) - 数据挖掘是指从大型数据库或数据仓库中提取隐含的、未知的及有潜在应用价值的信息或模式的高级处理过程。 - 模式:即知识,它给出了数据特性或数据之间的关系,是对数据所包含的信息更抽象的描述。按功能可以分为预测型模式和描述型模式。在实际应用中,可以细分为关联模式、聚类模式和序列模式等。 ?数据挖掘的类型 统计分析 关联分析 聚类分析 规则发现 知识发现 ?数据挖掘的常用方法 ①统计学方法 应用于预测、聚类规则挖掘和时序数据的趋势分析等。 回归分析:线性回归,多元回归,非线性回归,广义线性模型(对数回归和泊松回归) 方差分析 序列分析 趋势分析 4.4 数据分析 例4.12 某超市某商品在1995年至2009年的销售状况如下表,试预测2010年的销售状况。 4.4.1 数据分析方法 7.6100 2009 2.6640 2004 1.5923 1999 5.1880 2008 2.0664 2003 1.2522 1998 4.4130 2007 1.9814 2002 0.9206 1997 4.0506 2006 2.0652 2001 1.4799 1996 3.0810 2005 1.9496 2000 1.4338 1995 销售额 年度 销售额 年度 销售额 年度 4.4 数据分析 4.4 数据分析 例4.13 某企业在08-09年每月的经营状况如下表(数据已经过预处理),试分析该企业在2010年第一季度的销售状况 。 2.93 1.15 5.13 0.0907 127.33 1.79 200912 … … … … … … … 2.12 19.57 5.25 0.4493 2.39 1.07 200902 2.16 20.72 11.39 0.4966 2.10 2.82 200901 -1.25 25.32 13.49 0.7408 1.41 3.43 200812 … … … … … … … 1.09 24.17 11.80 0.6703 1.53 2.94 200803 -0.88 26.47 8.23 0.8187 1.30 1.92 200802 -1.69 27.63 18.30 0.9048 1.21 4.80 200801 销售额 生产率 人工 成本 周转 资金 市场 份额 原材料 价格 年月 4.4 数据分析 y1 bk . . . y2 xi x1 x2 . . . . . . wjk bj yk o1 oj wki 4.4 数据分析 例4.14 三位专家对2005-2009年30份科研项目立项申请书进行打分,打分指标包括立论依据A1 、研究计划A2 、研究基础A3 、研究结果A4和写作能力A5五项,各指标分值加权平均值如下表,试将申请书分为优秀、一般、较差三类 。 5.77 4.13 2.68 6.25 4.95 30 9.57 9.36 9.12 8.86 9.23 8 … … … … … … 8.17 7.76 8.15 8.24 8.41 7 7.51 7.51 6.18 7.47 7.15 13 7.32 5.56 4.14 4.36 4.22 6 8.25 7.91 7.43 8.72 8.05 12 7.69 6.28 5.12 7.27 6.45 5 8.66 6.82 4.13 7.42 7.84 12 7.14 6.75 4.51 8.12 8.23 4 7.82 6.74 4.36 6.52 6.91 11 8.38 7.87 7.81 7.96 8.24 3 7.66 4.63 3.39 5.74 5.22 10 8.01 7.23 6.12 7.26 7.35 2 8.27 8.81 8.15 8.34 8.61 9 8.51 7.35 7.61 7.52 8.13 1 A5 A4 A3 A2 A1 编号 A5 A4 A3 A2 A1 编号 4.4 数据分析 模糊矩阵 联机分析 遗传算法 人工神经网络 支持向量机 关联分析 数据包络法 层次分析法 决策树法 主成分分析 方差分析法 时间序列分析 回归分析 趋势分析 贝叶斯法 K-means/FCM 粗糙集 人工智能 数据库技术 运筹学 统计学 数学 评价 决策 预测 分类 4.4 数据分析 观察 编制数据分析处理程序 联机分析处理 专家 分析
文档评论(0)