商务智能与Data Mining的应用.pptVIP

  1. 1、本文档共115页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
商务智能与Data Mining的应用

* * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 损益表, * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * * 危机前二年 * 危机前三年 * 罗吉斯回归 因素筛检变量 关联性筛检变数 Enter Forward-LR Enter Forward-LR * * 类神经网络 倒传递类神经网络(MLP) 隐藏层神经元:2p-2,2p-1,2p,2p+1,2p+2 学习率:0.01,0.05,0.1 动量(Momentun):0.3(软件设定值) 准则:Test RMSE值最小为最佳模型 * 类神经网络 预测样本 96.2% * 综合比较 * 结论 在某些特定的变数上,在各产业间,确实有显著性的差异性(流动、速动比率、周转率、杠杆度…等) 距离危机发生的时间点愈近,将有助于模型的建立 类神经网络所建构的模型较佳(最高:94.2%、 预测96.2% ) 税后净利率%、财务杠杆度、现金流量比率%、营业利益率%、董监质押比率%、总资产周转率(次)、流动比率% 为主要的影响变量 人寿保险公司顾客满意度与 经营绩效认知之研究 银行业导入顾客关系管理之研究 以银行放款部门为例 * 商务智能与Data Mining的未来及其瓶颈 是事业务的事?企画的责任?IT的工作?还是… 是员工的事?老总的事?别人的事?还是… 是工具的问题?人员技术的问题?组织结构问题?还是… 一些未来指标的分析及架构的建议 * Data Mining未来趋势-Text Mining 有90%地信息以非结构性文件储存 Text Mining主要是用来处理这些非结构化信息,以找出规则与结构 可应用在专利文件、病例、论文研究、文件分类、知识管理、信用评等…. 市场上工具: SQL 2005 SSIS/ AS IBM Intelligent Miner for Text SAS Enterprise Miner for Text SPSS Clementine for Text 数据源:Microsoft Taiwan * 新增文字Data Mining功能 Term Extract, Term Lookup 目前仅支持英语 可撷取单字或是词组 可列举排除关键词 Fuzzy lookup, Fuzzy Grouping 容错指标Error-Tolerant Index 可应用在专利文件、病例、论文研究、文件分类、知识管理、信用评等…. 数据源:Microsoft Taiwan * 词汇索引 前 置 处 理 既有词汇撷取 文件 新生词汇撷取 关键词汇筛选及排名 (Ranking) 概念式分类/分群 多国语言 中(简繁体字)英日德俄… 词库式断词 专家断词 领域相关经验法则 指引式文件分类 文件自 动分类 (相似) 信息截取 (Information Extraction) 概念式 搜寻 信息分享 统计断词 关联与相依 分析 (Association Dependent Analysis) 专家校正 图形模式 贝氏机制 * 自动化议题分析程序 议题产生 系统建议 使用者自定 分析结果产生 资料收集 数据库 Intranet Internet 自动分类 摘要/查询 分析 议程汇整 关联预取建议 CBR+探勘机制 建议新议题 * 文献分类/分群 文献 知识表达方式之转换 Data Mining技术 Clustering – k-means, EM, agglomerative ,…,Categorization – kNN, DT, Bayes,... 表达方式之处理- 藉以取得运算矩阵 UMLS, MeSH medical hierarchy Library of Congress subject headings ACM keyword hierarchy 概念阶层 Concept Hierarchical Analysis * 关联与法则 议题关联相关 议题法则 法则推论 文献 相似分析/相依原理 法则逻辑推论 * 样本数据推论分析-知识脉络 * Age Abortion Age AND Abortion ? * Age Hrt * 专家与决策 文献 知识群组 * 知识呈现 * Data Mining的挑战 Data Mining软件繁多:软件商正在为非统计学专业人士们开发一些更加自动化的数据挖掘应用软件,让科学技术更加实用化。 迎合市场需求,Data Mining简单化操作:过分简单将会使结果出现偏差,使执行者基于错误的推理作出定价和盘货决定。 * Data Mining-各个领

文档评论(0)

baoyue + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档