- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
项目概述
项目目的
基金金融工程数据库中有着中国一千多只股票及几百只基金的基础财务数据、股权信息、资本运作信息及每个交易日的行情公告信息。金融工程数据库是一个海量的数据。作为基金管理单位,针对如此海量的信息记录,如何保证从这些数据中提取关键信息,找到有潜力的股票,改善持股结构, 为基金管理部门相关决策提供依据与向导,是我们数据挖掘的目的。因为这个题目太大,我们选择其中一个较小范围的新股发行方面的数据进行挖掘。
新股发行时,每个股票有所属行业,募集资金合计,发行市盈率,二级市场配售发行数量,预测净利润,上市首日表现等可统计信息。对这些数据进行挖掘,预测某只规模的新股上市时合理定价区间。过程中需要运用数据挖掘课程中的一些关键技术和思想,比如聚类分析、OLAP、决策树等方法体现在数据的抽取、数据的存储和管理、数据的展现和预测价值等过程中。
项目步骤
确定项目目标;
选取典型范围的新股上市的数据源与相关数据字典;
数据库建立与数据清理工作;
定义数据堆积维度和衡量值;
确定数据挖掘的理论方法(聚类、决策树);
学会应用Microsoft SQL Server 2000 Enterprise 和Analysis Server OLAP/Data Mining工具;
设计定义挖掘模型和算法;
预测结果测试。
图:数据挖掘步骤
工具介绍
SQL Server 2000 为用户提供了大规模联机事务处理 (OLTP)、数据仓库和电子商务应用程序所需的最新的出色数据库平台。SQL Server 2000 为用户提供了完全集成的可扩展标记语言 (XML) 环境、在分析服务中添加了新的数据挖掘功能、用元数据服务增强了知识库技术。
Microsoft SQL Server 2000 提供的分析服务显著增强了联机分析处理 (OLAP) 服务组件的功能。分析服务引入了数据挖掘功能,可以用来在 OLAP 多维数据集和关系数据库中发现信息。
Microsoft SQL Server 2000 元数据服务扩展并重命名了以前称为 Microsoft 知识库的知识库组件。通过引入新的知识库数据浏览器、新的 XML 交换支持和新的知识库引擎功能来扩展知识库技术。
Microsoft SQL Server 2000 的功能
关系数据库
关系数据的 XML 集成
图形化管理
数据复制
数据转换服务
分析服务
元数据服务
英语查询
在线帮助与文档
分析服务的功能
多维数据集
维度
数据挖掘
数据安全性
PivotTable? 服务中的客户连通性
Microsoft? SQL Server? 2000 扩展并重命名了以前的 OLAP 服务组件,该组件现在称为 Analysis Services。在此版本中,Analysis Services 引入了数据挖掘,这可以用于在 OLAP 多维数据集和关系数据库中发现信息。主题 描述 多维数据集多维数据集类型的多维数据集功能极大地扩展了 Analysis Services 的可伸缩性和功能。Microsoft? SQL Server? 2000 Analysis Services 极大地扩展了 OLAP 多维数据集的可伸缩性和功能。可以在多台服务器间分散多维数据集数据以提供更大的存储容量,创建链接的多维数据集以便在不复制多维数据集数据的情况下分散最终用户对信息的访问,创建在数据更改时实时更新的多维数据集,以及使用很多其它新特性创建可满足特定业务需要的多维数据集。 维度维度和层次结构类型、功能及改进扩展了多维数据集的分析能力。 数据挖掘数据挖掘与联机分析集成在一起,并且能够用于在 OLAP 多维数据集和关系数据库中发现信息。数据挖掘技术分析关系数据库和 OLAP 多维数据集中的数据以便发现感兴趣的信息。在以开放和可扩展的方式实现新的用于数据挖掘的 OLE DB 规范时,并入了 Microsoft? SQL Server? 2000 Analysis Services 的数据挖掘功能。SQL Server 2000 包括 Microsoft 研发中心开发的数据挖掘算法。 数据安全性包括在多维数据集单元和维度成员中使用角色、附加的身份验证方法和改进的强制能力。 PivotTable 服务中的客户连通性客户应用程序能够使用许多新特性和增强功能,例如数据挖掘、HTTP 或 HTTPS 连接、附加维度类型、用于回写的单元分配。 其它提供各种新特性,其中包括多用户管理、MDX 生成器、其它多维表达式 (MDX) 函数、虚拟多维数据集编辑器、支持 Active Directory? 以及更多功能。
4月16日~4月30日 课题研究制作,进行模拟预测等,并完成课题报告初稿
5月7日 报告定稿,答
文档评论(0)