- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
文档名称:需求分析说明书
项目计划:数据挖掘系统
项目负责人:王璇
编写:席汉斌、王璇
校对:徐李定
审核:席汉斌、王璇、徐李定
批准:王璇
开发单位:西邮信息1201班
一、引言
1.1编写目的
在信息化时代,大量的数据如同矿山一样,需要人们使用特殊的工具从中挖掘出有价值的信息、数据。目前已经逐步形成了一门学科,称为“数据挖掘”。在数据挖掘中,工具是必不可少的,所以我们打算开发数据挖掘器,作为一个数据挖掘系统。
本文档针对数据挖掘系统的功能,性能,运行环境等方面的要求进行描述,为系统的概要设计提供指导.
1.2 编写背景
项目名称: 数据挖掘系统
编写人员:组长:王璇
程序录入:王璇、徐李定
软件测试:席汉斌、徐李定
报告撰写:席汉斌
1.3 定义
静态数据: 系统固化在内的描述系统实现功能的一部分数据.
动态数据: 在软件运行过程中, 用户输入后的系统输出给用户的一部分数据,也就是系统要处理的数据.
数据字典: 数据字典中名字都是一些属性与内容的抽象与概括,它们的特点是数据的严密性和精确性.
1.4 参考资料
软件工程导论(第五版) ----张海藩 编著 清华大学出版社
数据挖掘导论 ----Pang-Ning Tan 主编 人民邮电出版社
二、任务概述
2.1 目标:
1.给出软件系统的数据流程图与数据结构,构造一个完全的系统逻辑模型;
2.提出详细的功能说明,确定设计限定条件,规定性能要求;
3.密切与用户的联系,使用户明确自己的任务,以便实现上述两项目标。
1.相应的功能有:
(1)用户可以指定被挖掘的数据集位置。
(2)对数据集中的噪音数据进行处理。
(3)用户可以对数据进行统计:最大、最小值,平均值,方差。
(4)用户可以选择相应的数据挖掘算法,例如:关联规则Apriori算法或聚类算法。
(5)选择相应的算法后,对数据集执行相应的算法。
(6)将算法执行的结果显示给用户。
(7)用户可以保存执行的结果。
2.用户的特点:本系统的操作人员的专业水平不需要太高的要求,只需要通过一定阶段的技术培训,便可以上任;而系统的维护人员则需要较高的专业要求和较高的技术水平;本系统中对数据的预先处理有一些要求。
3.条件和约束:本系统的开发期限为半月,该系统的工作量相对于我们的开发小组来说是很大,如包含软件维护及技术文档的整理、制作,由三人共同负责,采用分工作业,互相配合,以达到按时完成,并交付使用。
2.2 运行环境
终端机:AMD Athlon 64×2 1.73GHz ,1G 内存; Windows XP. 或同等配置。
三、功能需求
数据挖掘系统是个微型系统,要实现四个功能:数据录入,算法选择,数据处理,处理结果输出。
3.1数据录入
数据录入是进行数据处理最先的功能。
(一):目录选择
1、本地目录选择
(二): 数据选择
1、录入不同存贮格式的数据文件
3.2算法选择
算法选择功能就是允许用户自主选择处理算法的功能。
3.3数据处理
数据处理功能就是选用户选定的算法对待聚类数据进行处理的功能。
3.4处理结果输出
处理结果输出功能是将处理完的结果输出到指定的文件中。
四、数据描述
根据上面的分析就可以设计出能够满足用户需求的各种数据实体,以及它们之间的关系,为后面的逻辑结构设计打下基础.这些实体包括各种具体信息,通过相互之间的作用形成数据的流动. 本系统的实体有: 待聚类数据实体,结果数据实体.各个实体具体的描述E-R图如下:
待聚类数据数据类型数据个数数据格式结果数据11
待聚类数据
数据类型
数据个数
数据格式
结果数据
1
1
处理之后
处理之后
数据格式数据个数数据类型
数据格式
数据个数
数据类型
五、数据流图待聚类数据D1
待聚类数据
D1
数据读入
数据读入
数据处理人员1数据处理事务D2分类结果2产生结果返回数据分析人员事务结果结果存贮结果读取
数据处理人员
1
数据处理事务
D2
分类结果
2
产生结果返回
数据分析人员
事务
结果
结果存贮
结果读取
图5.1 数据挖掘系统功能级数据流图
D1待聚类数据数据处理人员1.1接受事务产生结果返回数据分析人员事务读取结果1.2读入数据1.3选择算法1.4处理数据2产生结果返回D2结果数据事务事务数据结果读取数据
D1
待聚类数据
数据处理人员
1.1
接受事务
产生结果返回
数据分析人员
事务
读取结果
1.2
读入数据
1.3
选择算法
1.4
处理数据
2
产生结果返回
D2
结果数据
事务
事务
数
据
结果
读
文档评论(0)