网站大量收购独家精品文档,联系QQ:2885784924

基于词性分析的数据流程图快速绘制方法.docVIP

基于词性分析的数据流程图快速绘制方法.doc

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于词性分析的数据流程图快速绘制方法

基于词性分析的数据流程图快速绘制方法-电子商务论文 基于词性分析的数据流程图快速绘制方法 文/宇文姝丽 摘要:数据流程图是信息系统分析的核心图表工具,它既是新系统逻辑模型的主要组成部分,又是系统物理设计的重要依据。本文作者从10多年的教学和科研中的经验总结出一种简易的快速绘制数据流程图的方法,该方法以调研报告为基础,通过对调研报告的分词和词性分析等预处理技术,形成调研报告的核心数据集,利用调研报告核心数据集来自动半自动的快速绘制数据流程图。通过40个班级2000多人的实验验证,该方法简单易学,可以大大的节约绘制数据流程图的时间和精力。 关键词 :词性分析;数据流程图;外部实体;数据处理;数据存储;数据流 引言 在系统分析中,数据流程图是描述信息系统逻辑模型的主要工具,同时也是系统分析员和用户交流思想的有效手段。它用少数几种符号通俗易懂地综合地反映出信息在系统中的流动、处理和存储情况[1]。实践证明,只要对用户稍作解释,用户就能看明白,同时由于数据流程图层次性强,适合不同管理层次的业务人员进行业务调查,因此在结构化系统开发方法中,数据流程图的绘制尤为重要,本文作者根据自己的科研和教学经验总结出一种简易的快速会这数据流程图的方法,该方法简单易用,可以大大的节省系统分析员从调研报告到数据流程图转换的时间。 1、数据流程图的组成 数据流程图是一种能全面地描述信息系统逻辑模型的主要工具,它可以用少数几种符号综合地反映出信息在系统中的流动、处理和存储情况[1]。一般来说,数据流程图由四种符号组成,分别详述如下: 1.1 外部实体 外部实体是指本系统之外的人或单位,它们是位于系统之外的信息提供者或使用者,和本系统有信息传递关系[1][2]。一般是存在于系统之外的人员或组织,用来是说明系统数据输入的源点(数据源)或数据输出的终点(数据终点或数据使用者),通常用S来表示和编号,具体如图1所示: 1.2 数据处理 数据处理,又称系统功能,是对系统中的所有数据逻辑的表示和说明,表示系统对数据进行的处理操作[1][2]。数据处理是数据流程图的核心,整个的系统流程图的分解就是以数据处理的分解为基础的,一般用P来表示和编号,具体如图2所示: 1.3 数据存储 数据存储是系统中需要进行长久或者临时存储的数据,一般会通过数据文件、文件夹或账本等形式出现,常用D来进行表示和编号,具体表示方式如图3所示: 1.4 数据流 数据流表示系统中流动着的数据和数据流向,由一组固定成份的数据组成,它可以是一项数据,也可以是一组数据(如文件、单据等),同时也可用来表示对数据文件的存储操作[1][2]。数据流可从数据处理流向数据处理,也可在数据处理与数据存储或外部实体之间流动;而且两个数据处理之间可有多股数据流。数据流常用F来进行表示和编号,具体表示方式如图4所示: 2、基于词性分析的数据流程图画法思路 从数据流程图的组成来看,构成数据流程图中的四个组成部分的主要内容大都是单位、人、数据以及人的相关动作,因此在绘制数据流程图时可以考虑使用词性分析来对调研报告进行预处理,从而从词性分析的角度来对其进行快速的绘制。 由以上数据流程图的组成部分的介绍可以看出,构成外部实体的大都是单位或人,因此在绘制数据流程图时可以直接的使用其名称来命名,而名称大多以名词形式来体现;同样对于数据存储和数据流来说,因为它们大都是文件或单据的形式存在,故而也可以考虑使用文件名和单据名等名词来命名;对于数据处理来说,它用来说明的系统的具体数据操作,多以相关人员的处理动作来代表,因此可以使用动词的形式来操作名命名。 综上所述,作者提出了一种基于词性分析的简易的快速数据流程图绘制方法,具体的绘制思路为:对于系统的调研报告进行分词和词性分析等预处理操作,形成调研报告的核心数据集,根据数据集的词性关系自动的绘制顶层数据流程图,然后调研报告和数据集对数据流程图进行逐层分解直到达到用户需求或者数据集中数据使用完毕,最后用户可以根据自己的具体需求进行人工的调整从而达到更好的绘制效果。详细的画法思路如下: 1) 词性标注:利用分析工具对系统调研报告进行分词,并对其进行词性标注; 2) 捡词处理:对标注后的调研报告进行捡词处理和统计分析,去掉不必要的虚词成分,并把其主要的名词和动词抽取出来形成初级核心数据集; 3) 数据预处理:对初级核心数据集进行归类分析、语义相似度分析和统计分析,对其中相同或相似的名词、动词根据调研报告和用户需求进行

文档评论(0)

phltaotao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档