- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息产业部电子信息中心系统部 蒋波 Email:jiangbo@ TEL:8610主要内容 主要内容——结构化数据 主要内容——结构化数据 主要内容——非结构化数据 Internet信息 Word(建议将内部的文件存入集中式的FTP或者文件服务器以及其他,自动备份最好) PDF HTML WPS Excel 超星 Email(咨询服务Email) Lotus(按照原有OA系统进行映射) OA(将产生的文档结合数据库进行采集) 。。。。。。 主要内容 数据的范畴 数据规划 部署与整合 发布与数据增值闭环 建议 数据的范畴 结构化数据(实时业务系统) 非结构化数据(知识管理、竞争情报) 数据的范畴 数据库、数据仓库、ERP、CRM、OA等 企业(政府)日常的非电子数据 面对的海量Internet信息(挖掘自身需求的数据) 组织中人员头脑中存在的数据 数据规划 定义数据类型,数据类型指的是支持组织的业务流所必须的逻辑上的相关数据 将结构化数据分为历史数据、年报数据、季报数据、月报数据、日报数据 将非结构化数据分为核心数据与非核心数据 按用途划分系统数据(元数据)、基础数据(日常)和综合数据(分析) 数据规划——步骤 定义职能域,确定规划工作的范围 分析每一职能域中的业务过程 将每个业务过程分解为业务活动,对定义的业务过程和活动进行复查 业务过程和业务活动分析所需要的实体通过矩阵法分组,组的名称即为主题数据库的名称 数据规划——步骤 主题数据库与业务过程的对应关系,形成逻辑子系统,并确定事务处理系统或决策支持系统等类型 研究现有应用系统与规划的信息系统的关系,确定相互接口,制定转换策略和计划,解决新旧系统过渡问题 研究业务过程发生的地点及所对应的主题数据库,分析集中或分布存储的理由,制定数据集中或分布存储的策略 复查主题数据库、信息系统体系结构和数据分布策略的报告 数据规划——结构化 数据分片同步 数据规划——非结构化(85%以上) 数据规划 数据规划 数据稳定 应用多变 部署与整合 部署与整合 部署与整合 Sample 数据路由HUB 数据库XML接口 ETL工具 应用整合EAI 部署与整合 数据抽取器(如Brio、Oracle、Microsoft、MicroStrategy)将数据加载到数据库或者数据仓库 分析加载数据的关键性、实时性 采用相应的基于XML数据网关(当前的数据库系统都支持XML命令,如IBM.DB2.XML.Extender) 集中化处理、集中化发布 中间件,数据逻辑集中化管理 部署与整合 了解企业或者政府内部的大致信息构成 (聚类分析) 针对业务逐步细化,按照类别逐步查找 (到组织内每个终端) 每个信息类型必须给出唯一信息源 建立非结构化数据的编码体制 内容自动同步(图像解决) * 数据管理之 ——数据规划、部署、整合、发布 数据规划方法论 知识管理与情报处理系统 (非结构化数据) 数据仓库与OLAP分析 (结构化数据) 经济师 副主任 上海 36 王五 工程师 主任 四川 27 李四 高工 总工 北京 24 张三 职称 职务 籍贯 年龄 姓名 腰一椎压缩性骨折,超 过1/3压缩,手术植入物 理矫正。 2004.6.7 2004.4.5 王五 颅内出血、同时有淤血, 淤血压迫视觉神经,造成 暂时性视觉丢失。 2004. 3.9 2004.2.7 李四 严重的胃部痉挛、同时 呈现胃部出血。 2004.11.7 2004.11.1 张三 内容 出院时间 入院时间 患者姓名 非结构化数据 结构化数据 EIP 门诊 住院部 药品 器材 Word PDF 多媒体 中心数据库 数据库 数据库 数据库 数据仓库 CUB OLAP 器材 OA 住院 门诊 抽取 移动计算 数据路由 非结构数据库 OA文档 数据库 网页 SharePoint EIP XML 代 理 器材 OA 住院 门诊 集群式磁盘阵列 所有服务器仅有支持系统软件运行的硬盘,实际数据存储在阵列中。 SQL Server Oracle 文件系统 …… XML数据代理 业务逻辑 XML数据代理 业务逻辑 XML数据代理 业务逻辑 数据路由、业务逻辑、负载平衡 XML代理 DataRounter SQL Server Oracle 文件系统 …… ETL事务 语义逻辑 ETL事务 语义逻辑 ETL事务 语义逻辑 ETL 数据库或数据仓库 SAP ORACLE …… 适配器 适配器 适配器 CRM 远程方法 WebService库 WebServiceHost 整合应用 非结构化数据整合不是全部为了统计,重点是对数据内容的管理分析、分类、聚类以及循环利用。
文档评论(0)