- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
大型集团企业非结构化数据平台建设方案
TOC\o1-3\h\z\u1. 非结构化数据平台建设目标 1
2. 非结构化数据平台架构设计 1
2.1. 内容采集 2
2.2. 内容管理 3
2.3. 知识管理 5
2.4. 内容安全 7
3. 非结构化数据平台方案设计 8
3.1. 建设方式分析及建议 8
3.2. 部署方案 11
3.3. 业务应用及BPM调用方案 15
3.4. 内容采集方案 17
3.5. 数据存储方案 18
非结构化数据平台建设目标
统一存储管理电子单据、财务凭证、原始凭证等非结构化数据的全生命周期管理,提供集团知识统一管理,支撑XX集团财务集中管控平台业务开展。
非结构化数据平台架构设计
内容管理是基于大容量存储设备,支撑XX集团非结构化数据的统一存储及管理,基于ECM建设实践及XX集团非结构化数据管理需求。ECM管理范围包括:
文档管理,支持各类电子文档、电子凭证、电子报表和具有法律效应的文件等的管理;
多媒体管理,支持各类支持多媒体信息的管理,包括:声音、视频、流媒体等;
影像管理,支持各类影像数据管理;
ECM功能架构如下图。
内容采集
通过建立统一的内容接入标准和规范,为XX集团的应用系统提供统一的非结构化数据采集的快速访问通道:
支持的文档内容类型可以是扫描仪、传真机、电子邮件附件、图片、电子表单、PDF等;
支持多语言自动OCR字符识别,可以将图片或者PDF文件中的字母、数字、符号等抽取作为属性元数据,结合元数据定义同步至内容服务器中,从而形成文件从纸张到电子化文档管理的完全自动化处理;
支持大批量扫描及自动识别功能;
图像增强、修改索引、工作流功能。
内容管理
ECM提供对内容统一管理,功能包括。
文件存储和元数据存储
内容属性(元数据)存储在关系数据库以便快速查询和检索;
内容(影像)以文件形式存储在文件存储区;
文件存储区可以是文件系统,基于文件系统的存储区可以托管在不同类型的存储环境;
内容支持:一般文件、网站内容、XML、多媒体、email等,且可扩展文件类型与文件格式;
内容库管理
内容签入,签出功能;
内容版本管理:支持授权用户对指定文件进行升版并填写升版相关的元数据,新版本文件发布前,该文件的有效版本仍是升版前的版本。在对文件进行升版后,系统自动将当前版本电子文件设置到新版本中。而各个版本信息的可追溯;支持自定义版次规则;防止跳版本和重复版本;同一文档可以保留全部版本,也可以选择仅保存每个文档的最新版本;
内容检索,支持与第三方检索引擎结合,支持自动索引更新服务,并且支持增量更新的方式进行更新,确保索引的性能明显优于采用全量更新的方式;支持检索类型:文档、文本文件、XML组件、HTML;
编码管理:支持自定义文件编码规则,申请编码和自动生成编码,保证编码的唯一性(消除重复,空号检查)和连续性,也支持多套编码方式同时存在;
元数据管理:文档系统能灵活地管理收录进入系统的文档及档案的属性元数据,并作为分类、搜索的依据,例如:根据某特定元数据属性自动归档到特定分类;另外搜索过程也可通过透过元数据精确定位某类文档;用户可以实现的功能包括:创建、定义、删除、修改、复制、继承元数据,元数据属性数量不限;
文档体系管理:支持自定义文件分类及其关联属性。并建立以用户自定义层次结构的文档分类配置管理控制模板,具备让组织内的人员按授权进行新文件生成或已有文件升版并录入相关元数据的功能;
文件批量导出功能:提供通用的文档导入、导出工具。
知识管理
内容管理是知识管理的基础,需要配备相应的知识组织及流程,对知识进行系统化管理,知识管理功能包括:
知识中心:
知识中心是非结构化信息的存储管理中心。非结构化信息包括各种格式的文档、各种格式的媒体文件、各种特殊格式的文件、离散数据、一次性数据等。
知识流程管理
知识管理流程分为知识管理申请、评估流程、知识管理权限申请流程、知识管理考核流程和知识管理归档流程。
知识目录管理
知识中心可被划分为多个逻辑区域,如集团知识中心、公司知识中心、各部门的知识中心和个人知识中心等。
知识处理
非结构化信息需要通过一定的结构化处理后才能进行知识中心。非结构化信息的结构化处理包括:
根据特定的格式定义非结构化信息的摘要
填写特定的非结构化信息的扩展属性
根据特定的要求定义非结构化信息的关键词
知识访问与发布
访问安全控制
多重发布渠道,支持企业邮件、应用系统、手持设备等
知识统计、分析和审计
知识地图
知识的多维度导航
知识地图的一个重要特征是知识的多维度导航;知识管理支持从从不同的纬度索引导航到相应的内容,常见的非结构化信息的纬度包括组织纬度、业务纬度和项目纬度。
知识管理的统一搜索
您可能关注的文档
- 【数据分析及可视化】大型集团企业数据分析及可视化建设方案WORD.docx
- 【数据资源管理平台】大型集团企业数据资源管理平台建设方案WORD.docx
- 【主数据管理】大型集团企业主数据管理(MDM)平台建设方案WORD.docx
- 【数据架构】大型集团公司数据架构总体设计方案.docx
- 2025年广西中考地理一轮复习考点突破+中国的地形+中国的气候+课件.pptx
- 2025年广西中考地理一轮复习考点突破+青藏地区+课件.pptx
- 2025年广西中考地理一轮复习考点突破+区域特征+东北三省(东北地区)+课件.pptx
- 2025年广西中考地理一轮复习考点突破+中国的自然资源+课件.pptx
- 2025年广西中考地理一轮复习考点突破+西北地区+课件.pptx
- 2025年广西中考地理一轮复习考点突破+欧洲西部+撒哈拉以南非洲+极地地区.pptx
- 2025年广西中考地理二轮复习:专题四+人地协调观+课件.pptx
- 2025年广西中考地理二轮复习:专题三+综合思维+课件.pptx
- 2025年中考地理一轮教材梳理:第4讲+天气与气候.pptx
- 第5讲+世界的居民课件+2025年中考地理一轮教材梳理(商务星球版).pptx
- 冀教版一年级上册数学精品教学课件 第1单元 熟悉的数与加减法 1.1.6 认识1-9 第6课时 合与分.ppt
- 2025年中考一轮道德与法治复习课件:坚持宪法至上.pptx
- 2025年河北省中考一轮道德与法治复习课件:崇尚法治精神.pptx
- 八年级下册第二单元+理解权利义务+课件-2025年吉林省中考道德与法治一轮复习.pptx
- 精品解析:湖南省娄底市2019-2020学年八年级(上)期中考试物理试题(原卷版).doc
- 2025年中考地理一轮教材梳理:第10讲+中国的疆域与人口.pptx
文档评论(0)