- 1、本文档共8页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
⼤数据应⽤实施过程作业指导书Yhw
数据模型应⽤过程作业指导书
⼀、总览
1.数据模型应⽤过程概述
数据模型应⽤过程是应⽤数据科学理论、⽅法、技术和⼯具,对外⽴⾜于服务政府精准施策和经济发展,对内⽴⾜于服务公司经营管理⽔平提升,依托实际数据应⽤需求,围绕重点领
域开展数据模型应⽤,深挖数据价值并形成各类⾼价值数据应⽤成果的⼯作过程。
2.数据模型应⽤过程内容
数据模型标准应⽤过程主要包括:业务设计、数据准备、模型构建、业务场景验证、模型迭代优化、成果固化、应⽤评估、推⼴共享8个阶段。
业务设计。调研厘清要解决的现有业务流程及管理现状痛点问题,提炼确定数据模型应⽤需求,依据业务实际和关联关系,梳理业务需求实现的关键点,明确建模依据的业务理论,以
业务视⾓凝炼合适的模型思路及技术实现路线。
数据准备。针对数据应⽤需求涉及的数据项、关联规则、映射关系、来源系统、获取⽅式等,溯源梳理形成数据需求表。严格按照数据取⽤流程及脱敏要求提取所需数据,分析数据整
体趋势、分布情况、规律特征、变量间相关关系,运⽤各种技术⼿段进⾏数据清洗、转换、集成、规约,形成准确可⽤的数据分析宽表,将其作为数据模型的输⼊源。
模型构建。基于业务实现逻辑及数据情况,框定算法范围,通过算法之间优劣对⽐分析,开展算法择优选型,构建相应的算法模型,提取数据样本,适应性调整测试集、验证集⽐例以
及模型参数,完成模型训练及构建。
业务场景验证。基于全量数据进⾏模型计算及结果输出,结合业务场景实际,设计数据验证表反馈格式,进⾏数据验证,收集验证结果,统计模型准确率、召回率,验证评估模型的准
确性及适⽤性。
模型迭代优化。根据模型业务验证的可⾏性、合理性、准确性等评价反馈,算法⼈员对算法模型开展迭代优化,以满⾜模型应⽤要求。
成果固化。根据数据应⽤需求、服务对象需求,将数据模型应⽤过程结果通过不同形式进⾏输出,形成应⽤⼯具类、⼤数据集类、算法模型类、智慧决策类等应⽤成果。
应⽤评估。评估数据模型应⽤成果对公司运营的效率、效益、质量、社会价值等绩效⽔平的提升情况,对各专业数据及技术领域的⽀撑推动情况,对成果本⾝实际运⾏的可⽤性、有效
性、实⽤性以及效率、效益情况等。
推⼴共享。以发挥数据应⽤价值为⽬标,对数据模型应⽤成果进⾏优选,提炼总结相应经验⽅法,形成有价值、可落地的数据应⽤成果,进⾏运营推⼴和价值转化。
3.适⽤范围
本规范适⽤于公司各部门及下属单位开展数据模型应⽤。⼆、业务设计
业务设计阶段主要包括梳理应⽤需求、设计建模思路等内容。
1.梳理应⽤需求
(1)应⽤需求调研
以确定应⽤需求为⽬标,从业务需求及数据需求两⽅⾯开展需求调研。
业务调研。调研上下游业务部门,确定现有业务流程及管理现状痛点问题,明确各业务条线的互动关系,调研发现业务⼈员隐藏的业务需求及瓶颈,最终提炼数据应⽤需求。
数据调研。调研影响因⼦、来源系统、数据存储情况、数据采集周期、数据频度、数据量,调研发现数据获取问题、数据质量问题。
(2)明确应⽤⽬标
通过应⽤需求调研情况,确定数据应⽤要实现的业务⽬标。包括且不限于业务规模扩⼤、成本节约、效率提升、安全提升、质量提升等。
2.设计建模思路
(1)业务建模逻辑研讨
根据梳理确定的应⽤需求,以业务⼈员为主深⼊掌握业务主线流程环节、业务规则及其他内在业务关联逻辑,提出建模业务依据,数据应⽤需求⽅会同业务⼈员、算法⼈员,对建模依
据的业务理论、技术⽅法进⾏模型化梳理研讨。最终确定建模业务实现逻辑。
(2)确定技术建模路线
依据建模业务实现逻辑,以分析挖掘⼈员、算法⼈员、数据
⽀撑⼈员为主深⼊探讨建模技术路线,明确应⽤需求在数据科学领域的问题分类,框定算法范围,确定技术实现路线。
表1:XXX建模思路⽰例
1.数据溯源
(1)梳理数据需求
根据业务设计需要,由业务⼈员、分析挖掘⼈员、算法⼈员、数据⽀撑⼈员多⽅研讨,梳理整合形成数据应⽤需求表。数据需求表须包含数据模型应⽤所需的所有字段,并注明字段格
式及填
写要求(业务含义、内外部数据、来源系统、数据频度、数据类型、数据格式、数据精度、数据取值范围等)。
表2:XXX模型数据需求项划分
内部数据
外部数据
线上数据线下数据
结构化数据⾮结构
化数据
结构化
数据
⾮结构
化数据
结构化数据⾮结构化数据
数据格式、存储路径;
对于线下数据,明确数据格式、管理部门及负责⼈员;
对于外部数据,通过公司数据归⼝管理部门掌握的外部数据清册,查询是否存在符合所需内容、统计⼝径、时间范围的数据,明确数据格式、管理部门及负责⼈员。
2.数据获取
按照数据溯源情况,数据⼈员从对应数据来源获取数据。数据
您可能关注的文档
- 学年七年级上学期期末数学试题(北师大版含答案) .pdf
- 孙家岔龙华煤矿2020-2024年生产接续汇报材料 .pdf
- 天津市河东区2023-2024学年部编版七年级上学期期末质量检测历史试题.pdf
- 大学22春“法学”《劳动法》作业考核题库高频考点版(参考答案完整版721026253.pdf
- 备战2024年中考英语综合练习卷-综合练11 倒装句100题(知识点全梳理.pdf
- 基于双减背景下初中英语作业分层设计研究 .pdf
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第3单元 经济全球化 第三单元过关检测.doc
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第4单元 国际组织 第四单元过关检测 (2).doc
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第3单元 经济全球化 第三单元过关检测 (2).doc
- 2007年湖南省株洲市中考数学试卷(教师版).doc
- 【重庆市S街道家庭医生签约服务现状调研分析报告6000字】.docx
- 八年级生物下册教学课件《选择健康的生活方式》.pptx
- 高中高考思想政治一轮总复习课后习题 选择性必修一 当代国际政治与经济 课时规范练30 和平与发展 (2).doc
- 企业社保费申报流程(核定版).docx
- 高中高考思想政治一轮总复习课后习题 选择性必修一 当代国际政治与经济 课时规范练31 中国的外交 (2).doc
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第1单元 各具特色的国家 第一单元过关检测.doc
- 第6章 生物的进化B卷 能力提升—高一生物学人教版(2019)必修二单元达标测试卷.docx
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第2单元 世界多极化 第4课 和平与发展 第2框 挑战与应对 (2).doc
- 高中思想政治选择性必修1当代国际政治与经济课后习题 第3单元 经济全球化 第6课 走进经济全球化 第2框 日益开放的世界经济.doc
- 【泰安交通建设集团人力资源管理模式研究4900字】.doc
最近下载
- HJ1147-2023水质pH值的测定电极法.pptx VIP
- 城市污泥处置中心建设工程项目建设的必要性分析.docx VIP
- 系统解剖学学习课件(复旦大学)脑干.ppt VIP
- 广东晟典律师事务所分所设置管理办法.DOC
- 设计公司项目提成方案模板.doc
- 机械设备的润滑培训PPT课件.ppt
- 建筑工程图集 FJ01~03(2007年合订本):防空地下室建筑设计(2007年合订本) 2.pdf VIP
- 建筑工程图集 FJ01~03(2007年合订本):防空地下室建筑设计(2007年合订本) 1.pdf VIP
- 动角问题专项训练(30道).pdf VIP
- 07FJ01~03 防空地下室建筑设计(2007年合订本)图集.pdf
文档评论(0)