- 1、本文档共24页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
TXX/TXXXXX—2024
高速公路数据采集技术规范
1范围
本文件规定了高速公路数据采集技术的术语与定义、缩略语、架构、方式与频率、采集内容、采集
流程、反馈和处理及数据安全等内容。
本文件适用于高速公路结构化、半结构化、非结构化等各类信息资源数据的采集。
2规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件,
仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本
文件。
GB/T22239信息安全技术—网络安全等级保护基本要求
GB/T35273信息安全技术个人信息安全规范
GB/T39786信息安全技术信息系统密码应用基本要求
GB/T43697数据安全技术数据分类分级规则
3术语和定义
下列术语和定义适用于本文件。
3.1
结构化数据
关系模型数据,即以关系数据库表形式管理的数据。
3.2
半结构化数据
非关系模型的、有基本固定结构模式的数据,例如日志类型文件、XML文档、JSON文档、Email等。
3.3
非结构化数据
没有固定模式的数据,如WORD、PDF、PPT、EXCEL,各种格式的图片、视频等。
3.4
敏感数据
泄漏后可能会给社会、企业或个人带来危害的数据。
3.5
中间件
位于系统软件之上,用于支持分布式应用软件,连接不同软件实体的支撑软件。
3.6
网关
在网络层以上实现网络互连,是最复杂的网络互连设备,仅用于两个高层协议不同的网络互连。
3.7
数据提供机构
承担数据提供工作的部门或单位(也称为数据来源机构)。
3.8
信源
信息的来源。
3.9
脱敏
TXX/TXXXXX—2024
对某些敏感信息通过指定规则进行数据的变形,实现对敏感数据的可靠保护。
3.10
加密
对敏感数据进行加密处理,使外部用户只看到无意义的加密后数据,同时在特定场景下,可以提供
解密能力,使具有秘钥的相关方可以获得源数据。
4缩略语
下列缩略语适用于本文件。
FTP:文件传输协议(FileTransferProtocol)
ODBC:开放数据库连接(OpenDatabaseConnectivity)
REST:表述性状态转移(REpresentationalStateTransfer)
SFTP:安全文件传送协议(SSHFileTransferProtocol)
VPN:虚拟专用网络(VirtualPrivateNetwork)
5架构
5.1总体架构
数据采集架构,见图1。
图1数据采集架构示意图
5.2架构功能
数据采集架构功能如下:
a)数据源:具有从数据提供部门获取数据的能力;
b)数据采集:提供可配置化的数据采集功能,包括结构化数据采集、半结构化数据采集、非结
构化数据采集的配置化接入能力,实现对各类数据类型的采集:
1)结构化数据采集:提供数据库采集、数据接口采集、数据上传采集、物理拷贝采集等采
集方式,满足批量、单个、实时、非实时等形式的结构化数据的采集,
2)半结构化数据集:提供系统日志采集、文件数据采集等数据采集方式,对半结构化数据
进行解析,形成键值对数据,
3)非结构化数据集:提供音视频数据采集、文件采集、网页采集等多种数据采集能力;
TXX/TXXXXX—2024
c)数据存储:
1)依据全量获取数据原则获取业务数据原始数据,将数据存放至数据贴源库,
2)将数据处理后的数据存储到数据资源库,首先将数据根据不同的数据源存储到对
文档评论(0)