2025年语音识别数据采集合同细则.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

2025年语音识别数据采集合同细则

一、合同核心定义与依据

(一)核心定义

语音数据:指本合同约定范围内,通过采集获得的包含自然人语音特征、对话内容、语音指令等的音频文件及配套标注数据(如转录文本、意图标签),其中语音特征信息属于《个人信息保护法》规定的敏感个人信息。

采集方:具备数据采集资质与技术能力,负责按约定完成语音数据采集、预处理及交付的一方。

委托方:因语音识别模型训练、产品优化等合法目的,委托采集方开展数据采集服务的一方。

数据主体:语音数据所对应的自然人(含采集对象、相关对话参与人)。

(二)合规依据

《中华人民共和国民法典》(隐私权与个人信息保护相关条款);

《中华人民共和国个人信息保护法》(敏感个人信息处理、用户授权、数据安全等核心要求);

《网络安全法》《数据安全法》(数据存储、传输、保密相关规定);

行业标准:语音数据采集技术规范、音频质量标准等。

二、数据采集核心细则

(一)采集范围与要求

数据类型:明确约定采集数据的具体类型,包括但不限于:

语言类型:普通话、特定方言(如粤语、四川话)、外语(如英语);

场景类型:日常对话、特定业务场景(如智能客服咨询、导航指令)、模拟场景对话;

数据形态:纯音频数据、音频+文本转录数据、音频+意图标注数据。

采集规模:量化采集目标,如“不少于XX小时高质量语音数据”“XX个独立音频文件”“覆盖XX种年龄/性别/口音画像”。

技术标准:

音频质量:采样率≥16kHz,比特率≥128kbps,信噪比≥45dB,无明显背景噪音、断音、失真;

采集设备:指定合规采集设备(如专业录音设备、经检测的智能终端),禁止使用非法窃听设备;

标注规范:若涉及标注,需明确标注精度(如转录准确率≥95%)、标注字段(如说话人识别、情绪标签)、标注格式(如XML/CSV)。

采集场景限制:

禁止在私密场所(如住宅、私人办公室)未经同意采集语音;

公开场合采集不特定人语音时,不得通过技术手段识别特定个人身份信息;

不得采集涉及国家秘密、商业秘密、个人隐私的敏感内容(如健康状况、家庭住址、金融信息)。

(二)用户授权与隐私保护

授权要求:

采集敏感语音信息需取得数据主体单独同意(书面授权/电子授权弹窗),明确告知采集目的、范围、使用期限及权利救济方式,禁止“默认同意”“模糊告知”;

授权文件需留存完整记录(如授权书原件、电子授权日志),留存期限不少于数据存储期限。

隐私保护措施:

采集过程中实时脱敏:对语音中包含的姓名、手机号、地址等隐私信息进行技术遮挡或删除;

数据传输加密:采用SSL/TLS等加密协议传输数据,防止传输过程中泄露;

存储安全:采集方使用加密服务器存储数据,设置访问权限控制,定期进行安全审计,防止数据篡改、丢失。

三、双方权利与义务

(一)采集方权利与义务

按合同约定的范围、标准、期限完成数据采集,定期向委托方汇报采集进度(如每周提交进度报告);

严格履行数据主体授权程序,提供完整的授权证明文件供委托方核查;

采取技术+管理双重措施保障数据安全,包括但不限于:建立数据采集台账、限制内部人员访问权限、定期开展安全培训;

不得超出合同约定范围采集数据,不得将采集数据用于委托方指定用途之外的任何场景;

配合委托方开展数据质量验收,对不合格数据按要求限期整改;

负责响应数据主体的权利请求(如查询、更正、删除数据),配合委托方处理相关投诉与纠纷。

(二)委托方权利与义务

向采集方提供明确的《数据采集需求规格说明书》,明确采集标准、场景要求及验收指标;

有权对采集过程进行监督、检查,核查授权文件完整性与采集合规性;

按合同约定及时支付服务费用,提供采集所需的必要支持(如场景说明、测试设备);

不得要求采集方从事非法采集活动(如未经授权监听、采集涉密信息);

对采集方交付的数据仅用于合同约定的合法目的(如模型训练),不得超范围使用或向第三方泄露;

配合采集方处理数据安全相关应急事件(如数据泄露、主体投诉)。

四、数据交付与验收

(一)交付内容

采集方需交付的材料包括:

原始音频文件(按约定格式打包,命名规范统一);

配套数据(如转录文本、标注文件、数据质量报告);

合规证明文件(数据主体授权清单、采集过程记录、安全审计报告)。

交付方式:通过加密网盘、专用传输通道等安全方式交付,禁止通过公共网络、未加密设备传输。

(二)验收标准与流程

验收标准:

数量达标:实际采集量不低于约定数量的95%;

质量合格:音频质量符合技术标准,标注准确率、转录准确率达到约定要求;

合规有效:授权文件完整,采集过程无违法违规情形。

验收流程:

委托方在收到交付材料后10个工作日内完成初步验收;

验收合格的,出具书面验收确认书;

验收不合格的,需书面说明不合格原因

您可能关注的文档

文档评论(0)

WYN177 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档