人工智能2025年机器学习数据集构建合同协议合同.docxVIP

人工智能2025年机器学习数据集构建合同协议合同.docx

本文档由用户AI专业辅助创建,并经网站质量审核通过
  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

人工智能2025年机器学习数据集构建合同协议合同

鉴于甲方希望委托乙方构建一个用于人工智能应用的机器学习数据集(以下简称“数据集”),该数据集需满足特定技术指标和应用需求,并计划于2025年投入使用;乙方具备构建高质量机器学习数据集的专业技术能力和经验,愿意接受甲方的委托,按照本合同约定的条款和条件完成数据集的构建工作。甲乙双方本着平等互利、诚实信用的原则,经友好协商,就数据集构建事宜达成如下协议,以资共同遵守。

第一条项目标的

甲方委托乙方构建一个用于人工智能应用的机器学习数据集,该数据集的应用领域为医疗影像分析,数据类型为图像,数据规模不少于50万张记录,数据质量要求准确率不低于95%,召回率不低于90%,覆盖率不低于85%,数据格式为JSON,并需符合国家相关医疗数据隐私保护法规。乙方应按照甲方的要求,构建满足上述指标和格式要求的数据集。

第二条项目范围

2.1数据采集

乙方根据甲方提供的数据需求,通过合法合规的途径采集相关医疗影像数据。数据采集方式包括但不限于与授权的医疗机构合作获取脱敏后的医疗影像数据、使用公开的授权医疗影像数据集、自行采集经脱敏处理的医疗影像数据等。乙方应确保数据采集过程的合法性和合规性,并获取必要的授权或许可。

2.2数据清洗

乙方对采集到的医疗影像数据进行清洗和预处理,包括去除重复记录、处理缺失值(如图像标签缺失)、纠正错误数据(如图像格式错误)、进行数据增强(如调整图像亮度和对比度以增加数据多样性)等,确保数据的质量和一致性,并符合医疗影像数据的标准格式。

2.3数据标注

乙方根据甲方提供的标注规范和标准,对医疗影像数据进行标注。标注类型包括疾病分类标注(如肿瘤、结节、炎症等)和位置标注(如肿瘤在图像中的具体坐标)。标注规范应详细说明各类标注的具体要求和标准,确保标注的准确性和一致性。乙方应使用专业的数据标注工具进行标注,并建立标注质量控制流程。

2.4数据集构建

乙方将清洗、标注和增强后的数据整合成符合甲方要求的医疗影像数据集,并进行必要的测试和验证,确保数据集的完整性和可用性。最终交付的数据集应包含原始数据(经脱敏处理)、标注数据、数据预处理脚本(包括数据增强脚本)以及数据集说明文档。

2.5数据安全

乙方应采取必要的技术和管理措施,确保数据的安全性和保密性,防止数据泄露、篡改或丢失。具体措施包括但不限于:

-建立数据安全管理制度和流程。

-对所有数据进行加密存储和传输。

-限制数据访问权限,仅授权项目相关人员访问。

-定期进行数据备份,并存储在安全的环境中。

-定期进行安全漏洞扫描和风险评估。

第三条项目进度与交付

3.1项目周期

本合同项下的数据集构建工作应于2024年11月1日至2025年3月31日完成,总周期为五个月。

3.2阶段划分

项目分为以下几个阶段:

3.2.1需求调研阶段:2024年11月1日至2024年11月15日,乙方完成对甲方数据需求的调研和分析,并向甲方提交需求分析报告。

3.2.2数据采集阶段:2024年11月16日至2024年12月15日,乙方根据需求分析报告进行数据采集,并提交初步的采集样本供甲方审核。

3.2.3数据清洗和标注阶段:2024年12月16日至2025年1月31日,乙方对采集到的数据进行清洗和标注,并分批提交阶段性成果供甲方审核。

3.2.4数据增强阶段:2025年2月1日至2025年2月28日,乙方根据需要,对数据进行增强,并提交增强后的数据供甲方审核。

3.2.5数据集构建和测试阶段:2025年3月1日至2025年3月15日,乙方构建数据集,并进行测试和验证,提交测试报告。

3.2.6项目验收阶段:2025年3月16日至2025年3月31日,甲方对乙方完成的数据集进行验收。

3.3交付时间

乙方应按照项目进度计划,按时向甲方交付各阶段的成果和最终的数据集。具体交付时间和方式如下:

-需求分析报告:2024年11月15日,通过电子邮件发送给甲方项目负责人。

-数据采集阶段性成果:2024年12月15日,通过加密网络存储空间上传,并提供访问链接。

-数据清洗和标注阶段性成果:每两周提交一次,直至2025年1月31日。

-数据增强阶段性成果:2025年2月28日,通过加密网络存储空间上传,并提供访问链接。

-最终数据集及相关交付物:2025年3月15日,通过加密网络存储空间上传,并提供访问链接。所有交付物均需提供相应的文档说明。

第四条项目费用与支付方式

4.1项目总费用

本合同项下的数据集构建服务费用总计为人民币贰拾伍万元整(¥250,000.00)。

4.2费用构成

项目总费用包括但不限于数据采集费用(含授权费用)、数据清洗费用、数据标注费用(

文档评论(0)

非洲小哈白脸 + 关注
实名认证
文档贡献者

人生本来就充满未知,一切被安排好反而无味。

1亿VIP精品文档

相关文档