基于用户黏着度的大数据推荐算法测评方法.pdf

基于用户黏着度的大数据推荐算法测评方法.pdf

  1. 1、本文档共13页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

基于用户黏着度的大数据推荐算法测评规范

1范围

本规范规定了基于用户黏着度的大数据推荐相关软件的算法标识、用户满意度、

预测准确度、覆盖率、置信度、多样性等技术指标及测评方法。

本规范适用对基于用户黏着度的大数据推荐算法进行测评。

2引用文件

本规范引用了下列文件:

GB/T35295-2017信息技术大数据术语第2部分:大数据BigData

GB/T8567计算机软件文档编制规范

GB/T9385计算机软件规格需求说明规范

凡是注日期的引用文件,仅注日期的版本适用于本规范;凡是不注日期的引用

文件,其最新版本(包括所有的修改单)适用于本规范。

3术语和定义

3.1用户黏着度customerstickiness

指用户在体验网站、产品或服务后,对其产生的包括但不限于再次使用时长、

间隔时长、频率,或产生消费期望的概率。

3.2大数据bigdata

具有体量巨大、来源多样、生成极快、且多变等特征,并且难以用传统数据体

系结构有效处理的包含大量数据集的数据。

[来源:GB/T35295-2017,2.1.1]

3.3推荐算法recommendationalgorithm

计算机专业的一种算法,通过分析用户的行为、兴趣和需求,利用数学方法和

算法预测用户可能再次使用的内容、产品、功能。

4概述

4.1技术指标

5

本规范使用“用户满意度、预测准确度、覆盖率、置信度、多样性”五个评价

指标对推荐算法的推荐合理性进行测评,评价指标的结果数值越高,说明其算法推

荐的越合理。

4.2参考数据集

本规范依据大数据推荐相关内容将推荐信息的数据集划分成参考数据集Ⅰ和参

考数据集Ⅱ,其具体要求说明如下所述。

4.2.1参考数据集Ⅰ

参考数据集Ⅰ应包含至少数十万条由用户对各类对象(如商品、服务、内容等)

给出的评分记录。每条记录应明确包含评分主体(用户)的标识、被评对象的标识

以及具体的评分值。评分主体和被评对象应具有自己的属性集合。评分应在明确的

数值范围内,如1到5或1到10,以实现标准化。为确保推荐系统的广泛适用性和

减少偏见,数据集中的用户属性集合应具有多样性,包括但不限于用户的性别、年

龄和职业等信息,以反映不同的用户特征。同时,被评对象的属性集合也应广泛,

如所属类别等,以涵盖多样的产品或服务类别。确保每条评分记录都带有时间戳,

有助于分析用户偏好的动态变化。所有数据在确保真实性的前提下,必须遵守隐私

保护和数据保护法规,对敏感数据进行恰当处理。数据集的文档应详细说明数据的

收集、处理方法及数据结构。

例:以MovieLens-1M数据集为例。MovieLens1M数据集专注于电影推荐,它不仅包含了丰

富的用户评分数据,还有电影的元数据和用户的人口统计信息,充分反映了电影推荐领域的特

点和需求。该数据集覆盖了多种类型的电影和广泛的用户群体,反映了真实世界中的多样性。

这种多样性对于测试推荐算法的泛化能力和处理不同类型用户和项目的能力至关重要。由于是

专门为研究目的设计和收集的MovieLens1M数据集在数据的完整性和质量方面具有很高的标

准,具有一定的代表性。

4.2.2参考数据集Ⅱ

参考数据集Ⅱ应包含至少数十万条用户行为数据,如用户的点击流、浏览历史、

购买记录等。每条记录必须明确用户主体标识、样本主体标识、对应行为和时间戳。

每条记录都配有时间戳,便于分析用户行为随时间的变化。样本主体可以具有自己

6

的属性集合,包括但不限于样本所属类别、所属品牌等信息。所有数据的收集和处

理应严格遵守隐私保护法规,确保所有用户信息的匿名性和脱敏处理,以保护个人

隐私。为确保推荐系统的代表性和减少偏见,应广泛收集涵盖各种用户群体和行为

模式的数据。数据集在保证数据准确性、完整性和一致性的同时,应详细说明数据

的收集、处理方法及数据结构。

注:以UserBehavior数据集为例。UserBehavior数据集是阿里巴巴真实电商平台的用户行

为数据集,它涵盖了用户的多种行为,包括点击、购买、加入购物车和收藏等,这些复杂的用

户行为模式对于研究和模拟现实世界的推荐系统至关重要。该数据集的大规模和高?(多)维

度特性使其成为测试和优化大规模推荐系统算法的理想选择,能够处理现实世界推荐系统中常

见的挑战,如处理大数据、稀疏性问题和高效计算需求。UserBeh

文档评论(0)

**** + 关注
实名认证
内容提供者

资料大多来源网络,仅供交流与学习参考, 如有侵犯版权,请私信删除!

1亿VIP精品文档

相关文档