数据分析7个性化推荐72课件讲解.pptx

;理解个性化推荐技术的基本概念;能够运用基于内容的推荐算法对新闻文本进行特征提取与分析;培养对数据的敏感度和分析能力;任务提出;;任务提出;;任务分析;;TF-IDF算法;核心原理;1.词频(TF):指某个词语在当前文本中出现的次数与该文本中总词语数的比值。通过计算词频,可以反映出词语在单篇文本中的重要性,其计算公式为:

TF(词语t,文本d)=词语t在文本d中出现的次数/文本d中所有词语的总数?

2.逆文档频率(IDF):指文档集合中包含该词语的文档数的反比,逆文档频率体现了词语的普遍重要性,其计算公式为:

IDF(词语t)=log(文档集合的总文档数/(包含词语t的文档数+1))

3.T

文档评论(0)

1亿VIP精品文档

相关文档