第11章大数据文本分析法-理论题参考答案
第一部分:概念解释题(共15分,每题3分)
题1-1:TF-IDF(3分)
参考答案:
定义:
TF-IDF(TermFrequency-InverseDocumentFrequency,词频-逆文档频率)是一种用于信息检索与文本挖掘的常用加权技术。它用于评估一个词对于一个文档集或语料库中的某一份文档的重要程度。
组成:
-TF(词频):表示词语在文档中出现的频率,计算公式为:
TF(t,d)=
-IDF(逆文档频率):表示词语的普遍重要性,计算公式为:
IDF(t,D)=
-TF-IDF:$TF-IDF(t,d,D)=TF(t
您可能关注的文档
最近下载
- 2026届高考补充篇目《朝天子·咏喇叭》.pptx VIP
- 2026CSCO前列腺癌诊疗指南.docx VIP
- 2016河南省通用安装工程预算定额_章节说明.pdf VIP
- Unit 4 Amazing art Understanding ideas Live from the Louvre 课件-外研版高中英语(2025)必修三(内嵌音频+视频).pptx VIP
- 2025年陕西省中考生物真题卷(附答案解析).pdf VIP
- 人教版八年级下册数学期末测试卷(含答案).docx VIP
- 2023年高考数学试卷及答案(新高考1卷).docx VIP
- 中国心脏起搏器植入指南(2026).docx VIP
- 《分众传媒营销策略现状及对策分析》17000字.docx VIP
- 《智能制造控制技术》课程标准.pdf VIP
原创力文档

文档评论(0)