- 1、本文档共20页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘与信息检索技术指南
TOC\o1-2\h\u11554第一章数据挖掘基础 3
290341.1数据挖掘概述 3
21421.2数据挖掘任务与流程 3
251621.2.1数据挖掘任务 3
229381.2.2数据挖掘流程 3
341.3数据挖掘常用算法 4
21525第二章数据预处理 4
314302.1数据清洗 4
295712.1.1错误识别 4
14172.1.2缺失值处理 5
211682.1.3异常值处理 5
147882.1.4重复记录处理 5
205782.2数据集成 5
170622.2.1数据源识别 5
154672.2.2数据抽取 5
175662.2.3数据转换 6
220052.2.4数据加载 6
176142.3数据转换 6
280552.3.1数据聚合 6
147042.3.2数据分割 6
206652.3.3数据变换 6
292072.3.4特征选择与特征提取 6
44162.4数据归一化与标准化 6
161692.4.1数据归一化 7
50382.4.2数据标准化 7
14863第三章信息检索基础 7
243343.1信息检索概述 7
235223.2信息检索模型 7
177583.3信息检索评价指标 8
160453.4信息检索系统架构 8
28777第四章文本挖掘技术 8
13914.1文本预处理 8
322844.1.1文本清洗 9
24394.1.2分词 9
288964.1.3词性标注 9
82444.1.4停用词过滤 9
70504.1.5词干提取 9
85184.2文本表示与特征提取 9
117244.2.1词袋模型 9
246344.2.2TFIDF 9
279984.2.3Word2Vec 9
49514.3文本分类与聚类 10
187364.3.1文本分类 10
165154.3.2文本聚类 10
80374.4文本相似度计算 10
178924.4.1余弦相似度 10
50924.4.2Jaccard相似度 10
11784.4.3Dice相似度 10
1224第五章关联规则挖掘 10
97315.1关联规则概述 10
212355.2关联规则挖掘算法 11
308295.3关联规则的评价指标 11
103825.4关联规则挖掘应用 11
1581第六章聚类分析 12
297616.1聚类分析概述 12
251836.2聚类分析方法 12
182746.2.1层次聚类方法 12
166256.2.2基于距离的聚类方法 12
303216.2.3基于密度的聚类方法 12
234506.2.4基于网格的聚类方法 12
57826.3聚类分析的评价指标 13
296736.3.1内部评价指标 13
20536.3.2外部评价指标 13
6746.3.3相对评价指标 13
318496.4聚类分析应用 13
26350第七章分类算法 13
86477.1分类算法概述 13
154087.2常见分类算法 14
75577.2.1决策树算法 14
295767.2.2支持向量机(SVM) 14
82967.2.3朴素贝叶斯算法 14
302697.2.4随机森林算法 14
255487.3分类算法的评价指标 14
1687.3.1准确率(Accuracy) 14
85527.3.2精确率(Precision) 14
85417.3.3召回率(Recall) 14
251727.3.4F1值(F1Score) 15
262667.4分类算法应用 15
100377.4.1文本分类 15
215827.4.2图像识别 15
150247.4.3医疗诊断 15
20277第八章机器学习方法 15
185838.1机器学习方法概述 15
199218.2监督学习 15
264828.3无监督学习 16
261978.4强化学习 16
28491第九章信息检索系统设计 17
186169.1
您可能关注的文档
- 工程审计工作流程规范及质量管理体系构建实务.doc
- 智能供应链管理优化策略研究.doc
- 零售电商运营作业指导书.doc
- 年度环保工程项目实施合作书.doc
- 经济法律风险防控手册.doc
- 建筑方案设计指南.doc
- 市场营销策略深化指导.doc
- 软件测试与质量保证体系完善作业指导书.doc
- 游戏开发项目流程优化及资源整合计划书.doc
- 全新环卫工人劳动合同.doc
- 市直机关工委及个人述职述廉2024年党建工作情况报告材料.docx
- 区委书记在2025年一季度经济运行部署会议上的讲话发言材料.docx
- 市直机关单位、卫健委党支部2024年工作述职报告材料.docx
- 市委副书记、市长在2025年市委城乡规划委员会第一次会议上的讲话发言材料.docx
- 某单位领导干部2024年生活会、组织生活会对照检查材料(对照“四个带头”).docx
- 2024年民政局、宣传部、教育局基层主要领导个人述责述廉报告材料.docx
- 2025年2月党支部“三会一课”参考主题方案.docx
- 在某中学2025年春季开学典礼上的讲话:以“三重境界”燃动新学期.docx
- 2024年度领导干部专题民主生活会、组织生活会对照检查材料(四个带头)及学习研讨会上的发言材料.docx
- 市纪委市监委2025年度纪检监察工作计划.docx
最近下载
- DB37∕T 5178-2021 山东省城市应急避难场所建设标准.docx
- 小学数学教具的合理使用与创新研究教学研究课题报告.docx
- 2023年马鞍山学院计算机科学与技术专业《数据结构与算法》科目期末试卷A(有答案).docx VIP
- CQI-30橡胶加工系统评估-中文.xlsx VIP
- 医院临床试验独立顾问制度.docx VIP
- 山西省太原市高职单招2025-2026学年综合素质模拟练习题三附答案.pdf VIP
- 02SG518-1 门式刚架轻型房屋钢结构图集.pdf
- 2025年财务总监年终述职报告.pptx VIP
- 山西省晋中市高职单招2025-2026学年生态学基础真题及答案 .pdf VIP
- 华师大插班生IQ测试题.doc
文档评论(0)