- 5
- 0
- 约 22页
- 2016-11-27 发布于广东
- 举报
第12章文本挖掘.ppt
数据仓库与数据挖掘 第12章 文本挖掘 在浩瀚的文本中找到所需信息。 第12章 文本挖掘 12.1 引例 12.2 文本挖掘 12.1 引例 乒乓球女团中国夺冠,第33金超越雅典奥运创造历史[文本1] 神舟六号轨道舱正常运行60天取得大量科学数据[文本2] 乒乓男单决赛颁奖 中国三虎将包揽金银铜牌[文本3] 前三段文本中哪两段文本在内容上更接近? 如果前两段文本各代表一类文本,那么,你认为第三个文本应该归为其中的哪一类? 12.2 文本挖掘 12.2.1 文本信息检索概述 12.2.2 基于关键字的关联分析 12.2.3 文档自动聚类 12.2.4 文档自动分类 12.2.5 自动摘要 12.2.1 文本信息检索概述 信息检索泛指用户从包含各种信息的文档集中查找所需要的信息或知识的过程,人们借助某种检索工具,运用某种特定的检索策略从待检索的信息源中查找出自己需要的信息。 信息检索是一种不确定性检索,用户在检索信息时,并不知道信息源里是否有符合需要的东西。 1. 信息检索的度量方式 查准率(Precision)是检索到的文档中的相关文档占全部检索到的文档的百分比,它所衡量的是检索系统的准确性 查全率(Recall)是被检索出的文档中的相关文档占全部相关文档的百分比,它所衡量的是检索系统的全面性 2. 基于模型的检索 模型的种类: 布尔模型:文档和查询式都表示为特征项的集合,运用集合
您可能关注的文档
- 现代管理学复习资料53235.doc
- 现金流paper1.ppt
- 现金流量表分析84600.ppt
- 现金流量表的编制44049.doc
- 现金流量表的编制85975.ppt
- 班级管理课题研究资料.doc
- 理财规划基础v.ppt
- 理财规划基础重点.doc
- 瓦斯防治能力评估相关制度.doc
- 生产企业做帐前准备实战篇.doc
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
最近下载
- TwinCAT软件开发:TwinCAT 3_(9).TwinCAT3可视化与HMI.docx VIP
- 页岩气体积压裂机理及水平井分段压裂技术.pptx VIP
- 2025年青海省定向选调生选调招聘考试《综合能力测试》真题及答案.docx VIP
- 粉尘爆炸风险辨识评估和管控制度.pdf VIP
- 公文写作格式与范文.docx VIP
- 医保政策对应的内部管理制度和财务制度.pdf VIP
- 2025年活性炭吸附实验实验报告[活性炭吸附实验].docx
- 新目标大学英语 视听说教程 徐锦芬 第二版 第2册 课后习题答案.pdf VIP
- 液位计UHZ51(1,2,3,4,7,8)使用说明书x.pdf
- 六年级数学上册计算题过关练习.pdf VIP
原创力文档

文档评论(0)