- 34
- 0
- 约5.6千字
- 约 33页
- 2018-03-23 发布于江苏
- 举报
文本挖掘 – 信息提取(IE)
文本挖掘 – 信息提取(IE) 参考Jaime Carbonell教授讲稿 文本中信息的提取 出发点:从文本中挖掘信息,而不是简单的词项匹配 上下文无关实体的提取 Context-Free Entity Extraction 基于规则的实体提取 关系提取(Relational Extraction) 在eBusiness中的应用 Text Mining (1) 文本本来是给人读的,不是计算机 大多数信息以文本形式存储 100 times as much online text as online DBs HTML网页是带有结构标记的文本(带来机会和挑战) 数据挖掘操作的是数据表 (i.e. numbers, fixed fields, adherence to data models). Text Mining (2) 许多应用,我们需要从文本到数据库表的转换器 一般的自然语言理解问题依然太困难 但我们能够解决简单些、同时也有用的子问题吗? Yes! 对文本按照主题分类 并且从文本中或者标记结构文字中提取某些信息是可能的。 Text Mining (3) Components of Text Mining(基本策略) 按照主题(话题,topics)分类 今天稍提一下,以后专门有一讲 从分类的文本中提取事实(本讲主要内容) 在数据库或者提取的事实中进行信息挖掘 Text Cat
您可能关注的文档
- 我展示的作品名称《跨越海峡的生命桥》教学实施计划《跨越.ppt
- 我当时表现怎样父亲又是怎样评价的我听了以后.ppt
- 我感觉利用教育技术进行教学,大大地激发了小朋友们的.ppt
- 我是来自桦甸市第二实验小学的一名音乐教师,我的名字叫.ppt
- 我的发现: xiang照相 照相机 图书 图书馆洒水 洒水车 电视 电视机.ppt
- 我的梦 中国梦百姓宣讲团成员做客人民网.doc
- 战略机遇期的中国高等教育——高等教育发展的宏观背景和政.ppt
- 所级ARP系统2.0版客户端的配置.doc
- 所谓的切削条件是.ppt
- 所谓象兵,就是骑着大象作战的士兵,士兵骑象杀敌,战.ppt
- 专项十三 复合句(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项十四 There be句型和主谓一致(含答案) 2026年中考人教版英语语法专项复习.doc.docx
- 专项14 构词法 学案(含答案)2025年中考人教版英语语法专项复习.doc.docx
- 静脉肾盂造影结石梗阻评估.ppt
- 《假期实践活动》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 老年结石病合并慢病综合诊疗.ppt
- 鹿角形肾结石复杂手术治疗.ppt
- 经皮肾镜超声碎石清石术.ppt
- 《参观爱国主义教育基地》教案-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
- 《生活中的大数:整理与复习》教案(2课时)-2025-2026学年冀教版(新教材)小学数学二年级下册.docx
最近下载
- 2025年广东省信宜市高三(二模)语文试题试卷含解析.doc VIP
- “十五五”时期财税政策赋能人工智能产业高质量发展的路径探索.docx
- 广东实验中学2024-2025学年高一下学期期中考试化学.docx VIP
- 2026年广东省江门市高三语文二模试卷及答案(含作文解析与范文).docx VIP
- 年产130万平米仿古砖天然气辊道窑毕业设计.doc
- 老年人需求调查问卷模板.docx
- 倍福NCI插补和坐标系变换技术V1.0.3 .pdf VIP
- (完整word版)专八词汇表.doc VIP
- 幼儿园教师心理健康培训.pptx VIP
- 广东实验中学2024-2025学年下期中考试生物学.pdf VIP
原创力文档

文档评论(0)