- 5
- 0
- 约5.75千字
- 约 33页
- 2018-05-10 发布于湖北
- 举报
文本挖掘 - 信息提取(IE)1131.ppt
* uouou lijlij * uouou lijlij 文本挖掘 – 信息提取(IE) 参考Jaime Carbonell教授讲稿 * ilujl 文本中信息的提取 出发点:从文本中挖掘信息,而不是简单的词项匹配 上下文无关实体的提取 Context-Free Entity Extraction 基于规则的实体提取 关系提取(Relational Extraction) 在eBusiness中的应用 * ilujl Text Mining (1) 文本本来是给人读的,不是计算机 大多数信息以文本形式存储 100 times as much online text as online DBs HTML网页是带有结构标记的文本(带来机会和挑战) 数据挖掘操作的是数据表 (i.e. numbers, fixed fields, adherence to data models). * ilujl Text Mining (2) 许多应用,我们需要从文本到数据库表的转换器 一般的自然语言理解问题依然太困难 但我们能够解决简单些、同时也有用的子问题吗? Yes! 对文本按照主题分类 并且从文本中或者标记结构文字中提取某些信息是可能的。 * ilujl Text Mining (3) Components of Text Mining(基本策略) 按照主题(话题,topics)分类
您可能关注的文档
- 我校科技成果管理工作简介1026.ppt
- 我省装备制造企业质量提升亟待解决的问题(以获省政府质.1029.ppt
- 我给你一份信用,你给我一份承诺 --致高校学生的一封信1030.ppt
- 战略分析内容与工具1033.ppt
- 戚翠莲天津行政学院1034.ppt
- 房地产相关税收政策分析1038.ppt
- 房地产行业税收风险监控模型建立及应用1039.ppt
- 房屋署、香港学校网络-网站交流会1041.ppt
- 手足口病管理1042.ppt
- 扎实做好纳服工作 全力落实减税措施1043.ppt
- 2026年山东省滨州市惠民县中考化学一模试卷(含答案).pdf
- 2026年山东省济南市历城区中考化学二模试卷(含答案).pdf
- 2026年山东省烟台市福山区中考化学模拟试卷(含答案).pdf
- 2026年山东省临沂市郯城县中考化学一模(含答案).pdf
- 2026年四川省德阳市中江县中考化学二诊试卷(含答案).pdf
- 2026年四川省绵阳市梓潼县中考化学二模试卷(含答案).pdf
- 2026年新疆乌鲁木齐市沙依巴克区中考化学适应性试卷(含答案).pdf
- 2026年重庆市永川区中考化学质检试卷(含答案).pdf
- 2026年重庆市第一中学校中考化学全真模拟试卷(二)(含答案).pdf
- 安徽池州市第二中学等校2025-2026学年高一下学期期中物理试卷A(含答案).pdf
原创力文档

文档评论(0)