- 22
- 0
- 约2.35万字
- 约 4页
- 2018-10-12 发布于天津
- 举报
文本挖掘技术研究进展-计算机应用研究
2006 年第 2 期 袁军鹏等: 文本挖掘技术研究进展 ·1 ·
文本挖掘技术研究进展 *
1 2 3 2 2
袁军鹏 , 朱东华 , 李 毅 , 李连宏 , 黄 进
( 1. 清华大学 公共管理学院, 北京 100084; 2. 北京理工大学 管理与经济学院, 北京 100081; 3. 空军济南四站
厂, 山东 济南 250022)
摘 要: 文本挖掘是一个对具有丰富语义的文本进行分析从而理解其所包含的内容和意义的过程, 已经成为数
据挖掘中一个日益流行而重要的研究领域。首先给出了文本挖掘的定义和框架, 对文本挖掘中预处理、文本摘
要、文本分类、聚类、关联分析及可视化技术进行了详尽的分析 , 并归纳了最新的研究进展。最后指出了文本挖
掘在知识发现中的重要意义, 展望了文本挖掘在信息技术中的发展前景。
关键词: 文本挖掘; 中文分词; 特征选取; 文本摘要; 文本分类; 文本聚类; 关联分析; 数据可视化
中图法分类号: TP311; TP18 文献标识码 : A 文章编号 : 1001- 3695( 2006) 02- 0001-04
Survey of Text Mining Technology
1 2 3 2 2
YUAN Jun-peng , ZHU Dong-hua , LI Yi , LI Lian-hong , HUANG Jin
( 1. School of Public Policy Management, Tsinghua University, Beijing 100084, China; 2. School of Management Economics, Beijing In-
stitute of Technology, Beijing 100081, China; 3 . Manufactory of Sizhan, Jinan Air Force, Jinan Shandong 250022, China)
Abstract: Text Mining, also known as intelligent text analysis, text data mining or Knowledge-Discovery in Text ( KDT) , is
a rapidly emerging field concerned with the extraction of concepts, relations, and implicit knowledge fromtexts. As most infor-
mation ( over 80% ) is stored as text, text mining is believed to have a high commercial potential value. Firstly, this review
paper discusses the research status of text mining, then it lays out the framework of text mining and analyses techniques of text
mining, such as feature selection, automatic abstracting, text categorization, text clustering, text association, data visualiza-
您可能关注的文档
最近下载
- 2025年轻型民用无人驾驶航空器安全操控(多旋翼)理论备考试题及答案.docx
- 《煤矸石集料在制备建筑砂浆中应用指南》.docx VIP
- 高中语文文言文300实词+18虚词.pdf VIP
- 2023-2014年生猪养殖行业(申万Ⅲ)比率、现金流、发展、盈利、经营、偿债能力均值.doc VIP
- 无人机飞行管理.pptx VIP
- 2024《中班幼儿饮食行为现状调查—以S幼儿园为例》12000字.docx VIP
- 林业标准地调查表格.docx VIP
- 2026年高考第一次模拟考试:地理一模突破卷01(新高考全国通用)(考试版).docx VIP
- 标准地调查方法与原则.pptx VIP
- 专题03功能中的图像问题(共12种图像类型)讲义-2025版高考物理图像专题.pdf VIP
原创力文档

文档评论(0)