文本挖掘中运用自组织特征映射算法分析中国人类工效学研究状况.pdfVIP

  • 13
  • 0
  • 约1.01万字
  • 约 4页
  • 2015-08-20 发布于未知
  • 举报

文本挖掘中运用自组织特征映射算法分析中国人类工效学研究状况.pdf

一般工业技术

维普资讯 厶 堂 !年3月第l3卷第1期 · 17 · 文章编号:1006-8309(2007)01-0017-04 文本挖掘中运用 自组织特征映射算法分析 中国人类工效学研究状况 吴星玮,饶培伦 (清华大学 工业工程系,北京 100084) 摘要:文本挖掘是抽取有效 、新颖、有用、可理解的、散布在文本文件中的有价值知识 , 并且利用这些知识 更好地组织信息的过程。利用文本挖掘中的自组织特征映射(SOM)算法,对中国《人类工效学》期刊数据库 的大量文档进行聚类分析,得到当前国内人类工效学研究领域里的主要研究类别、趋势,然后将聚类结果与国 际人类工效学协会 (IEA)公布的研究领域进行对比分析。 关键词:文本挖掘;自组织特征映射;聚类 ;人类工效学;国际人类工效学协会 (IEA) 中图分类号:TB18;TP39 文献标识码 :A ApplySerf-organizingM apTextM iningAlgorithm toAnalyze ChineseErgonomicsResearchArea WU Xing-wei.Pei-luenPatrick RAU (DepartmentofIndustrialEngineering,TsinghuaUniversity,Beijing100084,China) Abstract:Textminingisaprocessinwhicheffective,fresh,useful,understandableandvalubaleknowledgein thetextcontentsisextractedandutilizedtobetterorganizeinformation.Self-organizingmap(SOM)textminingalgo— rithmisappliedtoconductaclusteringanalysistowardsthedocumentsintheChineseErgonomicsjournaldatabase. Afterthetextminingprocess,thecurrentmainresearchraeas andtrendsinChineseergonomicsresearchisfoundnadhten comparehteclusteringresultswiththereesarchraeaspublishedbytheInternationalErgonomicsAssociation(1EA). Keywords:textmining;esfl-organizingmap(SOM);cluster;ergonomics;InternationalErgonomicsAssociation (1EA) I 引言 2 自组织特征映射文本聚类过程 现实世界中,知识不仅以传统数据库中结构 文本聚类的方法有很多,如以贝叶斯概率为 化数据的形式出现,而且还 以诸如书籍、研究论 基础的基 于概率 的方法,基于距离 的K均值 文、新闻文章、web页面及电子邮件等各种各样的 法2【J。本文主要采用 自组织特征映射SOM算法 文本形式出现。文本挖掘是抽取有效、新颖、有 作为理论基础,进行文本聚类。在SOM聚类过程 用、可理解的、散布在文本中的有价值知识,并且

文档评论(0)

1亿VIP精品文档

相关文档