- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于多个领域本体的文本层次被定义聚类方法.pdf
第 37 卷第 3 期
2010 年 3 月
计算机科学
Computer Science
Vol. 37 No.3
Mar 2010
基于多个领域本体的文本层次被定义聚类方法
张爱琦在万利正英梁滞
(吉林大学计算机科学与技术学院 长春 130012)
摘 襄 传统的聚类方法常常将文本中关键坷的相似度作为聚类的依据,丢失了很多重要的语义信息,导致聚类结采
不够准确且计算量大。提出了一种基于多个领域本体的文本层次聚类方法,利用多个领域本体将用关键饲农示的文
本特征向量表示为与之匹配的概念向量集,定义文本相似皮的计算公式,设计并实现基于多个领域本体的文本凝聚聚
类算法。实脸结身巳农明,该方法从概念层次上表示和处理文本,降低了提类对象空间的维皮,减少了计算量,提高了义
本聚类的精确度和聚类效率。
关键调 领域本体,相似皮计算,凝聚层次聚类
中圄法分提号 TP391 文献标识码 A
Text Hierarchical Clustering Based OD Several DomaiD 伽tol略阳
ZHANG Ai-qi ZUO Wan-li WANG Ying LIANG Hao
(College of Computer Science and 丁echnology. Jmn University. Changchun 130012. Chína)
Abstract Traditional clustering methods are usually based on the similarity of keywords appearing in documents. Since
these methods may leadωthe loss of lots of semantic information, their clustering results are not accurate enough and
often need large amount of computation. A new method for hierarchically clustering documents based on 附veral domain
ontologies was pro仰自ed. This method first transformed keyword-based vectors into corresponding concept-based vec-
tors making use of several domain ontologies. Then , a formula was given for calculating similarities between different
documents. An algorithm for document clustering based on several domain ontologies was proposed and its correspon-
ding prime system was also designed and implemented. The experimental results show that 0盯 method can express and
process documents from the perspective of concept semantics. lt can decrease the amount of computation by reducing the
dimension of the space of clustered objects and improve both the accuracy and the efficiency of document clustering.
Ke阳伽咖 Domain ontology. Similarity computing , Agglomerate hierarchical c1ustering
随着 Internet 和 Intranet 的飞速发展,各种电子文本数据
急剧增加,对其快速、有效地投取、管理和使用已经成为信息
科学和技术领域的一大挑战。文本聚类技术能自动对文本信
息进行处膊,将大酷倍息按照特征元监督地进行分挠,使用户
从繁琐的文梢处理工作中解放出来,极大地提高了信息处理
的准确率。文本聚类技术作为文本信息处理的撞要技术之
…. ,得到了相关研究者的广挺关植。
文本聚费方法按数据的积聚规则通常分为层次法[IJ 、划
分方法和基于模型的方法等。层次法将数据对象在不间阶段
组成不同粒庶的髓,在簇的凝聚和分型过程中不断改
您可能关注的文档
最近下载
- 防腐、保温施工方案.docx VIP
- (完整版)沟槽开挖及支护专项施工方案(深基坑专家论证).doc
- 4.1 水循环(教案)2023-2024学年湘教版(2019)高中地理必修一.docx VIP
- EIM Book 1 Unit 1 Free time单元检测试题.pdf VIP
- 金风1.5MW型风机变流器断路器反馈丢失故障作业指导书.docx VIP
- 信息与通信技术产品供应链安全测试方法.docx VIP
- 高中必备成语及解释800个.docx VIP
- 公差配合与测量技术 第2版 项目三 千分尺与指示表的测量操作.pptx VIP
- 金风1.5MW型风机主控柜断路器状态反馈丢失故障作业指导书.docx VIP
- 第2课学会沟通交流(教学课件) 道德与法治统编版五年级上册.ppt
文档评论(0)