叙词表词间关系可视化实验研究-e线图情.docVIP

叙词表词间关系可视化实验研究-e线图情.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
叙词表词间关系可视化实验研究-e线图情.doc

叙词表词间关系可视化实验研究 刘 俊 李 华 侯汉清 (南京农业大学信息管理系210095) 摘 要 叙词表已有的参照系统及几种图形显示形式在网络环境中显然不能动态地、全面地显示词间关系,不便于浏览和检索。本文分析了利用本体编辑工具Protégé实现叙词表可视化的必要性,并以《汉语主题词表》为例,利用Protégé的可视化插件,进行了叙词表等同关系、等级关系及相关关系可视化的实验,并讨论了整部关系和例举关系的可视化。 关键词 本体编辑工具 Protégé 叙词表可视化 信息可视化 叙词表是信息表示工作过程中广泛采用的文献主题标引和检索工具。它对自然语言进行词量、词类、词形、词义及词间关系的全面控制。可视化就是把数据信息和知识转化为图形、图像等比较直观的视觉形式的过程[1]。对叙词表的词间关系进行可视化,能够帮助用户更直观地感知词间关系,了解叙词的涵义,更便捷地对所需语词做出判断和选择[2]。 词间关系是指叙词之间内在的语义联系,包括等同关系、等级关系和相关关系。纸质叙词表的编制通常采用三种词间关系控制方法:①编制范畴索引和词族索引;②建立参照系统;③图形显示。前两种方法只能线性显示词间关系,而第三种方法借助图形的直观优势,更能有助于把握词间关系。本文尝试以《汉语主题词表》为例,用本体编辑工具Protégé实现叙词表的的可视化,全面地、形象地、动态地显示叙词表的各种词间关系。 1 叙词关系的图形显示 图形显示[3]是将叙词之间关系以二维图形式加以显示,亦称词族图,或称叙词关系图;包括同心圆图、箭头图、树形结构图、方框图等显示形式。 1.1同心圆图 族首词位于同心圆的圆心位置,族中词根据级别不同分布于半径不同的同心圆上。也就是说,专指度越大的下位词,距离圆心越远。直接上下位词之间由单向箭头相连,从上位词指向下位词。与族中词(同心圆上的某个叙词)相关的叙词列于同心圆之外,两者之间用直线相连。典型的有1963年由武装部队技术和情报中心编制的TDCK环形展示叙词表[3]。图1是以族首词“出版物”为中心展开绘制的TDCK环形图。 1.2箭头图 由多条横线和竖线相交成一个坐标图。族首词位于坐标图的中间位置,族中词根据级别不同分布于不同坐标点上。也就是说,专指度越大的下位词,距离中心词(族首词)越远。与同心圆图一样,直接上下位词之间由单向箭头相连,从上位词指向下位词。与族中词(坐标图上的某个叙词)相关的叙词列于坐标图之外,两者之间用虚线相连。图2就是以族首词“摄影机”为中心展开绘制的箭头图。 1.3树形结构图 词族中的等级关系用树状结构加以展开。族首词位于树形结构图的顶端位置,族中词根据等级关系一层层展开:一级下位词处于族首词位置之下的第一层,以此类推,最后一级的下位词处于结构图的末端。 1.4方框图 由多个方框组成的方框图。一个词族列于一个方框之内。族首词居中位于框内第一行,并用下划线加以标识。族中词按照等级关系用空格缩进形式进行全显示。每一页集中显示具有相关关系的几个词族方框,并共同置于一个大方框中,不同词族方框中有相关关系的族中词之间用直线或折线相连。该页显示不下的相关关系,只用缩略形式表示:相关叙词列于大方框外,加以数字标识来源,分别置于一个个小方框内,并与族中词用直线相连。 图1 TDCK 环形表样式[3] 图2 箭头关系图[3] “一画顶千言”,经图形显示的叙词关系直观、形象、清楚,便于用户对某个叙词的等级关系和相关关系有一个全面的了解。但是手工绘制词族图复杂又费时,而且这类词族图只是静态图,由于页面限制往往一页只能显示一个或几个词族,不利于浏览和检索。所以,叙词表采用词族图的仍寥若晨星,难于推广。 相比较之下,在电子和网络环境下,图形显示更能发挥有效的作用,因为借助超链接技术,用户就能直接浏览选定词语的详细内容或图示。网络上常用的受控词表的显示方式有[3]:路径等级显示、按分类体系或字母顺序显示、超链接导航(对所有与款目词有关的词建立链接)。 随着信息可视化技术的发展,一些商业产品能够生成概念图[4],例如本体编辑工具,可以对各类叙词进行编辑,自动生成叙词关系图。这在一定程度上解决了手工绘制词族图的繁琐,突破手工绘制的局限性,具有良好的友好性、动态性和可检索性。也就是说,用户通过浏览叙词表叙词关系图,对所感兴趣的领域有一个感性认识,可以从一个叙词到另一个相关叙词进行选择,从而确定标引和检索所要采用的叙词,有助于信息表示和检索过程中的找词选词。 2 本体编辑工具Protégé 的可视化功能 Protégé[5]

文档评论(0)

zhongshanmen002 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档