- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语义互联瓣麓基磷——后控词表的研究
赵共麓王源臻螋明
(中嗣科学院上簿有机化学讲究所信息中心。上海200032)
籀要拳文奔绍了语曳五联网蒋基破~一后控霹袅。裁表是为腮凌靖援硷索的需要
而编制的,后控词敏也如此,后控蠲表的出现是为了适应自然语言检索的需饕.叉
章讨论了基于自然谗言检索的后控词表技术,国内外对后控词农的研究现状,以反
实现摩投词袁存在酌一些妓拳翔题,翳鳃是在此篡础土发展我国的詹麓词表技术。
美键镯詹箍爨豪语义互联磺 鑫热语言辁索 ’
一、语义互联黼的基础——麟控词表
鼓1989年黢测粒子貔灌实验巍(CERN)费科学裳Tim
念舞始,Web已经不舔不燮走过了lO个寄被。互联蹲镌出现为夭积笈带、妖集痿惑掇供
了一条方便的途径。迅遄发展的甄联网聚巢了越来越多的信息。人们在窜受互联网获墩信
息便捷的同时,也感受到谯众多繁杂的曩联网信息中,鞭找到对自己有用的资料实非赫事a
.大髓遥常必笑注嚣求豹信息,囊不愿意凝嚣霸豹地测爨犬量无关豹员霹鞫信息。也就怒说
焘户需要懿蹙巍效。耪确靛信愚驻务,嚣嚣举莰莰是丈蘩傣惑静臻获。鬣联弼主熬传绞僖惑
检索方式通常存在以下几方面的问题:籍一。由于概念的不确定性而导致的无效检索,会
遗漏有用储意。语言本嶷鞠其存多义性的特点,对犀~穰念不嚼入可能溺不同的名称称呼,
比如西红柿和番茄就是同~概念。而在~般信息搜索照,如果你输入的是磷红柿,邓么关
予器菸豹臻惠藏会菝滤去;第二,会产垒大鳖穗关蛙不糍豹信惠。为了举瀛撵重要豹蘩慧,
就哭好人为扩丈信息提供豹范瑶,因先农传统的检索模式下不霹麓骧确界定用产真正静嚣
求。因此,用户不得不诧赞时问重新对搜索到的这些信息进行筛选。这种信息检索方战的
缺憾越来越成为制约互联网的瓶颈。在留迈入第二个十筚的时候,人们有充分的理幽必注
Web未来麴发震。在今羼酶10年孛,技术辫如蘩再造Web?Web的未来乏路在餐方?’
Tim
(Semantic
光辉烟烂的来束。XML姻耩髓就是“语义Web”中的“添义”。
按照Bemers-Lee的设想,语义互联网不仅可以理解词和概念的涵义,而且还能理解
窭葵串熬邋瓣美系。盈惫A类戆知瑷丈掇麓予嚣太柱嚣:语义学释数学。在数字楚理方巍,
电脑旱已超越了人类。辩浆邀蕊在语言和维理方蟊也麓撵优秀,宅就不仅麓帮弦人稍搿维
新知,而鼠还能自我创新。这样,人们再也不必看着一屏~屏的无关内容在阿上四处游荡-
‘
电脑可以通过“智能代理”浏览上千个嘲址并从中过滤出相关的信息。
。可扩鼹拣示语言(XML)器搂述资灞勰框架(R王)秘怒发展语义互联瓣豹嚣夫荚键投零
[51。RDF为Web资源籀述提供了一静逶麓耀絮,宅鞋~耪梳嚣霹毽辩翡方式祓表瑟蹬袋,
使用各种词汇集描述资漾。语义甄联网使用XML语法,再使用指定的词汇集来描述滚滚,
可|;l很方谯地用XML交按RDF的数据+.
·215·
XML是语义鬣联网的技术平台,而真正语义互联阿的发展依赖于RDF词汇表与相关
标准豹目益完善。丽“语义互联网”中理解词和概念的涵义,建巍词帮概念的逻辑荑系最
需要的是建立能反映其语义关系的词汇表。词汇袁主要功能要能耐自然语嚣巾文量存在盼
等鞫荧系、筹缓关系秽犬菇分翡篾芙系进行控辔4离提泰,霹壤撼检索秘露要将袈摄念蘩l瑟
寒潺及对怒加入溺袭中,荠给出调的概念军匿濑义,形袋一个韵悫谰表。实际上辘是我雷3所
指的后控词表。嚼的完善与否直接影响检索的效果。
‘二、基母螽然语言捡綮的焉控谣表技术
、
’
‘
文档评论(0)