基于Ontology的相关搜索.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Ontology的相关搜索.doc

基于Ontology的相关搜索 Report 冀铁亮王佳聪) 综述 近年来,搜索引擎的使用越来越广泛,用户对搜索引擎的性能的要求也越来越高。有人预测,未来的信息获取方式将不再是通过门户网站,而是通过搜索引擎。 对于简单的搜索请求,比如用户搜索“感冒”,普通的搜索引擎可能只会返回“感冒”的一些东西。可是,有一些用户会有这样的一些需求:比如某一天,用户感到身体不适,他想知道自己得了什么病,那么他输入“发烧”、“咳嗽”等关键词后,搜索引擎应该能返回感冒这个疾病,以及一些相关的病症及治疗方法。或者,由感冒可以诱发支气管炎,那么搜索引擎也应该能够返回支气管炎的相关搜索结果。“感冒”和“支气管炎”在文字上并没有相关性,但是在语义上有相关性,这就叫做语义相关性,以下简称相关词。 相关搜索,是通过一定的技术,使得用户可以由某一个检索词,不仅得到该检索词的检索结果,还可以得到与该检索词相关的其他项的检索结果,为用户提供相应服务的一种增值服务。 基于Ontology的相关搜索的关键在于,怎么样实现这样一种语义上的相关性,让搜索引擎可以自动识别。但是目前这种相关词的相关性的获取方式有限,现在的做法是预先用xml定义一个相关词表,供搜索引擎查询。 这里就需要语义网的一些相关知识。需要有一个相关词词典,用来保存所有语义上相关的关键词的集合。也就是说,两个查询词可能对应于同一概念。程序若要进行两个数据库之间信息的比较和合并,它就必须了解这两个查询词表示的是同一事物。在理想的情况下,对于遇到的任何数据库,程序必须有办法来发现这种同义的查询词。 Ontology通过许多方法增强网络的功能。通过简单的方法,它们就能改进网上搜索的准确性,使搜索程序只寻找那些指向精确概念的网页,而不是仅仅通过模糊关键字查到的所有页面。更高级的应用将使用ontology将页面上的信息关联到相关的知识结构和推理规则。 总之,利用Ontology进行相关搜索,使得用户可以由模糊搜索得到比较精确的结果,由一个搜索得到与之相关的其他搜索结果。 市场环境分析 经济 近十年中,信息及计算机产业得到了飞速的发展,随着电脑的普及,电脑从九十年代初贵族式、奢侈式的工具渐渐变为一个普及到千家万户的普通消费品。而且随着互联网的日益完善和强大,人们的日常生活已经和互联网密不可分。从互联网上获得信息,变为人们生活的主要部分。 社会 现在,随着互联网上的信息越来越丰富,范围越来越广,内容越来越多,要想找到自己真正想要的东西实在不容易。所以,搜索引擎应运而生,像Google,Baidu等等。但是,有些用户虽然知道自己想要什么,但是不善于用查询词来表达,所以,需要搜索引擎来寻找词义相关的结果来返回。现在,对相关搜索的呼声越来越高。 技术 我们可以把相关搜索的关键技术划分成几大模块:相关词表构建技术,相关词表分析技术,Web搜索技术。随着目前互联网的飞速发展,这些技术也在逐渐的进步着。 所有这些技术的进步,都将促进相关搜索的应用更加快速的发展,从而推动各种相关的应用。 市场定位和市场潜力分析 基于Ontology的相关搜索的目标市场是各种相关的信息检索服务,提供目标信息和相关信息的采集,搜索等等。 用户分析: 经常使用电脑的上网者,需要从电脑上获得大量信息的用户 市场容量分析 相关搜索服务被认为是搜索引擎中的杀手级服务之一,有着巨大的市场规模和良好的盈利前景 市场发展潜力分析 目前,比较大的搜索引擎都已经开始做相关检索的服务,但都还不成熟,相关搜索的潜力还没有完全开发出来。随着技术的逐步完善,相关搜索的服务将会越来越流行。 而且,好的搜索服务可以吸引更多的用户来使用这个搜索引擎。从而,搜索页面上的广告服务也可以带来额外的效益。 技术资源 关键技术简介 基于Ontology的相关检索需要以下关键技术: 相关词表构建技术 构件相关词表,使得语义上相关的词可以很方便的被关联在一起,这些相关词以特定的方式组织在相关词表中,使得从一个词可以快速准确的找到其语义相关的词。 相关词表分析技术 对相关词表进行分析,对某一个给定的词,分析相关词表,从中找出语义相关的词。 Web搜索技术 包括web网页抓取技术和web信息自动分类检索技术,从web上获取信息服务的主要数据源。 系统体系结构 基于Ontology的相关搜索的体系结构如下: 技术优势 我们目前的优势主要在这几个方面中都有体现。通过课程学习到的相关技术理论,我们可以很好地对网页信息进行收集分类。本项目小组2名成员对相关词表构建技术,相关词表分析技术,Web搜索技术都有一定的了解,并各有侧重分别对其做过研究,有很好的技术积累。我们坚信这些优势会帮助我们实现项目目标。 一个原型示例 下面这个简单的示例可以有效的说明基于Ontolog

文档评论(0)

docinpfd + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:5212202040000002

1亿VIP精品文档

相关文档