- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息免疫系统的研究与开发
赵孟德党齐民
如何能在互联网上快速并准确地找到所需要的信息,一直是人们所关注和研究的问题。
本文借鉴生物免疫系统的学习、记忆和自我识别机理,提出了信息免疫的思想,以实现信息的
预处理和过滤.并重点讨论了信息免疫算法。
近年来,随着Intemet规模的迅速增长,网络上的信息资源也随之迅速膨胀,信息检索技
术迅速发展,开发了各种不同的搜索引擎,它们能以一定的策略在互联网中搜集、发现信息,对
信息进行理解、提取、组织和处理,并为用户提供检索服务。
传统搜索引擎按其工作方式主要可分为以下3种:
TextSearch
1.全文搜索引擎(Full Engine)
的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用
户。该类搜索引擎搜集保存的是互联网上各网站的每一个网页的全部内容,服务方式是面向
网页的全文检索服务,其优点是信息量大、更新及时、毋须人工干预,缺点是返回信息过多、有
很多无关信息、用户必须从结果中进行筛选。
Index/Directory)
2.目录索引(Search
目录索引虽然有搜索功能,但不是真正的搜索引擎,仅仅是按目录分类的网站链接列表而
已。目录索引中最具代表性的是Yahoo!、OpenDirectory
狐、新浪、网易搜索等。该类搜索引擎只保存互联网上各网站的站名、网址和内容提要,以人工
方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先
确定的分类框架中。其信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引
擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介人、维护量大、信息量
少、信息更新不及时。
Search
3.元搜索引擎(METAEngine)
元搜索引擎在接受用户查询请求的同时,也能在其他多个引擎上进行搜索,并将结果返回
有自己的数据,它先将用户的查询请求同时递交给多个搜索引擎,再对返回的结果进行重复排
】64
除、重新排序等处理,最后作为自己的结果返回给用户。其服务方式为面向网页的全文检索.
主要优点是返回结果的信息量更大、更全,缺点是不能够充分使用所使用搜索引擎的功能,用
户需要做更多的筛选。
传统的全文检索技术是基于关键词匹配的检索,往往存在查不全、查不准、检索质量不高
的现象,特别是在网络信息时代,利用关键词匹配很难满足人们检索的要求。因此,人们开始
研究智能检索技术,开发出了一些具有智能能力的搜索引擎。
当前的一些智能检索技术主要从两个方面来提高检索的智自E性:(1)在智能检索系统中
增加了分词词典、同义词典,并从知识层面或者说概念层面上通过主题词典、上下位词典、相关
同级词典,形成一个知识体系或概念网络,能给用户智能知识提示,帮助用户获得最佳的检索
效果。(2)智能检索系统可进行歧义信息的检索处理,通过歧义知识描述库、全文索引、用户
检索上下文分析以及用户相关性反馈等技术可以揣摩用户的心理,能够高效、准确地把信息反
馈给用户。
智能型搜索引擎运用人工智能技术把信息检索从目前基于关键词检索的层面提高到基于
知识(或概念)检索的层面,突破了关键词检索限于形式的缺陷,可准确定位搜索结果的范围,
从而提高了检索效率并能对用户检索请求实现合理的联想和扩检,这是通过对搜索内容相关
性的自动学习,不断提高搜索结果的可用度来实现的。
但是目前的搜索引擎并不能完全满足人们检索信息的要求。一方面搜索引擎对信息的检
准率、检全率不能令人满意,搜索引擎对搜索结果的排序也不够客观、科学,对一个关键词的搜
索,往往动辄得到数以百计的结果。另一方面,当前的搜索引擎在学习、识别用户的信息检索
模式等个人喜好方面能力还比较弱,并不能为用户提供很好的个性化服务。
生物免疫系统具有分布性、自适应性、动态平衡性、学习和记忆能力、自我识别能力等特
性,这些特性为实现信息的智能化处理提供了有效的途径。为此,本文借鉴生物免疫系统的信
息处理机制提出了信息免疫系统的概念,并就信息免疫算法进行了重点讨论。
2免疫系统的信息处理机制和特点
生物免疫系统具有强大的信息处理机制,这些机制对于解决信息检索和过滤提供了基本
的手段,主要表现在:
(1)分布性
文档评论(0)