- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
石油、天然气工业
第 13卷 第 5期 重庆科技学院学报 自然科学版 2011年 l0月 基于启发式搜索的主题策略研究 张 福 泉 福州闽江学院,福州 350108 摘 要:介绍 目前较为常用的启发式搜索策略,重点探讨A 搜索策略,在此基础上提出一种改进的基于启发搜索与 网页链接和 内容相关度结合起来 的新型主题搜索算法,最后通过实验对新算法和最好优先 以及 A 搜索进行 比较。 关键词 :启发式搜索 ;主题策略 ;网页链接 中图分类号 :TP393 文献标识码 :A 文章编号 :1673—1980 2011 05-0159-04 人们在使用搜索引擎查询信息时,希望能够快 ≤ %n 。在衡量算法性能的时候 ,有个指标叫复杂
速地从搜索引擎海量的数据库里找到 自己想要的信 度 .A 算法的复杂度是指在搜索普通图时,A 算法
息。因此 ,基于主题 的搜索策略逐渐成为了研究重 所遍历的节点个数。Martelli己经证明,在最坏 的情
点。主题搜索策略是主题式搜索引擎的重要组成部 况下,A 搜索算法的复杂度为O 2n ,其中n的值表
分 ,它决定 了主题搜索引擎的搜索效率 。相对于一 示图的大小。Pohl等人还证明了在运用 A 算法时,
般搜索策略而言,主题搜索策略主要是查找仅 限于 当 一 n n c 常数 时 ,则表明此时的A
人为设定范围的对象 ,通过某些特殊 的查找方法确 算法的复杂性为指数级;当 n 一 c,则表 明此
定具体的查找路径 。通过这种策略查找 出来的结果 时的A 算法的复杂性具有线性特征,其中h n ≤ 是某种经过特殊筛选的符合人们特定主题需要的结 n 。A 算法的步骤如下:
果数据。 目前,在主题搜索策略中使用的最多的是 ①初始化生成一个搜索图G,该图包含算法搜
人工智能化的算法。 索的开始节点 加 ,并将节点 加 存入到 OPEN的列 表上 :
1 启发式主题搜索策略概述 ②初始化列表CLOSED,并将其初始值设为空; 启发式A 算法 。A 算法是通过一定的限制条 ③开始搜索,当检查到列表OPEN为空时,系统
件后得到的启发式搜索算法,具体的原理为:假设函 则失败退 出;
数 起始值为 加,限制其经过 n个节点后到达 目 ④将列表OPEN中的第一个节点选定并将它从
标节点的最小代价 函数值。设 , n 为估价函数 ,令它 OPEN删 除后 移入 列表 CLOSED 中 ,该 节 点在
是 n 的估计值 。函数 n 的组成部分有两个 :第 CLOSE中命名为 n:
一 部分是函数值 n ,它代表的是从算法搜寻路径 ⑤当n节点为系统搜索的目标节点时,则图G
中开始的节点n0到节点 n的最小代价 ;另一部分是 中从节点 n到 加 的节点指针路径被认为是最佳路
函数值 ㈨ ,它代表从节点n到 目标节点的最小代 径 。系统将该方案认为是解决方案 从指针指 向的内
价,因为在现实中会遇到多个 目标节点 ,此时,我们 容是一个搜索树 ,在第 7步建立 ;
按照最优选择的原则,择取代价最小的一个 。此时 ⑥将n节点进行扩展,得到后继的系列节点集
函数:户 ㈤ 。在函数户㈤的计算中,把厂 合M.在 图G中.节点 n不在M节点的子孙节点集 与户 相比, 相对于g木 来说是一个估计,h 合中。其 中图G中的 节点成员,将成为节点n的 凡 相对于 n 来说是一个估计。而A 算法的条件 后继节点 : 、
是当估价函数 ,n【 中的 n 都小于等于 即 n ⑦从集合 中筛选出不在图G中的成员建立
收稿 日期 :2011-04—02
作者简介:张福泉 1975一 ,男,福建福州人 ,工程硕士,高级实验师,研究方向为媒体信息技术。 · 159· 张福泉:基于启发式搜索的主题策略研 究
一 个指 向n的指针 例如 ,既不在 OPEN中,也不在 ⑨令参数 l代表爬行网页辐射空间内部网页之
CLOSED中 。并且将筛选 出来的节点加入到列表 间的长度。
OPEN中。对 的每一个已在 OPEN中或 CLOSED ⑩令 Max_depth D Max_depth 为深度阈值,它
中的成员m,如果到 目前为止找到的到达 m的最好 代表的是最大深度的网页爬行量。令当前网页节点
路径通过 n,就把它的指针指向rI 对已在 CLOSED n的估价函数为: n :g n ;g 凡 n +f n ,其
中的每一个成员,重新定 向它在 G中的每一个后 中 表示从初始网页节点 加 到当前节点 n所在
继,以使它们顺着到 目前为止发现 的最好路径指 向 网页辐射空间.s的长度 ,Z n 表示从网页辐射空间S
它们的祖先 : 的核心节点HD到
您可能关注的文档
最近下载
- 西门子PLC通讯.ppt VIP
- 在线网课学习课堂《研究生学术规范与学术诚信》单元测试考核答案.docx VIP
- 风力发电机组防腐规范.pdf VIP
- 卧式车床使用说明书.doc VIP
- 2025年八项规定精神纠正“四风”应知应会知识问答试题及答案详解(历年真题).docx VIP
- 广西桂林2021年中考语文现代文阅读真题.docx VIP
- 2018年10月注册土木工程师(水利水电工程)《专业知识考试(上)》真题及详解.doc VIP
- 疫苗采购管理制度.docx VIP
- 国家中医药管理局《中医药事业发展“十五五 ”规划》全文.docx
- 苏G02-2019 房屋建筑工程抗震构造设计.pdf VIP
文档评论(0)