基于启发式搜索的主题策略研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
石油、天然气工业

第 13卷 第 5期 重庆科技学院学报 自然科学版 2011年 l0月 基于启发式搜索的主题策略研究 张 福 泉 福州闽江学院,福州 350108 摘 要:介绍 目前较为常用的启发式搜索策略,重点探讨A 搜索策略,在此基础上提出一种改进的基于启发搜索与 网页链接和 内容相关度结合起来 的新型主题搜索算法,最后通过实验对新算法和最好优先 以及 A 搜索进行 比较。 关键词 :启发式搜索 ;主题策略 ;网页链接 中图分类号 :TP393 文献标识码 :A 文章编号 :1673—1980 2011 05-0159-04 人们在使用搜索引擎查询信息时,希望能够快 ≤ %n 。在衡量算法性能的时候 ,有个指标叫复杂 速地从搜索引擎海量的数据库里找到 自己想要的信 度 .A 算法的复杂度是指在搜索普通图时,A 算法 息。因此 ,基于主题 的搜索策略逐渐成为了研究重 所遍历的节点个数。Martelli己经证明,在最坏 的情 点。主题搜索策略是主题式搜索引擎的重要组成部 况下,A 搜索算法的复杂度为O 2n ,其中n的值表 分 ,它决定 了主题搜索引擎的搜索效率 。相对于一 示图的大小。Pohl等人还证明了在运用 A 算法时, 般搜索策略而言,主题搜索策略主要是查找仅 限于 当 一 n n c 常数 时 ,则表明此时的A 人为设定范围的对象 ,通过某些特殊 的查找方法确 算法的复杂性为指数级;当 n 一 c,则表 明此 定具体的查找路径 。通过这种策略查找 出来的结果 时的A 算法的复杂性具有线性特征,其中h n ≤ 是某种经过特殊筛选的符合人们特定主题需要的结 n 。A 算法的步骤如下: 果数据。 目前,在主题搜索策略中使用的最多的是 ①初始化生成一个搜索图G,该图包含算法搜 人工智能化的算法。 索的开始节点 加 ,并将节点 加 存入到 OPEN的列 表上 : 1 启发式主题搜索策略概述 ②初始化列表CLOSED,并将其初始值设为空; 启发式A 算法 。A 算法是通过一定的限制条 ③开始搜索,当检查到列表OPEN为空时,系统 件后得到的启发式搜索算法,具体的原理为:假设函 则失败退 出; 数 起始值为 加,限制其经过 n个节点后到达 目 ④将列表OPEN中的第一个节点选定并将它从 标节点的最小代价 函数值。设 , n 为估价函数 ,令它 OPEN删 除后 移入 列表 CLOSED 中 ,该 节 点在 是 n 的估计值 。函数 n 的组成部分有两个 :第 CLOSE中命名为 n: 一 部分是函数值 n ,它代表的是从算法搜寻路径 ⑤当n节点为系统搜索的目标节点时,则图G 中开始的节点n0到节点 n的最小代价 ;另一部分是 中从节点 n到 加 的节点指针路径被认为是最佳路 函数值 ㈨ ,它代表从节点n到 目标节点的最小代 径 。系统将该方案认为是解决方案 从指针指 向的内 价,因为在现实中会遇到多个 目标节点 ,此时,我们 容是一个搜索树 ,在第 7步建立 ; 按照最优选择的原则,择取代价最小的一个 。此时 ⑥将n节点进行扩展,得到后继的系列节点集 函数:户 ㈤ 。在函数户㈤的计算中,把厂 合M.在 图G中.节点 n不在M节点的子孙节点集 与户 相比, 相对于g木 来说是一个估计,h 合中。其 中图G中的 节点成员,将成为节点n的 凡 相对于 n 来说是一个估计。而A 算法的条件 后继节点 : 、 是当估价函数 ,n【 中的 n 都小于等于 即 n ⑦从集合 中筛选出不在图G中的成员建立 收稿 日期 :2011-04—02 作者简介:张福泉 1975一 ,男,福建福州人 ,工程硕士,高级实验师,研究方向为媒体信息技术。 · 159· 张福泉:基于启发式搜索的主题策略研 究 一 个指 向n的指针 例如 ,既不在 OPEN中,也不在 ⑨令参数 l代表爬行网页辐射空间内部网页之 CLOSED中 。并且将筛选 出来的节点加入到列表 间的长度。 OPEN中。对 的每一个已在 OPEN中或 CLOSED ⑩令 Max_depth D Max_depth 为深度阈值,它 中的成员m,如果到 目前为止找到的到达 m的最好 代表的是最大深度的网页爬行量。令当前网页节点 路径通过 n,就把它的指针指向rI 对已在 CLOSED n的估价函数为: n :g n ;g 凡 n +f n ,其 中的每一个成员,重新定 向它在 G中的每一个后 中 表示从初始网页节点 加 到当前节点 n所在 继,以使它们顺着到 目前为止发现 的最好路径指 向 网页辐射空间.s的长度 ,Z n 表示从网页辐射空间S 它们的祖先 : 的核心节点HD到

文档评论(0)

fengbing + 关注
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档