- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
信息检索中基于智能优化算法数据融合方法
信息检索中基于智能优化算法的数据融合方法
摘要:如何利用网络技术手段,帮助用户从互联网海量信息中迅速准确地获取用户所需信息是信息检索领域的首要问题。数据融合技术能够将不同检索系统提交的检索结果进行组合从而得到一个新的检索结果。对数据融合技术中的线性组合法进行研究,着重探讨如何采用智能优化算法解决线性组合法的权重分配问题,分析基于差分进化算法和基于粒子群算法的权重分配策略,在上述两种优化算法的基础上,提出一种新的线性组合法权重分配策略:基于自适应交替的粒子群差分进化优化算法权重分配策略。
关键词关键词:数据融合;线性组合法;权重分配;差分进化算法;粒子群算法
DOIDOI:10.11907/rjdk.171793
中图分类号:TP391
文献标识码:A文章编号文章编号2017)011020204
0引言
从已有研究中可以得知,数据融合方法能够有效提升检索性能[13]。根据对成员系统处理方式不同,数据融合方法可分为两类:同等处理方法和差别处理方法[4]。第一种方法是用相同的标准去处理每一个成员系统的检索结果,如CombSUM和CombMNZ方法;第二种方法会根据成员检索系统具体特征采用某种方式给其加权,如线性组合法(Linear Combination,LC)。因此,从现行组合法对成员系统的处理方式可以得知,优化权重分配策略是提升线性组合法融合性能的关键。线性组合法的成员系统权重分配属于全局优化问题,而全局优化问题一般都会存在非线性、复杂性、多极值性及约束性等问题。因此,本文使用差分进化算法、粒子群算法以及自适应交替的差分进化粒子群优化算法等智能优化算法,为线性组合方法训练权重以提高融合性能。
1数据融合方法
数据融合方法根据对成员系统处理方式的不同主要分为两类:同等处理方式的融合方法和差别处理方式的融合方法[5]。
同等处理方式的融合方法指在融合成员系统的检索结果时,用相同的标准去处理每一个成员系统的检索结果。常用方法有CombSUM和CombMNZ[67]。给定一个文档集D和m个参与融合的成员系统IR={ir1,ir2,ir3,…,irm},对于一个以查询为形式的用户需求q,m个成员系统对文档集D中的文档进行检索,返回的检索结果为Li=〈di1,di2,di3,…,din
其中,w表示惯性权重;c1和c2为加速因子;而r1和r2是[0,1]范围内的两个随机数;Vmax表示最大速度,用来限制粒子的移动速度,使粒子的运动保持在一定范围内,从而控制粒子在解空间的搜索范围;gj表示整个群体所有粒子的历史最优位置记录,即全局极值gbest;pij指个体极值pbest,表示粒子i在解空间内所搜寻到的历史最优解。
同基于差分进化算法的权重分配策略类似,在确定融合结果性能值(在MAP评价指标下)与权重集合W的关系后,将集合W作为粒子的所在位置,将MAP(g,Q)作为粒子群算法的适应度函数。这样,便可以通过粒子群算法优化权重,通过多次迭代得到一组权重,能够较好地提升融合结果MAP值。
2.3基于自适应交替粒子群差分进化算法的权重分配策略
本文使用了一种基于这两种算法的混合算法:自适应交替粒子群差分进化算法。在该算法中,使用p=1/(1+e-i)(i为算法的当前迭代次数)作为交替运行这两种算法的控制参数。这样通过?⑹?p控制,在算法运行初期以较大的几率运行粒子群算法对种群进行优化,可以发挥粒子群算法前期收敛快但后期容易陷入收敛停滞的特点;在算法运行后期则以较大的几率使用差分进化算法对种群进行优化,这样便可以充分利用差分进化算法前期收敛慢、后期收敛快的特点[11],提高效率的同时还能够降低收敛停滞现象发生几率。自适应交替粒子群算法流程如图1所示。
图1自适应交替粒子群差分进化算法流程
与前两种权重分配策略类似,将成员系统的权重集合W作为粒子的所在位置,将MAP(G,Q)作为自适应交替粒子群差分进化算法的适应度函数。这样,便可以通过该算法优化权重,经过多次迭代得到一组权重,可较好地提升融合结果MAP值。
3实验及结果分析
3.1实验设置
参与实验的方法有:CombSUM、CombMNZ、基于多元线性回归的权重分配策略、基于差分进化算法的权重分配策略、基于粒子群算法的权重分配策略、基于自适应简化粒子群算法的权重分配策略、基于自适应交替粒子群差分进化算法的权重分配策略、基于遗传算法的权重分配策略(实验中分别以MRFusion、DEFusion、PSOFusion、AESPSOFusion、PSODEFusion和GAFusion代替)。
本文采用的数据集为TREC 2004 Robust Task。在TREC 20
您可能关注的文档
- 信息技术背景下高中化学实验教学建议.doc
- 信息技术能力与企业绩效关系研究.doc
- 信息技术背景下英语教学研究.doc
- 信息技术自助餐式校本课程开发与研究.doc
- 信息技术视域下培养区域性教师学习共同体理论研究.doc
- 信息技术视角下大学英语多元互动型教学改革研究.doc
- 信息技术视角下形体舞蹈课程教学方法改革.doc
- 信息技术背景下锡山社区教育实践研究.doc
- 信息技术视角下职业教育城乡统筹发展理论研究.doc
- 信息技术视角下电子商务物流系统特征分析.doc
- 中国国家标准 GB/T 3883.203-2025手持式、可移式电动工具和园林工具的安全 第203部分:手持式砂轮机、盘式抛光机和盘式砂光机的专用要求.pdf
- 《GB/T 3883.203-2025手持式、可移式电动工具和园林工具的安全 第203部分:手持式砂轮机、盘式抛光机和盘式砂光机的专用要求》.pdf
- GB/T 18430.2-2025蒸气压缩循环冷水(热泵)机组 第2部分:户用及类似用途的冷水(热泵)机组.pdf
- 中国国家标准 GB/T 18430.2-2025蒸气压缩循环冷水(热泵)机组 第2部分:户用及类似用途的冷水(热泵)机组.pdf
- 《GB/T 18430.2-2025蒸气压缩循环冷水(热泵)机组 第2部分:户用及类似用途的冷水(热泵)机组》.pdf
- 中国国家标准 GB/T 46446.1-2025石油、石化和天然气工业 碳钢过程容器内涂层和衬里 第1部分:技术要求.pdf
- 《GB/T 46446.1-2025石油、石化和天然气工业 碳钢过程容器内涂层和衬里 第1部分:技术要求》.pdf
- GB/T 46446.1-2025石油、石化和天然气工业 碳钢过程容器内涂层和衬里 第1部分:技术要求.pdf
- 中国国家标准 GB/T 3883.206-2025手持式、可移式电动工具和园林工具的安全 第206部分:手持式锤类工具的专用要求.pdf
- 《GB/T 3883.206-2025手持式、可移式电动工具和园林工具的安全 第206部分:手持式锤类工具的专用要求》.pdf
最近下载
- 日鼎DHE完整版说明书.pdf VIP
- 新编实用英语综合教程一Unit8FromFattoFit.ppt VIP
- 网神SecSIS3600安全隔离与信息交换系统产品安装调试指导手册[V6.4.1].pdf VIP
- 新编实用英语综合教程一Unit 6 Oympics and Sports.ppt VIP
- 中药二【中成药口诀1】.pdf VIP
- 网神SecSIS-3600安全隔离与信息交换系统管理员手册.doc VIP
- 混凝土居间协议合同协议.docx VIP
- 《燃料的燃烧》教案.docx VIP
- 勿忘国耻-吾辈自强—国家公祭日主题班会精品课件.pptx VIP
- 最新国家开放大学电大《24211学前儿童社会教育活动指导》期末终考题库及标准参考答案 .pdf VIP
原创力文档


文档评论(0)