- 1、本文档共6页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基於网磷式法则之即畴勤悲需求比封
搜寻系统
Associationrule-Based
Immediately
Demand Search
MatchingSystem
徐被励木到速横料
台北师鲍单院教育傅播舆科技研究所E.mail:liu@tea.ntptc.edu.tw
面封浩瀚燕垠的桶路早留资源,我们不再搪心资讯的匮乏,相封的是如何自遇多的资源喾中
找出自己真正需要的资飙。然而现存的搜寻引擎,我们骚现有不少缺黠,因此本篇输文我们
提出使用资料挖掘中的网聊式法则即睛勤憋改造结果文件的排序,根撼迥去嫁上使用者的使
用就鲦,累稹艨上相同查鞫目的的使用者的搜寻就鲦,耀遇脚辫式演算之後做羯以後再有使
用者有相同查韵目的畴袷予搜寻路径建菇,逭檬一束,便可以解泱单子在资料搜寻上遭遇的
挫折,增加单留效率。我们依撩後东使用者的搜寻取向,改造结果文件的排列,有刖於以文
件本身的合道度稳排序的各演算法。
嗣键词:搜寻引擎明磷式法刖瓷料椴索
1简介
1.1前言
桶路单留突破了畴同、空同的藩蘸,资讯的掌握燕速佛界,蘸人享受不出朗能知天下事。透通搁路
擘留新知、接蠲世界胍勤,提舁自我。其中搜尊引擎是使用者最常使用的服耪之一,透遇逭檬的晕留工
具,鬻助使用者快速找出想獾得的资料,整合舆查淘翮有阴桶站,蘸使用者在桶路服捞中如虎添翼,快
速逋桔到目的桶站,在浩瀚的搁路世界中獯得瓷飙。
以下内容12是有嗣我们研究的勤横舆背景,在2.1中介招现存搜寻引擎的獯颊,2.2介绍资料挖掘
中的嗣聪式法刖,也是我们的方法之一,在3.1中介轺我们的研究方法,演算遇程,舆系统的使用介面,
最後在4是结输舆提出未柬骚展建蘸。
1.2研究勤横舆背景
以www柬就,根撼Netcraftwww
年,搁路上的桶页剐超遇10德倜搁页以上。www成稳一侗浩瀚羝涯、摊乱燕章的资讯储存库,有大量
重叠重覆的资飙;我们不再搪心瓷飙的不足舆匮乏,相封的是如何自遇多的瓷源宫中找出自己真正需要
的资飙。
雕然市埸上已趣充斥不少商紫搜寻引擎;的碓稳徒事搁路榆索的资飙需求者迪畴提供煽助,但是每
常我们下一佃查韵翮,我们畲鼗现所耀列出柬的桶址分成敷佃页面且不下上百佃遵结,而那袋簟绸页畲
是我们所需要的呢?值管搁路上有上僮肇的资飙,如果浸辨法骚现自己所需要的资飙,将是徒蒡羝功,
燕形之中增加孕生在资料搜寻上的困蘼,降低争留效率。
如何溅少不必要的文件,使搜寻更趣於合道,蘸结果文件的排序更符合需求,是我们系统的目檩。
根撩h小蝶(1990)研究骚现台湾地匾的捆路榆索有f少敦榱索嗣藁估有多敦使用频率J现象,在23蓠
簟榱索翮檗中,桧索频率超遇20次以上的懂估缒翮橐敷的4.33%,但谷口估榆索德次敷的74.89%,而榆
160
似的研究鞭告,指出榆索频率低於3次者高逵86.4%,因此,我们可以看出特剧的艨上使用者榆索行南
概沉。既然遣檬,如果我们能善加利用每佃综上使用者的搜寻靛缘,累稹有用的就镣,就像透迥舞限屠
人工的通滤横制般,把累稹的鑫己绿,壤後束的使用者享用,那磨後束的使用者将使用到燕数人通漶後的
资飙,自己也可前省静多畴同;将使搜寻服耪更臻完美。
因此,本篇谕文提出使用嗣骄式法则即畴勤憋改造结果文件的排序,我们相信:文件本身是固定的,
但是是否道合使用者,刖必须由使用者泱定之。
2文献探甜
2.1搜寻引擎的覆颓
(1)人工分频式搜寻引擎:提供分叛式目鲧,将所有搁页分朗别颊在各主题下,蘸使用者在不知如何下
查嗣嗣畴建结各主题造行分颧查询,像是:Yahoo,Sina,PC
嗣路管理者建立分叛目鲧,再由管理者或是搁站提供者自行登镣捆站主题,给予一些桶站筒介,供日後使
用者查韵。造棣的分颊模式较耗峙黄力,但可以得到鞍佳的分颧品耍。
(2)查莉嗣搜寻引擎:主要透遇Robot软髓攒器人到绸路上去探索绸页,定峙更新舆抓取新的桶百,再
等,遣檬的分颊快速、成本低,但是分颓的品簧御参差不齑。
Search
(3)匿缒式搜寻引擎(MataEngine):透通前雨獯搜寻引擎的軎f助而逵到搜寻目的,可以将使用
者的查韵嗣同峙派送给多佃搜寻引擎,透遇内部的演算法则将文件重新合饼排序,呈现单一介面给使用者,
您可能关注的文档
- 基于GIS技术的道路交通安全评价系统设计.pdf
- 基于HMM的大型旋转机械故障诊断方法的研究.pdf
- 基于Hoek-Brown准则的破裂围岩应力分析.pdf
- 基于Hopfild网络的板形预测控制模型.pdf
- 基于HPLC技术的代谢组学方法发现S180与H22小鼠肿瘤标记物研究.pdf
- 基于ITIL的运行维护管理平台设计的思考.pdf
- 基于ITIL的浙烟商业IT服务管理探讨.pdf
- 基于IT构架统一下的企业信息资源知识管理.pdf
- 基于J2EE的网络协同设计系统研究与实现.pdf
- 基于JAAS实现用户认证与授权服务.pdf
- DB43_T 3215-2025 沥青路面防水防裂黏结层设计与施工技术规范.pdf
- 人教版 三年级 语文 上册 三年级上册学习导引.pptx
- 人教版 五年级 数学 上册 第2单元《第2课时 在方格纸上用数对确定物体的位置》课件.pptx
- 第四章 §4.3 两角和与差的正弦、余弦和正切公式.docx
- 2024年和田地区社区工作者招聘真题 .pdf
- 第三章 §3.6 利用导数证明不等式.pptx
- 知名企办公区临建标准化图文并茂 .pdf
- 上海市黄浦区2024-2025学年高一下学期期末语文试题(解析版) .pdf
- 低磷胁迫下南酸枣家系筛选:磷效率评价与遗传机制 .pdf
- 2026年高考政治一轮复习:必修四《哲学与文化》知识点背诵提纲 .pdf
文档评论(0)