- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
第24卷 第9期 重 庆 理 工 大 学 学报 (自然科学) 2010年 9月
Vo1.24 No.9 JournalofChongqingUniversityofTechnology(NaturalScience) Sep.2010
搜索引擎用户接 口设计
何友全 ,徐小乐 ,徐 澄 ,栾红玉 ,唐华姣
(重庆交通大学 a.信息科学与工程学院;b.管理学院,重庆 400074)
摘 要:介绍了搜索引擎中用户界面的实现技术,包括抓取网页、索引和检索。在此基础
上,应用ajax技术实现用户接15的设计,利用Lucene技术,在建立好的索引库 中检索出用户感
兴趣 的网页,并给 出设计过程中部分关键代码。
关 键 词:搜索引擎;中文分词技术;Lucene;用户界面;Ajax技术
中图分类号:TP393 文献标识码 :A 文章编号:1674—8425(2010)09—0063—06
DesignofSearch Engine’SUserInterface
HEYou—quan ,XUXiao—le,XUCheng,LUANHong—yu,TANGHua-jiao
(a.IntbmlationScienceEngineeringDepartment;b.DepartmentofManagement,
ChongqingJiaotongUniversity,Chongqing400074,China)
Abstract:Search engine’Suserinterface technology includinggrabbingweb pages,indexingand
searchingisintroducedinthispaper.Then,userinterfacedesignisrealizedbyAjaxtechnology,and
thewebpagesinterestingforusersaresearchedinanestablishedindexwarehousebyLucenetechnol—
ogy.Thepaperalsopublishespansofkeycodesofthedesign.
Keywords:SearchEngine;ChineseWordSegmentation,;lucene;UserInterface;AjaxTechnology
由于互联 网信息量 的剧增 ,人们挖掘 出 自己 联接和分类,逐步找到 自己所需的信息;③ 直接通
感兴趣的信息的难度逐渐增大 。目前,人们从网 过url,打开需要浏览的网站,来查找感兴趣的信
上获取信息主要有3种方式:① 利用搜索引擎,输 息 ]。这 3种获取信息的方式各有优缺点。搜索
入关键词来挖掘 自己感兴趣的内容 ,比如以yahoo 引擎的出现,对网民获取信息做出了巨大的贡献。
为代表的第一代搜索引擎到现在 比较热 门的百 资料显示,几乎每个网民都会使用到搜索引擎。
度,google等;② 到某知名门户网站,通过其相关 当我们在搜索引擎 中输入待查询词后,在几秒钟
收稿 日期 :2010—05一l8
基金项 目:重庆市科委攻关项 目(CSTC,2010AC6074);重庆交通大学研究生教育创新基金资助项 目;重庆交通大学
实验教学改革与研究基金资助项 目(SYJ200922)
作者简介:何友全 (1964一),男,重庆人,博士,教授 ,主要从事信息处理、数据挖掘研究。
重 庆 理 工 大 学 学报
内就会获得大量的数据 ,其工作原理为:首先网络
爬虫(比如网络蜘蛛 crawler,spider)从网上抓取大 1 搜索引擎的实现技术
量的网页;其次搜索引擎抓到网页后,做大量的预
处理工作,然后提供检索服务,比如提取关键词、
文档评论(0)