- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
手机网购垂直搜索引擎使用说明书
SRP项目使用说明书
手机网购垂直搜索引擎
指导老师:曹传东
参与人员:郭晓东
参与人员:徐渊哲
参与人员:吴 静
参与人员:纪 冲
手机网购垂直搜索引擎使用说明书
配置源程序
附加SQLServer2005数据库
将“MobileSE.rar”解压到本地文件。
打开SQL Server2005,展开“数据库”节点,点击鼠标右键选择“附加”,如图1.1所示。
图1.1
打开附加数据库窗体,单击该窗体中的“附加”按钮,打开选择附加文件对话框,选择本项目数据库地址选择MobileSE/db/se _Data.MDF文件。单击“确定”按钮。如图1.2所示。
图1.2
右击“数据库”,单击刷新,即可看见附加结果,如图1.3所示。
图1.3
将程序导入到Eclipse中,并发布运行
将“MobileSE”文件夹拷贝到Eclipse的工作空间中。如图2.1所示。
图2.1
启动Eclipse,在左侧的“Package Explorer”中,单击鼠标右键,选择“Import”菜单项,在弹出的对话框中,展开“General”节点,并选择“Existing Projects into Workspace”子节点,如图2.2所示。
图2.2
单击“Browser”,选择Eclipse工作空间下的MobileSE文件夹,单击“Finish”即可导入工程,如图2.3所示。
图2.3
右击“MobileSE”-“build path”- “configure build path”,打开jar包配置框,单击“Add jars”,添加MobileSE\WebContent\WEB-INF\lib下的jar包。如图2.4所示。单击“Ok”完成导入。
图2.4
单击菜单栏中的“windows”-“preferences”-“servers”-“runtime enviroment”,打开服务器配置对话框。单击“ADD”,添加Apache tomcat V6.0版本,单击“next”完成其余配置后单击“Finish”,如图2.5所示。单击“OK”,完成服务器配置。
图2.5
右击“MobileSE”-“run as”-“run on a server”启动服务器。在浏览器中输入地址http://localhiost:8080/MobileSE 进入搜索页面,如图2.6所示。
图2.6
在搜索框中输入关键字,如“诺基亚”,单击搜索按钮,进行搜索,结果如图2.7所示。
图2.7
(8) 单击“单击进入”进入相应网站,可以查看手机的详细信息和进行网购,如图2.8所示。
图2.8
爬虫系统使用说明
操作注意事项
本系统的后台用户名为:admin,密码为:letmein。
操作流程
启动Heritrix爬虫。在浏览器中输入http://localhost:1234,进入爬虫登陆界面。输入用户名和密码登陆到系统。如图3.1所示。
图3.1
单击“job”-“with defaults”添加一个抓取任务,如图3.2所示。
图3.2
单击“Modules“,修改”Select writer“一项,如图3.3所示。
图3.3
单击“Settings”,将“user-agent”和“from”两项修改成图3.4所示格式。
图3.4
单击“submit job”,提交任务。单击“console”,单击“start”开始抓取任务,抓取进度如图3.5所示。
图3.5
打开Heritrix工程,抓取结果保存在job文件夹下。如图3.6所示。
图3.6
文档评论(0)