- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络蜘蛛需求说明
院 系:计算机学院计算机
实验课程:软件工程案例教程
实验项目:小型网络蜘蛛
指导老师:王涛
开课时间:2011~2012 年度第 二 学期
专 业:软件工程
班 级:09级09班
姓 名 :王建竣
学 号 :20092100004
华南师范大学教务
目录
1 引言 1
1.1 编写目的 1
1.2 范围 1
1.3 定义 1
1.4 参考资料 1
2 项目概述 2
2.1 产品描述 2
2.2 产品功能 2
2.3 用户特点 2
2.4 一般约束 2
3 具体需求 3
3.1 功能需求 3
3.1.1 开始下载网页并且搜索网页中的所有链接 3
3.1.2 按照给定个关键字过滤搜索到的网页 3
3.1.3 暂停网络爬虫的工作 4
3.1.4 停止网络爬虫的工作 4
3.1.5 对网络爬虫软件进行设置 4
3.1.6 退出软件 5
3.2 设计约束 5
1 引言
1.1 编写目的
本软件需求说明书的目的是定义出清晰的需求,方便编码人员设计出符合规范的软件作品.预期的读者是软件开发人员和软件测试人员
1.2 范围
A 待开发的软件系统的名称;小型网络蜘蛛
B 作用
网络蜘蛛是网络蜘蛛就是一个爬行程序,一个抓取网页的程序 通过网页的链接地址来寻找网页从网站某一个页面(通常是首页)开始,读取网页的内容,找到在网页中的其它链接地址,然后通过这些链接地址寻找下一个网页,这样一直循环下去,直到把这个网 站所有的网页都抓取完为止。如果把整个互联网当成一个网站,那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。.3 定义
链接:链接也称超级链接,是指从一个网页指向一个目标的连接关系,所指向的目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是图片、电子邮件地址、文件、甚至是应用程序。 网络标签(Tag)是一种互联网内容组织方式,是相关性很强的关键字,它帮助人们轻松的描述和分类内容,以便于检索和分享,Tag已经成为web 2.0的重要元素。.4 参考资料
要用到的参考资料:
自己动手写网络爬虫;
MFC十年经典
2 项目概述
2.1 产品描述
软件的开发意图是构造出一个实现了网络爬虫功能基本功能的软件。本软件是一个独立的小型软件,不需要与其他软件或者接口交互工作。
2.2 产品功能
2.3 用户特点
用户需要具备一定的程序设计知识和计算机基础知识,基本的逻辑思维和阅读能力。
2.4 一般约束
实用C++ 和 MFC框架进行开发
3 具体需求
3.1 功能需求
3.1.1 开始下载网页并且搜索网页中的所有链接
引言
输入起始网页,能够抓取网页中的所有链接,并把链接保存在工作链表中。根据起始网页搜索到所有链接是网络爬虫最基本的功能。
输入
起始网页
加工
检查网页的合法性
下载网页
遍历网页,找出所有的链接
把链接保存在工作链表
递归调用
输出
下载的网页
3.1.2 按照给定个关键字过滤搜索到的网页
引言
用关键字过滤掉不需要的网页,增加网络爬虫的有效抓取
输入
关键字
加工
根据关键字匹配抓取到的域名
抛弃不需要的域名
输出
保存域名中不含关键字的网页
3.1.3 暂停网络爬虫的工作
引言
暂时停止网络爬虫软件的工作
输入
消息
加工
暂停网络爬虫抓取网页的线程
输出
无
3.1.4 停止网络爬虫的工作
引言
完全停止网络爬虫软件的工作
输入
消息
加工
停止网络爬虫抓取网页的线程
输出
无
3.1.5 对网络爬虫软件进行设置
引言
设置软件的参数,如开机启动,最小化到托盘.
输入
参数
加工
根据参数安排软件的工作
输出
无
3.1.6 退出软件
3.2 设计约束
在PC/windows平台下工作
软件需求说明书编写规范
软件需求说明书编写规范
第 5 页
文档评论(0)