火车采集器采集说明.doc

下载文档 降价啦

5
0
约小于1千字
约 7页
2016-08-24 发布于河南
举报
版权申诉
保障服务

火车采集器采集说明.doc

1、本文档共7页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。

火车采集器采集说明

1 首先，如果你的电脑没有Microsoft_DotNetFXCHS这个软件，先安装文件夹里，然后打开 2、打开软件，进入采集页面 3 、在站点任务列表空白处右击“新建站点”，进入任务栏，站点名随便写，其他的不用填，点确定就可以了 4 、单击选中站点，右击“从该站点新建任务”，进入任务栏，如任务名“优美散文” 单击“向导添加”，进入采集地址地址栏，从采集页面第二页，网址复制，可能图看不清，网址/sanwen/youmei/list_2.html，记住把数字标记为同样，选中数字，然后点（*），变成/sanwen/youmei/list_(*).html，如果想采集多的数字变化从1到你采集的页面，然后点击“添加”按钮，出现这个页面，点击完成就可以了。 7、在输入随便一篇采集文章的网址，选中数字，点击（*）按钮，变成这个页面的需要文章列表源代码，右击选择产看“网页源代码” 最重要的，代码不能出错，再次强调文章列表的源代码，进入到源代码，找到文章列表开始处的靠近的源代码，如选中一段代码，复制，然后按Ctrl+f键，输入框粘贴，看选中的源代码是否是第1条，记住，所选源代码必须是第一条（我用的是谷歌浏览器，显示的是0，其他的浏览器只要是第一条即可），确定所选是第一条源代码，就输入，结束代码和开始代码一样，文章列表结束处找代码上述第一步，结束之后，第二步采集内容规则所选标签随自己选择，不需要的可以删。单击打开“内容”标签，随便打开文章页，右击“查看源代码”，和上述文章列表开始和结束的源代码一样，必须是第一条自定义数据里面除了段落、换行br、换行Tab\r\n\t三个不要，如图，单击确定。单击第三步：发布内容设置在方式二：保存为本地文件，启用前打钩，保存格式为.Txt，保存位置自定义，保存位置设置好以后，单击保存按钮打开站点，选中任务，右击开始任务采集，这样就可以了。