采集器VIP1.0手册.docVIP

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
采集器VIP1.0手册

安装要求 配置插件 添加采集规则 计划任务 同义词管理 本插件适用于php 5.x版本。 本插件要求开启allow_url_fopen功能。如果没有打开可以要求你空间的售后进行权限的开放。查看方法,下载附件phpinfo.php,上传至你的空间,不限目录,访问此文件,搜索“allow_url_fopen”,如果是On表示已经启用,如果是Off,就是关闭了。 独立服务器或vps可以自行打开方法如下: 在php安装目录找到Php.ini文件,寻找allow_url_fopen,把off改为on。 allow_url_fopen = On 配置插件 进入插件文件夹,打开config_robot.php文件。如下: $robot_set[allow_uid] = 1,3;// @robot_set[allow_uid] = 1,2,3; 允许哪些用户使用这个插件 $robot_set[robot_perpage] = 5;//list robots number perpage 界面设置:采集器列表一页显示多个采集器 $robot_set[message_perpage] = 5;//list messages number perpage 文件列表一页显示多少个文件 $robot_set[thread_credittype] = extcredits2;//发表主题添加的积分项 $robot_set[thread_creditadd] = 4;//发表主题添加的积分数 $robot_set[post_credittype] = extcredits2;//发表回复增加的积分项 $robot_set[post_creditadd] = 2;//发表回复增加的积分数 $robot_set[views_addnum] = rand(10,50);//主题的浏览数设置 $robot_set[urlallowmon_num] = 50; //为0,为不限制,检测历史文章url个数,按域名分类,并根据采集时间的降序检测,大大节约资源的占用。 $robot_set[subjectallowrepeat_num] = 100; //为0,为不限制,检测历史标题个数,按域名分类,并根据采集时间的降序检测,防止访问数据库超时。 $robot_set[repeatolog_keepday] = 3; //为0,为不限制,标题及URL记录保存天数。用于计划任务,其实过多的记录作用也不大。 首次安装的请把config_robot.php配置好.已经安装过的,覆盖后在后台插件升级.[导][图][重] 同义词库管理界面: 可以临时新增一组词,也可以用文本的方式批量导入。 同义词库4180组:/thread-28-1-1.html 也可以自行编写同义词库文本。 单向默认用“→” 双向默认用“=”。 一行一组词。如: 爱护=保护 安顿→安排 安全=平安 安适=安闲 安慰=抚慰 要求文本编码为ANSI,这也是记事本默认的编码。 图片是否加水印:这里将取代站点的水印开关设置,但具体水印设置按后台的水印设置。所以还是先要设置好站点后台的水印设置。 替换同义词:这里是设置是否使用同义词库自动替换同义词,替换范围包括标题和内容。对于纯图片的文章就没必要开启了。支持单向和双向替换,举个例子。 供给-供应(单向):文章中如果有“供给”这词就替换为“供给”,但如果是“供应”这词则不会替换为“供给”。 整洁-整齐(双向):文章中有“整洁”就会替换“整齐”,有“整齐”就会替换成“整洁”。 具体同义词库管理看后面的章节。 预定义发布时间:若这里设置了时间,则发布时间为设置时间,若留空,则时间为采集当前时间。 列表页面采集设置 根据自己的需要来进行相关内容的确定,这里以新闻中心为例。点击进入 内容非常的丰富,也分很多类别,确定自己要采集的类别。现在我的要找的是一个文章列表,目光焦点通常放到“更多”2个字上面。这里很明显不合用,继续查看,先找到要的猎物。 发现目标,这里选择国内新闻为例。点击国内进入。 同样类别非常的多,当然可以采集中间这个列表,但为了教程更通用,下面选择比较常见的列表形式。这里选择时政要闻。 点击进入。 非常好,很直观的列表。这里就找到了要用的列表地址: /newsgn/zhxw/shizhengxinwen.htm 继续观察列表的URL地址规律。 /newsgn/zhxw/shizhengxinwen_2.htm /newsgn/zhxw/shizhengxinwen_3.htm 。。。 规律很明显。 /newsgn/zhxw/shizhengxinwen_[page].htm 下面再测试一下首页是否也符合这个规律。根据规律写出地址: /newsg

文档评论(0)

xcs88858 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8130065136000003

1亿VIP精品文档

相关文档