- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
最新杰奇详细采集规则编写教程
杰奇详细采集规则编写教程
规则说明
系统默认变量:{articleid} - 文章序号,{chapterid} - 章节序号, {subarticleid} - 文章子序号, {subchapterid} - 章节子序号。
系统标签 * 可以替代任意字符串。
系统标签 ! 可以替代除了和以外的任意字符串。
系统标签 ~ 可以替代除了以外的任意字符串。
系统标签 ^ 可以替代除了数字和之外字符串。
系统标签 $ 可以替代数字字符串。
采集规则中,需要获取的内容部分用四个以上系统标签代替,如 !!!!
我的书屋
基本设置
网站标识configs\article\collectsite.php中所添写的标识,可随便填写,一般为所采集站点的域名简写,以和其他规则区分。例:book234
网站名称所采集站的名称。例:我的书屋
网站地址所采集站的地址。例:
文章子序号运算方式不是必须添写的,我这里就留空了。
支持使用{articleid}标记的四则运算(+加,-减,*乘,/除,%取余)
章节子序号运算方式不是必须添写的,我这里就留空了。(谁知道他一个文件夹放多少书啊,他不按规则放,我不是采集不到 )
支持使用{articleid}标记的四则运算(+加,-减,*乘,/除,%取余)
代理服务器地址 不使用代理服务器请留空
代理服务器端口
现有章节无法对应时候是否全部清空重新采集 是 否 根据自己需要选择
是否默认把采集到的文章设置为全本 是 否 根据自己需要选择,如果选择是无论文章是连载还是完结,你站上都显示全本,建议选“否”
发送HTTP_REFERER标志,用于突破防采集设置 是 否 默认选“是”,不知道什么用,我选“是”先突破下再说
对方网页编码 (自动检测 GB2312 UTF8 BIG5)默认“自动检测” 编码与本站不同将自动尝试转换
文章信息页面采集规则
文章信息页面地址书籍信息页网址,书籍ID用{articleid}代替。例:
/Book/{articleid}/Index.html
文章标题采集规则要求会查看网页的源文件啊 ,不会的可以停止了 .查看下信息页面的源文件,然后找到文章标题在源文件的什么位置(我们是以我的书屋为例的,就是章节信息页面那个《文章标题》在源文
件的位置).这里以《我的美女大小姐》这个为例,找到标题附近的代码是div id=CrBookTitlespan class=booktitle《我的美女大小姐》/span/div把上面代码复制到文章标题采集规则的那
个框里,然后把我的美女大小姐这个真实的标题替换为!!!!当然也可以替换成其他的替换符号比如****不过讲究的是在能表达意思的情况下范围越小越好(习惯问题,这里当然只能采集到文章标题了,但
是其他的一些采集的时候就有你不想要的东西).
作者采集规则li class=l6a href=/Author/WB/144238.html李兴禹/a/li这里的李兴禹是要采集的内容,用!!!!代替不过144238只对这个文章有用,其他文章有其他的数字,所以用任意数字串$代替.所以作者采集规则就是li class=l6a href=/Author/WB/$.html!!!!/a/li
文章类型采集规则 li class=l2a href=/Book/LN/133.html都市/a/li由上面两个采集规则的写法不难看出这里的规则是 li class=l2a href=/Book/LN/$.html!!!!/a/li
文章类型对应关系这个就自己写吧,呵呵,给出我的书屋的对应关系,大家参考下.玄幻=1||奇幻=1||武侠=2||仙侠=2||言情=3||都市=3||科幻=7||灵异=8||游戏=6||竞技=6||历史=4||军事=4||美文=10||同人=9||传记=10||名著=10||札记=10||笑话=10||外国=10||古典=10||少儿=10||侦探=5||经管=10||时尚=10||英语=10||电脑=10||学习=10||法律=10||其它=10
对方类型名称和本站类型序号的用“=”分割,两个类型之间用“||”分割,类型名称“default”标识默认的类型对应关系
本站类型和序号对应关系如下:
玄幻魔法=1||武侠修真=2||都市言情=3||历史军事=4||侦探推理=5||网游动漫=6||科幻小说=7||恐怖灵异=8||散文诗词=9||其他类型=10
关键字采集规则 找到关键字附近的代码主角检索关键字 —— 我的美女 李兴禹 美女 都市 br /这里的我的美女 李兴禹 美女 都市用****代替.结果规则是主角检索关键字 ——****br /
内容简介采集规则div id=CrbsSum ‘大‘小姐和大‘小‘姐,你们别折腾我了行不?我求你们了~~!
您可能关注的文档
最近下载
- 津津有味·读经典Level3《金银岛》译文和答案.docx
- SHT3503-2017石油化工建设工程项目交工技术文件规定.pdf VIP
- 九年级下学期班主任工作总结_九年级下学期的班主任工作总结范文.docx VIP
- 九年级下学期班主任工作计划--班主任工作计划.docx VIP
- 九年级班主任上学期工作计划 九年级上学期班主任学期工作计划(通用6篇).docx VIP
- 九年级上学期班主任工作总结.docx VIP
- 八年级下学期班主任工作总结-班主任工作总结.doc VIP
- 七年级上《第2章整式的加减》测试题及答案(数学试卷新课标人教版七年级上单元试题).doc VIP
- 八年级下学期班主任工作计划-班主任工作计划.doc VIP
- 班主任上学期工作计划:八年级上学期班主任工作计划.doc VIP
原创力文档


文档评论(0)