网站大量收购独家精品文档,联系QQ:2885784924

《正文标志教程续2.docVIP

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
《正文标志教程续2

正文标志教程续2 一、释义:什么是正文标识? 当我们通过软件从网页上获取有关信息(统称正文)时,我们一方面要提取有用的信息,另一方面则需要屏蔽、过滤掉无用的或干扰的信息。这就需要我们事先告诉软件,我们要提取的信息,从哪里开始提取,到哪里结束,即进行有关提取正文的设置。 在进行提取正文设置的过程中,我们通过软件提供的对话窗口填入的有关字符,就叫做正文标志。 二、获得正文标识的方法 1、源码法:我们需要提取的正文以及正文标识都包含在网页的源代码文件中。所以,从网页的源文件中寻找正文标识,不仅是可行的,也是最基本、最可靠的。我在《正文标志教程续1》中所介绍的正是这种方法。 2、页面法:在我们实际见到的网页中也包含有提取正文所需的正文标识,所以我们也可以从网页中直接查找我们所需要的正文标志。 3、混合法:以上两种方法,在实际操作时各有利弊。源码法相对来说比较抽象,不太利于新手操作。但源码法却是最基本、最可靠的制作正文标志的方法。页面法的优点是形象、直观,所见即所得;不足之处就是,并非所有的的字符都可以在页面上显示出来的,因此,当我们利用页面法制作正文标志时,有时会发现找不到我们所需的标志字符(这种情况一般在查找分卷标志时比较常见)!这时,我们又不得不使用源码法。如果你一开始使用的是页面法,那么,两种方法混用有时是不可避免的。 三、页面法制作小说下载阅读器正文标志示例 开始练习制作正文标志时,最好是在小说网站中挑选一部作者、简介、封面图片和分卷名都齐全的小说。在这里,我选择一个可能大家都没有正文标志的网站——第一书库(/),这样,大家就不用删除已有的正文标志了。 第一步:打开该网站首页,如图一。 PS:为了不至于在制作过程中不断在各个窗口跳转,建议大家选用Maxthon或GreenBrowser浏览器。 图一 第二步:依次打开你所选的小说简介页、目录页和某一章的阅读页。 第三步:在目录页中任意位置点右键,在弹出的菜单里点选“使用华之城小说下载”,让小说下载阅读器下载几章后停止下载。 这时你会看到如图二的情况。 点击打开已经下载的其中一章,你会看到图三的情况。 点击左侧小说列表中的《星辰变》,你会看到图四的情况 图二 图三 图四 第四步:点击“小说属性”,打开小说属性对话窗口(如图五),准备填写有关的正文标志项目。 第五步:回到浏览器中查找相关的正文标志字符,把找到的标志字符复制、粘贴或手工输入小说属性窗口中的相应栏目里。(如图八、九、十、十一、十二、十三所示。) PS:1、填完“目录开始标志”、“目录结束标志”、“章节开始标志”和“章节结束标志”之后,要先点击“存为设定标志”按钮,然后再点击“正文标志管理”按钮进入图六的界面,接着点击“修改”按钮打开如图七的对话窗口填写其他正文标识。 2、至于“分卷开始标志”和“分卷结束标志”,由于软件能自动识别并获取这部小说的分卷名,所以不用填。噢?你说你想填?很遗憾,你填不了的,因为页面上并没有分卷名的标志字符。如果你非要填写不可,那只好打开目录页的源文件,从源文件里找分卷名的标志字符了。 一般而言,利用页面法寻找正文标志时,无法在页面上找到分卷名的标志字符的,通常都要用“源码法”来确定分卷的正文标志。这是用页面法制作正文标志的一大缺陷。 3、从页面上获取章节开始和结束标志字符应把握的原则是: ①取离文章开头和结尾最近的字符。 ②不要取那些文字广告上的字符,因为网站的广告可能经常变换的 4、从页面上获取目录开始和结束标志字符应把握的原则是: ①、目录开始标志字符,不一定要取那些距离目录列表最近的字符,但一定不要取小说名作为标志字符,因为这不具有普遍性。所以,本例中你也可以试试取我标出的字符以外的字符作为目录开始标志字符试验一下。 ②目录结束标志字符有就取,如果目录列表后面没有字符了,窗口中的这一栏可以留空。 图五 图六 5、提取简介链接的基本原则: ①一般是从“返回书页”等类似的文字链接处提取,提取是一般是提取文字而不要提取链接分隔符“|”。 ②如果页面的左上角有诸如:“首页星辰变介绍星辰变目录 第七步:如果有什么问题,在换一下其他的标志字符试一试,直到满意为止。另换同一网站第其他小说下载在检验一下,有什么问题再作调整。 图七 图八 图九 图十 图十一 图十二 图十三 小结:页面法制作正文标识,虽然具有形象、直观和易于接受、易于操作等好处,但不足之处也实现而易见的。其一,分卷名的标志不好找。其二,有些网站为了保护自己的利益,常常在网页中设置“防采集码”或“干扰码”,当我们

文档评论(0)

wangz118 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档