制作游戏辅助教材推荐：抓取网页指定内容,获取网页里的图片.docVIP

下载本文档

48
0
约4.59千字
约 11页
2019-01-17 发布于江西
举报
版权申诉

制作游戏辅助教材推荐：抓取网页指定内容,获取网页里的图片.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

制作游戏辅助教材推荐：抓取网页指定内容（资料），获取网页里的图片来源：按键学院【按键精灵】 ? ???最近有遇到同学反馈，网页里的那些没有特征值的文本元素不知道怎么获取。以及，不知道怎么获取保存网页里出现的图片。获取网页指定文字：?? 目前按键支持的元素特征值有这些：? ?frame（框架）、id（唯一标识）、tag（标签）、type（类型）、txt（文本）、value（特征）、index（索引）、name（名字）? ?拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。命令名称： ??HtmlGet 获取网页元素的信息命令功能： ? ?获取网页元素指定属性的信息命令参数： ? ?参数1：字符串型，网页元素属性类型：text、html、 outerHtml、value、??src、??href、 offset ? ?参数2：字符串型，网页元素特征字符串 ? ? 例如下面的例子，按键精灵论坛搜索框，它有type、name、id这三个特征值。 ? ? 我们取它id特征值带入到HtmlGet 命令来查看下结果： Call Plugin.Web.Bind(WQM.exe) Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站 Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt 成功获取到了搜索框的value值。我们现在想要取下面红色区域块的帖子标题，想要把一个页面中的这些帖子名称都取出来。该怎么办？ ?? ? ? 这些文字，都没有特征值的。我们不能使用特征值的方式去找他们。 ??? ? ? ? 我们可以这样——??获取到整个网页的文本之后，去找我们要取的标题，前后不变的字符。 ? ? 大家会发现，这个页面中，帖子标题前后不便的字符是：“]“ 和 “果果。。“ 那我们就将”]“字符前面的文本都过滤掉，“果果。。“后面的文本也过率掉，这样就能得到我们所需要的文本。首先，我们需要复习下几个函数： InStr函数描述 start 可选的。规定每次搜索的起始位置。默认是搜索起始位置是第一个字符。如果已规定 compare 参数，则必须有此参数。 string1 必需的。需要被搜索的字符串。 string2 必需的。需搜索的字符串。 compare 必需的。规定要使用的字符串比较类型。默认是 0 。可采用下列值：? ? ? ?? ?0= vbBinaryCompare - 执行二进制比较。 1 = vbTextCompare - 执行文本比较。 ? ? Mid函数描述 string 必需的。从其中返回字符的字符串表达式。如果字符串包含 Null，则返回 Null。 start 必需的。规定起始位置。如果设置为大于字符串中的字符数目，则返回空字符串()。 length 可选的。要返回的字符数目。如果省略或 length 超过文本的字符数，将返回字符串中从 start 到字符串结??束的所有字符。 Len函数描述 string 任意有效的字符串表达式。如果 string 参数包含Null，则返回 Null。 varname 任意有效的变量名。如果 varname 参数包含 Null，则返回 Null。脚本过程： 1.? ???先打开一个要提取信息的网站。 2.? ???用??HtmlGet 命令获取整个网页的文本信息，存到Txt变量里面 3.? ???过滤]符号前面的文本?? 4.? ???从文本里的]符号后面的位置开始取字符串，这里取了一百个字符放到命名为cc的变量里。如下图，也可以设置取80个字符，60个字符，但是长度一定要把“果果。。” 给截进来，因为后面我们要通过“果果。。”作为基准，去过滤掉不要的文字。 HYPERLINK /forum.php?mod=attachmentaid=MTYyMTY2fDgzNzYzYTFifDE0MTgwMjY3ODV8MjMxNDU4Mnw1NDIwODc%3Dnothumb=yes \o 1.jpg 下载次数:0 \t _blank 5.? ???在cc变量里，找果果。。出现的位置，找到之后，截取“果果。。”之前的文本，也就是我们需要接取的地方。 6.? ???最后，设置叠加的变量x，把每次找到的] 这个符号的位置放到变量x里进行累加，累加之后第二次循环，就会跳过之前找过的内容，进行新的内容的寻找。源码： Call Plugin.Web.Bind(WQM.exe) Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站 Delay 1000 // 如果网页打开速度慢，可适当添加延