制作游戏辅助教材推荐:抓取网页指定内容,获取网页里的图片.docVIP

制作游戏辅助教材推荐:抓取网页指定内容,获取网页里的图片.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
制作游戏辅助教材推荐:抓取网页指定内容(资料),获取网页里的图片 来源:按键学院 【按键精灵】 ? ???最近有遇到同学反馈,网页里的那些没有特征值的文本元素不知道怎么获取。以及,不知道怎么获取保存网页里出现的图片。 获取网页指定文字:?? 目前按键支持的元素特征值有这些:? ?frame(框架) 、id(唯一标识) 、tag(标签) 、type(类型)、txt(文本) 、value(特征) 、index(索引) 、name(名字)? ?拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。 命令名称: ??HtmlGet 获取网页元素的信息 命令功能: ? ?获取网页元素指定属性的信息 命令参数: ? ?参数1:字符串型,网页元素属性类型:text、html、 outerHtml、value、??src、??href、 offset ? ?参数2:字符串型,网页元素特征字符串 ? ? 例如下面的例子,按键精灵论坛搜索框,它有type、name、id这三个特征值。 ? ? 我们取它id特征值带入到HtmlGet 命令来查看下结果: Call Plugin.Web.Bind(WQM.exe) Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站 Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt 成功获取到了搜索框的value值。 我们现在想要取下面红色区域块的帖子标题,想要把一个页面中的这些帖子名称都取出来。该怎么办? ?? ? ? 这些文字,都没有特征值的。我们不能使用特征值的方式去找他们。 ??? ? ? ? 我们可以这样——??获取到整个网页的文本之后,去找我们要取的标题,前后不变的字符。 ? ? 大家会发现,这个页面中,帖子标题前后不便的字符是:“]“ 和 “果果。。“ 那我们就将”]“字符前面的文本都过滤掉,“果果。。“后面的文本也过率掉,这样就能得到我们所需要的文本。 首先,我们需要复习下几个函数: InStr函数 描述 start 可选的。规定每次搜索的起始位置。默认是搜索起始位置是第一个字符。如果已规定 compare 参数,则必须有此参数。 string1 必需的。需要被搜索的字符串。 string2 必需的。需搜索的字符串。 compare 必需的。规定要使用的字符串比较类型。默认是 0 。可采用下列值:? ? ? ?? ?0= vbBinaryCompare - 执行二进制比较。 1 = vbTextCompare - 执行文本比较。 ? ? Mid函数 描述 string 必需的。从其中返回字符的字符串表达式。如果字符串包含 Null,则返回 Null。 start 必需的。规定起始位置。如果设置为大于字符串中的字符数目,则返回空字符串()。 length 可选的。要返回的字符数目。如果省略或 length 超过文本的字符数,将返回字符串中从 start 到字符串结??束的所有字符。 Len函数 描述 string 任意有效的字符串表达式。如果 string 参数包含Null,则返回 Null。 varname 任意有效的变量名。如果 varname 参数包含 Null,则返回 Null。 脚本过程: 1.? ???先打开一个要提取信息的网站。 2.? ???用??HtmlGet 命令 获取整个网页的文本信息,存到Txt变量里面 3.? ???过滤]符号前面的文本?? 4.? ???从文本里的]符号后面的位置开始取字符串,这里取了一百个字符放到命名为cc的变量里。如下图,也可以设置取80个字符,60个字符,但是长度一定要把“果果。。” 给截进来,因为后面我们要通过“果果。。”作为基准,去过滤掉不要的文字。 HYPERLINK /forum.php?mod=attachmentaid=MTYyMTY2fDgzNzYzYTFifDE0MTgwMjY3ODV8MjMxNDU4Mnw1NDIwODc%3Dnothumb=yes \o 1.jpg 下载次数:0 \t _blank 5.? ???在cc变量里,找果果。。出现的位置,找到之后,截取“果果。。”之前的文本,也就是我们需要接取的地方。 6.? ???最后,设置叠加的变量x,把每次找到的] 这个符号的位置放到变量x里进行累加,累加之后第二次循环,就会跳过之前找过的内容,进行新的内容的寻找。 源码: Call Plugin.Web.Bind(WQM.exe) Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站 Delay 1000 // 如果网页打开速度慢,可适当添加延

文档评论(0)

新起点 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档