制作游戏辅助教材抓取网页指定内容,获取网页里图片.docxVIP

下载本文档

9
0
约3.58千字
约 11页
2018-07-24 发布于福建
举报
版权申诉

制作游戏辅助教材抓取网页指定内容,获取网页里图片.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

制作游戏辅助教材抓取网页指定内容,获取网页里图片

制作游戏辅助教材推荐：抓取网页指定内容（资料），获取网页里的图片来源：按键学院【按键精灵】? ???最近有遇到同学反馈，网页里的那些没有特征值的文本元素不知道怎么获取。以及，不知道怎么获取保存网页里出现的图片。获取网页指定文字：??目前按键支持的元素特征值有这些：? ?frame（框架）、id（唯一标识）、tag（标签）、type（类型）、txt（文本）、value（特征）、index（索引）、name（名字）? ?拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。命令名称：??HtmlGet 获取网页元素的信息命令功能：? ?获取网页元素指定属性的信息命令参数：? ?参数1：字符串型，网页元素属性类型：text、html、 outerHtml、value、??src、??href、 offset? ?参数2：字符串型，网页元素特征字符串 ? ? 例如下面的例子，按键精灵论坛搜索框，它有type、name、id这三个特征值。? ? 我们取它id特征值带入到HtmlGet 命令来查看下结果：Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt成功获取到了搜索框的value值。我们现在想要取下面红色区域块的帖子标题，想要把一个页面中的这些帖子名称都取出来。该怎么办？ ?? ? ? 这些文字，都没有特征值的。我们不能使用特征值的方式去找他们。 ??? ?? ? 我们可以这样——??获取到整个网页的文本之后，去找我们要取的标题，前后不变的字符。? ?大家会发现，这个页面中，帖子标题前后不便的字符是：“]“ 和 “果果。。“ 那我们就将”]“字符前面的文本都过滤掉，“果果。。“后面的文本也过率掉，这样就能得到我们所需要的文本。首先，我们需要复习下几个函数：InStr函数描述start可选的。规定每次搜索的起始位置。默认是搜索起始位置是第一个字符。如果已规定 compare 参数，则必须有此参数。string1必需的。需要被搜索的字符串。string2必需的。需搜索的字符串。compare必需的。规定要使用的字符串比较类型。默认是 0 。可采用下列值：? ? ? ?? ?0= vbBinaryCompare - 执行二进制比较。 1 = vbTextCompare - 执行文本比较。? ?Mid函数描述string必需的。从其中返回字符的字符串表达式。如果字符串包含 Null，则返回 Null。start必需的。规定起始位置。如果设置为大于字符串中的字符数目，则返回空字符串()。length可选的。要返回的字符数目。如果省略或 length 超过文本的字符数，将返回字符串中从 start 到字符串结??束的所有字符。Len函数描述string任意有效的字符串表达式。如果 string 参数包含Null，则返回 Null。varname任意有效的变量名。如果 varname参数包含 Null，则返回 Null。脚本过程：1.? ???先打开一个要提取信息的网站。2.? ???用??HtmlGet 命令获取整个网页的文本信息，存到Txt变量里面3.? ???过滤]符号前面的文本??4.? ???从文本里的]符号后面的位置开始取字符串，这里取了一百个字符放到命名为cc的变量里。如下图，也可以设置取80个字符，60个字符，但是长度一定要把“果果。。” 给截进来，因为后面我们要通过“果果。。”作为基准，去过滤掉不要的文字。2014-9-12 19:22 上传下载附件(65.96 KB)5.? ???在cc变量里，找果果。。出现的位置，找到之后，截取“果果。。”之前的文本，也就是我们需要接取的地方。6.? ???最后，设置叠加的变量x，把每次找到的] 这个符号的位置放到变量x里进行累加，累加之后第二次循环，就会跳过之前找过的内容，进行新的内容的寻找。源码：Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站Delay 1000 // 如果网页打开速度慢，可适当添加延迟Txt =Plugin.Web.HtmlGet(text,)??//获取网页的文本 x=1Do? ? aa = ]??//过滤]符号前面的文本? ? bb = InStr(x, Txt, aa) // 返回aa变量里的[这个字符在整个网页文本txt里的位置? ? cc = Mid(Txt, bb + Len(aa), 100)//