- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
制作游戏辅助教材抓取网页指定内容,获取网页里图片
制作游戏辅助教材推荐:抓取网页指定内容(资料),获取网页里的图片来源:按键学院 【按键精灵】? ???最近有遇到同学反馈,网页里的那些没有特征值的文本元素不知道怎么获取。以及,不知道怎么获取保存网页里出现的图片。获取网页指定文字:??目前按键支持的元素特征值有这些:? ?frame(框架) 、id(唯一标识) 、tag(标签) 、type(类型)、txt(文本) 、value(特征) 、index(索引) 、name(名字)? ?拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。命令名称:??HtmlGet 获取网页元素的信息命令功能:? ?获取网页元素指定属性的信息命令参数:? ?参数1:字符串型,网页元素属性类型:text、html、 outerHtml、value、??src、??href、 offset? ?参数2:字符串型,网页元素特征字符串 ? ? 例如下面的例子,按键精灵论坛搜索框,它有type、name、id这三个特征值。? ? 我们取它id特征值带入到HtmlGet 命令来查看下结果:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站Txt=Plugin.Web.HtmlGet(value,id:scbar_txt) TracePrint Txt成功获取到了搜索框的value值。我们现在想要取下面红色区域块的帖子标题,想要把一个页面中的这些帖子名称都取出来。该怎么办? ?? ? ? 这些文字,都没有特征值的。我们不能使用特征值的方式去找他们。 ??? ?? ? 我们可以这样——??获取到整个网页的文本之后,去找我们要取的标题,前后不变的字符。? ?大家会发现,这个页面中,帖子标题前后不便的字符是:“]“ 和 “果果。。“ 那我们就将”]“字符前面的文本都过滤掉,“果果。。“后面的文本也过率掉,这样就能得到我们所需要的文本。首先,我们需要复习下几个函数:InStr函数描述start可选的。规定每次搜索的起始位置。默认是搜索起始位置是第一个字符。如果已规定 compare 参数,则必须有此参数。string1必需的。需要被搜索的字符串。string2必需的。需搜索的字符串。compare必需的。规定要使用的字符串比较类型。默认是 0 。可采用下列值:? ? ? ?? ?0= vbBinaryCompare - 执行二进制比较。 1 = vbTextCompare - 执行文本比较。? ?Mid函数描述string必需的。从其中返回字符的字符串表达式。如果字符串包含 Null,则返回 Null。start必需的。规定起始位置。如果设置为大于字符串中的字符数目,则返回空字符串()。length可选的。要返回的字符数目。如果省略或 length 超过文本的字符数,将返回字符串中从 start 到字符串结??束的所有字符。Len函数描述string任意有效的字符串表达式。如果 string 参数包含Null,则返回 Null。varname任意有效的变量名。如果 varname参数包含 Null,则返回 Null。脚本过程:1.? ???先打开一个要提取信息的网站。2.? ???用??HtmlGet 命令 获取整个网页的文本信息,存到Txt变量里面3.? ???过滤]符号前面的文本??4.? ???从文本里的]符号后面的位置开始取字符串,这里取了一百个字符放到命名为cc的变量里。如下图,也可以设置取80个字符,60个字符,但是长度一定要把“果果。。” 给截进来,因为后面我们要通过“果果。。”作为基准,去过滤掉不要的文字。2014-9-12 19:22 上传下载附件(65.96 KB)5.? ???在cc变量里,找果果。。出现的位置,找到之后,截取“果果。。”之前的文本,也就是我们需要接取的地方。6.? ???最后,设置叠加的变量x,把每次找到的] 这个符号的位置放到变量x里进行累加,累加之后第二次循环,就会跳过之前找过的内容,进行新的内容的寻找。源码:Call Plugin.Web.Bind(WQM.exe)Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站Delay 1000 // 如果网页打开速度慢,可适当添加延迟Txt =Plugin.Web.HtmlGet(text,)??//获取网页的文本 x=1Do? ? aa = ]??//过滤]符号前面的文本? ? bb = InStr(x, Txt, aa) // 返回aa变量里的[这个字符 在整个网页文本txt里的位置? ? cc = Mid(Txt, bb + Len(aa), 100)//
文档评论(0)