- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
制作游戏辅助教材推荐:抓取网页指定内容(资料),获取网页里的图片
来源:按键学院 【按键精灵】
? ???最近有遇到同学反馈,网页里的那些没有特征值的文本元素不知道怎么获取。以及,不知道怎么获取保存网页里出现的图片。
获取网页指定文字:??
目前按键支持的元素特征值有这些:? ?frame(框架) 、id(唯一标识) 、tag(标签) 、type(类型)、txt(文本) 、value(特征) 、index(索引) 、name(名字)? ?拥有这些特征值的元素才能直接使用HtmlGet命令来获取元素文本信息。
命令名称:
??HtmlGet 获取网页元素的信息
命令功能:
? ?获取网页元素指定属性的信息
命令参数:
? ?参数1:字符串型,网页元素属性类型:text、html、 outerHtml、value、??src、??href、 offset
? ?参数2:字符串型,网页元素特征字符串
? ? 例如下面的例子,按键精灵论坛搜索框,它有type、name、id这三个特征值。
? ? 我们取它id特征值带入到HtmlGet 命令来查看下结果:
Call Plugin.Web.Bind(WQM.exe)
Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站
Txt=Plugin.Web.HtmlGet(value,id:scbar_txt)
TracePrint Txt
成功获取到了搜索框的value值。
我们现在想要取下面红色区域块的帖子标题,想要把一个页面中的这些帖子名称都取出来。该怎么办?
??
? ? 这些文字,都没有特征值的。我们不能使用特征值的方式去找他们。 ??? ?
? ? 我们可以这样——??获取到整个网页的文本之后,去找我们要取的标题,前后不变的字符。
? ?
大家会发现,这个页面中,帖子标题前后不便的字符是:“]“ 和 “果果。。“ 那我们就将”]“字符前面的文本都过滤掉,“果果。。“后面的文本也过率掉,这样就能得到我们所需要的文本。
首先,我们需要复习下几个函数:
InStr函数
描述
start
可选的。规定每次搜索的起始位置。默认是搜索起始位置是第一个字符。如果已规定 compare 参数,则必须有此参数。
string1
必需的。需要被搜索的字符串。
string2
必需的。需搜索的字符串。
compare
必需的。规定要使用的字符串比较类型。默认是 0 。可采用下列值:? ? ? ?? ?0= vbBinaryCompare - 执行二进制比较。 1 = vbTextCompare - 执行文本比较。
? ?
Mid函数
描述
string
必需的。从其中返回字符的字符串表达式。如果字符串包含 Null,则返回 Null。
start
必需的。规定起始位置。如果设置为大于字符串中的字符数目,则返回空字符串()。
length
可选的。要返回的字符数目。如果省略或 length 超过文本的字符数,将返回字符串中从 start 到字符串结??束的所有字符。
Len函数
描述
string
任意有效的字符串表达式。如果 string 参数包含Null,则返回 Null。
varname
任意有效的变量名。如果 varname 参数包含 Null,则返回 Null。
脚本过程:
1.? ???先打开一个要提取信息的网站。
2.? ???用??HtmlGet 命令 获取整个网页的文本信息,存到Txt变量里面
3.? ???过滤]符号前面的文本??
4.? ???从文本里的]符号后面的位置开始取字符串,这里取了一百个字符放到命名为cc的变量里。如下图,也可以设置取80个字符,60个字符,但是长度一定要把“果果。。” 给截进来,因为后面我们要通过“果果。。”作为基准,去过滤掉不要的文字。
HYPERLINK /forum.php?mod=attachmentaid=MTYyMTY2fDgzNzYzYTFifDE0MTgwMjY3ODV8MjMxNDU4Mnw1NDIwODc%3Dnothumb=yes \o 1.jpg 下载次数:0 \t _blank
5.? ???在cc变量里,找果果。。出现的位置,找到之后,截取“果果。。”之前的文本,也就是我们需要接取的地方。
6.? ???最后,设置叠加的变量x,把每次找到的] 这个符号的位置放到变量x里进行累加,累加之后第二次循环,就会跳过之前找过的内容,进行新的内容的寻找。
源码:
Call Plugin.Web.Bind(WQM.exe)
Call Plugin.Web.go(/forum-250-1.html)??//要提取信息的网站
Delay 1000 // 如果网页打开速度慢,可适当添加延
您可能关注的文档
- 孕前优生健康检查的质量管理.doc
- 详述肋痛的病因与中医分型疗法.doc
- 项目概况及工程分析.doc
- 消防设施改造项目施工组织设计(鹭恒达) .doc
- 运动生理学的考试复习资料.doc
- 小贷公司业务管理大纲.doc
- 运球、双手胸前传接球.doc
- 在当前形势下,大学生如何树立正确的就业.doc
- 在开学第一次校长办公会上的发言.doc
- 小米手机公司.doc
- 质检员考试试题.doc
- 新视野大学英语视听说教程2(第二版)答案(带unit test).doc
- 新视野大学英语视听说教程4(第二版)Unit 2_test答案.doc
- 新视野大学英语视听说教程4(第二版)Unit 5_test答案.doc
- 新视野大学英语视听说教程4(第二版)Unit 6_test答案.doc
- 新视野大学英语视听说教程4(第二版)Unit 9_test答案.doc
- 新视野大学英语视听说教程4(第二版)Unit 10_test答案.doc
- 智能读图,心电图机家用化的关键一环20140812.doc
- 新视野大学英语视听说教程4(第二版)Unit1test.doc
- 新视野大学英语视听说教程4《9~10》单元.doc
文档评论(0)