- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
                        查看更多
                        
                    
                在大多数情况下,上网冲浪是件令人愉快的事情。但若是数百
                    
  在大多数情况下,上网冲浪是件令人愉快的事情。但若是数百上千的超链接摆在你面前,而你又不得不 
一一点击这些链接、进入相应的网页、手工筛选出每页里你需要的信息、最后再将这些信息编进数据库 
中、,你将做何感想?如果每天都从事这种繁杂、枯燥的工作会不会让你发疯? 
  “ 自动上网机器人”或许可救你出“苦海” :你可以喝着咖啡、听着音乐、看着“机器人”辛勤地替你工作, 
那感觉是不是棒极了! 
   本文结合实例详尽讨论了用 VB 实现“上网机器人” 的技术细节。我们知道,搜集和下载资料是人们使用 
互联网的最主要的目的之一,但有些信息资源过于庞大,用手工摘取的方法是困难的或根本就是行不通的。 
例如,你需要搜集欧洲进口机械设备的公司名录以便给他们发信邀请其参加博览会,在网上找到这些信息 
并不难,但出于数据安全等方面的考虑,几乎所有提供类似信息的网站都没有提供直接下载数据的功能。 
   要想搜集齐想要的数据,唯一可用的方法就是一页一页地浏览每个公司的信息页,摘取其中有用的数据 
并存入数据库。但当公司总数超过数千时,巨大的工作量会让任何人望而却步!其实,这浩大的工作完全 
可以由程序来完成,因为这些任务完全是机械的重复性工作。而且,用程序完成比用手工要快得多。本文 
涉及的技术细节是通用的,即对实例程序稍加修改就可完成任何“ 自动上网冲浪”任务。 
  自动拨号上网、自动处理中途掉线、任务完成后自动挂断,这些都是“上网机器人” 的最基本的功能之一。 
它还能给你带来明显的经济回报:如果你让“机器人”在晚间至凌晨的上网费优惠期内拨号上网去自动冲浪, 
那真可称得上是典型的“一石三鸟”你睡觉、它工作、还省钱!有关这方面的细节将在本文的第三部分里 
讨论。该部分提供了实现上述各功能的若干方法, 
并比较了这些方法各自的优劣。 
  本文的第一和第二部分分别以两个实例讨论了自动浏览的技术细节:在网页上的输入区内自动填入数据 
以便完成诸如用户登录等的操作、自动更新CheckBox、自动选择下拉式列表(ComboBox )的值、自动点 
击网页上的按钮、从网页上精确提取有用的数据并存盘、将网页上二维表(Table )内的数据一一提取出来 
并转换且存储成可直接导入数据库或  Excel 的格式,以及控制浏览进程的技巧等等。 
第一部分  从网页上精确提取数据 
  本部分的实例是:下载沪深两市全部约 1100 家个股的基本信息及财务数据。若用手工操作,如上图所 
示,需要在股票代码区内分别输入 1100 个股票代码,在下拉式列表(ComboBox )中分别选择“个股资料” 
和“财务数据解读”,算下来约是2200 次操作!这样的工作当然是由程序来完成划算得多。况且手工提取数 
据(先选中、再使用 Ctrl+C 拷贝)极容易出错(多选或漏选),又很费眼神。 
1.  在输入区内自动填入数据 
  为使程序能高效地自动浏览,需引入一些最基本的功能,如在输入区内自动填入数据、自动点击按钮等 
等。虽然用变换  URL 地址的方法有时也能完成任务,但往往过于费力,尤其当网页上的输入区较多时更 
是如此。 
  为了在输入区内输入数据,需要先搜索到该对象的名字,然后将该对象的值置为要填入的数据即可。搜 
索名字的工作可编程完成,亦可用  FrontPage 轻松获得。 
2. 自动在下拉式列表(ComboBox )中进行选择 
  同样地,首先要获得下拉式列表的名字。然后根据下拉式列表的元素总数(length 属性)在列表中搜索 
要设置的值(列表的  Options 集合中元素的 Text 属性),找到后,将该元素设为选中元素(元素的 Selected 
属性)。 
3. 自动点击按钮 
  对于按钮来讲,可根据其名字访问,亦可根据其值访问。按钮的值就是显示在按钮上的文字。一个按钮 
可能没有名字,但一定有值。本例的程序就是根据值来访问按钮。执行按钮的  Click 方法就相当于点击了 
该按钮。 
  
  
  图二中红色箭头所指即为程序自动填入输入框、自动在ComboBox 中选择以及自动点击按钮的情况。 
4.  精确提取数据 
   仅将有用的数据存储下来才是有意义的。必须研究网页,找出有效数据所在的 Tag 区(可用文本编辑器 
或  FrontPage ),然后用该对象的innerText 属性获得最终的文本。本例中要存储的数据如下图所示,其所 
用的 Tag 为“PRE” 。 
   下面给出的是实例程序的完整代码: 
          ´  程序一:从网页上精确提取数据 
          ´ 
          ´  为运行本程序,应在“菜单-工程-部件” 中添加“Microsoft Internet Contr
                 原创力文档
原创力文档 
                        

文档评论(0)