- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
 - 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
 - 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
 - 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
 - 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
 - 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
 - 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
 
                        查看更多
                        
                    
                基于动易网站系统自动采集软件设计与实现
                    基于动易网站系统自动采集软件设计与实现
    [摘 要] 目前许多政府机关,教育单位等都是以动易为系统内核制作的网站,但是,各单位由于地域上的关系,一般都是使用自己独立的网站服务器,这样就造成了本单位和下属单位网站之间的网站数据交互非常困难,成为一个可研究并急需解决的实际问题,基于上述原因,本文特别制作了动易网站数据自动采集工具。 
  [关键词] 动易 网站系统 自动采集软件 
  中图分类号:S611文献标识码:A 文章编号: 
  1 实现原理 
  利用VB编写程序,通过WEBBORWS控件,自动定时加载下属网站的相关网页,通过对页面自动进行分析,得到网页具体信息的标题和超级链接等数据,利用ADO技术直接写入本地的动易数据库。 
  2 动易数据库结构 
  动易数据库一般放在网站根目录下的database目录下,名称可自行定义,打开数据库后,主要的新闻数据表名称为PE_Article,它的结构如下: 
   
  3 下属单位采集页面的编写 
  下属单位网站中必须要放一个固定名称的具体页面文件caiji.asp 
  主要用来存放要采集的栏目的具体新闻条目信息,asp代码如下: 
     PageTitle) 
  strHTML = Replace(strHTML, {$ShowPath}, strNavPath) 
  strHTML = Replace(strHTML, {$MenuJS}, GetMenuJS(, False)) 
  strHTML = Replace(strHTML, {$Skin_CSS}, GetSkin_CSS(0)) 
  Set PE_Content = New Article 
  PE_Content.Init 
  strHtml = PE_Content.GetCustomFromTemplate(strHtml) 
  strHtml = PE_Content.GetPicFromTemplate(strHtml) 
  strHtml = PE_Content.GetListFromTemplate(strHtml) 
  strHtml = PE_Content.GetSlidePicFromTemplate(strHtml) 
  Response.Write strHtml 
  Set PE_Content = Nothing 
  Call CloseConn 
  % 
  4 软件的具体实现 
  打开VB6,进行如下界面设计:程序主要引用了WEBBROWS控件和定时器控件,并且进行了ADO引用。 
   
  采集系统写入数据库核心代码为: 
  getdbstr = Provider=Microsoft.Jet.OLEDB.4.0;Data Source=  App.Path  \Sitexu.asp  ;  Persist Security Info=False; 
  Set con = New ADODB.Connection 
  con.ConnectionString = getdbstr利用ADO打开数据库 
  con.Open 
  Set adodct = New ADODB.Recordset 
   Set adodct.ActiveConnection = con 
   adodct.Open select * from PE_Article order by ArticleID desc 
  Id = adodct!ArticleID 
   
   WebBrowser1.Navigate “http://下属单位网址/caiji.asp” 
  Set vtag = WebBrowser1.Document.getElementById(xu1) 
   Set vtag = WebBrowser1.Document.getElementById(xu1).getElementsByTagName(a) 
  zuozhe = xz(ii) +  + Mid(vtag(i).Title, InStr(1, vtag(i).Title, 者:) + 2, InStr(1, vtag(i).Title, cedil;更新时间) - InStr(1, vtag(i).Title, 者:) - 4) 
  对标题链接进行自动分析,得出标题名称和链接地址。 
  If adodct.State  adStateClosed Then adodct.Close 
   adodct.Open select * from PE_Article where ClassID=33 and LinkUrl=  vtag(i).h
                
原创力文档
                        

文档评论(0)