基于动易网站系统自动采集软件设计与实现.docVIP

基于动易网站系统自动采集软件设计与实现.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于动易网站系统自动采集软件设计与实现

基于动易网站系统自动采集软件设计与实现   [摘 要] 目前许多政府机关,教育单位等都是以动易为系统内核制作的网站,但是,各单位由于地域上的关系,一般都是使用自己独立的网站服务器,这样就造成了本单位和下属单位网站之间的网站数据交互非常困难,成为一个可研究并急需解决的实际问题,基于上述原因,本文特别制作了动易网站数据自动采集工具。   [关键词] 动易 网站系统 自动采集软件   中图分类号:S611文献标识码:A 文章编号:   1 实现原理   利用VB编写程序,通过WEBBORWS控件,自动定时加载下属网站的相关网页,通过对页面自动进行分析,得到网页具体信息的标题和超级链接等数据,利用ADO技术直接写入本地的动易数据库。   2 动易数据库结构   动易数据库一般放在网站根目录下的database目录下,名称可自行定义,打开数据库后,主要的新闻数据表名称为PE_Article,它的结构如下:      3 下属单位采集页面的编写   下属单位网站中必须要放一个固定名称的具体页面文件caiji.asp   主要用来存放要采集的栏目的具体新闻条目信息,asp代码如下:    PageTitle)   strHTML = Replace(strHTML, {$ShowPath}, strNavPath)   strHTML = Replace(strHTML, {$MenuJS}, GetMenuJS(, False))   strHTML = Replace(strHTML, {$Skin_CSS}, GetSkin_CSS(0))   Set PE_Content = New Article   PE_Content.Init   strHtml = PE_Content.GetCustomFromTemplate(strHtml)   strHtml = PE_Content.GetPicFromTemplate(strHtml)   strHtml = PE_Content.GetListFromTemplate(strHtml)   strHtml = PE_Content.GetSlidePicFromTemplate(strHtml)   Response.Write strHtml   Set PE_Content = Nothing   Call CloseConn   %   4 软件的具体实现   打开VB6,进行如下界面设计:程序主要引用了WEBBROWS控件和定时器控件,并且进行了ADO引用。      采集系统写入数据库核心代码为:   getdbstr = Provider=Microsoft.Jet.OLEDB.4.0;Data Source= App.Path \Sitexu.asp ; Persist Security Info=False;   Set con = New ADODB.Connection   con.ConnectionString = getdbstr利用ADO打开数据库   con.Open   Set adodct = New ADODB.Recordset    Set adodct.ActiveConnection = con    adodct.Open select * from PE_Article order by ArticleID desc   Id = adodct!ArticleID       WebBrowser1.Navigate “http://下属单位网址/caiji.asp”   Set vtag = WebBrowser1.Document.getElementById(xu1)    Set vtag = WebBrowser1.Document.getElementById(xu1).getElementsByTagName(a)   zuozhe = xz(ii) + + Mid(vtag(i).Title, InStr(1, vtag(i).Title, 者:) + 2, InStr(1, vtag(i).Title, cedil;更新时间) - InStr(1, vtag(i).Title, 者:) - 4)   对标题链接进行自动分析,得出标题名称和链接地址。   If adodct.State adStateClosed Then adodct.Close    adodct.Open select * from PE_Article where ClassID=33 and LinkUrl= vtag(i).h

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档