- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于动易网站系统自动采集软件设计及实现
基于动易网站系统自动采集软件设计及实现[摘 要] 目前许多政府机关,教育单位等都是以动易为系统内核制作的网站,但是,各单位由于地域上的关系,一般都是使用自己独立的网站服务器,这样就造成了本单位和下属单位网站之间的网站数据交互非常困难,成为一个可研究并急需解决的实际问题,基于上述原因,本文特别制作了动易网站数据自动采集工具。
[关键词] 动易 网站系统 自动采集软件
中图分类号:S611文献标识码:A 文章编号:
1 实现原理
利用VB编写程序,通过WEBBORWS控件,自动定时加载下属网站的相关网页,通过对页面自动进行分析,得到网页具体信息的标题和超级链接等数据,利用ADO技术直接写入本地的动易数据库。
2 动易数据库结构
动易数据库一般放在网站根目录下的database目录下,名称可自行定义,打开数据库后,主要的新闻数据表名称为PE_Article,它的结构如下:
3 下属单位采集页面的编写
下属单位网站中必须要放一个固定名称的具体页面文件caiji.asp
主要用来存放要采集的栏目的具体新闻条目信息,asp代码如下:
“ PageTitle)
strHTML = Replace(strHTML, “{$ShowPath}”, strNavPath)
strHTML = Replace(strHTML, “{$MenuJS}”, GetMenuJS(““, False))
strHTML = Replace(strHTML, “{$Skin_CSS}”, GetSkin_CSS(0))
Set PE_Content = New Article
PE_Content.Init
strHtml = PE_Content.GetCustomFromTemplate(strHtml)
strHtml = PE_Content.GetPicFromTemplate(strHtml)
strHtml = PE_Content.GetListFromTemplate(strHtml)
strHtml = PE_Content.GetSlidePicFromTemplate(strHtml)
Response.Write strHtml
Set PE_Content = Nothing
Call CloseConn
%
4 软件的具体实现
打开VB6,进行如下界面设计:程序主要引用了WEBBROWS控件和定时器控件,并且进行了ADO引用。
采集系统写入数据库核心代码为:
getdbstr = “Provider=Microsoft.Jet.OLEDB.4.0;Data Source=“ App.Path “\Sitexu.asp” “;” “Persist Security Info=False;”
Set con = New ADODB.Connection
con.ConnectionString = getdbstr利用ADO打开数据库
con.Open
Set adodct = New ADODB.Recordset
Set adodct.ActiveConnection = con
adodct.Open “select * from PE_Article order by ArticleID desc”
Id = adodct!ArticleID
WebBrowser1.Navigate “http://下属单位网址/caiji.asp”
Set vtag = WebBrowser1.Document.getElementById(“xu1”)
Set vtag = WebBrowser1.Document.getElementById(“xu1”).getElementsByTagName(“a”)
zuozhe = xz(ii) + ““ + Mid(vtag(i).Title, InStr(1, vtag(i).Title, “者:”) + 2, InStr(1, vtag(i).Title, “cedil;更新时间”) - InStr(1, vtag(i).Title, “者:”) - 4)
对标题链接进行自动分析,得出标题名称和链接地址。
If adodct.State adStateClosed Then adodct.Close
adodct.Open “select * from PE_Article where ClassID=33 and LinkUrl
原创力文档


文档评论(0)