获取网页数据并分析.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
获取网页数据并分析

获取网页数据并分析 最近写一个抓网页并提取页面信息的小东东(需要登陆的网站) 一   登陆的标识: UID和COOKIE   获取后把UID和COOKIE写入ini以备使用 二   获取网页数据的一些基本方法   (1) (CHttpConnection* )m_pConnection=(CInternet *Session) m_Sessions.GetHttpConnection(_T(m_HostAdderss),m_Port);   (2)m_pConnection-OpenRequest(m_Method,m_GetPath+m_FileName,m_Referer,1,NULL,m_HttpVersion, INTERNET_FLAG_EXISTING_CONNECT );   (3)pot = (CHttpFile* )m_pFile-SendRequest( _T(Headers),(LPVOID)(LPCTSTR)_T(this-m_SendMeg),m_SendMeg.GetLength());   (4)m_pFile-ReadString(tempString) 三 分析页面数据的一个片段(命名很混乱 )   filedata.Find(BZ);//BZ:关键字 filedata = filedata.Mid(pot); count = filedata.Replace(BZ,BZ); filedata = filedata.Mid(18); for(int i=0;icount;i++) { pot = filedata.Find(BZ);//分成几个联赛 if( pot == -1) { pot = filedata.GetLength(); lsdata_ls = filedata.Left(pot); } else { lsdata_ls = filedata.Left(pot); filedata = filedata.Mid(pot+18); } //每个联赛再分 hj =0;hjj =0; Newdata += ; pot = lsdata_ls.Find(); lsdata_ls = lsdata_ls.Mid(pot); pot2 = lsdata_ls.Find(); Newdata += lsdata_ls.Mid(1,pot2-1); Newdata += ,; lsdata_ls = lsdata_ls.Mid(pot2+20); kk = lsdata_ls; while(kk.GetLength()10) { gameid = ;//得到gameid pot = kk.Find(javascript:DoVote); if(pot==-1)break; kk =kk.Mid(pot); gameid = kk.Mid(23,7)+,; pot = m_game.Replace(gameid,gameid); if(pot==0) m_game +=gameid; kk = kk.Mid(30); } while(lsdata_ls.GetLength()10) { pot= lsdata_ls.Find(/TR); lsdata_cc = lsdata_ls.Left(pot); lsdata_ls = lsdata_ls.Mid(pot+6); while(lsdata_cc.GetLength()10) { if(lsdata_cc.GetLength()300)//和局 { hj++; while(1) { pot = lsdata_cc.Find(); lsdata_cc = lsdata_cc.Mid(pot); pot2

文档评论(0)

f8r9t5c + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8000054077000003

1亿VIP精品文档

相关文档