1.PHP发HTTP请求的代码.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PHP实现数据采集 什么叫采集? 答:使用PHP程序,把其他网站中的信息抓取到我们自己的数据库中、网站中。 PHP制作采集的技术: 底层-》高层: 1. socket编程: 使用curl_一套函数 把HTTP协议都封装成了很多参数,直接传相应参数即可,降低了编写HTTP协议字符串的难度: 前提:在PHP.INI中要开启curl扩展。 直接使用file_get_contents 前提:在PHP.INI中 网络之间通信主要使用的是以上三种。其中后两种用的较多: 如果要批量采集大量的数据时使用第二种【CURL】,性能好、稳定。 偶尔发几个请求发的频繁不密集时使用第三种。 扩展:图片的防盗链如何破? 比如7060网站上的图片做了防盗链:在他的网站中可以看到图片,把图片拿到站外就无法访问。 原理:在HTTP协议中有一个referer项,代表发这个请求的来源地址,服务器会判断如果这个请求不是这个网站发来的就会过滤掉这个请求: 解决办法:发HTTP时自己模拟referer即可: 扩展:有些要采集数据时时必须先登录,可以使用模拟的试模拟在登录状态下的采集: 先用浏览登录一下,登录完,浏览器的COOKIE中就会有人SESSIONID b. 发PHP发HTTP协议时,把浏览器中的SESSIONID放到PHP的HTTP协议请求里,这样就在以登录的状态发请求。 总结:所有客户端发过来的数据都可以被模拟,所以服务器上的程序必须要必要的地方过滤客户端的数据。 什么时候用以上东西:接口开发时、采集时。

文档评论(0)

潮起潮落 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档