Pycrl安装与使用.docVIP

下载本文档

6
0
约8.7千字
约 12页
2017-11-20 发布于江苏
举报
版权申诉

Pycrl安装与使用.doc

1、本文档共12页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Pycrl安装与使用

Pycurl的简单使用与对比在几次莫名其妙的退出之后，我终于有点放弃urllib2，开始尝试其他的模块。看到很多人推荐wget和pycurl。wget是独立软件，所以就没考虑。pycurl的话，得益于基于c语言开发的curl性能强劲，使得普遍反映它效率快、稳定性高、功能强大。于是决定尝试之，简单测试了下（见后面），如果用平均值来比较的话，pycur所消耗的时间远小于urllib2。这对于爬虫来讲，累积之后变化就非常可观了。 PycURL 是一个非常快速（参考多并发操作）和丰富完整特性的，但是有点复杂的接口。如果你需要些简单或纯 Python 的模块，你可以参考一下??urllib2 或 urlgrabber 。通过 / 了解 PycURL 的文档信息及其其他信息。因为 PycURL 是对 libcurl 的一个封装，使用时还需要参考 libcurl 的文档（针对 C 的）。 pycurl的安装 ? 获取和安装libcurl非常简单，取决于您所运行的Linux版本，如果你也使用ubuntu，那只需要使用ap-get就可以轻松安装。 $　sudo　apt-get　　libcurl3 $　sudo　apt-get　　python-pycurl 如果想查看下系统内pycurl版本信息可以： 1 import pycurl 2 pycurl.version 3 libcurl/7.19.7 GnuTLS/2.8.5 zlib/ libidn/1.15 如上所示，我的系统里的libcurl是7.19.7的最新版本。 pycurl的使用： pycurl.Curl() -?Curl?object 这个函数创建一个同 libcurl中的CURL处理器相对应的Curl对象.Curl对象自动的设置CURLOPT_VERBOSE为0, CURLOPT_NOPROGRESS为1,提供一个默认的CURLOPT_USERAGENT和设置CURLOPT_ERRORBUFFER指向一个私有的错误缓冲区. pycurl.CurlMulti() -?CurlMulti?object 这个函数创建一个新的与libcurl中的CURLM处理器相对应的CurlMulti对象. pycurl.CurlShare() -?CurlShare?object 这个函数创建一个新的与libcurl中的CURLSH处理器相对应的CurlShare对象.CurlShare对象可以在Curl对象上传递SHARE选项参数. [待续] 其中： Curl对象具有以下方法: close() - None?对应的是 libcurl中的curl_easy_cleanup方法.当Curl对象不再被引用时pycurl会自动调用这个方法,但也可直接地调用这个方法. perform() - None?对应于libcurl中的curl_easy_perform方法. setopt(option, value) - None?对应于libcurl中的curl_easy_setopt方法, option使用libcurl中的CURLOPT_*常量来指定,只可惜CURLOPT_前缀现在已经被去掉了.value的数据类型依赖于 option,它可以是一个字符串,整型,长整型,文件对象,列表或是函数. Example usage: import pycurl c = pycurl.Curl() c.setopt(pycurl.URL, /) c.setopt(pycurl.HTTPHEADER, [Accept:]) import StringIO b = StringIO.StringIO() c.setopt(pycurl.WRITEFUNCTION, b.write) c.setopt(pycurl.FOLLOWLOCATION, 1) c.setopt(pycurl.MAXREDIRS, 5) c.perform() print b.getvalue() getinfo(option) - Result?对应于 libcurl中的curl_easy_getinfo方法, option同样使用libcurl中的CURLOPT_*常量来指定,只可惜CURLOPT_前缀现在已经被去掉了. Result包含一个整数,浮点数或字符串,这都信赖于给定的option.getinfo方法不能在perform方法未调用或完成之前进行调用. Example usage: import pycurl c = pycurl.Curl() c.setopt(pycurl.URL, ) c.setopt(pycurl.FOLLOWLOCATION, 1) c.perform() print c.getinfo(pycurl.