Python大数据编程.pptxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Python大数据编程

Python大数据编程2 大数据处理过程 4数据分析1数据收集3数据描述2数据整理Python大数据编程便捷数据获取4用Python获取数据本地数据如何获取?文件的打开,读写和关闭? 文件打开? 读文件写文件? 文件关闭5用Python获取数据网络数据如何获取?抓取网页,解析网页内容urllibPython 3中被urllib.request代替urllib2Python 3中被http.client代替httplib?httplib2/q/cp?s=%5eDJI+Componen/q/cp?s=%5EDJI+Componen tyahoo财经数据利用urllib库获取yahoo财经数据File# Filename: dji.py import urllib import redBytes = urllib.request.urlopen(/q/cp?s=%5eDJI+Components).read()ht/q/cp?s=%5eDJI+Components).read()tp:///q/cp?s=%5EDJI+Components/q/cp?s=%5eDJI+Components).read()).read() dStr = dBytes.decode(GBK) #在python3中urllib.read()返回bytes对象而非str,语句功能是将dBytes转换成Strm = re.findall(trtd class=yfnc_tabledata1ba href=.*?(.*?)/a/b/tdtdclass=yfnc_tabledata1(.*?)/td.*?b(.*?)/b.*?/tr, dStr)if m:print m print \n print len(m)else:print not match数据形式? 包含多个字符串(dji)AXP, American Express Company, 86.40BA, The Boeing Company, 122.24CAT, Caterpillar Inc., 99.44CSCO, Cisco Systems, Inc., 23.78CVX, Chevron Corporation, 115.91– …便捷网络数据是否能够简单方便并且快速的方式获得雅虎财经上各上市公 司股票的历史数据?File# Filename: quotes.pyfrom matplotlib.finance import quotes_historical_yahoo from datetime import dateimport pandas as pdtoday = date.today()start = (today.year-1, today.month, today.day)quotes = quotes_historical_yahoo_ochl(AXP, start, today) df = pd.DataFrame(quotes)print df函数目前更新为 quotes_historical_ yahoo_ochl便捷网络数据quotes的内容日期开盘价收盘价最高价最低价成交量便捷网络数据自然语言工具包NLTK需要先执行nltk.download()下载某一个或多个包,若下Source载失败,可以在官网(/nltk_data//nltk_data/) ?古腾堡语料库? 布朗语料库? 路透社语料库? 网络和聊天文本? …单独下载后放到本地python目录的nltk_data\corpora下 from nltk.corpus import gutenberg import nltkbrown print gutenberg.fileids()[uausten-emma.txt, uausten-persuasion.txt, uausten-sense.txt, ubible-kjv.txt, ublake-poems.txt, ubryant-stories.txt, uburgess-busterbrown.txt, ucarroll- alice.txt, uchesterton-ball.txt, uchesterton-brown.txt, uchesterton-thursday.txt, uedgeworth-parents.txt, umelville-moby_dick.txt, umilton-paradise.txt, ushakespeare-caesar.txt, ushakespeare-hamlet.txt, ushakespeare-macbeth.txt, uwhitman-leaves.txt] tex

文档评论(0)

整理王 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档