- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
补丁 安装过程发现出现了下面的错误: raise ImportError(matplotlib requires dateutil)ImportError: matplotlib requires dateutil 这个需要dateutil。 把dateutil 安装完后又出现如下错误: raise ImportError(matplotlib requires pyparsing)ImportError: matplotlib requires pyparsing 需要?pyparsing ?到这里下载安装。 ImportError: No module named six 解决办法是把路径如:Python27\Lib\site-packages\scipy\lib中的six.py six.pyc six.pyo三个文件拷贝到Python27\Lib\site-packages目录下。 Natural Language Processing With Python 语言信息处理 Python and text 文本(text)是本课程研究的主要对象,是原始数据。 为何选用Python? Python是‘一种解释型、面向对象的、带有动态语义的高级程序设计语言’。 自带大量的非常适合语言数据处理的函数。 Python可以使用户将主要精力集中在处理的问题上,而不是编程,即,用较少的代价(代码量)实现功能,且程序可懂性好。 Python有两种运行方式:交互式和文件式,(interactive development environment,IDLE)。 /about/success/中列举了许多成功使用Python 的故事。 Python简单练习:代数运算 Python的运行方式 交互式和文件式执行在本质上是相同的:它们都是由解释器来解释执行用户编写的Python语句。 解释执行是相对于编译执行而言的。 编译执行是指,编译器将编写的程序从源文件转换成计算机使用的机器语言,经连接器连接后形成二进制可执行文件。当运行该二进制可执行文件的时候,因为已经编译好了,所以加载器软件把二进制程序从硬盘载入内存中并运行。如,C或C++。 解释执行是指,解释器不需要编译成二进制代码,它可以直接从源代码运行程序。当用户运行程序文件的时候,解释器把源代码转换成中间形式:字节码,然后再由虚拟机来执行这些字节码。如,Matlab,Python。 缺点:每次运行时都要进行转换成字节码,再由虚拟机把字节码转换成机器语言,最后才能在硬件上运行。较之于编译性编程语言,都会多出两道工序,所以它的性能会低些。 优点:不用关心程序的编译以及库的连接等问题,所以开发工作会变得更轻松;面向的是虚拟机,距离物理机器远了, 所以解释程序易于移植,实际上无需改动就能在多种平台上运行。 Python的模块 什么是模块: 每一个.py文件都是一个模块,其他文件可以通过导入一个模块读取这个模块的内容。模块导入增加了python的功能。 如import math命令导入math模块,可以使用其中的功能,如取整。 用户编写文件模块的位置: 模块函数的调用形式:模块.函数,如上例,math.floor() 函数调用其他方法: From math Import floor,这在确定其他模块没有重名函数的情况下使用 Floo=math.floor,可以根据使用时需要,重命名 模块一般是工具库,因此封装了很多变量名,在一个包中的变量名就是属性,或者说,属性就是绑定在特定对象上的变量名。import语句将模块作为一个整体引用,相当于引入一个类的对象。 NLTK What is NLTK? Suite of open source Python libraries and programs for NLP. Developed for educational purposes by Steven Bird, Ewan Klein and Edward Loper. NLP broad sense: any kind of computer manipulation of natural language from word frequencies to understanding meaning Applications text processing information extraction document classication and sentiment analysis document similarity automatic summarizing discourse analysis sentence = At eight oclock on Thursday
文档评论(0)