网站大量收购闲置独家精品文档,联系QQ:2885784924

自然语言处理技术与应用 实验手册.docx

自然语言处理技术与应用 实验手册.docx

  1. 1、本文档共109页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多

一、Python开发环境——Anaconda的安装

Anaconda是一个用于科学计算的Python发行版,支持Linux、Mac、Windows系统,它提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换以及各种第三方包安装问题。Anaconda能够轻松安装经常使用的程序包,同时可以使用它创建多个虚拟环境,以便轻松处理多个项目。Anaconda简化了工作流程,并且解决了多个包和Python版本之间遇到的大量问题。

(1)anaconda安装

anaconda安装包下载,不建议去官网下载,官网下载太慢了,推荐下载地址/anaconda/archive/清华镜像站下载。

一般建议不要选择最新版的(不太稳定),建议选择2020-2021中的anaconda3随意一个版本。

注意:在安装步骤中第一项AddAnaconda…这个是说将安装路径自动添加系统环境变量,强烈建议勾选上,后续可以省去很多麻烦。(不用去手动添加环境变量)

第二项是说要默认使用python的版本,选上!!

(2)Anaconda安装完毕后可以通过两种方式启动Anaconda的Notebook:

第一种:在Windows开始菜单里面找到Anaconda,如图所示,然后点击AnacondaPrompt,输入JupyterNotebook启动,或者直接点击JupyterNotebook。

第二种:在工作目录下,按住shift,加右键,点击在此处打开Powershell窗口,输入JupyterNotebook启动。

启动之后,在浏览器会出现如图所示画面。

通过右上角菜单new——Python3新建一个编写代码的页面。在网页窗口中的“In”区域输入代码,通过“Shift”+“Enter”运行。

二、Python正则化包的使用

(1)文件的打开和关闭

文件打开open常用形式:

file=open(name,[,mode])#name:文件的路径(绝对路径/相对路径)mode:文件打开的方式

文件操作模式:

mode:r文件只读模式

rb以二进制读取一个文件

r+打开一个文件用于读写

rb+以二进制格式读写文件

w打开一个文件进行写入

wb以二进制格式写入一个文件

w+打开一个文件进行读写

wb+以二进制格式打开文件进行追加

a打开一个文件进行追加

ab以二进制格式打开文件进行追加

a+打开文件进行读写追加

ab+以二进制格式打开文件进行读写追加

文件操作:

file.read([size])#size未给定值或给定一些负值,则代表读取整个文件

file.readline()#读取一行的内容,包括“\n”字符

file.readlines([size])#读取所有的行并返回一个列表形式,size大于0,则设置读取多少行

file.write(str)#将str字符串给写入file文件中

file.tell()#返回一个整数,表示当前文件指针的位置

file.close()#关闭文件

在使用“只读”模式打开文件时,需要注意如果文件不存在,open()函数就会抛出一个IOError的错误,并且给出错误码和详细的信息。

f=open(111.txt,r)

FileNotFoundErrorTraceback(mostrecentcalllast)

ipython-input-1-1e2de6d4c7fcinmodule

f=open(111.txt,r)

FileNotFoundError:[Errno2]Nosuchfileordirectory:111.txt

所以,为了保证无论是否出错都能正确地关闭文件,可以使用try…finally来实现:

try:

f=open(111.txt,r)

exceptIOErrorase:

print(e)

else:

print(wrong)

(2)字符串运算

定义两个变量:

a=Hello

b=Python

对两个变量进行字符串拼接:

print(a+b输出结果:,a+b)

重复输出字符串:

print(a*2输出结果:,a*2)

字符串截取:

print(a[1]的输出结果:,a[1])

print(a[1:4]的输出结果:,a[1:4])

成员运算符:

if(Hina):

pr

您可能关注的文档

文档评论(0)

balala11 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档