- 1、本文档共273页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
01-第一讲-万小军-自然语言处理-V100.pdf
NLPCC2013 Tutorial
自然语言处理:基础技术与互联网创新
万小军
北京大学计算机科学技术研究所
语言计算与互联网挖掘研究室
/lcwm/
2013年11月15日
第一课 自然语言处理基础
?自然语言处理概述
?词性标注(POS)
?句法分析(Parsing)
2
自然语言处理概述
3
Let’s talk!
This model shows what a mans body would look like if
each part grew in proportion to the area of the cortex of
Natural Languagethe Processing brain4 - Introduction concerned with its movement.
基本概念
? 语言
? 广义上:一套共同采用的沟通符号、表达方式与处理规则;
? 自然语言 vs. 动物语言 vs.电脑语言
? 自然语言
? 指自然地随文化演化的语言,是人类交流和思维的主要工具,
例如英语、汉语、日语等
? 不包括编程语言等为计算机而设的“人造”语言
? 自然语言处理
? 又称自然语言理解,是人工智能和语言学领域的分支学
科。
? 利用计算机为工具对人类特有的书面形式和口头形式的自
然语言的信息进行各种类型处理和加工的技术。
5
自然语言交流
6
基本任务
机器翻译
自动分词 文本分类
命名实体识别 情感分析
词性标注 信息检索与过滤
句法分析 自动问答
语义分析 信息抽取
篇章分析 自动文摘
人机对话
关键任务 应用型任务
7
例子
8
基本方法
? 理性主义方法
? 研究人的语言知识结构,人工编汇语言知识+ 推理系统
? 符号处理系统
? 经验主义方法
? 直接研究实际的语言数据,从大量的语言数据中获得语言
的知识结构
? 基于语言数据的计算方法
? 理性主义方法与经验主义方法的融合
? 融合方法
9
发展历程
? 萌芽期
? 1946年世界上第一台计算机出现,自然语言理解的研究
起始于机器翻译。
? 发展期
? 自1966年美国自动语言处理咨询委员会(ALPAC) 提出
ALPAC报告开始到20世纪80年代中期。研究重点转向其
它分支:人机接口、对话系统、信息检索等。乔姆斯基语
法理论及一批语法理论发表
? 基本方法:基于规则分析方法。
? 繁荣期
? 自20世纪80年代末期以后,基于大规模语料库的统计方
法引入自然语言处理。
10
研究现状
? 哪个问题都没有彻底解决!
? 有没有其他方法体系?有没有理论上限?
? 部分技术已取得较好的效果,能够服务于信息检索、文本挖
掘等应用系统
? 自动分词、词性标注、命名实体识别等
? 部分技术尽管效果不尽如人意,但能为人类提到辅助性帮助
? 机器翻译
? 若干关键技术在研究和
您可能关注的文档
最近下载
- 年产8万吨聚甲醛工艺的初步设计.docx
- 3D3S 基本操作手册.pdf
- 2019新疆生产建设兵团中考化学真题.doc VIP
- 8.铁路工程预算定额 路基工程宣贯讲义.ppt
- 房地产市场报告 -天朗2024年报【在时代洪流的弄潮中 尽显从容-把脉逆周期调解下大的北京房地产市场】.docx
- 【人教部编版】二年级上册语文课件:4《田家四季歌》第一课时(共27张PPT).pptx
- 年产25万吨合成氨合成工段工艺设计.docx
- 2023徐州市八年级下册期末物理试卷含答案 .pdf
- 毕业设计(论文)-反铲式挖掘机工作装置结构设计.doc
- 工程训练(广东工业大学)智慧树知到期末考试答案章节答案2024年广东工业大学.docx
文档评论(0)