- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
第20届国际东方语言计算机处理会议概况.ppt
“第20届国际东方语言计算机处理会议”概 况 吕学强 基本情况(1) 时间:2003.8.4-6 地点:沈阳 主办: 东北大学 清华大学 中国中文信息协会 美国中文计算机协会 工作语言:英语和汉语 基本情况(2) 特邀报告:4 提交论文:120 录用论文:81 论文分布 词法、句法和语义:28 工具和资源:4 机器翻译:11 基于内容的信息检索:19 字符集、文档图象分析、OCR后处理:12 语音识别和合成:7 当前热点(1) 基于内容的文本处理*** 特邀报告:1 信息提取:6 文本分类:5 文本摘要:1 问题回答:3 特点 与Internet的需求紧密结合,为智能信息检索服务 当前仍以统计方法为主 机会 进一步发展需要构建通用和领域知识库 (ontology) 当前热点(2) 浅层分析 特邀报告:1 分词:1 名词实体识别:6 组块分析:3 特点 浅层:词或短语 推崇统计方法 传统的句法、语义分析(追求完整)因看不到希望而被暂时抛弃、否定 给饥饿的比尔盖茨设计的饼 机会 需要并依赖各层次上的标注语料库 当前热点(3) EBMT/双语语料 文本对齐: 3 EBMT方法:4 特点 依葫芦画瓢 机会 需要大型各层次对齐的双语、多语语料库 当前冷门 小语种(少数民族语言) 藏文: 3 蒙文: 1 民(维)文: 2 甲骨文: 1 特点 还处在编码、输入、切分的初级阶段 机会 地广人稀好种田 主流方法 统计方法、机器学习 支持向量机 最大熵 神经元网络 决策树 体系发展(1) 体系发展(2) 体系发展(3) 国内NLP趣象 30年代向60年代过渡 双刃剑:资源、技术的保护与共享 执着的攀登者 神秘的派别 当前NLP的困境与机遇 困境 技术突破前景暗淡,全球企业支持下降(日本除外) 机遇 “数字奥运”,国家投入 谢谢! * * 北京大学计算语言学研究所 2003.11.18 人工规则库 (词法、句法 语义) 应用系统 语料库 人工规则库 (词法、句法 语义) 应用系统 概率参数 统计机器学习 自然知识源 宇宙知识 应用系统 概率参数 面向机器的统计学习 面向人的机器加工 人工知识源 专家指导的人工处理
文档评论(0)