隐藏在北语的一座金矿.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
隐藏在北语的一座金矿   计算语言学到底研究啥   北语的计算语言学开设于全校唯一理工科学院信息科学学院(简称信科)。学院副书记李超是学院首届本科学生,作为本硕博都在这儿读的,彻头彻尾的土著,讲起北语信科和计算语言学,他滔滔不绝。   北语信科的历史有近三十年了,前身是计算机科学与技术系,成立于2000年,再之前,是1987年成立的中国第一个以汉语信息处理为主要研究方向的“语言信息处理研究所”。2014年,北语进行了大部制改革,信科在原有的语言信息处理研究所基础上,成立了另外三个研究所,分别是:大数据与语言教学研究所、语言监测与社会计算研究所(国家语言监测与研究平面媒体中心)和管理科学与工程研究所。几个研究所基本上都与计算语言学学科直接相关,分别对语言的教学、研究和应用开展深入的研究。信科的主要任务是培养外语水平出色,具有信息处理基本素养的   人工智能大潮滚滚而来,语言信息处理是人工智能中最难突通用人才,在信息领域开展一些前沿性的研究。破和最难解决的核心技术问题之一。“语言智能与技术,是北语在中国语言文学一级   北京语言大学语言智能与技术(以下称计算语言学),就是学科下,自主设置的二级学科。”李超说,计算语言专门做语言信息处理的。计算语言学是语言学的一个分支,学就是利用计算机对语言进行计算处理,比如要提出   某个语言现象,若没有语言数据的支持,就不能成为   利用计算机对语言进行研究。不同于传统的语言学,它是一一个语言规律。而发现规律一般有两种方法:一种基门由语言学、计算机科学和数学三者交叉的新型学科,融合于规则,如语法专家经过研究,发现语言规律;另一了计算机的奥妙、语言学的神秘,还有数学的逻辑,在人工种基于统计,根据大规模数据提炼规则。后一种就是智能的科技大潮中,显示出非凡的生命力和创造力。计算语言学主要做的事。   在这门融合了计算机科学、语言学和数学的计算语言学中,计算机科学是研究工具,语言学是处理对象,数学是建模工具,此外还会用到物理学等知识。李超进一步解释:“计算语言学,是从字、词、句、篇章、语音等各个维度去研究语言,比如让计算机自动评判一个留学生写汉字写得对不对、好不好,这项技术的核心是数学曲线在二维平面的变换;再比如研究日本人说汉语,计算机可以判断他们说得对不对、准不准,这项技术就利用了物理学中的声学理论,通过发音的波形进行判断。”计算语言学的应用还有很多,最常见的比如在拼音输入法中,有一项功能是“拼写和语法错误”,一旦判定有错误嫌疑,系统就会用红色波浪线划出。还有让计算机评判一篇论文写得好不好,对不对等。   资源优势独一无二   除了北语,国内开展计算语言研究的还有清华大学、北京大学、中国科技大学、哈尔滨工业大学、复旦大学、中国科学院等名校。每所大学的研究各有侧重,比如中国科技大学的科大讯飞主攻语音信息处理,特别是语音识别。语音识别的应用也很多,比如语音输入法,又比如语音考试,“在口语考试中,有一种题型是模仿原声读句子,计算机会给考生自动评分。”传统牛校的计算语言研究规模大,相比之下,北语更像是小团队作战,但在某些领域有得天独厚的优势。   这优势就是在语言资源方面,尤其是搜集外国人的语言资源上面。李超在写博士论文时,需要收集各国人书写的汉字样本做研究。当时,他的一个师弟在英国读博,也做着相同的研究。师弟采集样本时跑遍了英国,还专门跑去了埃及,可是一年下来,收集的样本规模还不如李超在北语一堂汉语课上收集得多。“在北语,随便推开一间教室的门,20位同学就可能来自20个国家,我只要收集每个人的汉字,就是20个国别样本。”李超自豪地说。目前,约有170多个国家和地区的学生在北语学习,校园里能见到世界各地的人。在北语,研究语言信息处理根本不愁样本,这是其他高校无法比拟的。   李超的博士论文研究外国人写汉字。在传统教学模式中,老师只能看到留学生写完的汉字,看不到写字过程中的笔画顺序,无法全方位判断写得怎么样。李超研究时用了一种数码笔,“它看起来和普通圆珠笔一样,但书写的时候,能记录书写者书写汉字时的位置、速度、压力等信息,再加上研制的算法,计算机就能告诉留学生写的汉字到底对不对了,如果不对还能指出哪里写得不对,给出修正意见。”   北语坚持‘专业+外语’的复合型人才培养模式。大一到大四都开设英语课,学院本科生的英语专八考试通过率能达到70%。   此外,计算语言研究需要的理论知识,北语也有着得天独厚的条件。“全球近300所孔子学院,由北语承办的就有17所。在培养汉语国际教学师资方面,北语是培训汉语国际教学师资的官方机构,对汉语国际教学中的各种教学研究得非常深入。”丰富的学生资源、专业的理论积累,都为北语的计算语言学提供了良好环境。   专业教学各有特色   北语计算语言学专业招收

文档评论(0)

heroliuguan + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

版权声明书
用户编号:8073070133000003

1亿VIP精品文档

相关文档