- 1、本文档共153页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
中文信息处理发展报告(2016
前言
当前已经进入以互联网、大数据和深度学习为标志的海量信息时代,互联网和机器
学习技术的快速发展对中文信息处理提出了许多新的挑战。
《中文信息处理发展报告(2016)》是中国中文信息学会召集专家对本领域学科方
向和前沿技术的一次梳理,我们的定位是深度科普,旨在向政府、企业、媒体等对中文
信息处理感兴趣的人士简要介绍相关领域的基本概念和应用方向,向高校、科研院所和
高技术企业中从事相关工作的专业人士介绍相关领域的前沿技术和发展趋势。
编撰《中文信息处理发展报告》的想法来源于中国中文信息学会主办的“中文信息
处理战略研讨会”。2006 年 11 月 20 日召开的中国中文信息学会第六届理事会第一次常
务理事会上,常务理事们建议择期召开“中文信息处理战略研讨会”,共同探讨中文信
息处理未来的研究方向和发展战略。中国中文信息学会于 2007 年 4 月 20 日在广西南宁
召开“第一届中文信息处理战略研讨会”,之后于 2012、2014、2016 年分别于江西婺源、
贵州贵阳、海南海口连续召开了“中文信息处理战略研讨会”,在与会各位专家的热情
支持、积极参与、认真准备和共同努力下,这几次会议都取得了圆满成功,促进了本领
域前沿技术的创新与发展!
在这几次战略研讨会上与会专家学者从学科发展趋势、国内外研究热点、未来重要
应用、产业融合与发展等多个角度,给出了各自独到的见解和思考,会上也就我国中文
信息处理未来的发展机遇和挑战进行了热烈的研讨。
尽管每次会后我们都会将专家的报告在学会网站分享以飨读者,但是因为比较零散,
无法形成系统的观点。在今年的战略研讨会上,我们提出了发布《中文信息处理发展报
告》的工作计划,由学会学术工作委员会主任马少平教授负责。
2016 年 5 月 12 日在中科院软件所召开了工作会议(马少平、孙乐、宗成庆、赵军、
张敏、张家俊、韩先培、刘康等),经讨论确定报告分为基础研究和应用研究及各自具
体的研究方向,也确定了撰写的模板,主要包括:方向定义及研究目标、关键科学问题
和研究内容、研究方法及国内外现状、总结及展望等,宗成庆研究员提供了机器翻译方
向的模板供大家编撰时参考。会后我们邀请各个方向的著名专家撰写了各个方向的报告:
基础研究:
词法与句法分析:李正华、陈文亮、张民(苏州大学)
语义分析:周国栋、李军辉 (苏州大学)
篇章分析:王厚峰、李素建(北京大学)
1
语言认知模型:王少楠,宗成庆 (中科院自动化研究所)
语言表示与深度学习:黄萱菁、邱锡鹏(复旦大学)
知识图谱与计算:李涓子、候磊 (清华大学)
应用研究:
文本分类与聚类:涂存超,刘知远 (清华大学)
信息抽取:孙乐、韩先培 (中国科学院软件研究所)
情感分析:黄民烈(清华大学)
自动文摘:万小军、姚金戈(北京大学)
信息检索:刘奕群、马少平(清华大学)
信息推荐与过滤:王斌(中科院信工所)、鲁骁(国家计算机网络应急中心)
自动问答:赵军、刘康,何世柱 (中科院自动化研究所)
机器翻译:张家俊、宗成庆(中科院自动化研究所)
社会媒体处理:刘挺、丁效 (哈尔滨工业大学)
语音技术:说话人识别——郑方(清华大学)、王仁宇(江苏师范大学),语音
合成——陶建华(中科院自动化研究所),语音识别——王东(清华大学)
文字识别:刘成林(中科院自动化研究所)
多模态信息处理:陈晓鸥(北京大学)
医疗健康信息处理:陈清财、汤步洲 (哈尔滨工业大学)
少数民族语言信息处理:吾守尔•斯拉木 (新疆大学)、那顺乌日图 (内蒙古大
学)、海银花 (内蒙古大学)等
最后由张敏(清华大学)、韩先培(中国科学院软件研究所)、张家俊(中科院自动
化研究所)、刘康(中国科学院自动化研究所)等对初稿反馈意见,校对统一成文。
由于时间仓促,难免有疏漏,甚至错误的地方,供有志于中文信息处理事业的同仁
和青年学者们参考,进行更广泛的讨论和思考,期待在我们的共同努力下再创中文信息
处理事业新的辉煌!
文档评论(0)