加强中文信息处理的基础建设.pdfVIP

  • 6
  • 0
  • 约2.01千字
  • 约 2页
  • 2017-09-12 发布于重庆
  • 举报
加强中文信息处理的基础建设 宋柔 北京语言大学 中文信息处理已经走过30 年,取得很大成就,但并未取得主流学科的地位,根本原因 在于:汉字输入输出基本解决以后, 中文信息处理未能持续地对科学进步和社会发展做出重大贡献。 深层次的原因  学科本身难度太大  基础建设不够 因此,不必怨天尤人,还是要加强主观努力,特别是踏踏实实做好基础建设工作。 1. 加强基础研究 计算语言学是数学、计算机科学、语言学的交叉学科。要想推进计算语言学的研究和应 用,提高中文信息处理的社会贡献度,不能仅仅在交叉接口上做文章,必须在应用导向的前 提下,深入这三个学科进行研究,在基础研究方面取得突破。 (1)数学—模型  各种统计模型的数学性质(适用范围的约束条件,这种条件与实际文本的吻合程度 及对应用效果的影响,比如某种特征发生的随机性和独立性)  建立更加适合中文信息处理的数学模型  语料库的数学性质(语料库规模、语料库质量、特征规模和深度、语料库建设成本 等因素的定量关系,语料领域

文档评论(0)

1亿VIP精品文档

相关文档