另起一页段前分页演示后.pdfVIP

  1. 1、本文档共3页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

第1章概论

1.1信息处理

中文信息处理技术作为计算机技术与语言文字相结合的一门交叉学科,随着信息处

理技术的发展,近年来得到了快速的发展。语言文字信息处理作为计算机应用技术的一个重要

分支,伴随着计算语言学、心理学、数学以及计算机科学的发展,已经成为新世纪中

的一个重要研究领域。无论是中文信息处理还是语言文字信息处理,都离不开“信息”的概念。

信息(information)既是一种抽象的概念,又是一个无处不在的实际。控制论创始人

维纳(NorbertWiener)认为,信息既不是物质也不是能量,是人类在适应外部世界时以及在

感知外部世界时而作出协调时与外部环境交换内容的总称。因此,可以认为,信息是人与外界

的一种交互通信的信号量。

1.2中文信息处理

中文信息处理,从广义来说,由我们祖先创立中文开始,就一直在进行;从狭义来说,从

第一部中文字典产生以来,就一直在进行中文信息的分析和综合处理(计算机中文信

进行的加工和操作,包括对、短语、句、篇章的输入、输出、识别、转换、压缩、、

检索、分析、理解和生成等各方面的处理技术。它是在语言文字学、计算机应用技术、人工智

能、认知心理学和数学等相关学科的基础上形成的一门边缘学科。汉字学和汉语语言学中的词

法学、句法学、语义学和语用学给中文信息处理的各个层面提供了可靠的理论依据,而人工智

能的知识工程、机器学习、模式识别和神经计算,数学中的模型理论、形式化理论和数理统计

等构成了中文信息处理的方法论基础。

1.3计算机中文信息处理主要研究对象

计算机中文信息处理包含了多个研究层次。在计算机操作系统方面,需要解决中文信息在

计算机的表示,中文信息的输入和输出以及中文信息在Internet上的传输等问题,从而使

中文信息在计算机中的处理变得可行。在语言文字方面,需要解决选择(或规范)多少汉字进

入计算机,汉字的字形、字型信息的描述等问题。在应用方面,需要解决包括机器学习、自然

语言处理、计算机翻译等一系列与语言信息处理相关的问题。

文档评论(0)

honglajiao + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档