从彭泽润李葆嘉《语言理论》看分词连写-2019年精选文档.docxVIP

从彭泽润李葆嘉《语言理论》看分词连写-2019年精选文档.docx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
从彭泽润李葆嘉《语言理论》看分词连写 、引言 目前,我国高等院校汉语言文学专业有一门必修课叫做 《语 言学概论》,意在阐明语言学的基本理论和基本概念,为学习各 门语言课程提供必要的理论知识。 从 20 世纪 80 年代叶蜚声与徐 通锵的《语言学纲要》开始,我国语言学界先后出版了几十种教 材,李葆嘉与彭泽润( 2007)《语言理论》(中南大学出版社) 以其系统性、实用性、创新性见长,尤其是在分词连写方面有开 创性,但我们认为分词连写和真正的中文信息处理还有一定的距 离。本文从分词连写和自动分词的关系入手, 对分词连写的必要 性和可能性展开论述。 二、《语言理论》的分词连写 从《语言理论》 的封面我们就可以知道这本书的一个重要特 色,那就是实践了彭泽润等的主张一一分词连写。 内容固然重要, 但特别的形式同样能够给人以耳目一新的感觉, 或者说能够反映 主编对内容的突出理解。这本书的分词连写形式不能不说特别, 正如前言所说的一样“恐怕可以得第一”。 正如编者所言“建设 本好教材不容易,更不能一劳永逸”,彭、李所编的《语言理 论》第二版在第一版局部采用分词连写的基础上全部使用分词连 写。 五十多年前, 周有光等人就曾经作过将分词连写方式引入中 文的尝试,但由于当时的条件还不够成熟,没能取得突破。 1987 年,我国计算机产业奠基人之一陈力为院士基于信息处理的需 要,推出了提倡分词连写的第一篇力作当前中文信息处理 要,推出了提倡分词连写的第一篇力作 当前中文信息处理 中的几个问题及其发展前景》。 1995 年,我国信息处理专家俞 士汶和周锡令基于同样原因发表了近年来较早倡导分词连写的 另外两篇重要文章一一《关于受限的规则汉语的设想》和《软件 书籍中译本的可读性和几点看似荒谬的建议》。之后,一直密切 关注中文书写体式改革的语言学家陆丙甫、 彭泽润分别发表了题 为《也谈中文的改革》和《文字中的字间空隙和词间空隙》的文 章,参与有关讨论。 以前没有出现中文信息处理分词连写的问题,一是由于当 以前没有出现中文信息处理分词连写的问题, 一是由于当 时的科技水平还不够发达, 没有可能; 二是记录汉语的书面符号 即汉字是表意型文字, 它以词义或语素义为主要表现对象, 文言 文的字界就是词界,没有必要。现在这两个原因都改变了,我们 对分词连写的认识也应该随之发生改变。 现在我们不能由于‘未 有充分的实践经验使我们认识到它的严重危害性和‘未感受 到国民经济信息化的进程对信息处理的猛烈冲击”(陈力为, 1996)。造成“难将计算机和网络在信息处理上的优势完全发挥 出来,最终影响到中文信息处理的更充分更深入更快速的发展” 和“难以补救”的问题(李辉阳,2001 和“难以补救”的问题(李辉阳, 2001)。 语言理论》正是在“汉语分词既有必要性又有紧迫性,还 有可行性”(王卫兵, 2006)的前提下进行实践的,“它在这一 点上开了一个新风气”(王均, 2002)。笔者曾经留意彭泽润先 生在北大中文论坛里的语言理论板块, 他自己不仅带头采用分词 连写的形式,也要求他的学生使用,可以说是对“君不见,那些 中文分词连写提倡者, 有几人带头垂范、 身体力行?” (曹德和, 2006)的有力回答。 目前尚未看到有其他教材采用分词连写的形式, 所以,这本 教材在贯彻分词连写方面所作的开创之功是值得推崇的。 三、分词连写和自动分词的关系 一)联系 虽然有关分词连写的论文并不少见, 但真正给“分词连写” 定义的并不多见, 这里选择彭泽润先生在 《语言理论》 里的界定: 分词连写又叫做词式书写、 词连写, 是用以词为单位的方式书 写,把记录口语中每个词的字连接在一起, 使词和词之间在书写 上有明显的距离,体现词的界线” (P242)。自动分词是指“让 计算机确定中文文本之间词与词之间的界限” (齐沪扬、陈昌来, 2007)。通过上述定义可以知道,分词连写和自动分词其实是有 内部联系的。 关于分词连写的目的, 彭先生说“逼真地反映口语 中词的信息, 方便阅读, 能够提高书面语言的阅读效率”进而实 现中国语言文字的“现代化”(吴文超, 2007),至于中文自动 分词,齐、陈二位先生说“是任何中文信息处理系统都难以回避 的第一道‘工序”进而促进中文信息处理的“智能化”。可 见,从根本上二者都是为了促进中文的现代化或者说中文信息处 理而进行的一项工作,而且都认为中文信息处理时应该进行分 词。 二)区别 从上面的定义中可以知道分词连写和自动分词的不同: 前者 是指人把句子中的词分好, 再用分词连写的方法输入计算机; 而 后者是指让机器来完成分词这一过程。 因此, 虽然它们的目的都 是促进中文的现代化, 但它们的根本策略即实施分词者是完全不 同的,也就是说前者把分词的任务直接交给人, 并认

文档评论(0)

zhaoxiaoj + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档