字本位与汉语形式化.docVIP

  • 6
  • 0
  • 约2.23万字
  • 约 18页
  • 2016-11-24 发布于天津
  • 举报
字本位与汉语形式化.doc

《字本位理论与应用研究》8.3 字本位与汉语形式化 在“字、辞、块、读、句”与“字、二字组、三字组、…、多字组”的结构划分过程中,汉语“字本位”理论,强调:“字”是汉语的“基本结构单位”。其“核心字、两点论、语义句法”给笔者印象极深。 出于“探寻汉语思维特点”的“好奇心”和“寻找改进汉语理论和中文信息处理以及计算机辅助汉语教学的新方法”的“强烈愿望”,笔者采用“字本位”的上述两种“结构划分”细化了“一种知识信息数据处理方法及产品(珠海邹晓辉的发明2000)”的汉语部分。 本文主要论证“字本位与中文信息处理”方面的探索成果与研究心得,即:在完善“两表”的基础上,用“两表”为“参照系”进一步解析“字与字组的关系”。 8.3.1 “字本位”与“两表” 基于“字本位”而构造的“汉语语汇数据库”,用事实证明了汉语“字本位”理论的优越性。 基于“字本位”而确立的“字与字组的关系”,在“两表”中可得到“形式化”体现。 由文本总量控制模型(GTCM)“4,5,6”分表构成“汉语(的字和基于字的)字组粗分模型”(见:图1);由音节总量控制模型(GSCM)“1,2,3,…,m”分表构成“汉语(的字和基于字的)字组细分模型”(见:图2)。 以下的探讨所述的“两表”特指“汉语字组粗分模型”与“汉语字组细分模型”。 下面用“两表”作为解析“字与字组的关系”立体坐标从“字内信息、字间信息、字外信息”三个

文档评论(0)

1亿VIP精品文档

相关文档