- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一个现代汉语语义知识库的研究和实现.pdf
一个现代汉语语义知识库的研究和实现
陈群秀
清华大学计算机科学与技术系智能技术与系统国家重点实验室,北京 100084
E-mail:cqx@s1000e.cs.tsinglIua.edu.cn
摘要:本文首先提出汉语词汇语义知识表示的一种解决方法:对动词、形容词从格框架角度用论旨网格描
述其句法、语义、语用知识,对名词从槽关系角度用槽关系联想表达式(槽类型、槽序)描述复杂定语与被
修饰的中心词的语义关系,对名词还从语义场角度描述上下位语义关系。然后。本文着重介绍清华大学计
算机系与中国人民大学,北京语言大学、北京青年政治学院凝同承担的四个语言工程“现代汉语述语动词
机器词典”、。现代汉语述语形容词机器词典”,。现代汉语名词槽关系系统”、“信息处理用现代汉语语义分
类词典”的研究和实现情况。最后,论文还建立了现代汉语语义知识库平台.
关键词:现代汉语述语动词机器词典:现代汉语述语语形容词机器词典:现代汉语名词槽关系系统:信息
处理用现代汉语语义分类词典:论旨网格方法:槽关系表示方法:槽类型:槽序:槽关系联想表达式
l前言
目前。世界上各国学者十分重视语言信息处理的知识资源的建设,知识包括词汇学知识、
句法学知识、语义学知识、语用学知识乃至常识方面的知识,核心问题是语义学知识。相比
而言.句法分析理论和技术(无论是对外语还是对汉语)发展得比较成熟和完善,语义学则
是难度较大、起步较晚的一个薄弱环节,空白点更多。特别是面向机器处理的语义学研究,
国内外起步时问均不长。汉语缺乏屈折变化,是意合语言是语义型语言.对语义的依赖更大,
句法分析对句子的贡献比英语等语言要小,语义分析对汉语机器理解尤为重要。因此研究面
向机器处理的汉语语义知识表示更具有重大意义。在语义知识中词汇意义占很重要的位置,
是驾驭整个语义系统的基础。
在对述语动词、述语形容词、名词词组作了大量的分析和研究的基础上,我们决定:对
述语动词、述语形容词用论旨网格方法、从词法、句法、语义、语用多角度全面描述动词和
形容词的信息,重点是语义信息;对名词的定语从语类、语序、定语与中心语的语义关系(槽
类型、槽序)等多角度进行描述;同时对名词还从分类的角度描述名词的上下位关系。即:
对汉语述语动词、述语形容词从格框架角度用论旨网格方法描述其语义、语用知识:对汉语
名词的定语从槽关系角度以槽关系为主、以语类、语序为辅、用槽关系联想表达式(槽类型
和槽序的表达式)描写复杂定语与被修饰的中心名词的语义关系;对名词还从语义场角度(即
义类角度)描述上下位语义关系和语义特征。基于此,清华大学与中国人民大学、北京语言
大学、北京青年政治学院共同承担了“现代汉语述语动词机器词典”、“现代汉语述语形容词
机器词典”、“现代汉语名词槽关系系统”、。信息处理用现代汉语语义分类词典”四个语言工
程的研究和实现的项目。本文下面将着重介绍这四个语言工程的研究和实现情况。
一172—
2现代汉语述语动词机器词典的研究和实现
清华大学和中国人民大学正是抓住动词词典这个关键中的关键,自1994年开始以“现
代汉语述语动词机器词典的研究和建立”为题开展合作,对现代汉语常用的7800个动词的
10000个义项作详细描述,用计算词典方法建造一部信息丰富、结构合理的机器可循词典
(MachineTractable
者和科技工作者使用。
现代汉语述语动词机器词典的特点是:以原则参数语法作为理论指导,以论旨网络
function)”作详尽描写:从论旨角色语义约束的角度,建立汉语句词性概念的分类体系
据的传统词典学编辑方法同主要以从机贮语料库中获取的大量例证为依据的计算词典学编
辑方法结台起来.以使动词机器词典的研究和建立真正立足在丰富和客观的语言事实基础
上;除了构造一部现代汉语述语动词典外.还建立一个功能齐全的软件支撑环境。
现代汉语述语动词机器词典工作单描述的信息包括“词形”、“拼音”、“动词类型”、“论
元数目”、“义项数目”、“义项序号”、“释义”等词汇信息.包括论旨模式的“基本式l”及
“句例”、“变换式I”及“句例”、“基本式2”及“旬例”、“变换式2”及“句例”、“基本
式3”及“句例”、“变换式3”及“句例”、“论旨名称”、 “语类”、“句法功能”、“语义分
类”、“语义特征”、“论旨标记”、“论旨实例”等论旨属性(语义、句法、语用
您可能关注的文档
- 《财会信息数据资源元数据规范》研制工作的设想.pdf
- 《财务会计》教学模式优化设计中的情景教学.pdf
- 《贵州农业科学》1988~2005年载文作者群分析.pdf
- 《超声回弹综合法检测混凝土强度技术规程》CECS+0288修订简介.pdf
- 《超限高层建筑工程抗震设计指南》的编制及概要.pdf
- 《轻型客车结构安全要求》解说.pdf
- 《过程流体机械》教学过程中的一些基本认识.pdf
- 《过程装备成套技术》课程建设与教学实践.pdf
- 《过程装备成套技术》课程的教学方法讨论.pdf
- 《过程设备设计》在线考试系统.pdf
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
最近下载
- 保障性住房承诺书.pdf VIP
- 人教版(2024新版)八年级上册物理期末质量监测试卷 3套(含答案).docx VIP
- 二级建造师考试精讲PPT课件.pptx VIP
- 高中历史《中外历史纲要(下)》教材问题注解和课后题答案大全 加页码 简化版 加页眉.pdf VIP
- 西师大版小学四年级数学上册试题单元测试卷含答案(全册).pdf VIP
- rcwl-9610低成本分体开放式超声波测距芯片.pdf VIP
- 中国急性胰腺炎诊治指南(2021).pptx VIP
- 八上地理每日默写知识点(背诵版).pdf VIP
- XX医院医德医风领导小组制度及职责.docx VIP
- 院感监测采样方法课件.ppt VIP
文档评论(0)