- 1、本文档共9页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
PAGE1
PAGE2
人工智能汉语框架语义技术标注规范
第1部分:框架构建
范围
本文件规定了汉语框架的术语和定义、框架结构、框架分类以及框架构建流程。
本文件适用于汉语框架数据构建方开展框架创建活动。汉语框架数据需求方对框架数据进行检查、验收或第三方机构对框架数据进行评估的活动可参照执行。
规范性引用文件
本文件没有规范性引用文件。
术语和定义
下列术语和定义适用于本文件。
图式化场景
人类认识或理解客观世界的认知结构。
框架
对概念结构、实践经验、信仰习俗等的图式化表示。
框架语义
以框架为形式的语言意义。
义项
词的某种特定意义。
目标词
具体句子中能够激起框架的词。
语义角色
目标词和其他语言成分间的语义关系的标签。
框架元素
框架语义场景中的参与者、工具等要素,包括核心框架元素与非核心框架元素。
核心框架元素
框架语义场景中在概念和逻辑上必不可少的语义角色,如谓词的主语、宾语。
非核心框架元素
框架语义场景中在概念和逻辑上非必要的外围语义角色,如时间、空间、环境条件、原因、目的等。
词元
词形与特定义项的组合对,即具有特定意义的词。
每个词语可激起一个或者多个框架,但在具体的句子语境中,词元只能激起某个特定的框架。
框架结构
基本要素
汉语框架的基本要素可分为框架、框架元素及词元三部分,结构如图1所示。其中,框架包含框架中文名称、框架英文名称以及场景定义;框架元素包括中文名称、英文名称、缩写、类型以及定义;词元信息包括词、词性和例句。在一个汉语框架中,可以包含多个框架元素,以及多个词元。
汉语框架结构
框架名称
应对框架语义场景进行简洁、准确的描述,并同时具备中文名称和英文名称:
框架中文名称命名原则:
名称应准确指称图示化场景;
字符长度应适宜。
框架英文名称命名原则:
应遵循框架中文名称命名原则;
首字母应大写。
场景定义
应用简洁准确的文字描述抽象的图式化场景,对框架场景中的语义角色及其关系进行整体描述,可提供例句以帮助理解所定义框架。
框架元素
中文名称
应采用简洁准确的文字,概括命名图示化场景中的语义角色。
英文名称
应采用框架元素中文名称的对等词来命名。英文名称的首字母须大写。
缩写
是对框架元素英文名称进一步简化,其英文字母须全部小写。
类型
应从概念和逻辑角度,根据其在语义场景中的必要性判断是否属于“核心框架元素”或“非核心框架元素”。
定义
应采用简洁明确的文字,概括描述框架场景中的语义角色。
词元
应是能激起框架的语言成分。词元的词性应是动词、名词、形容词等12种词性之一,词性定义与示例参见附录A。
框架分类
事件类框架
用于描述在特定时间发生的、包括行为、活动及状态变化的框架,应有助于分析事件发生的相关参与者、时间、地点及可能的后果,框架示例参见附录B的表B.1~表B.3。
关系类框架
用于描述不同实体间的相互依存、联接或互动关系的框架,应强调它们之间的相关性,框架示例参见附录B的表B.4~表B.6。
状态类框架
用于描述实体在特定时间点的特定属性、条件或特征的框架,应着重于描述实体的瞬时情况和相关属性,框架示例参见附录B的表B.7~表B.9。
实体类框架
用于描述具体的实体,包括这些实体名称、特征、类别、用途或相关属性等信息,应有助于系统性地组织和理解各种实体的本质和特点,框架示例参见附录B的表B.10~表B.12。
框架构建流程
框架创建应按照图2所示流程进行实行,详细示例参见附录C1:
收集语料:确立目标词并收集包含目标词的句子语料,应尽可能多的收集数据;
分析语料:对句子语料进行句法分析,应理解目标词的主语、宾语、定语、状语等句法成分;
归纳图示场景:对句法成分进行语义层面分析并确立目标词语义的图式化表示;
确认框架信息:通过图式化场景中各个参与者/工具之间的静态/动态关系以及前/背景关系,确定框架名称、场景定义和框架元素;
扩充词元:收集归纳能激起该框架的其他词语,扩充语义框架的词元。
框架创建流程图
(资料性)
词性定义及示例
词性定义及示例见表A.1。
表A.1词性列表
词性
定义
示例
名词
表示人或事物名称的词。
人、友谊、团体、今天、北京。
动词
表示人或事物的动作、存在、变化的词。
走、笑、有、在、看。
形容词
表示人或事物的性质或状态的词。
高、细、软、白。
数词
表示数目的词。数词连用或者加上别的词,可以表示序数、分数、倍数、概数。
第一、八成、百分之五、一千倍、十六七。
量词
表示人、事物或动作的单位的词。
尺、寸、斗、升、斤、两、个。
代词
代替名词、动词、形容词、数量词、副词的词,包括:人称代词,疑问代词,指示代词。
人称代词:我、你、他;
疑问代词:谁、什么、哪儿;
指示代词:这、这里、这么。
副词
修饰或限制动词和形容词,表示范围、程
您可能关注的文档
- 自然资源要素支撑产业高质量发展指导目录(2024年).docx
- 自驾车旅居车康养旅游线路设计指南.docx
- “行”认证总结介绍.pptx
- 猪流行性腹泻免疫防控技术规程.docx
- 猪苓趁鲜加工技术规程.docx
- 中医智慧康养管理规范.docx
- 中深层地热能开发方案编制技术要求井下换热.docx
- 智能仪表集成互操作信息模型.docx
- 智慧图书馆空间建设指南.docx
- 植保智能漫雾机通用技术规范.docx
- 2025年中国金属加工机床行业市场深度研究及投资规划建议报告.docx
- 2025年中国精密注塑件行业市场深度分析及投资战略规划报告.docx
- 中国斜锥型提取罐行业市场全景监测及投资前景展望报告.docx
- 2025年中国粮油机械行业市场全景调研及投资规划建议报告.docx
- 2025年中国公路养护机械市场规模预测及投资战略咨询报告.docx
- 2025年中国三元催化转化器市场供需现状及投资战略研究报告.docx
- 中国通用零部件制造机械修理行业市场调查研究及投资战略咨询报告.docx
- 2020-2025年中国汽车钢管行业市场深度分析及发展前景预测报告.docx
- 智能家居用品设计》教学设计 2023—2024浙教版初中劳动技术七年级.pdf
- 中国车载T-BOX市场竞争策略及行业投资潜力预测报告.docx
文档评论(0)