- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
信息处理用现代汉语词类及词性标记集规范
(征求意见稿)
教育部语言文字应用研究所计算语言学室
“语料库加工”课题组
2002-04-08
1.名词(n),表示人和事物的名称或时间、位置,在句中主要充当主语和宾语。如:
手 山 云 学生 暑假 字典 长城 人类 车辆 气氛 意识 老者
运动员 今年 近代 清早 星期一 里头 下面 周围 北京 白垩纪
1.1普通名词(n),表示人和事物的名称。如:
人 书 水 导师 石匠 阿姨 老虎 柳树 辣椒 厨房 桌子 木头
温度 哲学 情况 作风 因素 思想 自行车 电冰箱 冰棍儿
1.2时间名词(nt),表示时间。如:
世纪 年代 期 年 周年 季 月 旬 星期 礼拜 日 天 夜 时
小时 点 刻 分 秒 毫秒 朝 代 朝代 世 纪 时代
八月/nt白露/nt白天/nt白昼/nt初四/nt春季/nt春天/nt国庆/nt黄昏/nt星期二/nt元旦/nt元月/nt月初/nt昨天/ntnh/三世/nt]nt
[路易/nh十五/m]nt 甲午/m年/nt 马年/nt 20/m世纪/nt
50/m年代/nt 三/m星期/nt
1995/m 年/nt/11/m月/nt 29/m日/nt 14/m 时/nt 15m分/nt
一九九五/m年/nt十一月/nt二十九/m日/nt十四/m时/nt十五/m分nt
一年的十二个月份、一周的七天、农历的初一到初十,为一个切分单位。如:
十二月/nt 星期天/nt 正月/nt初八/nt
1.3 方位名词(nd),表示位置的相对方向。如:
东 中 上 后 左 内 外 旁 边 侧 间 东方 后方 处所名词(nl),表示处所、位置。
处所名词一般由名词与方位名词(nd)构成组合,有的需要先切分再组合。如:
[窗/n外/nd]nlnl [海/n上/nd]nl[门/n前/nd]nl/nd]nl [外/n地/nl [后/nd院/n]nl [前/nd街/n]nl
1.5 人名(nh),表示人的名称(姓名)。
汉族人的姓和名切分,外国人及外族人姓和名不切分,依照汉族人姓名组合的外国人及外族人姓和名切分。姓标注为(nhf),名标注为(nhs),不切分的标注为(nh)。如:
张/nhf仁伟/nhs 欧阳/nhf修/nhs 阮/nhf志雄/nhs
朴/nhf贞爱/nhs 夫差/nh 西施/nh 貂禅/nh
鲁/nhf迅/nhs 茅/nhf盾/nfs 巴/nhf金/nhs
白/nhf桦/nhs 金/nhf日成/nhs 三毛/nh 琼瑶/nh
布什/nh 叶利钦/nh 才旦卓玛/nh 小林多喜二/nh
卡尔·马克思/nh 比尔·克林顿/nh 赛福鼎·爱则孜/nh
表示称谓的名词是一个半封闭系列,其系列集合中包括亲属、职务、职称等各种类型的称谓。如:
主席 书记 总理 总统 部长 司长 处长 科长 主任 经理 教授 讲师
助教 工程师 经济师 会计师 技师 医生 医师 同志 先生 师傅 小姐
公子 大婶 阿姨 老总 氏 爷(爷爷) 爸(爸爸) 妈(妈妈) 哥(哥哥)
姐(姐姐) 嫂(嫂嫂) 弟(弟弟) 妹(妹妹) 伯(伯伯) 叔(叔) 婶(婶)
舅(舅) 姑(姑) 爹(爹爹) 公(公公) 婆(婆婆) 外公 外婆 姑妈 姨妈
舅妈 老爸 老妈 老伯 老叔 老哥 老弟 老公 老婆 表哥 表姐 表嫂
表弟 表妹 表伯 表叔 父 母 兄 弟 姊 妹
姓/名/附缀+称谓,切分。如:
江/nhf主席/n 小平/nhs同志/n 江/nhf总/h书记/n 张/nhf教授/n
王/nhf部长/n 陈/nhf老总/n 李/nhf大娘/n 刘/nhf阿姨/n
龙/nhf姑姑/n 恩来/nhs同志/n 小/h李/nhf 老/h刘/nhf 大/h李nhf
带排行的亲属称谓,为一个切分单位。如:
大哥/n 小弟/n 小姐/n 大姐/n
[三/m哥/n]n [二/m妹/n]n [四/m伯/n]n [八/m叔/n]n [五/m爷/n]n
1.6地名(ns),表示地理区域的名称(包括国名、族名等)。
1.6.1 国名、族名
国名、族名都作为地名处理,能切分的先切分再组合。如:
中国/ns [中华/n[人民/n[共和/n国/n]n]n]ns [美利坚/ns合众国/n]ns,
[柬埔寨/ns王国/n]ns [蒙古/ns国/n]ns
文档评论(0)