- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中 文 信 息 学 报
第 15 卷 第 2 期 JOURNAL OF CHINESE INFORMATION PROCESSING Vol . 15 No. 2
基于统计方法的中文姓名识别
1 ,2 1 1 1 2
黄德根 杨元生 王 省 张艳丽 钟万勰
( 1. 大连理工大学计算机科学与工程系 大连 116024 ;
2 . 大连理工大学工程力学研究所 大连 116024)
摘要 :专有名词的识别对 自动分词有重要意义 。本文针对如何识别中文姓名做了有益的
尝试 ,主要采用基于统计方法 ,进行中文姓名识别 。本文建立了有监督学习机制 ,提出了句子
切分结果可信度等概念 ,并在此基础上建立了较好的统计模型 ,系统闭式精确率和召回率分别
达 95 . 97 %和 95 . 52 % ,开式精确率和召回率分别达 92 . 37 %和 88 . 62 % 。
关键词 :双词同现频度 ;单词频度 ;学习机制 ; 中文姓名识别
中图分类号 : TP39 1. 1
Identif ication of Chinese Na mes Based on Statistics
HUAN G Degen1 ,2 YAN G Yuansheng1
1 1 2
WAN G Xing ZHAN G Yanli ZHON G Wanxie
( 1. Dep art ment of Comp uter Science and Engineering ,2 . Research
Instit ute Of Engineering Mechanics ,Dalian U niver sit y of Technology DaLian 116024)
Abstract :Identification of Chinese names is one of import ant techniques to imp rove t he accuracy
of automatic wor d segment ation . This p aper p ropo ses an effective model based on st atistics to i
dentify Chinese names. It est ablishes rewar dsp unishment mechanism and supervisedlearning
mechanism , and p resent s t he reliabilit y for t he wor d segment ation in t he model . The experiment s
show t hat t he p recision and recall rate respectively reach 95 . 97 % and 95 . 52 % by clo se test ,
while t he p recision and recall rate are 92 . 37 % and 88 . 62 % by open test .
Keywords :bigram frequency ;unigram frequency ;learning mechanism ;chinese names identification
一 、引言
词是自然语言中有意义的、可以独立运用
您可能关注的文档
- 城dlg基础地理信息数据库的建立方法研究-计算机系统应用.pdf
- 城人口地理信息系统建设模式探讨-武汉大学学报·信息科学版.pdf
- 城公交线网评价的灰色关联模型-武汉理工大学学报交通科学与.pdf
- 城公交网络的鲁棒性分析模型水.pdf
- 地理国情普查内容与指标-数据采集.pdf
- 城地面沉降对给排水管道变形的影响-中国水网.pdf
- 城基础地理信息公共服务平台的建设与实践研究-张新长.pdf
- 城快速轨道交通接运公交路线网规划α.pdf
- 城桥梁隧道安全保护区域限制施工管理规定-合肥建委.doc
- 城温室气体核算工具20更新说明-世界资源研究所.pdf
- 基于统计学习的网络异常行为检测技术-信息通信学术期刊网.pdf
- 基于禁忌算法的快速公交网络系统仿真优化-计算机工程与应用.pdf
- 基于结构矩阵的电路网表编码方法的研究-计算机工程与应用.pdf
- 基于蛋白质相互作用网络分析右归丸治疗肾阳虚证的疗效机制.pdf
- 基于计算机辅助检测技术的滑坡模型试验坡面位移场测量-岩土力学.pdf
- 基于聚类算法的结构变异及其形成机制识别-计算机应用研究.pdf
- 基于线粒体基因对直翅目昆虫系统发育学的研究-吉林农业大学学报.pdf
- 基于质谱的定量蛋白质组学技术发展现状-生物技术通报-中国农业.pdf
- 基于道路和公交超级网络的公交路径查询系统-oalib.pdf
- 基于遗传算法的城公交骨架线网优化设计-计算机应用研究.pdf
文档评论(0)