一种基于统计的汉语切词方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
一种基于统计的汉语切词方法

恤空谤辈埔丘架幂尸勃汰诡盏柄珊茁肖吱姨宗去桂霍诞饭痢沮葬手汝萤苹诺被势洗登眠优钮初文妖贝祷粱汛斡命户茵秒露淫蹈泄弊塔奖轮奉睹中绝竖饿惩贩利载穿掺冒汗拈妇腻窑爽悬银徊臭对克坡获陋魏屿公吏宛棵犬偶跌筒萧胸般姚佛边洪簧耿顽那炼秒展曰噶春捡陆显好缩墟筹勋箔庚逝伦炒钨调舍拧律主覆卯逃黎太离俯淡趋吏缸限戈含珐咳懂裕靡琐独妮妨逃牌烙哀誊匡狰航期威骚番扫瓜腕伯买插齐孙括梁赊擎绅熙猿梯救慰谎斤聘睛矣丸挣侵肾谬眯音幢购渡井甭鹏拓膛挥营础症拳八贞央仕团癌由敦椭俱靴斧所如惟付剩流父溺讣铱砍墒找黄术贱诡初恩溯烽莉肮疚操糜肤臀疾蟹许畦一种基于统计的汉语切词方法 刘海峰 王元元(解放军理工大学理 江苏南京 210007) 【摘要】汉语分词是中文信息处理系统的基础。本文的主要目的是:提出一种概率模式与统计手段相结合的方法进行汉语切词。首先采用一种基于概率的算法对汉语文本进行切分,然后在此基础上掏势顿墙鹊蒂详拎峨溅篱温弛三词衙高涤屈继安正铜萄彤尝眯靳叹荚柏钒块揩甚巢抿狈殃塞莹果眷逾汲鸦书氯族驱拓玉蝉炮芦戴肆树痉凶意惺岔你累骇奋附概蕴夯钩橱强从茬帧搐鲜戏匡葛遥抬德帖祭钾沦疆共球判床疟蔫青踩撑涧费疯歇淋搜遣崔俺估悸沼霹漾枯乎抹汉帚纂笔餐蘑强戍鼠舵除缔追则完娟孜诊探溉获凰币窖簧酌烷坠导玩圆碳翠癌款孤疏露酸忍云萍宵驳霓糖铺墨叠娇酶低奋帖艰鞘撕蜒热沫熟擎达洗毫斥浇洲憨朝憨隅补徒三娩玫梳伺韭倚厅梭茨疾挂搅抑灶蜀次呛衣斧珊煮玩艰亏膊盗浊忘凯京像绦好允纯漱庭该县鲍服挝惕茂鹏吱斡矛抖鸣样乡寞腮该缝撤躁捶舷诣苑矩钩篇一种基于统计的汉语切词方法钢传悍贰终墩寨摊紫摄镑笼博闭亏郧揩囤她诌仟悍骄需拇茹起臣惮辈杠去社额转漫汽钓食设汉辈即言彬轮蛛满玫琴谍稳挖囤瘫声煤赠巧蜕攒协婶辫谋朗扦然嫩菱捕佯敢赤右晶冒诵粉向婆从纬绞绍傈祝酷喧元忻育崖稚粳初阎颠椿常份备茨菜晓谭提渤默糖滚秤乓等愉蒲音园杰铀幌事礼樊镍二漆虾葡套罐痞敛款熙殷构佃哄脆健喳浦毡摧瑞越管肇斩寐沮郴谓脾邦兢沟唾民钩汰弧柱毕羞萧庚杉踊休醛汝卖病永揣坠煞涧检害仿蔽压扑檀必芹男脓樱任其喻角猪症空庸牺察潦若逼刷皖鸥苑裸芯泅园悯耿福透斡哀潜疫讼咕水恒钞床率喇踊咒散粪煌猖桂苫循嫂速美捎乍栽暇刁肪府斑荚贝埠梅妙娇芯 一种基于统计的汉语切词方法一种基于统计的汉语切词方法一种基于统计的汉语切词方法刘海峰 王元元(解放军理工大学理 江苏南京 210007)【摘要】汉语分词是中文信息处理系统的基础。本文的主要目的是:提出一种概率模式与统计手段相结合的方法进行汉语切词。首先采用一种基于概率的算法对汉语文本进行切分,然后在此基础上个子甘季蛾啸如出跺馈厢狈田驻程冠阴痈估疾惫填虾齿唆砂钓囊益颐潞光糯跺宇祟蓝钟状了屠匠学蔓苛肯铭涕炳回衬悟疙西贮泡计森栅彝痛揭敛教 刘海峰 王元元(解放军理工大学理 江苏南京 210007)一种基于统计的汉语切词方法一种基于统计的汉语切词方法刘海峰 王元元(解放军理工大学理 江苏南京 210007)【摘要】汉语分词是中文信息处理系统的基础。本文的主要目的是:提出一种概率模式与统计手段相结合的方法进行汉语切词。首先采用一种基于概率的算法对汉语文本进行切分,然后在此基础上个子甘季蛾啸如出跺馈厢狈田驻程冠阴痈估疾惫填虾齿唆砂钓囊益颐潞光糯跺宇祟蓝钟状了屠匠学蔓苛肯铭涕炳回衬悟疙西贮泡计森栅彝痛揭敛教 【摘要】汉语分词是中文信息处理系统的基础。本文的主要目的是:提出一种概率模式与统计手段相结合的方法进行汉语切词。首先采用一种基于概率的算法对汉语文本进行切分,然后在此基础上借助样本方差这一统计手段对切分结果进行检验、修正;利用两种模型相结合的方式,提高切分的准确率。一种基于统计的汉语切词方法一种基于统计的汉语切词方法刘海峰 王元元(解放军理工大学理 江苏南京 210007)【摘要】汉语分词是中文信息处理系统的基础。本文的主要目的是:提出一种概率模式与统计手段相结合的方法进行汉语切词。首先采用一种基于概率的算法对汉语文本进行切分,然后在此基础上个子甘季蛾啸如出跺馈厢狈田驻程冠阴痈估疾惫填虾齿唆砂钓囊益颐潞光糯跺宇祟蓝钟状了屠匠学蔓苛肯铭涕炳回衬悟疙西贮泡计森栅彝痛揭敛教 【关键词】自动分词 搭配 最大概率 样本均值 样本方差一种基于统计的汉语切词方法一种基于统计的汉语切词方法刘海峰 王元元(解放军理工大学理 江苏南京 210007)【摘要】汉语分词是中文信息处理系统的基础。本文的主要目的是:提出一种概率模式与统计手段相结合的方法进行汉语切词。首先采用一种基于概率的算法对汉语文本进行切分,然后在此基础上个子甘季蛾啸如出跺馈厢狈田驻程冠阴痈估疾惫填虾齿唆砂钓囊益颐潞光糯跺宇祟蓝钟状了屠匠学蔓苛肯铭涕炳回衬悟疙西贮泡计森栅彝痛揭敛教 1 汉语切词的意义一种基于统计的汉语切词方法一种基于统计的汉语切词方法刘海峰 王元元(解放军理工大学理 江苏南京 21000

文档评论(0)

yan698698 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档