基于局部性原理的有意义串提取方法研究.pdfVIP

基于局部性原理的有意义串提取方法研究.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于局部性原理的有意义串提取方法★ 黄玉兰L2,龚才春3,许洪波1,程学旗1 (1.中困科学院计算技术研究所北京100190:2.中国科学院研究生院北京100190) ’ (3.北京市计算中心北京100005) E—mail:huan毅ulan@sofiware.ict.ac.cn 摘要:本文提出基于局部性原理的有意义串提取算法。本文发现有意义串遵循空间局部性原理和时间局 部性原理,并用LE值量化字符串的局部性。在此基础上,利用LE值和其他统计璺共同提取有意义串。 实验证明局部性原理能够提离查找有意义串的准确率,并且可以有效提取低频有意义串。 关键词:有意义串,局部性原理,准确率 on AMeani I Stri Extracti onAI i thmBased ngfu ng got LocaI i ty HUANGYh.1an坨,GONGCai-chun¨,XU Hong-bo‘,CHENGXue-qil (3.BeijingComputingCenter,Beijing,100005) E-mail:huangv—ulan,q一/,;software.ict.ac.cn’ Abstract:A extraction basedOn is inthis strings string algorithm localitypresentedpaper,Meaningful meaningful and LEvalueis toestimatethe foreach observe locality.A proposed localitydegree string.The£E temporalspatial with showthat carl valueCanbeusedtOextract otherstatistical佗atures.Experimentslocality meaningfulstrings canbeextracted this the by addition,Low-frequentmeaningfuls廿ings effectivelyalgorithm. improveprecision.In Keywords:meaningfulstring;locality;precision. 1 引言 词汇抽取是自然语言处理的基础,各种模型都要面临词汇抽取问题,如词性标注、句法分 析等。中文语料中没有空格标识词的边界,因此从中文语料中抽取词汇的难度更大。现在已有不 少学者开展了词汇抽取的研究工作,并将抽取结果用于信息检索【1】、文本分类【2】、机器翻译【3】 领域。 词汇抽取的任务是从语料中提取具有特定语义、能够独立使用的字符串。符合这种性质的字 String,MS)。具体来说,有意义串具有;DT几个特点: 符串称为“有意义串”(Meaningful 1) 具有一定的流通度,在真实语料中频繁出现:

文档评论(0)

带头大哥 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档