电子公文主题词测试系统地研究.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
电子公文主题词测试系统的研究 孙莉张工厂 (东华大学计算机学院,上海200051) E-mail:zgczgc2008@126.tom 摘要随着计算机科学技术的发展,电子政务的应用也越来越广.电子公文的应用也越来越多。如何对电子岱文进行 主题词的测试也成为了非常重要的问题。本文将着重介绍电子公文的主题词测试系统的研完。 美键词电子政务电子公文主题词测试 ResearchofTheme-wordsTest ofE-document System SunLiZhangGongchang of and Technology,Doughua 200051) (CollegeComputer University,Shanghai Abstract:Withthe ofseienceand of is widerand technology,the becoming development applicationE-government wider.and∞doesE—document.Howteconducttheme-wordstestbecomes will veryimportant.Thispaper present of researchtheme-wordstest ofE-document. system Keywords:E—government,E-documentttheme-words,teat 1引言 计算语言学家是早把HMM技术应用于英语的词性标注 在世界各国积极倡导的“信息高速公路”的五个应用领域 并取得了极大的成功.仅仅依靠简单的统计方法就已达到95% 中.“电子政务”被列为第一位¨I,其后是“电子商务、远程教育、 左右的正确率。在词性标注中,可观察层是词的序州,隐藏层是 远程医疗、电子娱乐”。可见,政府信息化是社会信息化的基础 词类标记的序州,训练数据是标注好词性的文本语料,经过训 和重要组成部分。电子政务的主要目标之一是为公众提供高质 练的HMM就成为自动标注器.它可眦给只包含词序列的文本 高效的信息服务和事务办理。·电子公文在这一过程中扮演着重 中的每个同标注上词类标记。 要的角色。如何确保电子公文中出现的主题词符合国家标准, 就成为当前非常重要的问题。 非递归的名词短语,并取得了成功。 电子公文主题词测试系统正是为了解决该问题而提出的。 设N为HMM的状态数.M为观测符号数.T为观测符号 在本系统的研究过程中,采用以下方法: 序列的长度,HMM可由A、B和1r三个概率矩阵来定义,记为: (1)对电于公文体进行分词; X=(A.B.1r) (2)从分同的结果中提取主题词; 其中: (3)将提取出的主题词与电子公文中的主题词项进行比较. A=f%】为状态转移概率矩阵,矩阵元素粕为状态%转移列 H 如果一致.则通过测试;如果两者不一致,则确定其符合程度。

文档评论(0)

gubeiren_001 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档