基于主题图的中文自动分类原型系统设计与实现(设计毕业资料).docVIP

基于主题图的中文自动分类原型系统设计与实现(设计毕业资料).doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于主题图的中文自动分类原型系统设计与实现(设计毕业资料) 文档信息 : 文档作为关于“IT计算机”中“Python”的参考范文,为解决如何写好实用应用文、正确编写文案格式、内容素材摘取等相关工作提供支持。正文4506字,doc格式,可编辑。质优实惠,欢迎下载! 目录 TOC \o 1-9 \h \z \u 目录 1 正文 2 文1:基于主题图的中文自动分类原型系统设计与实现 2 1 系统功能模块设计 3 2 系统设计思路(见图1) 4 3 系统实现 4 3.1 获取文本 4 3.2 中文分词 5 3.3 词频记录 5 3.4 词频统计 6 3.5 分类推荐 6 4 应用效果 7 5 结语 7 文2:探索基于Java3D的网络三维可视化原型系统设计与实现 7 摘要4-5 8 -21 9 -22 9 -24 10 -26 10 -28 10 -29 10 需求分析32 10 -34 10 -35 10 -36 10 -37 10 -38 10 -40 10 -42 11 -44 11 -47 11 -48 11 -50 11 -52 11 -54 11 -57 11 -58 11 -62 12 -63 12 -65 12 致谢72 12 参考文摘引言: 12 原创性声明(模板) 13 文章致谢(模板) 13 正文 基于主题图的中文自动分类原型系统设计与实现(设计毕业资料) 文1:基于主题图的中文自动分类原型系统设计与实现 主题图被誉为信息时代的GPS,它是多种技术进行融合而出现的一种新兴技术,其作为一种复杂的元数据、一种数字化的知识组织方式、一种智能化的知识索引方式、一种模型化的知识表示和导航技术、一种灵活的分布式资源链接技术,引起了国内外学者越来越多的关注和思考。近年来出现了主题图在图书情报机构、医疗机构、企业单位、网络教育、电子商务、政府部门等领域的研究和应用。主题图将资源之间的关系透过TAO,即主题(Topics)、资源出处(Occurrences)和关联(Associations)描述出来,它们就如同三维空间中的“点、线、面”,将一定领域的知识结构和他们之间的语义关联具体化。而在实际应用中,一般使用和存储XML 语法形式的XTM(XML Topic Maps)描述。 目前常用的主题图引擎有TM4J、tinyTIM、XTM4XMLDB和OKS等,然而仅有挪威Ontopia公司的OKS(Ontopia Knowledge Suite)获得了成功。Ontopia知识开发组件(Ontopia Knowledge Sui te,OKS)是由Ontopia公司开发的一个由本体驱动,基于Web的Topic Maps构建和管理工具,主要用于创建、维护、配置主题图应用程序,是目前较完整的商业开发工具。 在OKS(Ontopia Knowledge Suite)组件中,提供了基于主题图的自动分类功能,但是仅局限于英语和挪威语,缺乏对中文的支持。图书馆作为文献信息的服务机构,藏有大量历史文献,是众多历史研究者及历史爱好者查找资料、研究学习的场所。面对如此巨大的文献馆藏,若完全由人工来进行分类是不现实的。于是,在Ontopia的基础上实现了基于主题图的中文自动分类系统的原型系统。 1 系统功能模块设计 为实现基于主题图的中文自动分类,基于主题图的中文自动分类系统的目标如下:提供文档内容提交接口;提供文档上传接口;支持中文、英文、以及中英文混合文档;支持多种文档格式;自动提供分类推荐。 2 系统设计思路(见图1) 图1为系统功能模块,系统包括:分别是获取文本、中文分词、词频记录、词频统计、分类推荐。具体是:获取文本模块—其主要功能是通过提供用户接口,由用户提交文档内容或文档,获取文本;中文分词模块—其主要功能是分析文本,采用中文分词工具实现中文分词;词频记录模块—其主要功能是对分词结果进行词频计算;词频统计模块—其主要功能是根据词频记录进行统计排序;分类推荐模块—其主要功能是在词频统计的基础上返回分类推荐结果。 3 系统实现 3.1 获取文本 获取文本模块,其主要功能是与用户交互,从而获取需要分类的文本。 系统提供了两种用户交互的人机界面:一种是直接提交文档内容,一种是直接上传文档。 (1)第一种界面(直接提交文档内容)提供了用户输入文档内容的文本框。通过这个文本框,用户输入文本内容,提交到系统中。采用这种方式,用户的操作比较复杂,需要打开文档,然后再复制文档内容,再粘贴到文本输入框提交文

文档评论(0)

ayun1990 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档