研究论文教程.PDFVIP

  1. 1、本文档共8页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
研究论文教程

研究论文 033 DOI :10.13530/ j .cnki.jlis.140002 学术文献的文体特征及其检索意义 ——— 计算机科学文献与相关新闻报道文体的比较研究∗ ∗ 邹永利  冯静娴  郑  荟 摘  要  计算机科学学术文献具有独特的文体特征,且部分特征能够用于计算机科学网络中文学术文献的自动识别与 检索,提高计算机科学学术文献的相对检准率。 本文通过建立计算机学术文献语料库与IT 新闻语料库,对计算机科学 学术文献和IT 新闻在特有表述、平均句长、中西文比例三方面的文体特征进行提取与加权,应用于基于百度的网络中文 学术检索系统(NSIRS)中。 结果显示,本研究提取并设定的文体特征能有效提高NSIRS 对计算机科学学术文献的检索 效率,从而证明发掘并应用特定学科文献独特的文体特征的意义。 图2。 表4。 参考文献14。 关键词  文体特征  计算机科学  学术文献  IT 新闻  NSIRS 系统 分类号  G354 StylisticCharacteristicsandRetrievalofChineseAcademicLiteratures: A Comparative Study on the Stylistic Characteristics between Aca⁃ demic Papersand PressReports of Computer Science ZouYongli, FengJingXian&Zheng Hui ABSTRACT  Computer science academic documents have distinctive stylistic features that can be explored to facilitate the au⁃ tomatic identification and retrieval of Chinese computer science academic papers on the web. This paper establishes a computer academic literature corpus and an IT news corpus to find the different typical expressions average length of sentences ratio of Chinese characters to Roman alphabets and gives them different weights. Finally this paper applies the results to Baidu⁃based NSIRS system. Precision evaluation over the NSIRS shows significant advantage of our approach over previous study using the same system. 2 figs. 4 tabs. 14 refs. KEYWORDS  Stylistic characteristics   Computer science   Academic literature   IT news   NSIRS system. 互联网上存在大量HTML 格式的免费中文学 异,开发出基于中文学术文献文体特征的网页检索 术文献,但缺失实用的检索工具或系统。 为了在海 系统(NSIRS)[3] ,验证了某些文体特征对于提高中 量互联网信息中自动识别网络中文学术文献,排除 文网络学术文献检准率的影响。 研究发现,中文学 [4] 干扰文献,我们借鉴日本学者安形辉、石田荣美、池 术文献文体特征存在学科差异 ,但尚未就这些差 - [1 2] 内淳 等人的研究思路,采用文体计量学方法, 异对特定学科文献检索效率的影响作深入研究。 对比学术文献与新闻报道、网络日志之间的文体差 计算机科学是与互联网联系最为紧密的学科,其网

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档