基于Web检索的陕北民歌语料库设计.pdf

基于Web检索的陕北民歌语料库设计.pdf

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于 Web 检索的陕北民歌语料库设计  摘 要:运用语料库语言学的基本观点,探讨陕北民歌语料库构建原则及 Web 管理系统的 设计实现设计了陕北民歌 ACCess 语料数据库,其中包含全文语料数据表、句子语料数据表 、陕北民歌词表数据表共 3 个。介绍语料库的在线检索和管理功能,提出字词频统计功能 和 Web 在线检索功能实现的方法,开发基于 ASP 的陕北民歌开放性语料库 Web 管理系统, 用户可以方便地通过 IE 浏览器进行语料检索、词频统计、语料提取等操作。关键词:语料 库; 陕北民歌; 频度统计; Web 检索   中图分类号:TN911-34; TP311 文献标识码:A   文章编号:1004-373X(2010)22-0038-02   Design of Folk Song Corpus Based on Web Retrieval   ZHANG Tong-xuan    (Management Office of South Campus, WEinan Teacher University, Weinan 714000, China)   Abstract: The structuring principle of folk song corpus of WEB management system is investigated with the basic features of corpus linguistics. The ACCess corpus database of folk songs of northern Shaanxi province is created, in which the full-text corpus form, the sentence corpus form and the lyric corpus form are contained. The online retrieval and management functions of the corpus are introduced. The implementation method of the word frequency statistics function and Web online retrieval function is proposed. The Web management system of the folk song corpus based on the ASP is developed. As a result, users can carry out the online retrieval, word frequency statistics and corpus extraction through IE browser.Keywords: corpus; folk song of northern Shaanxi province; frequency statistics; Web search   收稿日期:2010-06-28   基金项目:渭南师范学院 2010 专项基金资助项目(10YKZ055)   语料库作为基础研究是近年来应用语言学研究的一个重要发展。建立陕北民歌语料库 是一个浩大工程,也是陕北民歌研究取得新突破的基础工程。陕北民歌是特定的时代、特 定地理环境中的特定产物,是陕北劳动人民抒发感情的最好手段。陕北民歌研究始于 20 世 纪初,到 20 世纪 80 年代中后期,在各个方面的研究都取得了不少成绩[1]。不过,传统研究 往往着眼于作品的人文及艺术特征,研究者多半依靠自身良好的文化修养与“强闻博记”,凭感 悟直接把握作品的内涵 ,对作品的语言全貌进行横向或纵向的细密分析时,往往显得力不从 心[2]。20 世纪 80 年代以来,随着计算机应用技术的不断发展,以语料库为基础的研究在语 言学和计算机科学研究中都取得了丰硕的成果。无论是在语言学研究,还是在自然语言处 理领域,语料库都已经成为重要的基础资源,发挥了越来越重要的作用。   1 陕北民歌语料库设计   1.1 陕北民歌语料库建设原则   语料库通常指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语 或口语样本汇集而成,用来代表特定语言或语言变体。通过语料库可以观察和把握语言事 实,分析和研究语言系统规律。语料库已经成为语言学理论研究和语言工程不可缺少的基 础资源,对它的研究已发展成为一个跨世纪、跨学科的语言研究学科。   陕北民歌语料库是“专用性语料库”(Specialized Corpus),是

文档评论(0)

qicaiyan + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档