全唐诗全宋诗分析系统介绍.doc

  1. 1、本文档共7页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
全唐诗全宋诗分析系统介绍

全唐诗分析系统 全宋诗分析系统 产品说明 中国国际图书贸易集团有限公司 北京大学数据分析研究中心 北京欣诺格科技有限公司 2010年8月 设计理念和定位 1、产品设计理念 “全唐诗分析系统”与“全宋诗分析系统”由北京大学数据分析研究中心和北京欣诺格科技有限公司联合研制。 1998年北京大学中文系承担了国家“九五”211项目——“全唐诗电子检索系统”的研发。项目主持人李铎博士为项目提出了三个目标:一、使用Unicode编码,使全球任何语言版本的操作系统均可正常使用该系统;二、使用XML标记语言,脱离数据库平台,使用最先进的搜索引擎,实现跨平台的多维度检索;三、建设开放的、可扩展的模块化结构,可以任意增减数据。鉴于当初互联网上数据不精,往往给学术研究带来不便的问题,该项目组制定出文本校对高于纸介出版物的标准。此后,作为211项目子课题,吸收借鉴“全唐诗分析系统”的成功经验和先进的设计理念,又设计制作了“全宋诗分析系统”。 2、产品定位 “全唐诗分析系统”与“全宋诗分析系统”突破了以往全文检索的信息提供模式,在数据深层挖掘和知识发现方面具有开创性意义。其重出诗提取、格律诗标注、字及词组的频率分布统计、用户自作诗的格律分析等带有智能化特点。该系统还提供多维的检索分析方式,为中国古代文学、古代汉语、古文献学等研究领域提供了可靠的分析数据。它的成功研制标志着计算机科学在中文信息处理应用方面由全文检索的信息提供模式开始转向智能分析模式。“全唐诗分析系”与“全宋诗分析系统”是信息处理技术与中国古代文学研究的成功结合,展示出信息技术在中国古代文学研究领域应用的方向和广阔前景。海内外专家一致认为该系统达到了国际领先水平,在信息处理技术与中国古代文学研究结合方面居国际领先地位。 3、应用领域 ◇ 在古代文学研究方面可应用于:诗人风格研究、诗歌流变研究、诗文相关研究、地域文化与诗歌特征研究等。 ◇ 在古代汉语研究方面可应用于:古代诗歌语言模式分析、诗歌字及词组频率分析、诗歌语言发展史研究、音韵学相关研究等。 ◇ 在古代文献整理方面可应用于:重出诗整理分析、误收诗分析等。 ◇ 在古代文学教学方面可应用于:格律诗教学模拟系统研究、诗作评价、诗作相似性分析等。 ◇ 在跨学科研究方面的可应用于:计算机技术与古代文学相关研究、古代文献数据深层挖掘、古代文献数据自动化整理等。 4、典型用户 目前全球范围内有近100家单位和个人正在使用或已经购买“全唐诗分析系统”与“全宋诗分析系统”,一些典型用户如下。 ◆中国国家图书馆、中华书局、温岭市图书馆、台湾中央研究院、日本首都大学东京中文研究室 ◆北京珍本书店、北京科普图书有限公司 产品功能介绍 1、技术创新点 ◇ 格律诗自动标注 《全唐诗》57000多首,《全宋诗》254240首,其中格律诗占三分之二,数据量大,人工无法完成。本系统使用计算机自动完成此项工作,为此建设了格律诗模型库、音韵库等知识库,对《全唐诗》、《全宋诗》每一首诗进行多维判断,准确地提取出了全部格律诗。 图:格律标注 产品功能介绍 重出诗的提取 《全唐诗》、《全宋诗》的编纂中有重出现象,本系统使用比较复杂的算法,由计算机自动提取出全部重出诗,为进一步整理分析《全唐诗》、《全宋诗》打下了基础。 产品功能介绍 自作诗分析 本系统使用格律诗模型库、音韵库等知识库,对用户自作的诗进行分析,可以准确地分析出用户自己的诗作是否合律。 2、功能特点 ◇ 强大的检索功能 “全唐诗分析系统”与“全宋诗分析系统”提供了全文检索、重出诗检索、诗人小传检索和高级检索。支持严格数据检索和混合模式检索,所谓混合模式是指输入繁体或者简体汉字,均可检索到与之相对应的简体或繁体字,如输入“后”可以检索到“后”与“後”。所谓严格数据检索,即输入“后”只检索“后”,输入“後”只检索“後”。该系统支持人名、别名扩展检索,如输入“杜甫”或“子美”或“杜工部”均可检索到全部杜甫诗作。 产品功能介绍 科学的分析功能 “全唐诗分析系统”与“全宋诗分析系统”统可以进行字、词组和诗歌格律使用情况的统计和分析。作为智能分析系统,它远远超过了人力统计分析的效率,利用计算机进行智能分析和穷尽式统计,可以为学术研究提供更多的增长点。 系统配置 1、客户机 中央处理器:Intel Celeron 2GHz(或以上) 内存:512MB DDR2(或以上) 网络带宽:512Kbps(或以上) 显示器分辨率:1024×768(或以上) 操作系统:Windows XP(或以上)/ Windows 2003(或以上)、 浏览器:IE 6.0(或以上)/ FireFox 3.5(或以上),须开启 Javascript 功能 字体库:Sun-ExtA、Sun-ExtB、宋体-方正超大字符集 多媒体插件:Adobe

文档评论(0)

aicencen + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档