- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
语言理论研究
汉语史研究中的数字化研究手段简介
□甘 勇
一、最初的方法 量异体字、古今字、通假字、冷僻字、讹俗字,在制作和显
汉语史研究中的数字化研究手段是语言学的计算机辅助 示方面有着特殊困难,故而其生产缺乏社会认同度,只能由
研究,即CAR(Compute-Assisted Research)的一部分。① 从事语言研究的学者和单位自己承担。近年来,不少的单位
(P56)最初语言学引入的数字化手段集中在语料库,特别是 和专家都意识到汉语言文字典籍数据数字化工作的重要,也
现代语言语料库的建设方面,即将以往由纸制材料存储的语 有了一些初步的成果。
料改为由计算机存储,从而实现了由自然人的阅读向机器阅 (二)关系数据库系统
读的转变。机器阅读以其速度、精确度方面的优势为语言研 全文检索系统只是利用数字化资料的最为基础的应用,
究中的统计、采样、辞书编纂等提供了方便。数字化最先在 它以字符串作为数据,采用的是非组织化的整体存储方式,
汉语史研究中的应用也是从古籍语料库的建设和利用开始 数据之间的关系被人为隔开,该方式决定我们只能通过它进
的,其后又引入了关系数据库等手段,为文献语料精细分析 行直接的、穷尽性的字符串检索。然而语言研究中的要求是
加工提供了可能。 多种多样的,绝不满足于全文检索系统的检索字、词、句。
我们认为,迄今汉语史研究的数字化主要包括语料的数 关系数据库技术是在全文检索技术之后又一个深受语言
字化(古籍电子语料库建设)、原有语言知识的数字化(汉 研究者青睐的技术手段,两者各有所长,互相补充。全文检
语史专家知识库建设)和新语言知识生成的数字化三个层 索系统主要存储非线性的、非结构化的数据信息,数据库系
次。语料的数字化多借助于古籍文献语料全文检索系统而实 统则主要存储、管理有组织的、结构化的数据信息,通俗地
现,原有语言知识的数字化和新语言知识生成的数字化则既 讲,就是类似于表格的数据信息。所谓关系数据库是指能处
借助全文检索系统,又借助关系数据库及其编程技术而实 理二维表格,能够进行投影、连接和选择等关系操作的数据
现。 库。该数据库既便于人们观察数据的关系,又具备强大的系
(一)古籍文献语料全文检索系统 统管理功能,能开展一些全文检索系统不能胜任的工作。
古籍文献语料全文检索系统,亦被称作古籍电子化,是 数据库技术运用于汉语史研究是从汉语史专家知识库的
指“利用现代计算机技术,对古籍文献进行科学系统的整 建设开始的。从事汉语史研究的学者发现大量的语言学典
理,主要应解决存储与检索问题”,它服务于相关人文社会 籍,其文献结构本身就是结构化的。如《广韵》《集韵》等
科学的各个部门。据《国学宝典》的设计制作者尹小林先生 韵书,文献本身即构成语言知识,它们是古代语言学家语言
②
的观点 ,古籍全文检索系统的主要制作程序包括以下十个方 研究成果的一个固化。1986年华中工学院陈汉清、邓希敏完
面:1.选书;2.数据规划;3.录入;4.补字;5.审校;6.标 成的《古今字音对照手册》计算机处理系统通过了技术鉴
引;7.软件编写;8.数据联调;9.软件测试;10.界面设计。 定。该系统将《古今字音对照手册》作为信息源全部存入计
汉语史因其主要的工作就是从古代文献语料中发现语言 算机,建立了古今字音对照的原始资料库、数据资料库以及
规律,故而成为古籍文献语料全文检索系统的最为主要的用 面向专家分析、研究、检索、验证系统,大大方便了音韵学
户之一。古籍文献语料全文检索系统的主要优点是“长于检 ⑤[P89-91]
研究。 此外,关系数据库技术还可应用于汉语
您可能关注的文档
最近下载
- NHA-509稳态工况法工控柜安装手册V1.1.doc VIP
- 办公设备采购(电脑、打印机等)投标方案.docx VIP
- 南华NHA509汽车排放气体测试仪操作规程24页.pdf VIP
- 苏教版二年级数学上册全单元测试题(可打印).docx VIP
- 可行性研究报告-财务分析表格-全部带公式-准完美版.xls VIP
- PLC控制的Z3050型摇臂钻床电气控制报告讲解.pdf VIP
- 公安局辅警招聘考试试题库《综合理论知识》(含政治理论、法律法规、公安工作基本知识).pdf VIP
- 核心素养导向下的大单元教学设计.docx VIP
- (高三地理试卷)-693-江苏省连云港、徐州、淮安、宿迁四市高三第一次调研考试(一模)地理的试题.doc VIP
- 新概念英语第一册练习题Lesson43—Lesson44.pdf VIP
文档评论(0)