- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
北京语料库检索使用说明
北京语料库检索使用说明
首? 页
一 关于CCL语料库及其检索系统
二 关于查询表达式
2.1 特殊符号
2.2 基本项
2.3 简单项
2.4 复杂项
2.5 过滤项
2.6 子句
2.7 查询表达式
三 关于查询结果
四 在结果中查找
五 举例
一 关于CCL语料库及其检索系统
1.1 CCL语料库及其检索系统为纯学术非盈利性的。不得将本系统及其产生的检索结果用于任何商业目的。CCL不承担由此产生的一切后果。
1.2 本语料库仅供语言研究参考之用。语料本身的正确性需要您自己加以核实。
1.3 语料库中所含语料的基本内容信息可以在“高级搜索”页面上,点击相应的链接查看。比如:?? “作者列表”:列出语料库中所包含的文件的作者?? “篇名列表”:列出语料库中所包含的篇目名?? “类型列表”:列出语料库中文章的分类信息?? “路径列表”:列出语料库中各文件在计算机中存放的目录?? “模式列表”:列出语料库中可以查询的模式
1.4 语料库中的中文文本未经分词处理。
1.5 检索系统以汉字为基本单位。
1.6 主要功能特色:
支持复杂检索表达式(比如不相邻关键字查询,指定距离查询,等等);
支持对标点符号的查询(比如查询“?”可以检索语料库中所有疑问句);
支持在“结果集”中继续检索;
用户可定制查询结果的显示方式(如左右长度,排序等);
用户可从网页上下载查询结果(text文件);
二 关于查询表达式
本节对CCL语料库检索系统目前支持的查询表达式加以说明。
2.1 特殊符号
查询表达式中可以使用的特殊符号包括7个: |?? ?? $?? ??? #?? ?? +?? ? -???? ~?? ? !?
这些符号分为三组:
Operator1: |
Operator2: $?????? #?? ?? +????? -???? ~??Operaotr3: !?
符号的含义如下:
(一) Operator1:? Operator1是二元操作符,它的两边可以出现“基本项”(关于“基本项”的定义见2.2)
(1)? |?? 相当于逻辑中的“或”关系。
(二) Operator2:Operator2是二元操作符,它的两边可以出现“简单项”(关于“简单项”的定义见2.3)
(2)? $?? 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数小于或等于Number(3)? #?? 表示它两边的“简单项”出现于同一句中,不考虑前后次序。两个“简单项”之间相隔字数小于或等于Number(4)? +?? 表示它两边的“简单项”按照左边在前、右边在后的次序出现于同一句中。两个“简单项”之间相隔字数刚好等于Number
(5)? -?? 表示它左边的“简单项”出现于句子中,并且,在右边相隔Number个字的范围内,-号右边的“简单项”不出现。
(6)? ~?? 表示它左边的“简单项”出现于句子中,并且,在左边相隔Number个字的范围内,~号右边的“简单项”不出现。
(三)Operator3:Operator3是一元操作符。
(7)? !?? 表示它后面的“简单项”是本次查询的主关键字符串,显示查询结果时以该“简单项”作为中心来进行定位。
注意: Operator2后面的Number是必须的,不能省略。Number=0表示相邻,Number=1表示间隔1个单位,其余依此类推。
2.2 基本项
指不包含特殊符号和空格的连续字符串
2.3 简单项
简单项可以由以下三种形式的序列组成
(1)? 基本项
(2)? 基本项1 Operator1 基本项2 Operator1 ...
(3) (基本项1 Operator1 基本项2 Operator1 ...)
注意:在实际表达式中,Operator1 前后不能有空格
2.4 复杂项
复杂项可以由以下三种形式的序列组成
(1)? 简单项
(2)? 简单项1 Operator2 Number 简单项2?
(3)? 简单项1 Operator2 Number Operator3 简单项2
其中第二种形式,等价于?? Operator3 简单项1 Operator2 Number 简单项2,换句话说,如果以第一个简单项作为查询结果的显示中心,!可以省略。
注意:Number为0和正整数。Operator2,Operator3前后均不能有空格
2.5 过滤项
过滤项可以包含以下表达式:
(1)author:简单项(2)name:简单项(3)path:简单项(4)type:简单项(5)pattern:简单项
(“author:简单项”的含义是指“author:”后面跟的表达式是上面2
您可能关注的文档
最近下载
- 妇科手术切口脂肪液化管理中国专家意见(2025年版)解读PPT课件.pptx VIP
- 卫生部修订病历书写基本规范(全文).pdf VIP
- 学术论文写作与规范课件(1).pptx VIP
- 2025年济南市中考英语试题卷(含答案解析).docx
- 【《社交媒体对旅游目的地营销传播的影响实证研究》20000字(论文)】 .pdf VIP
- 【安全类】卸料平台监理实施细则.docx VIP
- 标准图集-08SS523-建筑小区塑料排水检查井.pdf VIP
- 富士达各功能电梯地址码(1)(1).pdf VIP
- 建筑地面工程防滑技术规程.docx VIP
- 乡村振兴及人居环境整治工程施工图设计总说明.docx VIP
文档评论(0)