- 1、本文档共38页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
UAMCorpusTool版本20用户手册(2008年9月)MickODonnell.PDF
汉译:刘晓晗 Liu Xiaohan
UAM CorpusTool
版本 2.0 用户手册
(2008 年9 月)
Mick O’Donnell
michael.odonnell@uam.es
(Translated by Liu Xiaohan)
1
汉译:刘晓晗 Liu Xiaohan
目录
第一节:关于UAM CorpusTool
第二节:项目的创建
1 创建一个新的项目
2 添加层系(layer )
3 添加文件以供分析
4 加入文件的操作
4.1 改变文件元数据
4.2 浏览文件的常规统计信息
4.3 从语料库中撤出文件
4.4 打开标注窗口
5 退出CorpusTool
6 继续已有项目
第三节:制定标注体系
1 打开体系编辑器
2 编辑体系
3 添加“注释”到特征
4 选项菜单
5 生成图像到文件或网页
第四节:文件标注
1 标注类型
2 标注整体文档文件
3 标注分节文件
3.1 生成、移动并选定节(切分段)
3.2 忽略节
4 标注图像文件
5 “其它按钮”菜单
第五节:语料库查询
1 简介
2 指定查询式
3 检索式搜索
4 启动查询式
5 修改查询式
6 搜索结果界面
第六节:自动标注
1 简介
第七节:语料库统计
1 简介
2 对比特征研究
3 研究操作
4 解释结果:特征研究
5 展示结果为网络式
6 保存统计数据
第八节:文本样式器
2
汉译:刘晓晗 Liu Xiaohan
1 文本的样式
2 打开文本样式器
3 文本样式化
4 样式文本的保存
附录一:导入Systemic Coder 研究结果
附录二:查询式搜索中的词汇特征
3
汉译:刘晓晗 Liu Xiaohan
第一节:关于第一节:关于UAM CorpusTool
第一节:关于第一节:关于
1 简介
UAM CorpusTool 是文本和图像语言标注的工具集,其核心内容包括:
用户制定一个“项目”,即一组文档,和应用于每一文档的分析规则。
每一类“分析规则”可视为标注的“层系”。CorpusTool 现在有两种类型的
标注。
1. 整体文档标注整体文档标注:文档(文本或图像)的整体特征标注。例如,这些特征可
整体文档标注整体文档标注
以表明该文档的语域(语场、语旨、语式)或文本类型。
2. 切分段标注切分段标注:用户选择文件中的节,并分别赋予特征。节可通过鼠标在文
切分段标注切分段标注
本/ 图像中拖动指定,同时提示用户指定该节的特征值。
后续版本将添加其他标注类型,可以是修辞结构理论(RST ),体裁结构(GSP ),
参与者链条(participant chaining ),句子结构(比如主语、谓语、情态、附加语
adjunct 等),口语数据标注等等。
UAM CorpusTool 取代作者之前的Systemic Coder 软件仅能在单一层系上对单个
文档标注。UAM CorpusTool 是为了克服Coder 用户诸多限制的一个尝试。我希
望感谢广大 Coder 用户近年来作出的评论和本新软件的评论。参见附录一讲
Systemic Coder 研究结果导入CorpusTool 。
CorpusTool 相关在:
/CorpusTool/
访问该网站以指导CorpusTool 在电脑中的安装。
您可能关注的文档
- Proquest数据库信息推送.ppt
- Python以及QuTip包简介.PDF
- Q195钢盘条折弯开裂原因分析-材料与测试网.PDF
- QM之基础数据.doc
- R32冷媒产品售后安装维修操作指引-暖通空调.ppt
- Railgun一切皆可缓存-Cloudflare.PDF
- RDC5121用户手册-深圳市睿达科技有限公司.PDF
- RhinogenResazurin细胞活性检测染料-苏州瑞安生物科技有限公司.PDF
- RNAscope25HD检测试剂盒(棕色)用户手册第2部分-诺为生物.PDF
- R语言中的t-test和ANOVA组员.ppt
- 深度剖析:2025年智慧仓储自动化升级项目实施成本控制与效益分析.docx
- 深度学习与人工智能:2025年AI医疗影像诊断在骨折病例中的效果评估.docx
- 面向2025年的轨道交通装备智能化运维技术体系构建与节能降耗策略研究.docx
- 2025年教育科技行业人才需求与供给失衡问题及对策报告.docx
- 批判性思维与独立判断班会.pptx
- 农业科技引领乡村振兴,2025年农业产业链协同创新研究.docx
- 农业生物技术在种质资源创新中的基因编辑技术应用现状与展望报告.docx
- 2025年主题公园沉浸式体验项目开发与虚拟现实技术培训报告.docx
- 城市更新中历史文化街区保护与开发的社区共建共享模式研究报告.docx
- 2025年绿色建材市场推广策略与绿色建筑材料市场布局报告.docx
文档评论(0)