网站大量收购独家精品文档,联系QQ:2885784924

UAMCorpusTool版本20用户手册(2008年9月)MickODonnell.PDF

UAMCorpusTool版本20用户手册(2008年9月)MickODonnell.PDF

  1. 1、本文档共38页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
UAMCorpusTool版本20用户手册(2008年9月)MickODonnell.PDF

汉译:刘晓晗 Liu Xiaohan UAM CorpusTool 版本 2.0 用户手册 (2008 年9 月) Mick O’Donnell michael.odonnell@uam.es (Translated by Liu Xiaohan) 1 汉译:刘晓晗 Liu Xiaohan 目录 第一节:关于UAM CorpusTool 第二节:项目的创建 1 创建一个新的项目 2 添加层系(layer ) 3 添加文件以供分析 4 加入文件的操作 4.1 改变文件元数据 4.2 浏览文件的常规统计信息 4.3 从语料库中撤出文件 4.4 打开标注窗口 5 退出CorpusTool 6 继续已有项目 第三节:制定标注体系 1 打开体系编辑器 2 编辑体系 3 添加“注释”到特征 4 选项菜单 5 生成图像到文件或网页 第四节:文件标注 1 标注类型 2 标注整体文档文件 3 标注分节文件 3.1 生成、移动并选定节(切分段) 3.2 忽略节 4 标注图像文件 5 “其它按钮”菜单 第五节:语料库查询 1 简介 2 指定查询式 3 检索式搜索 4 启动查询式 5 修改查询式 6 搜索结果界面 第六节:自动标注 1 简介 第七节:语料库统计 1 简介 2 对比特征研究 3 研究操作 4 解释结果:特征研究 5 展示结果为网络式 6 保存统计数据 第八节:文本样式器 2 汉译:刘晓晗 Liu Xiaohan 1 文本的样式 2 打开文本样式器 3 文本样式化 4 样式文本的保存 附录一:导入Systemic Coder 研究结果 附录二:查询式搜索中的词汇特征 3 汉译:刘晓晗 Liu Xiaohan 第一节:关于第一节:关于UAM CorpusTool 第一节:关于第一节:关于 1 简介 UAM CorpusTool 是文本和图像语言标注的工具集,其核心内容包括: 用户制定一个“项目”,即一组文档,和应用于每一文档的分析规则。 每一类“分析规则”可视为标注的“层系”。CorpusTool 现在有两种类型的 标注。 1. 整体文档标注整体文档标注:文档(文本或图像)的整体特征标注。例如,这些特征可 整体文档标注整体文档标注 以表明该文档的语域(语场、语旨、语式)或文本类型。 2. 切分段标注切分段标注:用户选择文件中的节,并分别赋予特征。节可通过鼠标在文 切分段标注切分段标注 本/ 图像中拖动指定,同时提示用户指定该节的特征值。 后续版本将添加其他标注类型,可以是修辞结构理论(RST ),体裁结构(GSP ), 参与者链条(participant chaining ),句子结构(比如主语、谓语、情态、附加语 adjunct 等),口语数据标注等等。 UAM CorpusTool 取代作者之前的Systemic Coder 软件仅能在单一层系上对单个 文档标注。UAM CorpusTool 是为了克服Coder 用户诸多限制的一个尝试。我希 望感谢广大 Coder 用户近年来作出的评论和本新软件的评论。参见附录一讲 Systemic Coder 研究结果导入CorpusTool 。 CorpusTool 相关在: /CorpusTool/ 访问该网站以指导CorpusTool 在电脑中的安装。

文档评论(0)

wendang_12 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档