antconc使用.pptVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Antconc使用 2010.11.10 免费软件 下载网址:http://www.antlab.sci.waseda.ac.jp/antconc_index.html 下载版本: antconc3.2.1w 使用指南:http://www.antlab.sci.waseda.ac.jp/software/README_antconc3.2.1.txt 链接时间: 2008年4月13日 英语词频 日本人开发,支持中文。 北大计算所98年1月份人民日报分词语料为例 计算词频,生成词频表; 计算n元组的出现频率; 保存结果 处理中文之间要做个语言设置,否则显示乱码 Antconc包括以下工具: 索引 Concordance 索引定位 Concordance Plot 文件查看 File View 词丛 Clusters N元模式(部分词丛) N-grams 搭配 Collocates 词单 Wordlist 关键词单 Keyword List 索引工具 使用步骤: 选择文件(一个或多个); 输入检索词; 使用“Search Window size”(检索窗口大小)选择检索词两边显示的字符数; 按“start”开始产生索引行的检索结果,按stop随时停止; 使用“Kwic Sort”(上下文关键词分类)选择一个目标词赖重排索引行,0是检索词,1L、2L是检索词左边第一、第二个单词; 按sort键重新分类排序; 将指针移到其中一行索引行突出的检索词上,指针变成手形工具,点击检索词,可以看到检索词在原文出现的情况。 注意:索引行的总数在“concordance hits”下显示,处理结束时,会“FINISHED”;如果没有产生索引行,则“NO HITS”,并且索引行的窗口不会更新。 检索词可以通过“search term”上面的word选项设定为“词(默认)”或“词的片段”,也可以通过case来选择不区分大小写,也可选择“Regex”使用完整的正则表达式。 /quickstart.html 按Advanced键,可以进行更为复杂的搜索。 两个高级搜索项: 定义一组检索词,可以一行一个的输入,也可以直接载入文件中的检索词单,这个特征允许用户使用一大组检索词,但不用每次重复输入; 定义上下文词(context words)和一个上下文的范围,在这个范围中必须出现检索词; 索引定位(concordance plot) 进行索引定位的步骤与索引工具的使用方法一样,索引定位工具提供了索引行另一个不同的视角。 每一个文件的所有索引条数都在一个条形码上定位出来,表示文中有检索词的索引行的位置所在。 可以查看哪些文件包含目标检索词,也可以确定检索词在哪儿遇到词丛。 索引条数、文件长度在条形码右侧显示, 文件查看 任何时候,目标文件都可以使用该工具来查看原文。 选择一个要查看的文件; “File View”按钮,start,得到检索词在原文中出现的情况; 使用Hit Location,可以跳到上一个或下一个检索词上; 改变检索词,点击开始键,查看其它检索项 词丛(Clusters) 用来生成目标文件检索词周围排列成序的词丛列表的。 词丛既可以按照频率也可以按照词头或词尾排序,也可以按照词丛第一个单词的出现概率排序。 用户可以选择每个词丛的最大或最小长度,以及列出词丛的最小频率。 可以选择检索词是否总出现词丛左边或右边。 使用词丛的操作: 选定主窗口上的clusters按钮,选择合适的排序选项; 按start键,任何时候都可以stop; 点击词丛会产生一组上下文关键词行或者索引行。 N元模式(部分词丛) 生成目标文件有序的N元组。 N元模式是单词的N元,大的文件将会产生大量的N元。 排序和词丛工具一样,可以选择N元的最大或最小尺寸,显示N元的最小词频。 生成N元模式的操作: 选择Clusters窗口模式下search term右边的N-grams选项; 选择合适的排列选项; 按开始键,任何时候都可以中止; 点击词汇束会产生一组上下文关键词行。 搭配(collocates)工具 用来生成目标文件的一组有序的搭配列表。 搭配可以按词频,也可以按检索词左边或右边的搭配频率,或者词头或词尾排序。也可以按照检索词和搭配间的统计量来排列。 统计量的值测的是检索词和搭配之间的相关程度。 可以选择检索词左右两边的单词跨度,显示搭配的最小频率。 要列一个搭配列表,需要进行的操作: 选择合适的排列选项,及相关设置; 按开始键,任何时候都可以中止; 点击搭配会产生一组上下文关键词行。 词表(word list) 生成目标文件的有序的词表。 词表既可以按词频也可以按词头或词尾的顺序排列。 选择合适的排列选项; 按开始键

文档评论(0)

kabudou + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档