antconc使用.pptVIP

下载本文档

433
0
约2.49千字
约 20页
2016-12-16 发布于重庆
举报
版权申诉

antconc使用.ppt

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

Antconc使用 2010.11.10 免费软件下载网址：http://www.antlab.sci.waseda.ac.jp/antconc_index.html 下载版本： antconc3.2.1w 使用指南：http://www.antlab.sci.waseda.ac.jp/software/README_antconc3.2.1.txt 链接时间： 2008年4月13日英语词频日本人开发，支持中文。北大计算所98年1月份人民日报分词语料为例计算词频，生成词频表；计算n元组的出现频率；保存结果处理中文之间要做个语言设置，否则显示乱码 Antconc包括以下工具：索引 Concordance 索引定位 Concordance Plot 文件查看 File View 词丛 Clusters N元模式（部分词丛） N-grams 搭配 Collocates 词单 Wordlist 关键词单 Keyword List 索引工具使用步骤：选择文件（一个或多个）；输入检索词；使用“Search Window size”（检索窗口大小）选择检索词两边显示的字符数；按“start”开始产生索引行的检索结果，按stop随时停止；使用“Kwic Sort”（上下文关键词分类）选择一个目标词赖重排索引行，0是检索词，1L、2L是检索词左边第一、第二个单词；按sort键重新分类排序；将指针移到其中一行索引行突出的检索词上，指针变成手形工具，点击检索词，可以看到检索词在原文出现的情况。注意：索引行的总数在“concordance hits”下显示，处理结束时，会“FINISHED”;如果没有产生索引行，则“NO HITS”，并且索引行的窗口不会更新。检索词可以通过“search term”上面的word选项设定为“词（默认）”或“词的片段”，也可以通过case来选择不区分大小写，也可选择“Regex”使用完整的正则表达式。 /quickstart.html 按Advanced键，可以进行更为复杂的搜索。两个高级搜索项：定义一组检索词，可以一行一个的输入，也可以直接载入文件中的检索词单，这个特征允许用户使用一大组检索词，但不用每次重复输入；定义上下文词（context words）和一个上下文的范围，在这个范围中必须出现检索词；索引定位（concordance plot）进行索引定位的步骤与索引工具的使用方法一样，索引定位工具提供了索引行另一个不同的视角。每一个文件的所有索引条数都在一个条形码上定位出来，表示文中有检索词的索引行的位置所在。可以查看哪些文件包含目标检索词，也可以确定检索词在哪儿遇到词丛。索引条数、文件长度在条形码右侧显示，文件查看任何时候，目标文件都可以使用该工具来查看原文。选择一个要查看的文件； “File View”按钮，start，得到检索词在原文中出现的情况；使用Hit Location，可以跳到上一个或下一个检索词上；改变检索词，点击开始键，查看其它检索项词丛（Clusters）用来生成目标文件检索词周围排列成序的词丛列表的。词丛既可以按照频率也可以按照词头或词尾排序，也可以按照词丛第一个单词的出现概率排序。用户可以选择每个词丛的最大或最小长度，以及列出词丛的最小频率。可以选择检索词是否总出现词丛左边或右边。使用词丛的操作：选定主窗口上的clusters按钮，选择合适的排序选项；按start键，任何时候都可以stop；点击词丛会产生一组上下文关键词行或者索引行。 N元模式（部分词丛）生成目标文件有序的N元组。 N元模式是单词的N元，大的文件将会产生大量的N元。排序和词丛工具一样，可以选择N元的最大或最小尺寸，显示N元的最小词频。生成N元模式的操作：选择Clusters窗口模式下search term右边的N-grams选项；选择合适的排列选项；按开始键，任何时候都可以中止；点击词汇束会产生一组上下文关键词行。搭配（collocates）工具用来生成目标文件的一组有序的搭配列表。搭配可以按词频，也可以按检索词左边或右边的搭配频率，或者词头或词尾排序。也可以按照检索词和搭配间的统计量来排列。统计量的值测的是检索词和搭配之间的相关程度。可以选择检索词左右两边的单词跨度，显示搭配的最小频率。要列一个搭配列表，需要进行的操作: 选择合适的排列选项，及相关设置；按开始键，任何时候都可以中止；点击搭配会产生一组上下文关键词行。词表（word list）生成目标文件的有序的词表。词表既可以按词频也可以按词头或词尾的顺序排列。选择合适的排列选项；按开始键