- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
英语词汇分析工具软件的功能设计
摘 要:针对英语词汇数据分析中数据采集困难的问题,编制了英语词汇分析工具软件。该软件用于对教学材料词汇数据的采集,可采集词汇分级构成数据、单词量、总词量、词汇覆盖率、词频等。
关键词:英语;词汇分析;数据采集;功能设计
Functional design for English vocabulary analysis tool software
Li Dong1, Huang Jinru1, Lu Yingen2, Li Aihua1, Zou Mingxue1
1.Nantong University, Nantong, 226019, China;
2.Nantong Radio and TV University, Nantong, 226006, China
Abstract: This paper introduces the overall structure and functional design of the software which was designed in response to the diffuculty we met in the analysis of English vocabulary. The software can automatically produce difference types of data such as hierarchically organized words and their number, total number of words: repetive/non-repetitive and their percentage, word coverage and word frequency etc.
Key words: English; vocabulary analysis; data collection; function design
英语词汇数据分析在教材编写、试卷分析、语言研究中有很高的应用价值,提升教材和教学质量。由于英语词汇变化形式繁多,词汇数量庞大,人工完成材料中的词汇原型转换、分类统计、类型计算等工作,最终形成有效数据,十分困难,成为开展词汇数据分析的瓶颈。为此,笔者根据英语词汇特点,设计了采集词汇分析基础数据的专用软件―英语词汇分析工具软件,下载地址:http:///test_page_en61.exe。
1 设计原则
1.1 平台通用性原则
目前,计算机操作平台90%以上为Windows系列,其中Windows7占49%以上,居首位。因此,笔者选择在Windows7环境下完成程序编制,并通过WindowsXP,WindowsVista,Windows7的32位版和64位版平台兼容性测试。
1.2 操作简便性原则
操作界面设计简单、易懂,无需培训就能使用,并在操作界面同步提供帮助信息,便于操作者理解、使用(如图1所示为部分操作界面)。
图1 部分操作界面
1.3 人性化原则
现在最常见的文件格式是纯文本和html,操作平台无需安装其他软件就可使用。以试卷或教材作为英语词汇分析对象,生成的数据文件格式均采用纯文本文件,需要标色的数据文件使用html格式。提供数据文件存放路径设置功能,生成的所有数据文件存放在用户指定的文件夹内,方便日后查阅。用户可以对词汇数据库的参数做简单改动,了解当前和最新版本,及时升级软件,可以通过操作界面直接进入软件论坛交流信息。
2 功能设计
2.1 总体结构
词汇分析数据的采集是将测试材料中单词在词汇特征数据库的支持下逐一转变成原型,按难度分级、归类排序,统计得到原始数据,然后进入指定的数据加工模块进行简单计算,最终得到要求的基础数据。程序包括数据库部分与各功能程序部分,结构如图2所示。
图2 英语词汇分析工具结构图
2.2 数据库
系统包含两个数据库,一个是词汇数据库,另一个是生词库。
2.2.1 词汇数据库
通用词汇处理程序在识别测试文档的单词时,通过检索词汇数据库中对应词汇的相关信息,对检索词进行分类标记、原型转换和排序。词汇数据库收集了5万余个英语单词的特征信息,包括每个单词的系统序列号、各种变化形式和分级,分级参照2007年版大学英语词汇表,分为中学词汇、一般要求词汇、较高要求词汇、更高要求词汇、超纲词汇和高级词汇6个等级。
2.2.2 生词库
在处理过程中,一旦遇到词汇数据库没有收载的词汇,系统自动将其收入生词库中,管理生词库的程序对生词库自动进行重复词滤除、按首字母重新排序等,为扩充词汇
文档评论(0)