浅述将LRC文件转换成XML单词本.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
浅述将LRC文件转换成XML单词本

浅述将LRC文件转换成XML单词本   摘要:本文叙述了使用Microsoft Visual Studio 2008环境和C++语言,将市面出售的考试单词书附赠光盘中LRC歌词文件或单词文本文件处理成为基于XML的单词本,并讨论了ANSI、Unicode、UTF-8编码之间的异同和转换,转换成XML单词本后可导入有道词典等工具中使用。   关键词:LRC;可扩展标记语言   中图分类号:TP391.41文献标识码:A文章编号:1007-9599 (2011) 24-0000-02   Analysis of the LRC File into XML Word   Gao Zijuan,Zhou Mosong   (Software College of Hebei Normal University,ShiJiaZhuang050018,China)   Abstract:There are many words in lyrics files of the CD from a word book.In this article,the authors transform these lyrics files to XML files by using Microsoft Visual Studio 2008 and C++ programming language.The XML files can be used in Youdao dictionary.The article also describes the differences and transformation among ANSI code,Unicode and UTF-8 code.   Keywords:LRC;XML   一、引言   随着全球化的发展,英语的使用越来越多,英语的学习是必不可少的。在英语的学习中,单词问题成为国人最为烦恼的问题,纸质的单词本是解决方法之一,但由于单词不易分类,携带不便等原因已不能满足很多人的需求。有道词典有电子单词本的功能,却不容易将自己所需要背下的单词一次性导入。本文叙述了使用Microsoft Visual Studio 2008环境和C++语言,将市面出售的考试单词书附赠光盘中LRC歌词文件或单词文本文件处理成为基于XML的单词本,并讨论了ANSI、Unicode、UTF-8编码之间的异同和转换,转换成基于可扩展标记语言(XML)单词本后可导入有道词典等工具中使用。   二、LRC文件和XML   (一)LRC文件   LRC是一种计算机文件格式,用于与一个音频文件同步歌词。它是一种包含着“*:*”形式标签的、基于纯文本的歌词专用格式。   单词书所带光盘的LRC文件中包括行时间标记、标题(ti)、唱片集(al)、作者(ar)、建者(by),在此我们只关注行时间标记,也就是记录了单词和词义的歌词正文部分。行时间标记格式为:[mm:ss.xx],其中mm为分钟数,ss为秒数,xx为百分之一秒。也就是说每行开头的十个字符后面的内容是我们所需要的单词和词义,我们需要在程序中将读进的每行内容的前十个字符去除,保存为新文件。此部分代码如下:   ifstream fin_lrc(file_lrc);   getline(fin_lrc,str_tmp,lim);   str_tmp=str_tmp.replace(0,10,);   //将读入的一行中从第0个位置开始的共计10个字符去除。   if(str_tmp.length()!=0)    fout_textstr_tmpendl;   while(getline(fin_lrc,str_tmp,lim)   {   if(fin_lrc.peek()==EOF)break;   str_tmp=str_tmp.replace(0,10,);   if (str_tmp.length()!=0)   fout_textstr_tmpendl;    }    fout_textendl;   (二)可扩展标记语言XML   可扩展标记语言XML具有良好的扩展性,但遵循严格的语法要求,它内容与形式分离,便于在不同系统之间传输信息。   我们需要将刚才处理过的文件,添加被有道词典等软件所识别的XML标签,使它变成单词本。   单词本中所有内容被一对所包含,每个单词被一对所包含,而标签表示单词,标签表示词性和词义,表示音标表示单词所属于的分类。   在刚才已处理过的文本中,每行包括一个单词和相应的词性词义,中间以空格分隔,用如下代码将其分割成单词和词性词义两部分,然后添加所需标签。   getlin

文档评论(0)

3471161553 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档