读txt文档,匹配单词数据库查询.docVIP

下载本文档

15
0
约3.37千字
约 8页
2017-01-08 发布于重庆
举报
版权申诉

读txt文档,匹配单词数据库查询.doc

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

读txt文档,匹配单词数据库查询

一：JAVA程序读取.txt文档，所需要的基本知识 1：File类是文件名极其目录路径的一个包装类。在Windows中，语句 new File(“c:\\book”)在目录下c:\book下创建一个File对象二：因为我们做的是一个对英文文本文档，做四六级单词的匹配并且进行标注出来，所以我们需要应用正则表达式进行对单词的匹配。我们学习一下各种匹配问题。首先学习一下应用正则表达式对汉字的匹配这个表达式是匹配汉字的正则表达式：[\\u4e00-\\u9fa5] 这个是一个测试文本： String s2=”h 无材可去补苍天，枉入红尘若许年。;/?!@\|~`”; String s1=”[\\u4e00-\\u9fa5]” Pattern p=Ppile(s1); Matcher m=p.matcher(s2); 上图是匹配汉字，把汉字找到之后，然后把是汉字的用1进行替换。这是我们用空白替换之后所得到的而这个表达式：前面加个符号“^”[^\\u4e00-\\u9fa5]，是把所有的不是汉字的进行匹配，包括英文字符以及各种标点符号空格符号。不是汉字的进行匹配，然后在把不是汉字的进行用1替换 “\”:将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如，“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。 “\w”:匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”。 “\W”:匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。 “\d”:匹配一个数字字符。等价于[0-9] String mi = [^\\w]|\\d;//不是单词的正则表达式 Pattern p = Ppile(mi);//运用不是单词的正则表达式的规则 Matcher m = p.matcher(s2);//对s2进行匹配如图是把不是单词的匹配掉三：因为进行四六级单词查询问题，所以我们需要掌握有关数据库查询语句。 1：首先来学习一下先前做的郑码查询所用的基础知识问题。先从最基本的问题开始。 dbName=request.getParameter(name);//得到表单传过来的值 dbmyName=new String(dbName.getBytes(ISO-8859-1),UTF-8); （1）就是将字符集改成UTF-8的形式（2）字符编码转换，因为tomcat容器默认采用了..iso-8859-1的编码方式。 charAt(index) 方法返回字符串生成器中下标为某个特定下标index的字符 2：SQL选择语句的使用： SELECT * FROM 表名称使用符号 * 取代列的名称，星号（*）是选取所有列的快捷方式 SELECT 列名称 FROM 表名称 WHERE 列运算符值其中运算符有“=”等于；“”和“!=”代表不等于例如：SELECT * FROM Persons WHERE City=Beijing ORDER BY 语句： ORDER BY 语句用于根据指定的列对结果集进行排序例如本郑码查询中： sqlstr = select * from zhengma2 where zi = +zi.charAt(i)+ ORDER BY zi; zhengma2：代表表名 Zi(第一个zi)：代表数据库中表名为zhnegma2的这个表的列名为zi的这一列 zi.charAt(i)：代表你输入的汉字。例如我们输入汉字“啊你好” 4：SQL 模糊查询：在进行数据库查询时，有完整查询和模糊查询之分。一般模糊查询语句如下： SELECT 字段 FROM 表 WHERE 某字段 Like 条件其中关于条件，SQL提供了四种匹配模式：（1），% ：表示任意0个或多个字符。可匹配任意类型和长度的字符，有些情况下若是中文，请使用两个百分号（%%）表示。比如 SELECT * FROM [user] WHERE u_name LIKE %三% 将会把u_name为“张三”，“张猫三”、“三脚猫”，“唐三藏”等等有“三”的记录全找出来。另外，如果需要找出u_name中既有“三”又有“猫”的记录，请使用and条件 SELECT * FROM [user] WHERE u_name LIKE %三% AND u_name LIKE %猫% 若使用 SELECT * FROM [user] WHERE u_name LIKE %三%猫% 虽然能搜索出“三脚猫”，但不能搜索出符合条件的“张猫三”。（2），_ ：表示任意单个字符。匹配单个任意字符，它常用来限制表达式的字符长度语句：比如 SELECT * FROM [use