- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
读txt文档,匹配单词数据库查询
一:JAVA程序读取.txt文档,所需要的基本知识
1:File类是文件名极其目录路径的一个包装类。在Windows中,语句 new File(“c:\\book”)在目录下c:\book下创建一个File对象
二:因为我们做的是一个对英文文本文档,做四六级单词的匹配并且进行标注出来,所以我们需要应用正则表达式进行对单词的匹配。
我们学习一下各种匹配问题。首先学习一下应用正则表达式对汉字的匹配
这个表达式是匹配汉字的正则表达式:[\\u4e00-\\u9fa5]
这个是一个测试文本:
String s2=”h 无材可去补苍天,枉入红尘若许年。;/?!@\|~`”;
String s1=”[\\u4e00-\\u9fa5]”
Pattern p=Ppile(s1);
Matcher m=p.matcher(s2);
上图是匹配汉字,把汉字找到之后,然后把是汉字的用1进行替换。
这是我们用空白替换之后所得到的
而这个表达式:前面加个符号“^”[^\\u4e00-\\u9fa5],
是把所有的不是汉字的进行匹配,包括英文字符以及各种标点符号空格符号。不是汉字的进行匹配,然后在把不是汉字的进行用1替换
“\”:将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。
“\w”:匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”。
“\W”:匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。
“\d”:匹配一个数字字符。等价于[0-9]
String mi = [^\\w]|\\d;//不是单词的正则表达式
Pattern p = Ppile(mi);//运用不是单词的正则表达式的规则
Matcher m = p.matcher(s2);//对s2进行匹配
如图是把不是单词的匹配掉
三:因为进行四六级单词查询问题,所以我们需要掌握有关数据库查询语句。
1:首先来学习一下先前做的郑码查询所用的基础知识问题。先从最基本的问题开始。
dbName=request.getParameter(name);//得到表单传过来的值
dbmyName=new String(dbName.getBytes(ISO-8859-1),UTF-8);
(1)就是将字符集改成UTF-8的形式
(2)字符编码转换,因为tomcat容器默认采用了..iso-8859-1的编码方式。
charAt(index) 方法返回字符串生成器中下标为某个特定下标index的字符
2:SQL选择语句的使用:
SELECT * FROM 表名称
使用符号 * 取代列的名称,星号(*)是选取所有列的快捷方式
SELECT 列名称 FROM 表名称 WHERE 列 运算符 值
其中运算符有“=”等于;“”和“!=”代表不等于
例如:SELECT * FROM Persons WHERE City=Beijing
ORDER BY 语句:
ORDER BY 语句用于根据指定的列对结果集进行排序
例如本郑码查询中:
sqlstr = select * from zhengma2 where zi = +zi.charAt(i)+ ORDER BY zi;
zhengma2:代表表名
Zi(第一个zi):代表数据库中表名为zhnegma2的这个表的列名为zi的这一列
zi.charAt(i):代表你输入的汉字。例如我们输入汉字“啊你好”
4:SQL 模糊查询:在进行数据库查询时,有完整查询和模糊查询之分。
一般模糊查询语句如下:
SELECT 字段 FROM 表 WHERE 某字段 Like 条件
其中关于条件,SQL提供了四种匹配模式:
(1),% :表示任意0个或多个字符。可匹配任意类型和长度的字符,有些情况下若是中文,请使用两个百分号(%%)表示。
比如 SELECT * FROM [user] WHERE u_name LIKE %三%
将会把u_name为“张三”,“张猫三”、“三脚猫”,“唐三藏”等等有“三”的记录全找出来。
另外,如果需要找出u_name中既有“三”又有“猫”的记录,请使用and条件
SELECT * FROM [user] WHERE u_name LIKE %三% AND u_name LIKE %猫%
若使用 SELECT * FROM [user] WHERE u_name LIKE %三%猫%
虽然能搜索出“三脚猫”,但不能搜索出符合条件的“张猫三”。
(2),_ : 表示任意单个字符。匹配单个任意字符,它常用来限制表达式的字符长度语句:
比如 SELECT * FROM [use
文档评论(0)