数据库中怎样处理大型数据.docVIP

下载本文档

1
0
约1.31万字
约 8页
2017-06-09 发布于北京
举报
版权申诉

数据库中怎样处理大型数据.doc

1、本文档共8页，可阅读全部内容。
2、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。
3、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
5、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
6、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
7、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
8、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

数据库中怎样处理大型数据

处理百万级以上的数据提高查询速度的方法： ?1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 ?2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 ?3.应尽量避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描，如：???? select id from t where num is null???? 可以在num上设置默认值0，确保表中num列没有null值，然后这样查询：???? select id from t where num=0 ?4.应尽量避免在 where 子句中使用 or 来连接条件，否则将导致引擎放弃使用索引而进行全表扫描，如：???? select id from t where num=10 or num=20???? 可以这样查询：???? select id from t where num=10???? union all???? select id from t where num=20 ?5.下面的查询也将导致全表扫描：(不能前置百分号)???? select id from t where name like ‘%abc%’??? 若要提高效率，可以考虑全文检索。 ?6.in 和 not in 也要慎用，否则会导致全表扫描，如：???? select id from t where num in(1,2,3)???? 对于连续的数值，能用 between 就不要用 in 了：???? select id from t where num between 1 and 3 ??8.应尽量避免在 where 子句中对字段进行表达式操作，这将导致引擎放弃使用索引而进行全表扫描。如：???? select id from t where num/2=100???? 应改为:???? select id from t where num=100*2 ?9.应尽量避免在where子句中对字段进行函数操作，这将导致引擎放弃使用索引而进行全表扫描。如：???? select id from t where substring(name,1,3)=’abc’–name以abc开头的id???? select id from t where datediff(day,createdate,’2005-11-30′)=0–’2005-11-30′生成的id???? 应改为:???? select id from t where name like ‘abc%’???? select id from t where createdate>=’2005-11-30′ and createdate<’2005-12-1′ ?10.不要在 where 子句中的“=”左边进行函数、算术运算或其他表达式运算，否则系统将可能无法正确使用索引。 ?11.在使用索引字段作为条件时，如果该索引是复合索引，那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引，否则该索引将不会被使用，并且应尽可能的让字段顺序与索引顺序相一致。 ?12.不要写一些没有意义的查询，如需要生成一个空表结构：???? select col1,col2 into #t from t where 1=0???? 这类代码不会返回任何结果集，但是会消耗系统资源的，应改成这样：???? create table #t(…) ?13.很多时候用 exists 代替 in 是一个好的选择：???? select num from a where num in(select num from b)???? 用下面的语句替换：???? select num from a where exists(select 1 from b where num=a.num) ?14.并不是所有索引对查询都有效，SQL是根据表中数据来进行查询优化的，当索引列有大量数据重复时，SQL查询可能不会去利用索引，如一表中有字段 sex，male、female几乎各一半，那么即使在sex上建了索引也对查询效率起不了作用。 ?15.索引并不是越多越好，索引固然可以提高相应的 select 的效率，但同时也降低了 insert 及 update 的效率，因为 insert 或 update 时有可能会重建索引，所以怎样建索引需要慎重考虑，视具体情况而定。一个表的索引数最好不要超过6个，若太多则应考虑一些不常使用到的列上建的索引是否有必要。 ?16.应尽可能的避免更新 clustered