- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
实战:MySQLSendingdata导致查询很慢的问题详细分析
【问题现象】
使用sphinx支持倒排索引,但sphinx从mysql查询源数据的时候,查询的记录数才几万条,但查询的速度非常慢,大概要4~5分钟左右
【处理过程】
1〕explain
首先疑心索引没有建好,于是使用explain查看查询方案,结果如下:
从explain的结果来看,整个语句的索引设计是没有问题的,除了第一个表因为业务需要进行整表扫描外,其它的表都是通过索引访问
2〕showprocesslist;
explain看不出问题,那到底慢在哪里呢?
于是想到了使用showprocesslist查看sql语句执行状态,查询结果如下:
发现很长一段时间,查询都处在“Sendingdata”状态
查询一下“Sendingdata”状态的含义,原来这个状态的名称很具有误导性,所谓的“Sendingdata”并不是单纯的发送数据,而是包括“收集+发送数据”。
这里的关键是为什么要收集数据,原因在于:mysql使用“索引”完成查询结束后,mysql得到了一堆的行id,如果有的列并不在索引中,mysql需要重新到“数据行”上将需要返回的数据读取出来返回个客户端。
3〕showprofile
为了进一步验证查询的时间分布,于是使用了showprofile命令来查看详细的时间分布
首先翻开配置:setprofiling=on;
执行完查询后,使用showprofiles查看queryid;
使用showprofileforqueryquery_id查看详细信息;
结果如右:
从结果可以看出,Sendingdata的状态执行了216s
4〕排查比照
经过以上步骤,已经确定查询慢是因为大量的时间消耗在了Sendingdata状态上,结合Sendingdata的定义,将目标聚焦在查询语句的返回列上面
经过一一排查,最后定为到一个description的列上,这个列的设计为:`description`varchar(8000)?DEFAULTNULLCOMMENT游戏描述,
于是采取了比照的方法,看看“不返回description的结果”如何。showprofile的结果如下:
可以看出,不返回description的时候,查询时间只需要15s,返回的时候,需要216s,两者相差15倍
【原理研究】
至此问题已经明确,但原理上我们还需要继续探究。
这篇淘宝的文章很好的解释了相关原理:innodb使用大字段text,blob的一些优化建议
这里的关键信息是:当Innodb的存储格式是?ROW_FORMAT=COMPACT?(or?ROW_FORMAT=REDUNDANT)的时候,Innodb只会存储前768字节的长度,剩余的数据存放到“溢出页”中。
我们使用showtablestatus来查看表的相关信息:
可以看到,平均一行大约1.5K,也就说大约1/10行会使用“溢出存储”,一旦采用了这种方式存储,返回数据的时候本来是顺序读取的数据,就变成了随机读取了,所以导致性能急剧下降。
另外,在测试过程中还发现,无论这条语句执行多少次,甚至将整个表select*几次,语句的执行速度都没有明显变化。这个表的数据和索引加起来才150M左右,而整个Innodbbufferpool有5G,缓存整张表绰绰有余,如果缓存了溢出页,性能应该大幅提高才对。
但实测结果却并没有提高,因此从这个测试可以推论Innodb并没有将溢出页〔overflowpage〕缓存到内存里面。
这样的设计也是符合逻辑的,因为overflowpage本来就是存放大数据的,如果也放在缓存里面,就会出现一次大数据列〔blob、text、varchar〕查询,可能就将所有的缓存都更新了,这样会导致其它普通的查询性能急剧下降。
【解决方法】
找到了问题的根本原因,解决方法也就不难了。有几种方法:
1〕查询时去掉description的查询,但这受限于业务的实现,可能需要业务做较大调整
2〕表结构优化,将descripion拆分到另外的表,这个改动较大,需要已有业务配合修改,且如果业务还是要继续查询这个description的信息,那么优化后的性能也不会有很大提升。
文档评论(0)