sql语句查询慢都是因为引起了filesort(文件排序,根据索引或者全表扫描)

1.走索引

table表有复合索引(age,score),走索引需要符合最左匹配原则,一般的情况就不赘述了,要注意使用order by或者group by时,如:select * from table where age desc,score asc; 虽然符合最左匹配原则,但是因为两个索引列排序的规则不一样,所以也会引起filesort ,排序条件相同则不会。

2.in和exists区别

原则是小表驱动大表(目的是为了减少实际查询的次数) in适合外表大而内表小的情况,exists适合外表小而内表大的情况。 in查询内部表和外部表上都可以使用到索引,exists查询仅在内部表上可以使用到索引。 为什么会有这种结论?当子查询结果集很大,而外部表较小的时候,exists的Block Nested Loop(Block 嵌套循环)的作用开始显现,弥补外部表无法用到索引的缺陷,查询效率会优于in。当子查询结果集较小,而外部表很大的时候,exists的Block嵌套循环优化效果不明显,in 的外表索引优势占主要作用,此时in的查询效率会优于exists。 in先执行子查询,也就是in()所包含的sql语句,子查询得到数据以后,将前面的查询分为n次普通查询(n是在子查询中返回的数据行数); exists查询,是查询出一条数据就去执行一次子查询。如果子查询查到数据,就返回布尔值true,如果没有,就返回布尔值false。返回布尔值true则将该条数据保存下来,否则就舍弃掉。 比如有两个表,orders(1000万条数据)和users(100条数据),orders表有字段users_id与users表的id字段关联 语句: (1)select count(1) from orders o where o.user_id in(select u.id from users u); (2)select count(1) from orders o where exists (select 1 from users u where u.id = o.user_id); 分析: (1)执行的顺序是,先执行in()里面的sql语句,可以从users表得到100条数据,然后再到orders表里面执行100次查询; (2)执行的顺序是,先执行select count(1) from orders o,从orders表每查出一条数据,就执行一次exists()里面的sql语句,所以会执行1000万次查询; 故在上面这个内表小(结果集小)而外表大的场景下,应该使用in。 注意:上面例子的sql语句都是没有查询条件的,数据集就是表的数据量————表的规模不是看内部表和外部表,而是外部表和子查询结果集。

3.慢查询

(1)慢查询作用 记录下所有执行时间超过long_query_time时间的sql语句,便于我们找到执行慢的sql,从而对这些sql进行优化。