写出高效sql语句


写出高效sql语句
 
一个高效率的数据库系统是从两个方面来评价的：响应时间和吞吐量。 在应用系统开发阶段，由于开发库上的数据比较少，在SQL语句的编写上感觉不出各种写法的性能差异，在将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就会成为最需要解决的主要问题之一。  缩短系统的响应时间，增加操作的并发度，可以提高系统的吞吐量。要缩短系统的响应时间，就需要可以高效率执行的SQL语句。高效SQL语句的基本原则，是充分合理的利用索引，避免表扫描。 
 
理解索引  大多数情况下，数据库使用索引来检索表，优化器根据用户定义的索引来提高执行性能。但是，如果在SQL语句的where子句中写的SQL代码不合理，就会造成优化器忽略索引而采用全表扫描，而这种SQL语句就是所谓的劣质SQL语句。在编写SQL语句时需要了解优化器根据何种原则来使用索引，这将有助于写出高性能的SQL语句。  IS NULL 与 IS NOT NULL    以NULL值做条件时，将无法使用包含NULL值的列上的索引。即使索引有多列这样的情况下，只要这些列中有一列含有null，该列就会从索引中排除。也就是说如果某列存在空值，在使用NULL值做条件时，即使对该列建索引也不会提高性能 
 
带通配符（%）的like语句    
select * from employee where last_name like '%cliton%';    
由于通配符（%）在搜寻词首出现，所以数据库将不使用last_name的索引。在很多情况下可能无法避免这种情况，但是一定要心中有数，通配符如此使用会降低查询速度。   当通配符出现在字符串其他位置时，优化器就能利用索引。 
在下面的查询中索引得到了使用：   
select * from employee where last_name like 'c%'; 
 
 
Order by语句  
ORDER BY语句决定了数据库如何将返回的查询结果排序。Order by语句对要排序的列没有什么特别的限制，也可以将函数加入列中（象联接或者附加等）。任何在Order by语句的非索引项或者有计算表达式都将降低查询速度。   
需要仔细检查order by语句以找出非索引项或者表达式，它们会降低性能。   
解决这个问题的办法就是重写order by语句以使用索引，也可以为所使用的列建立另外一个索引，同时应绝对避免在order by子句中使用表达式。  
NOT  
not (status ='VALID')和 (status<>'VALID')哪个效率更高？  
salary<>3000 和 salary<3000 or salary>3000 和salary<＝2999 or salary>=3001(假设是整数)哪一个效率更高？ 
在where子句使用一些逻辑表达式，如大于、小于、等于以及不等于等等，也可以使用and（与）、or（或）以及not（非）。NOT可用来对任何逻辑运算符号取反。  例：  
... where not (status ='VALID')    
要使用NOT，则应在取反的短语前面加上括号，并在短语前面加上NOT运算符。NOT运算符包含在另外一个逻辑运算符中，这就是不等于（<>）运算符。换句话说，即使不在查询where子句中显式地加入NOT词，NOT仍在运算符中，见下例：  
... where status <>'INVALID';    
再例：  
select * from employee where  salary<>3000;    
解决方法，不使用NOT：  
select * from employee where  salary<3000 or salary>3000;    
这两种查询的结果一样，但是第二种查询方案会比第一种查询方案更快些。第二种查询会对salary列使用索引，而第一种查询则不会使用索引。 
 
IN和EXISTS    
将一列和一系列值相比较，常用的方法是在where子句中使用子查询。  
在where子句中可以使用两种格式的子查询。   
第一种格式是使用IN操作符：   
... where column in(select * from ... where ...);    
第二种格式是使用EXIST操作符：  
... where exists (select 'X' from ...where ...);   
采用第二种格式要比第一种格式的效率高。  
第二种格式中，子查询以‘select 'X'开始。运用EXISTS子句不管子查询从表中抽取什么数据它只查看where子句。这样优化器就不必遍历整个表而仅根据索引就可完成工作（这里假定在where语句中使用的列存在索引）。   使用EXIST，数据库系统会首先检查主查询，然后运行子查询直到它找到第一个匹配项。 使用IN子查询时，首先执行子查询，并将获得的结果列表存放在在一个加了索引的临时表中。在执行子查询之前，系统先将主查询挂起，待子查询执行完毕，存放在临时表中以后再执行主查询。   所以使用EXISTS通常比使用IN查询速度快。   应尽可能使用NOT EXISTS来代替NOT IN，尽管二者都使用了NOT（不能使用索引而降低速度），但NOT EXISTS要比NOT IN查询效率高 
 
小结   
 
所谓优化即where子句利用了索引，不可优化即发生了表扫描或额外开销。     
任何对列的操作都将导致表扫描，它包括数据库函数、计算表达式等等，查询时要尽可 能将操作移至等号右边。 左右不重要，重要的是表达式中是否包含列。  
in、or子句常会使用工作表，使索引失效；如果不产生大量重复值，可以考虑把子句 拆开；拆开的子句中应该包含索引。要善于使用存储过程，它使SQL变得更加灵活和高效。   
SQL优化的实质就是在结果正确的前提下，用优化器可以识别的语句，充份利用索引，减少表扫描的I/O次数，尽量避免表搜索的发生。 
 
高效SQL 
SQL 
UNION  :在UNION 查询中，如果没有指定 ALL 关键字，数据库系统将检查每个查询结果集合，试图合并可能存在重复记录；不管实际情况是否存在重复记录，这一操作是必然执行。 
在执行记录集合的检查过程中，数据库系统将对结果的全部字段建立临时索引，以便判断。因此，这一过程是极其消耗系统资源的。 
   在需要执行UNION 操作的SQL中，业务上一般是接收重复记录的。因此，如果不加入ALL 关键字，将影响系统的执行效率。 
FROM : 
  解析器按照从右到左的顺序处理FROM子句中的表名 也就是说 数据量少的表要尽量远离FROM WHERE : 
  当条件有多个的时候。那些可以过滤掉最大数量记录的条件那些可以过滤掉最大数量记录的条件尽量放在这个WHERE的末尾。 
SELECT :少用*这个大家都知道。 
用Where子句替换HAVING子句 
  避免使用HAVING子句，HAVING只会在检索出所有记录之后才对结果集进行过滤，这个处理需要排序、统计等操作，如果能通过WHERE子句限制记录的数目，那就能减少这方面的开销 
EXISTS 和 IN 
  EXISTS ：外大内小的时候使用特别是（里面只有一个条件的时候） 
  IN ：外小内大。  ---加not同理 
 
用表连接替换EXISTS 
用EXISTS替换DISTINCT 
索引： 
  不能使用 !=  <> NOT 
  不能在索引列上使用函数 
  索引类不能在 前面+% 
  不能在索引列上计算 
  不能在索引列上进行文字连接 
  检索NULL值时，不能使用索引列。