最近博主看完了《SQL進階教程》這本書，看完后給博主打開了SQL世界的新大門，對于 SQL 的理解不在局限于以前的常規用法。借用其他讀者的評論，

讀完醍醐灌頂，對SQL做到了知其然更能知其所以然。全書從頭到尾強調了 SQL的內在邏輯是基于集合論和謂詞邏輯，而著兩條主線恰恰在使用SQL起到了至關重要的指導作用。

(資料圖片僅供參考)

本文給大家總結如何讓SQL起飛（優化）

一、SQL寫法優化

在SQL中，很多時候不同的SQL代碼能夠得出相同結果。從理論上來說，我們認為得到相同結果的不同SQL之間應該有相同的性能，但遺憾的是，查詢優化器生成的執行計劃很大程度上受到SQL代碼影響，有快有慢。因此如果想優化查詢性能，我們必須知道如何寫出更快的SQL，才能使優化器的執行效率更高。

1.1 子查詢用EXISTS代替IN

當IN的參數是子查詢時，數據庫首先會執行子查詢，然后將結果存儲在一張臨時的工作表里（內聯視圖），然后掃描整個視圖。很多情況下這種做法都非常耗費資源。使用EXISTS的話，數據庫不會生成臨時的工作表。但是從代碼的可讀性上來看，IN要比EXISTS好。使用IN時的代碼看起來更加一目了然，易于理解。因此，如果確信使用IN也能快速獲取結果，就沒有必要非得改成EXISTS了。

這里用Class_A表和Class_B舉例，

我們試著從Class_A表中查出同時存在于Class_B表中的員工。下面兩條SQL語句返回的結果是一樣的，但是使用EXISTS的SQL語句更快一些。

--慢SELECT *  FROM Class_A WHERE id IN (SELECT id                FROM Class_B);--快SELECT *  FROM Class_A  A WHERE EXISTS        (SELECT *          FROM Class_B  B          WHERE A.id = B.id);

使用EXISTS時更快的原因有以下兩個。

如果連接列（id）上建立了索引，那么查詢 tb_b 時不用查實際的表，只需查索引就可以了。（同樣的IN也可以使用索引，這不是重要原因）如果使用EXISTS，那么只要查到一行數據滿足條件就會終止查詢，不用像使用IN時一樣掃描全表。在這一點上NOT EXISTS也一樣。

實際上，大部分情況在子查詢數量較小的場景下EXISTS和IN的查詢性能不相上下，由EXISTS查詢更快第二點可知，子查詢數量較大時使用EXISTS才會有明顯優勢。

1.2 避免排序并添加索引

在SQL語言中，除了ORDER BY子句會進行顯示排序外，還有很多操作默認也會在暗中進行排序，如果排序字段沒有添加索引，會導致查詢性能很慢。SQL中會進行排序的代表性的運算有下面這些。

GROUP BY子句ORDER BY子句聚合函數（SUM、COUNT、AVG、MAX、MIN）DISTINCT集合運算符（UNION、INTERSECT、EXCEPT）窗口函數（RANK、ROW_NUMBER等）

如上列出的六種運算（除了集合運算符），它們后面跟隨或者指定的字段都可以添加索引，這樣可以加快排序。

實際上在DISTINCT關鍵字、GROUP BY子句、ORDER BY子句、聚合函數跟隨的字段都添加索引，不僅能加速查詢，還能加速排序。

1.3 用EXISTS代替DISTINCT

為了排除重復數據，我們可能會使用DISTINCT關鍵字。如1.2中所說，默認情況下，它也會進行暗中排序。如果需要對兩張表的連接結果進行去重，可以考慮使用EXISTS代替DISTINCT，以避免排序。這里用Items表和SalesHistory表舉例：

我們思考一下如何從上面的商品表Items中找出同時存在于銷售記錄表SalesHistory中的商品。簡而言之，就是找出有銷售記錄的商品。

在一（Items）對多（SalesHistory）的場景下，我們需要對item_no去重，使用DISTINCT去重，因此SQL如下：

SELECT DISTINCT I.item_no  FROM Items I INNER JOIN SalesHistory SH    ON I. item_no = SH. item_no;item_no-------    10    20    30

使用EXISTS代替DISTINCT去重，SQL如下：

SELECT item_no  FROM Items I WHERE EXISTS          (SELECT ＊              FROM SalesHistory SH            WHERE I.item_no = SH.item_no);item_no-------    10    20    30

這條語句在執行過程中不會進行排序。而且使用EXISTS和使用連接一樣高效。

1.4 集合運算ALL可選項

SQL中有UNION、INTERSECT、EXCEPT三個集合運算符。在默認的使用方式下，這些運算符會為了排除掉重復數據而進行排序。

MySQL還沒有實現INTERSECT和EXCEPT運算

如果不在乎結果中是否有重復數據，或者事先知道不會有重復數據，請使用UNION ALL代替UNION。這樣就不會進行排序了。

1.5 WHERE條件不要寫在HAVING字句

例如，這里繼續用SalesHistory表舉例，下面兩條SQL語句返回的結果是一樣的：

--聚合后使用HAVING子句過濾SELECT sale_date, SUM(quantity)  FROM SalesHistory GROUP BY sale_dateHAVING sale_date = "2007-10-01";--聚合前使用WHERE子句過濾SELECT sale_date, SUM(quantity)  FROM SalesHistory WHERE sale_date = "2007-10-01" GROUP BY sale_date;

但是從性能上來看，第二條語句寫法效率更高。原因有兩個：

使用GROUP BY子句聚合時會進行排序，如果事先通過WHERE子句篩選出一部分行，就能夠減輕排序的負擔。在WHERE子句的條件里可以使用索引。HAVING子句是針對聚合后生成的視圖進行篩選的，但是很多時候聚合后的視圖都沒有繼承原表的索引結構。

二、真的用到索引了嗎

2.1 隱式的類型轉換

如下，col_1字段是char類型：

SELECT * FROM SomeTable WHERE col_1 = 10; -- 走了索引SELECT * FROM SomeTable WHERE col_1 ="10"; -- 沒走索引SELECT * FROM SomeTable WHERE col_1 = CAST(10, AS CHAR(2)); -- 走了索引

當查詢條件左邊和右邊類型不一致時會導致索引失效。

2.2 在索引字段上進行運算

如下：

SELECT *  FROM SomeTable WHERE col_1 * 1.1 > 100;

在索引字段col_1上進行運算會導致索引不生效，把運算的表達式放到查詢條件的右側，就能用到索引了，像下面這樣寫就OK了。

WHERE col_1 > 100 / 1.1

如果無法避免在左側進行運算，那么使用函數索引也是一種辦法，但是不太推薦隨意這么做。使用索引時，條件表達式的左側應該是原始字段請牢記，這一點是在優化索引時首要關注的地方。

2.3 使用否定形式

下面這幾種否定形式不能用到索引。

<>!=NOT

這個是跟具體數據庫的優化器有關，如果優化器覺得即使走了索引，還是需要掃描很多很多行的哈，他可以選擇直接不走索引。平時我們用!=、<>、not in的時候，要注意一下。

2.4 使用OR查詢前后沒有同時使用索引

例如下表：

CREATE TABLE test_tb ( id int(11) NOT NULL AUTO_INCREMENT, name varchar(55) NOT NULLPRIMARY KEY (id)) ENGINE=InnoDB DEFAULT CHARSET=utf8;

使用OR條件進行查詢

SELECT * FROM test_tb WHERE id = 1 OR name = "tom"

這個SQL的執行條件下，很明顯id字段查詢會走索引，但是對于OR后面name字段的查詢是需要進行全表掃描的。在這個場景下，優化器直接進行一遍全表掃描就完事了。

2.5 使用聯合索引時，列的順序錯誤

使用聯合索引需要滿足最左匹配原則，即最左優先。如果你建立一個（col_1, col_2, col_3）的聯合索引，相當于建立了 (col_1)、(col_1,col_2)、(col_1,col_2,col_3) 三個索引。如下例子：

-- 走了索引SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 AND col_3 = 500;-- 走了索引SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 ;-- 沒走索引SELECT * FROM SomeTable WHERE col_1 = 10 AND col_3 = 500 ;-- 沒走索引SELECT * FROM SomeTable WHERE col_2 = 100 AND col_3 = 500 ;-- 沒走索引SELECT * FROM SomeTable WHERE col_2 = 100 AND col_1 = 10 ;

聯合索引中的第一列（col_1）必須寫在查詢條件的開頭，而且索引中列的順序不能顛倒。

2.6 使用LIKE查詢

并不是用了like通配符，索引一定會失效，而是like查詢是以%開頭，才會導致索引失效。

-- 沒走索引SELECT  *  FROM  SomeTable  WHERE  col_1  LIKE"%a";-- 沒走索引SELECT  *  FROM  SomeTable  WHERE  col_1  LIKE"%a%";-- 走了索引SELECT  *  FROM  SomeTable  WHERE  col_1  LIKE"a%";

2.7 連接字段字符集編碼不一致

如果兩張表進行連接，關聯字段編碼不一致會導致關聯字段上的索引失效，這是博主在線上經歷一次SQL慢查詢后的得到的結果，舉例如下，有如下兩表，它們的name字段都建有索引，但是編碼不一致，user表的name字段編碼是utf8mb4，user_job表的name字段編碼是utf8，

CREATE TABLE `user` (  `id` int NOT NULL AUTO_INCREMENT,  `name` varchar(255) CHARACTER  SET utf8mb4 COLLATE utf8mb4_0900_ai_ci DEFAULT NULL,  `age` int NOT NULL,  PRIMARY KEY (`id`),  KEY `idx_name` (`name`)) ENGINE=InnoDB AUTO_INCREMENT=2 DEFAULT CHARSET=utf8;CREATE TABLE `user_job` (  `id` int NOT NULL,  `userId` int NOT NULL,  `job` varchar(255) DEFAULT NULL,  `name` varchar(255) DEFAULT NULL,  PRIMARY KEY (`id`),  KEY `idx_name` (`name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8;

進行SQL查詢如下：

EXPLAINSELECT * from `user` u join user_job j on u.name = j.name

由結果可知，user表的查詢沒有走索引。想要user表也走索引，那就需要把user表name字段的編碼改成utf8即可。

三、減少中間表

在SQL中，子查詢的結果會被看成一張新表，這張新表與原始表一樣，可以通過代碼進行操作。這種高度的相似性使得SQL編程具有非常強的靈活性，但是如果不加限制地大量使用中間表，會導致查詢性能下降。

頻繁使用中間表會帶來兩個問題，一是展開數據需要耗費內存資源，二是原始表中的索引不容易使用到（特別是聚合時）。因此，盡量減少中間表的使用也是提升性能的一個重要方法。

3.1 使用HAVING子句

對聚合結果指定篩選條件時，使用HAVING子句是基本原則。不習慣使用HAVING子句的人可能會傾向于像下面這樣先生成一張中間表，然后在WHERE子句中指定篩選條件。例如下面：

SELECT *   FROM (    SELECT sale_date, MAX(quantity) max_qty      FROM SalesHistory       GROUP BY sale_date     ) tmp WHERE max_qty >= 10

然而，對聚合結果指定篩選條件時不需要專門生成中間表，像下面這樣使用HAVING子句就可以。

SELECT sale_date, MAX(quantity)  FROM SalesHistory GROUP BY sale_dateHAVING MAX(quantity) >= 10;

HAVING子句和聚合操作是同時執行的，所以比起生成中間表后再執行的WHERE子句，效率會更高一些，而且代碼看起來也更簡潔。

3.2 對多個字段使用IN

當我們需要對多個字段使用IN條件查詢時，可以通過 || 操作將字段連接在一起變成一個字符串處理。

SELECT *  FROM Addresses1 A1 WHERE id || state || city    IN (SELECT id || state|| city          FROM Addresses2 A2);

這樣一來，子查詢不用考慮關聯性，而且只執行一次就可以。

3.3 先進行連接再進行聚合

連接和聚合同時使用時，先進行連接操作可以避免產生中間表。原因是，從集合運算的角度來看，連接做的是“乘法運算”。連接表雙方是一對一、一對多的關系時，連接運算后數據的行數不會增加。而且，因為在很多設計中多對多的關系都可以分解成兩個一對多的關系，因此這個技巧在大部分情況下都可以使用。

到此本文講解完畢，感謝大家閱讀。

關鍵詞：

国产三级日本三级日产三级66,五月天激情婷婷大综合,996久久国产精品线观看,久久精品人人做人人爽97

讓SQL起飛（優化）

一、SQL寫法優化

1.1 子查詢用EXISTS代替IN

1.2 避免排序并添加索引

1.3 用EXISTS代替DISTINCT

1.4 集合運算ALL可選項

1.5 WHERE條件不要寫在HAVING字句

二、真的用到索引了嗎

2.1 隱式的類型轉換

2.2 在索引字段上進行運算

2.3 使用否定形式

2.4 使用OR查詢前后沒有同時使用索引

2.5 使用聯合索引時，列的順序錯誤

2.6 使用LIKE查詢

2.7 連接字段字符集編碼不一致

三、減少中間表

3.1 使用HAVING子句

3.2 對多個字段使用IN

3.3 先進行連接再進行聚合

科技

5G

国产三级日本三级日产三级66,五月天激情婷婷大综合,996久久国产精品线观看,久久精品人人做人人爽97

讓SQL起飛（優化）

一、SQL寫法優化

1.1 子查詢用EXISTS代替IN

1.2 避免排序并添加索引

1.3 用EXISTS代替DISTINCT

1.4 集合運算ALL可選項

1.5 WHERE條件不要寫在HAVING字句

二、真的用到索引了嗎

2.1 隱式的類型轉換

2.2 在索引字段上進行運算

2.3 使用否定形式

2.4 使用OR查詢前后沒有同時使用索引

2.5 使用聯合索引時，列的順序錯誤

2.6 使用LIKE查詢

2.7 連接字段字符集編碼不一致

三、減少中間表

3.1 使用HAVING子句

3.2 對多個字段使用IN

3.3 先進行連接再進行聚合

延伸閱讀：

科技

5G