今天欄目為大家介紹MySQL的索引優化規則。
select * from doc where title like '%XX'; --不能使用索引select * from doc where title like 'XX%'; --非前導模糊查詢,可以使用索引複製程式碼
union
能夠命中索引,並且MySQL 耗費的 CPU 最少。select * from doc where status=1union allselect * from doc where status=2;複製程式碼
in
能夠命中索引,查詢優化耗費的 CPU 比 union all
多,但可以忽略不計,一般情況下建議使用 in
。select * from doc where status in (1, 2);複製程式碼
or
新版的 MySQL 能夠命中索引,查詢優化耗費的 CPU 比 in
多,不建議頻繁用or
。select * from doc where status = 1 or status = 2複製程式碼
where
條件中使用or
,索引會失效,造成全表掃描,這是個誤區:①要求where
子句使用的所有欄位,都必須建立索引;
②如果資料量太少,mysql制定執行計劃時發現全表掃描比索引查詢更快,所以會不使用索引;
③確保mysql版本5.0
以上,且查詢優化器開啟了index_merge_union=on
, 也就是變數optimizer_switch
裡存在index_merge_union
且為on
。
負向條件有:!=
、<>
、not in
、not exists
、not like
等。
例如下面SQL語句:
select * from doc where status != 1 and status != 2;複製程式碼
select * from doc where status in (0,3,4);複製程式碼
如果在(a,b,c)
三個欄位上建立聯合索引,那麼他會自動建立 a
| (a,b)
| (a,b,c)
組索引。
登入業務需求,SQL語句如下:
select uid, login_time from user where login_name=? andpasswd=?複製程式碼
(login_name, passwd)
的聯合索引。因為業務上幾乎沒有passwd
的單條件查詢需求,而有很多login_name
的單條件查詢需求,所以可以建立(login_name, passwd)
的聯合索引,而不是(passwd, login_name
)。
- 建立聯合索引的時候,區分度最高的欄位在最左邊
- 存在非等號和等號混合判斷條件時,在建立索引時,把等號條件的列前置。如
where a>? and b=?
,那麼即使a
的區分度更高,也必須把b
放在索引的最前列。
- 最左字首查詢時,並不是指SQL語句的where順序要和聯合索引一致。
(login_name, passwd)
這個聯合索引:select uid, login_time from user where passwd=? andlogin_name=?複製程式碼
where
後的順序和聯合索引一致,養成好習慣。
- 假如
index(a,b,c)
,where a=3 and b like 'abc%' and c=4
,a
能用,b
能用,c
不能用。
<、<=、>、>=、between
等。(empno、title、fromdate)
,那麼下面的 SQL 中 emp_no
可以用到索引,而title
和 from_date
則使用不到索引。select * from employees.titles where emp_no < 10010' and title='Senior Engineer'and from_date between '1986-01-01' and '1986-12-31'複製程式碼
date
上建立了索引,也會全表掃描:select * from doc where YEAR(create_time) <= '2016';複製程式碼
select * from doc where create_time <= '2016-01-01';複製程式碼
select * from order where date < = CURDATE();複製程式碼
select * from order where date < = '2018-01-2412:00:00';複製程式碼
phone
欄位是 varchar
型別,則下面的 SQL 不能命中索引。select * from user where phone=13800001234複製程式碼
select * from user where phone='13800001234';複製程式碼
更新會變更 B+ 樹,更新頻繁的欄位建立索引會大大降低資料庫效能。
「性別」這種區分度不大的屬性,建立索引是沒有什麼意義的,不能有效過濾資料,效能與全表掃描類似。
一般區分度在80%以上的時候就可以建立索引,區分度可以使用 count(distinct(列名))/count(*)
來計算。
Select uid, login_time from user where login_name=? and passwd=?複製程式碼
(login_name, passwd, login_time)
的聯合索引,由於 login_time
已經建立在索引中了,被查詢的 uid
和 login_time
就不用去 row
上獲取資料了,從而加速查詢。NULL
值,那麼這一列對於此複合索引就是無效的。所以我們在資料庫設計時,儘量使用not null
約束以及預設值。order by
最後的欄位是組合索引的一部分,並且放在索引組合順序的最後,避免出現file_sort 的情況,影響查詢效能。where a=? and b=? order by c
,可以建立聯合索引(a,b,c)
。 WHERE a>10 ORDER BY b;
,索引(a,b)
無法排序。對列進行索引,如果可能應該指定一個字首長度。例如,如果有一個CHAR(255)
的列,如果該列在前10
個或20
個字元內,可以做到既使得字首索引的區分度接近全列索引,那麼就不要對整個列進行索引。因為短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作,減少索引檔案的維護開銷。可以使用count(distinct leftIndex(列名, 索引長度))/count(*)
來計算字首索引的區分度。
但缺點是不能用於 ORDER BY
和 GROUP BY
操作,也不能用於覆蓋索引。
不過很多時候沒必要對全欄位建立索引,根據實際文字區分度決定索引長度即可。
offset
行,而是取 offset+N
行,然後返回放棄前 offset 行,返回 N 行,那當 offset 特別大的時候,效率就非常的低下,要麼控制返回的總頁數,要麼對超過特定閾值的頁數進行 SQL 改寫。id
段,然後再關聯:selecta.* from 表1 a,(select id from 表1 where 條件 limit100000,20 ) b where a.id=b.id;複製程式碼
select * from user where login_name=?;複製程式碼
select * from user where login_name=? limit 1複製程式碼
需要 join 的欄位,資料型別必須一致,多表關聯查詢時,保證被關聯的欄位需要有索引。
例如:left join
是由左邊決定的,左邊的資料一定都有,所以右邊是我們的關鍵點,建立索引要建右邊的。當然如果索引在左邊,可以用right join
。
consts
:單表中最多隻有一個匹配行(主鍵或者唯一索引),在優化階段即可讀取到資料。
ref
:使用普通的索引(Normal Index)
。
range
:對索引進行範圍檢索。
當 type=index
時,索引物理檔案全掃,速度非常慢。
insert
速度,這個速度損耗可以忽略,但提高查詢速度是明顯的。另外,即使在應用層做了非常完善的校驗控制,只要沒有唯一索引,根據墨菲定律,必然有髒資料產生。既然索引可以加快查詢速度,那麼是不是隻要是查詢語句需要,就建上索引?答案是否定的。因為索引雖然加快了查詢速度,但索引也是有代價的:索引檔案本身要消耗儲存空間,同時索引會加重插入、刪除和修改記錄時的負擔,另外,MySQL在執行時也要消耗資源維護索引,因此索引並不是越多越好。一般兩種情況下不建議建索引。
第一種情況是表記錄比較少,例如一兩千條甚至只有幾百條記錄的表,沒必要建索引,讓查詢做全表掃描就好了。至於多少條記錄才算多,這個個人有個人的看法,我個人的經驗是以2000作為分界線,記錄數不超過 2000可以考慮不建索引,超過2000條可以酌情考慮索引。
另一種不建議建索引的情況是索引的選擇性較低。所謂索引的選擇性(Selectivity),是指不重複的索引值(也叫基數,Cardinality)與表記錄數(#T)的比值:
Index Selectivity = Cardinality / #T複製程式碼
(0, 1]``,選擇性越高的索引價值越大,這是由
B+Tree的性質決定的。例如,
employees.titles表,如果
title`欄位經常被單獨查詢,是否需要建索引,我們看一下它的選擇性:SELECT count(DISTINCT(title))/count(*) AS Selectivity FROM employees.titles; +-------------+| Selectivity | +-------------+| 0.0000 | +-------------+複製程式碼
title
的選擇性不足0.0001
(精確值為0.00001579),所以實在沒有什麼必要為其單獨建索引。
有一種與索引選擇性有關的索引優化策略叫做字首索引,就是用列的字首代替整個列作為索引key,當字首長度合適時,可以做到既使得字首索引的選擇性接近全列索引,同時因為索引key變短而減少了索引檔案的大小和維護開銷。下面以employees.employees
表為例介紹字首索引的選擇和使用。
假設employees表只有一個索引<emp_no>,那麼如果我們想按名字搜尋一個人,就只能全表掃描了:
EXPLAIN SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido'; +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra | +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+| 1 | SIMPLE | employees | ALL | NULL | NULL | NULL | NULL | 300024 | Using where | +----+-------------+-----------+------+---------------+------+---------+------+--------+-------------+複製程式碼
<first_name>
或<first_name, last_name>
,看下兩個索引的選擇性:SELECT count(DISTINCT(first_name))/count(*) AS Selectivity FROM employees.employees; +-------------+| Selectivity | +-------------+| 0.0042 | +-------------+SELECT count(DISTINCT(concat(first_name, last_name)))/count(*) AS Selectivity FROM employees.employees; +-------------+| Selectivity | +-------------+| 0.9313 | +-------------+複製程式碼
<first_name>
顯然選擇性太低,`<first_name, last_name>
選擇性很好,但是first_name
和last_name
加起來長度為30
,有沒有兼顧長度和選擇性的辦法?可以考慮用first_name和last_name的前幾個字元建立索引,例如<first_name, left(last_name, 3)>
,看看其選擇性:SELECT count(DISTINCT(concat(first_name, left(last_name, 3))))/count(*) AS Selectivity FROM employees.employees; +-------------+ | Selectivity | +-------------+ | 0.7879 | +-------------+複製程式碼
SELECT count(DISTINCT(concat(first_name, left(last_name, 4))))/count(*) AS Selectivity FROM employees.employees; +-------------+| Selectivity | +-------------+| 0.9007 | +-------------+複製程式碼
18
,比<first_name, last_name>
短了接近一半,我們把這個字首索引建上:ALTER TABLE employees.employees ADD INDEX `first_name_last_name4` (first_name, last_name(4));複製程式碼
SHOW PROFILES; +----------+------------+---------------------------------------------------------------------------------+ | Query_ID | Duration | Query | +----------+------------+---------------------------------------------------------------------------------+ | 87 | 0.11941700 | SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido' | | 90 | 0.00092400 | SELECT * FROM employees.employees WHERE first_name='Eric' AND last_name='Anido' | +----------+------------+---------------------------------------------------------------------------------+複製程式碼
效能的提升是顯著的,查詢速度提高了120多倍。
字首索引兼顧索引大小和查詢速度,但是其缺點是不能用於ORDER BY
和GROUP BY
操作,也不能用於Covering index
(即當索引本身包含查詢所需全部資料時,不再存取資料檔案本身)。
本篇文章腦圖
和PDF檔案
已經準備好,有需要的夥伴可以回覆關鍵詞索引優化
獲取。
更多相關免費學習推薦:(視訊)
以上就是鐵汁,MySQL索引優化規則送你!!的詳細內容,更多請關注TW511.COM其它相關文章!