剛開始學寫程式時,是照著書本上的範例利用 LIMIT offset, row_count 來達到分頁的功能,但是隨著資料量越來越大,這種分頁方式會造成越後面的頁數 query 時間越長。因為在 MySQL 中有指定 offset 的情況下,並不會直接從該 offset 開始進行資料查詢,而是依照 where 條件取得所有資料之後,再從 offset 開始取出所需要的資料筆數。

也就是說,假設在滿足 where 條件有 100 萬個結果時,如果要只取出最後 1 千筆結果,用 LIMIT 999000, 1000 的話, MySQL 仍然會先找出 100 萬筆後,再從第 999000 筆開始取出最後 1 千筆結果,造成資料越多查詢速度越慢。

比較好的方式不指定 offset ,只指定 limit 限制資料筆數。

例如:

LIMIT 1000

Offset 的部分則是想辦法利用 Unique Key, Primary Key 等條件找到需要的資料,搭配 ORDER BY 確保分頁的正確性。如此一來,就會先從找到的資料後開始取出所需要的資料筆數。

以使用者資料為例(user_account 是 PK),假設上一頁的使用者資料的最後一筆是 brandy ,那麼下一頁就可以從 brandy 開始查起。

SELECT
    user_account,
    first_name,
    last_name
FROM
    user
WHERE
    user_account > 'brandy'
ORDER BY
    user_account ASC
LIMIT
    1000

LIMIT offset, row_countLIMIT row_count 2 者的差異可以用 EXPLAIN 來比較,就可以看到差異。

改善前:

EXPLAIN SELECT
    user_account,
    first_name,
    last_name
FROM
    user
ORDER BY
    user_account ASC
LIMIT
    999000, 1000;

+----+-------------+--------------+-------+---------------+---------+---------+------+---------+-------+
| id | select_type | table        | type  | possible_keys | key     | key_len | ref  | rows    | Extra |
+----+-------------+--------------+-------+---------------+---------+---------+------+---------+-------+
|  1 | SIMPLE      | user_account | index | NULL          | PRIMARY | 100     | NULL | 1000000 | NULL  |
+----+-------------+--------------+-------+---------------+---------+---------+------+---------+-------+

看得出來雖然有指定 offset MySQL 還是找了 1000000 筆。

改善後:

EXPLAIN SELECT
    user_account,
    first_name,
    last_name
FROM
    user
WHERE
    user_account > 'GeorgeMartin'
ORDER BY
    user_account ASC
LIMIT
    1000;

+----+-------------+--------------+-------+---------------+---------------+---------+------+--------+-----------------------+
| id | select_type | table        | type  | possible_keys | key           | key_len | ref  | rows   | Extra                 |
+----+-------------+--------------+-------+---------------+---------------+---------+------+--------+-----------------------+
|  1 | SIMPLE      | user_account | range | user_account  | user_account  | 100     | NULL | 300021 | Using index condition |
+----+-------------+--------------+-------+---------------+---------------+---------+------+--------+-----------------------+

上述的 explain 結果中的 rows 明顯下降(該值只是預估值,並非真正的查詢結果數),代表 MySQL 不再需要先找出所有資料後再取出所需要的筆數。

以上就是比較高效能的 MySQL 分頁方式,如果想知道更詳細的話,可以看看這份簡報 Efficient Pagination Using MySQL