MySQL 随机函数获取数据速度和效率分析

发布网友发布时间：2022-04-22 10:46

共1个回答

热心网友时间：2022-04-08 19:18

在mysql中带了随机取数据的函数，在mysql中我们会有rand()函数，很多朋友都会直接使用，如果几百条数据肯定没事，如果几万或百万时你会发现，直接使用是错误的。下面我来介绍随机取数据一些优化方法。
SELECT
*
FROM
table_name
ORDER
BY
rand()
LIMIT
5;
rand在手册里是这么说的:
RAND()
RAND(N)
返回在范围0到1.0内的随机浮点值。如果一个整数参数N被指定，它被用作种子值。
mysql>
select
RAND();
->
0.5925
mysql>
select
RAND(20);
->
0.1811
mysql>
select
RAND(20);
->
0.1811
mysql>
select
RAND();
->
0.2079
mysql>
select
RAND();
->
0.7888
你不能在一个ORDER
BY子句用RAND()值使用列，因为ORDER
BY将重复计算列多次。然而在MySQL3.23中，你可以做：
SELECT
*
FROM
table_name
ORDER
BY
RAND()，这是有利于得到一个来自SELECT
*
FROM
table1,table2
WHERE
a=b
AND
c<d
ORDER
BY
RAND()
LIMIT
1000的集合的随机样本。注意在一个WHERE子句里的一个RAND()将在每次WHERE被执行时重新评估。
网上基本上都是查询max(id)
*
rand()来随机获取数据。
SELECT
*
FROM
`table`
AS
t1
JOIN
(SELECT
ROUND(RAND()
*
(SELECT
MAX(id)
FROM
`table`))
AS
id)
AS
t2
WHERE
t1.id
>=
t2.id
ORDER
BY
t1.id
ASC
LIMIT
5;
但是这样会产生连续的5条记录。解决办法只能是每次查询一条，查询5次。即便如此也值得，因为15万条的表，查询只需要0.01秒不到。
上面的语句采用的是JOIN，mysql的论坛上有人使用
SELECT
*
FROM
`table`
WHERE
id
>=
(SELECT
FLOOR(
MAX(id)
*
RAND())
FROM
`table`
)
ORDER
BY
id
LIMIT
1;
我测试了一下，需要0.5秒，速度也不错，但是跟上面的语句还是有很大差距
后来请教了,得到如下代码
完整查询语句是：
SELECT
*
FROM
`table`
WHERE
id
>=
(SELECT
floor(
RAND()
*
((SELECT
MAX(id)
FROM
`table`)-(SELECT
MIN(id)
FROM
`table`))
+
(SELECT
MIN(id)
FROM
`table`)))
ORDER
BY
id
LIMIT
1;
SELECT
*
FROM
`table`
AS
t1
JOIN
(SELECT
ROUND(RAND()
*
((SELECT
MAX(id)
FROM
`table`)-(SELECT
MIN(id)
FROM
`table`))+(SELECT
MIN(id)
FROM
`table`))
AS
id)
AS
t2
WHERE
t1.id
>=
t2.id
ORDER
BY
t1.id
LIMIT
1;
最后在php中对这两个语句进行分别查询10次，
前者花费时间
0.147433
秒
后者花费时间
0.015130
秒
执行效率需要0.02
sec.可惜的是,只有mysql
4.1.*以上才支持这样的子查询.
注意事项
查看官方手册，也说rand()放在ORDER
BY
子句中会被执行多次，自然效率及很低。
以上的sql语句最后一条，本人实际测试通过，100W数据，瞬间出结果。
感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！