MySQL 随机函数获取数据速度和效率分析
发布网友
发布时间:2022-04-22 10:46
我来回答
共1个回答
热心网友
时间:2022-04-08 19:18
在mysql中带了随机取数据的函数,在mysql中我们会有rand()函数,很多朋友都会直接使用,如果几百条数据肯定没事,如果几万或百万时你会发现,直接使用是错误的。下面我来介绍随机取数据一些优化方法。
SELECT
*
FROM
table_name
ORDER
BY
rand()
LIMIT
5;
rand在手册里是这么说的:
RAND()
RAND(N)
返回在范围0到1.0内的随机浮点值。如果一个整数参数N被指定,它被用作种子值。
mysql>
select
RAND();
->
0.5925
mysql>
select
RAND(20);
->
0.1811
mysql>
select
RAND(20);
->
0.1811
mysql>
select
RAND();
->
0.2079
mysql>
select
RAND();
->
0.7888
你不能在一个ORDER
BY子句用RAND()值使用列,因为ORDER
BY将重复计算列多次。然而在MySQL3.23中,你可以做:
SELECT
*
FROM
table_name
ORDER
BY
RAND(),这是有利于得到一个来自SELECT
*
FROM
table1,table2
WHERE
a=b
AND
c<d
ORDER
BY
RAND()
LIMIT
1000的集合的随机样本。注意在一个WHERE子句里的一个RAND()将在每次WHERE被执行时重新评估。
网上基本上都是查询max(id)
*
rand()来随机获取数据。
SELECT
*
FROM
`table`
AS
t1
JOIN
(SELECT
ROUND(RAND()
*
(SELECT
MAX(id)
FROM
`table`))
AS
id)
AS
t2
WHERE
t1.id
>=
t2.id
ORDER
BY
t1.id
ASC
LIMIT
5;
但是这样会产生连续的5条记录。解决办法只能是每次查询一条,查询5次。即便如此也值得,因为15万条的表,查询只需要0.01秒不到。
上面的语句采用的是JOIN,mysql的论坛上有人使用
SELECT
*
FROM
`table`
WHERE
id
>=
(SELECT
FLOOR(
MAX(id)
*
RAND())
FROM
`table`
)
ORDER
BY
id
LIMIT
1;
我测试了一下,需要0.5秒,速度也不错,但是跟上面的语句还是有很大差距
后来请教了,得到如下代码
完整查询语句是:
SELECT
*
FROM
`table`
WHERE
id
>=
(SELECT
floor(
RAND()
*
((SELECT
MAX(id)
FROM
`table`)-(SELECT
MIN(id)
FROM
`table`))
+
(SELECT
MIN(id)
FROM
`table`)))
ORDER
BY
id
LIMIT
1;
SELECT
*
FROM
`table`
AS
t1
JOIN
(SELECT
ROUND(RAND()
*
((SELECT
MAX(id)
FROM
`table`)-(SELECT
MIN(id)
FROM
`table`))+(SELECT
MIN(id)
FROM
`table`))
AS
id)
AS
t2
WHERE
t1.id
>=
t2.id
ORDER
BY
t1.id
LIMIT
1;
最后在php中对这两个语句进行分别查询10次,
前者花费时间
0.147433
秒
后者花费时间
0.015130
秒
执行效率需要0.02
sec.可惜的是,只有mysql
4.1.*以上才支持这样的子查询.
注意事项
查看官方手册,也说rand()放在ORDER
BY
子句中会被执行多次,自然效率及很低。
以上的sql语句最后一条,本人实际测试通过,100W数据,瞬间出结果。
感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!