mysql 分页计算问题

V2EX = way to explore

V2EX 是一个关于分享和探索的地方

现在注册

已注册用户请登录

› MySQL 5.5 Community Server

› MySQL 5.6 Community Server

› Percona Configuration Wizard

› XtraBackup 搭建主从复制

Great Sites on MySQL

› Percona

› MySQL Performance Blog

› Severalnines

推荐管理工具

› Sequel Pro

› phpMyAdmin

推荐书目

› MySQL Cookbook

MySQL 相关项目

› MariaDB

› Drizzle

参考文档

› http://mysql-python.sourceforge.net/MySQLdb.html

这是一个创建于 566 天前的主题，其中的信息可能已经有所发展或是发生改变。

有一次和一个硅谷的哥们儿聊项目，电商类的项目，azure 上跑着。

他说他们分页有点慢，我问了下分页方法，大概实现如下：

大概 30%的 hot 数据，全部加载到 redis ，加上多级缓存，缓存没有，再去 mysql 查，mysql 分库分表。

其中有个神奇的地方，比如排序，按价格排序，每页 20 条，缓存命中了 15 条，由于剩下的 5 条是分散在数据库的，并不知道在哪边，所以他们做了一个算法，准确的计算出这 5 条数据在数据库中的位置，直接 select, 计算会慢一点。

我以前没有接触过这种用法，数据量大了，搜索直接上 es ，离线分析 clickhouse 一把梭，这种计算的方法，没有遇到过，超出认知了。

有没有知道这种方法的兄弟，解说一下的？

或者说电商的分页，和一般社交行业的分页，有什么不一样的地方？

MySQL

分页

计算

排序

12 条回复 • 2024-03-20 00:10:39 +08:00

seedhk

2024-02-29 16:42:27 +08:00

难道他的分库分表依据是根据价格来的？

oneisall8955

PRO

2024-02-29 17:01:05 +08:00 via Android

维护起来不头痛吗？

oneisall8955

PRO

2024-02-29 17:02:23 +08:00 via Android

@seedhk 价格会变，不可能用价格分库分表吧

AlohaV2

2024-02-29 17:06:25 +08:00

但感觉如果是一个价格的区间，好像可以分？因为一件商品的价格变动，感觉不会超过某个量级。并且一般来说越贵的数量越少。

sijue

2024-02-29 17:08:37 +08:00

剩下的五条记录如果有商品 id ，大概率根据商品 id 分表

PythonYXY

2024-02-29 18:50:01 +08:00

按价格排序，怎么知道第几页哪些是在缓存中，哪些是在数据库？不是很懂。

xuanbg

2024-02-29 21:03:37 +08:00

尽量不要分表，数据多了可以把冷数据归档处理。

yagamil

2024-03-01 09:49:29 +08:00

这种算法在 es ，mongodb 里面的切片里也有用到把，根据分布的位置，比如第 x 个表 x 分区，写到生成的数据的 id 或某个字段里面

dododada

2024-03-01 10:13:41 +08:00

具体的算法我不了解，那个哥们儿说很复杂，算法本身已经影响到查询性能了。

有没有电商行业的兄弟，来解个惑？

gpt 说后面的 5 条数据，用 WHERE price > last_record_price 就行 ...

8355

2024-03-01 10:31:56 +08:00

按照我的理解，不管是 redis sorted set 还是其他什么方案，本质上是按照正确的方式排序并分页，获取到排序之后其实一组分页的商品 id ，之后批量根据商品 id 进行获取商品详情并按顺序返回即可。

markgor

2024-03-01 15:58:21 +08:00

据我所知京东淘宝的按价格排序从未正确过

dyv9

2024-03-20 00:10:39 +08:00 via Android

@dododada 忽悠外行人的，或者他本来数据结构与算法只是入门水平。