V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
echo404
V2EX  ›  问与答

为什么我使用分区列了进行查询,但 MYSQL 还是扫描了所有的分区

  •  
  •   echo404 · 2019-03-14 14:33:13 +08:00 · 1205 次点击
    这是一个创建于 2111 天前的主题,其中的信息可能已经有所发展或是发生改变。

    1、背景

    我们一个交易表,数据量比较大(一个星期大概有 2000W 的新数据)。现在老板想让我们对这个表做个分区,增加一下性能。没办法被赶鸭子上架,大概看了一下手册后,以周为单位,按时间设计了这样的分区结构:

    CREATE TABLE t_o2o_dm (
    id bigint(20) unsigned NOT NULL AUTO_INCREMENT COMMENT '订单编号',
    device_id int(10) unsigned DEFAULT NULL COMMENT '设备编号',
    dt datetime NOT NULL DEFAULT '0000-00-00 00:00:00' COMMENT '上传时间',
    PRIMARY KEY (id,dt),
    KEY IDX_DT (dt),
    KEY IDX_DEVICE_ID (device_id),
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8 ROW_FORMAT=DYNAMIC
    PARTITION BY RANGE (YEARWEEK(dt))
    (PARTITION p1 VALUES LESS THAN (201901) ENGINE = InnoDB,
    .......
    PARTITION p52 VALUES LESS THAN (201952) ENGINE = InnoDB,
    PARTITION p53 VALUES LESS THAN MAXVALUE ENGINE = InnoDB);

    2、问题

    第一问题是:在进行测试时,我发现使用这样的查询语句: EXPLAIN PARTITIONS SELECT * FROM t_o2o_dm WHERE dt BETWEEN "2019-03-10 00:00:00" AND "2019-03-10 23:59:59" 竟然无法过滤分区,每次查询都会把所有分区都扫描一次。可是按官网描述优化器应该根据 dt 列直接将查询范围固定到特定的分区才对。下面是这条语句 explain 的执行结果:图片 1

    另一个就是,执行下面这样的查询语句时: SELECT * FROM t_o2o_dm WHERE dt BETWEEN "2019-03-11 00:00:00" AND "2019-03-11 23:59:59" AND device_id = "382414"。查询效率竟然比不分区还慢一倍。 图片 2

    有没有做过表分区的老哥来介绍下经验啊,我百度谷歌找了半天全是几篇一样的文章,都是从 mysql 官方手册和高性能 mysql 上粘过去。很无奈啊

    2 条回复    2019-03-14 15:04:23 +08:00
    noe132
        1
    noe132  
       2019-03-14 14:57:01 +08:00
    dt 有索引吗?
    echo404
        2
    echo404  
    OP
       2019-03-14 15:04:23 +08:00
    @noe132
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1344 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 23:51 · PVG 07:51 · LAX 15:51 · JFK 18:51
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.