V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
rogergood
V2EX  ›  问与答

GeoMesa 某个时空查询速度很慢以及修改索引精度不起作用?

  •  
  •   rogergood · 2020-04-03 13:32:57 +08:00 · 849 次点击
    这是一个创建于 1455 天前的主题,其中的信息可能已经有所发展或是发生改变。

    如果没理解错的话,Geomesa 用的 XZorder 做时空索引,默认的 XZ-Index Precision 是 12,拿纬度举例也就是 180 除以 12 个 2,大概 0.0439 换算到纬度上索引精度大概是 4km 。

    然后我有一个大概 1kmx1km 的时间范围为一个月的范围查询:

    query BBOX(geom, -73.92,-73.91,40.762,40.772) AND dtg DURING 2010-01-02T15:05:00+00:00/2010-01-31T15:25:00+00:00
    

    在 HBase 上用了 GeoMesa-tutorial 导入了 NYC Taxi 的数据集执行上面的查询,发现速度比较慢要 10~20s,返回了 354450 条数据,而实际上这个范围内只有 8501 条数据。我想这个可能是和索引精度有关( 4km>1km ),导致会多读很多不在这个范围内的数据,造成速度比较慢。

    于是尝试提高索引精度,通过在 createScheme 时设置 geomesa.xz.precision 这个参数(应该是设置成功的,在 HBase 的表中可以看到 GeoMesa 记录了这个信息,其余都是用的默认参数)

    SimpleFeatureType sft = ...
    sft.getUserData().put("geomesa.xz.precision", 18);
    

    但是查询返回的结果数量还有响应时间都几乎没有变化,按照我的理解,索引精度改变后至少结果数量应该会有比较大的变化,这个情况是哪里没配置对还是 Geomesa 本身的问题?还有 Geomesa 本身是否能比较快的处理上面的这种查询?

    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   3574 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 04:45 · PVG 12:45 · LAX 21:45 · JFK 00:45
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.