1
VampireDemon 3 天前 1
nifi +doris
|
2
woduzibue OP @VampireDemon 感谢大佬,这是要自己再单独部署这两个工具是吧
|
3
heqingpan 2 天前 via Android 1
按 id>上次已处理的 id order by id limit 1000 ,从前到后批次查询、处理、批次写入(批次大小可以设置 1000 左右)。
如果有必要,单个批次可以加事务。 每个批次间可以加点 sleep 控制处理的 tps 。 每处理 10 万条记录写个日志,以便确认运行状态,成功、失败、异常都加上对应日志。 数据库性能够的话,一天处理个两三亿数据没什么问题。 如果可能分多次跑,记得把已处理的 id 记在某人地方,让下次运行时可以指定对应的值。 |
4
VampireDemon 2 天前 1
@woduzibue 对,很方便简单上手快,拖拉拽就好了。生态强大。
|