V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  Braisdom  ›  全部回复第 9 页 / 共 31 页
回复总数  613
1 ... 5  6  7  8  9  10  11  12  13  14 ... 31  
2024-01-29 23:04:09 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@dexterzzz 再说,内存计算,也还是无法回避过度计算的问题,如果不能自动解决过度,Agile Query 还是有一定的生存空间的。
2024-01-29 22:57:35 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@dexterzzz 兄弟的回复比较全面,有些信息我的确不知道需要仔细研究了,
既然 DSL 是个成熟的方案,为什么像 FineBI 还是预计算的形式进行数据开发,

你说的那些 DSL 是否能解决多表关联时引发的过度计算,是否需要数据工程手工去处理。

本质上 Agile Query 的 DSL 不是新语法,只不过是为了自动关联表,并且自动处理过度计算而已。
2024-01-29 22:10:02 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
2024-01-29 21:48:43 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@beneo 这个函数生成的 SQL 比较复杂,纯粹的在 superset 里写这样的 SQL 还是有难度的。
@lexa
2024-01-29 21:47:21 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@beneo 上面的确是一种 DSL ,只不过这类 DSL 更接近领域问题,使用起来更加方便。

建议去看一下: https://www.agiquery.com/blog/rfm/
2024-01-29 21:45:30 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@beneo Agile Query 只需要一个函数就可以实现,

SEGMENT(
CASE
WHEN MONTH_DIFF(NOW(), MAX(orders.order_date)) < 2
AND SUM(order_details.quantity * order_details.unit_price) > 1000
AND COUNT(orders.order_id) > 10 THEN '高价值客户'
WHEN DAY_DIFF(NOW(), MAX(orders.order_date)) < 50
AND SUM(order_details.quantity * order_details.unit_price) > 100 THEN '重要发展客户'
WHEN MONTH_DIFF(NOW(), MAX(orders.order_date)) > 4
AND SUM(order_details.quantity * order_details.unit_price) > 400 THEN '重要挽留客户'
ELSE '其它'
END,
customers.customer_id,
orders.order_date = LAST_YEARS(1)
)

FineBI 的: https://help.fanruan.com/finebi/doc-view-703.html

PowerBI 的: https://zhuanlan.zhihu.com/p/220408371

Agile Query 本质上和 PowerBI 比较接近,FineBI 的就差太远了。
2024-01-29 21:28:19 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@beneo 兄弟本质上是一个 DSL 生成 SQL ,关键是如何生成的 SQL ,
生成的 SQL 能不能进行 "RFM 分析"、"同环比分析"、"客户画像"等,

如果兄弟开发出通过拖拽实现上述分析,我需要向兄弟你好好学习一下,有机会一定去拜访。
2024-01-29 16:10:58 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@Alias4ck 我和这个项目不是同一类项目,后面再写个文章介绍一下 chatgpt 和实际的数据分析之间的距离。
2024-01-29 15:49:06 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@dayeye2006199 kylin 是预计算最典型的产品,
2024-01-29 15:40:40 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@hanhugh 非常同意你的看法,自己设计的 DSL 短期内很难产生影响力,毕竟 SQL 已经出现近 40 年了,已经根深蒂固了,只能通过间接的方法实现,除非有越级大的公司做背书。

Google 提的 NoSQL 目前只能在部分领域适用,关系运算还是以 SQL 为主,估计还得需要类似 OpenAI 形式的创新,来改写历史。
2024-01-29 14:58:29 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
统一感谢一下。。。。
2024-01-29 14:57:32 +08:00
回复了 Braisdom 创建的主题 推广 预计算的时代该结束了
@token10086 抱歉,修改好了。实在没留意,文章刚刚写好。
2024-01-29 11:16:41 +08:00
回复了 Braisdom 创建的主题 推广 Agile Query 新版网站上线了
@hopehack
1 )明细数据是普通的业务数据库的表,不需要额外加工
2 )组装过程就是公式的编写过,只需要聚焦单个指标,不需要关注与其它维度的组合关系,那些都是由 SQL 编译器完成。
处理好依赖关系,和容错后重试就可以了,
2024-01-24 22:35:16 +08:00
回复了 onemruo 创建的主题 创业组队 [开源][组队找人] 一个隐私优先的开源笔记产品
很多伟大的产品都就小细节开始,加油楼主
2024-01-24 20:48:59 +08:00
回复了 danielxuforever 创建的主题 PostgreSQL Postgres 在中国还能起来么?
我的项目都是 PostgreSQL 了,MySQL 好多年不接触了,Bug 实在太多了,
我的项目: https://www.agiquery.com
2024-01-24 12:14:10 +08:00
回复了 Braisdom 创建的主题 推广 Agile Query 新版网站上线了
@JavaGo 我会尽补上的,里面的几个场景里已经涉及不少函数了。
2024-01-23 19:45:26 +08:00
回复了 Braisdom 创建的主题 推广 Agile Query 新版网站上线了
@Alias4ck 您说的很对,前期我参考过这个项目,但是 proql 没有处理 "多对多" 关联时,直接 JOIN 导致的过度计算(有些团队称为数据膨胀),proql 还是需要数据工程师自己手工处理

Agile Query 通过算法智能处理过度计算,这也是最核心的算法。
2024-01-23 15:15:44 +08:00
回复了 Braisdom 创建的主题 推广 Agile Query 新版网站上线了
@moyi97 这块后面我写篇文章详细介绍一下,这里我先简单回答一下。

superset, dataeasy, redash 这类 BI 所有的数据都需要数据工程师写 SQL 完成,像用户画像,RFM 这类统计的 SQL 非常复杂。

agiquery 中,这些都可以通过一些简单的抽象函数实现。SQL 是由编译器完成的。

用户画像: https://www.agiquery.com/blog/customer-profiling-segmentation/

RFM 统计: https://www.agiquery.com/blog/rfm/
2024-01-23 10:47:47 +08:00
回复了 Braisdom 创建的主题 推广 Agile Query 新版网站上线了
@beneo 感谢祝福,看样兄弟应该钟情与手写 SQL 和预计算表了,应该还停留在 MySQL 的时候呢。
1 ... 5  6  7  8  9  10  11  12  13  14 ... 31  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2162 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 20ms · UTC 12:29 · PVG 20:29 · LAX 04:29 · JFK 07:29
Developed with CodeLauncher
♥ Do have faith in what you're doing.