1
rekulas 113 天前
这个网上不是很多分析了么,根本原因就是 ai 在缺乏对基础知识(投影、形体、物理、空间关系、力学等)的真正理解,而手虽然看起来简单,实际是一个比较复杂的结构,不同手势、角度带来的变化太大了,以目前 ai 的训练量还很难较为完美绘制
mj 在手部上不算特别出色,现在有一些针对手部的增强模型,可以 mj 画了主图之后用增强模型修复手部,可以上 civitai 搜搜 另外我觉得这也只是暂时的,大力出奇迹,ai 还在不断迭代,只要训练数据够多别说手千手观音都 so easy |
2
dai269619118 OP @rekulas 兄弟我知道手势很难 我上面的问题是 手指生成数量的问题
|
3
coderluan 113 天前
试试最新的 Flux ,参数多了效果就好很多了,手这块比 midjourney 强很多。
|
4
rekulas 113 天前
一样的道理啊,因为手势的复杂性,喂给 ai 的图可能只有 3 根手指 可能 5 根,就像你训练 ai 看了 1 亿颗树,它肯定能画出让你满意的树,但绝对没法稳定画出树叶数量刚好==平均树叶数量的树
你问的是原因,你若要问解决方案,没什么好的办法,只有尝试下新的模型,sd3 和手部增强版 |
5
cmdOptionKana 113 天前
flux 在这方面有明显改善,偶尔画错,但正确率已经很高,已经不能说 AI 画不好手了。
|
6
kaneg 113 天前 via iPhone
其实画过画的应该知道,画手是比较难的
|
7
freshgoose 113 天前
flux 在这方面的改善还是很大的,这里有个免费版可以测试一下 https://fluxai.dev/zh/playground
|
8
linch97 113 天前
AI 学的是统计规律,并没有逻辑。而且每个特征分辨率越低,越容易出错,你画几张手占主体的就会发现出错概率低了。加上手本来结构就很复杂,经常还有遮挡关系,都是目前 AI 绘图原理无法解决的。
|
9
flankechen 113 天前
1.人画画,手也是最难画的之一。
2.现在的 ai 画画本质上都是扩散模型从纯噪声一步步去噪而已,物理,结构,投影一毛线关系没有,细致的结构,提示词对齐,一致性还有很多可以进步的。 3.LS 说了,统计规律而已,目前数据细致程度和参数量没能到那个量级。不过一开始的时候,脚的数量有时候都会不对啊,现在的 fulx 好多了。 |
10
pkoukk 113 天前
我猜,是大家给图片打标签喂给 AI 的时候,并没有标注这图上有几根手指吧...
所以 AI 也并不清楚,这时候应该有几根 |
11
sentinelK 113 天前
因为画图 AI 的实现逻辑,是从一个低分辨率图,利用统计学原理作为概率基础,逐步细化去噪的过程。
因为是统计学原理,所以 AI 对于什么是“手”,以及“手”的物理概念一无所知。他只是知道绝大多数的画,在这个地方,会画成这样而已。 手部在绘画中占用的资源(像素点)并不多,同时手部因为灵活,所以遮挡、姿势多样。相对脸部,躯干而言,属于信息量小,但变化大的部位。这也就导致其统计学“局部最优解”比较多,而且没有明显的全局最优。 这就会导致手部的绘画容易出现错误。 |
12
cocomanber 112 天前
这个手的数量的确是个问题哈哈哈,mj 都出现过鸡爪。。。离谱
|
13
leegradyllljjjj 112 天前
真以为是外星智能啦,ai 后台跑的都是统计学模型,现阶段所有 ai 模型都是基于概率论的,现在的大模型是语言模型,加减乘除都能算错
|