2025 年,ai ide/model 协作编程能力大幅度提升,作为后端开发,跟前端相比毫不了太多。做 ai 应用一年了,做了 rag 系统,机器学习图像识别项目,但面对核心的 ai/ml 算法设计部分不得要领。你们是如何与机器学习/ai 模型算法工程师协作以至于能承担部分工作增加核心竞争力的?
1
ranley123 7 天前 via iPhone
转大模型 infra ,不过现在这个光景很难了。两年前我后端直接转大模型训练 infra 。现在已经杀得一片红海,同组算是国内最顶尖的大模型 infra 团队,进来的全是清北上交的博士,cmu 的也比比皆是。
但是现在如果实在想转,可以看看大模型相关的存储网络等等基础架构相关的,甚至 GPU 和大模型相关的 k8s 团队也行。应该能吃到一些涨幅溢价,只不过都是大厂了。 |
2
jiangbingo OP @ranley123 前外企大厂被优化,现创业小公司待着,无论是后端开发还是测试开发,经过一年多深度 vibe coding 深深的感受到传统程序员的生命周期比预期的要短。
|
3
Elietio 7 天前 via Android
手头有个 NLP 的项目要做,完全零基础暂时先用 AI 干着。。。
|
4
ranley123 7 天前 via iPhone
@jiangbingo 是的,我赞同你的观点。所以新时代多往 AI 和大模型靠靠,是能够延长的,甚至还有机会远程。个人经验也是如此。自从我入了 LLM infra ,至少前景和钱景上都得到了爆炸式提升
|
5
ranley123 7 天前 via iPhone
@jiangbingo 外企大厂该不会是 ms 吧哈哈,如果是的话那就是前同事了。我觉得你可以学习一下大模型的原理,比如 transformer 和 attention 之类的,甚至包括一些推理的框架基本知识 kv cache 之类的,如果对训练感兴趣的话可以看看并行训练的基本框架,不过会比较困难。
|
6
ranley123 7 天前 via iPhone
或者自己写写 ai agent 以后找 agent 工作
|
7
richarddingcn 7 天前
@ranley123 ai infra 是写算子么?请教下大佬有啥学习渠道感谢🙏
|
8
ranley123 6 天前 via iPhone
@richarddingcn 不止算子了,infra 包括高端的并行训练框架,算子优化,还有一系列分布式稳定性框架,LLM 故障检测和处理,LLM 存储 hdfs 优化和网络 NCCL 啥的,一大堆
|
9
ranley123 6 天前 via iPhone
@richarddingcn 框架基本不用想了,现在只有清北博士级别和妖孽硕士的才能进。其他的就按照正常的基础架构+LLM 知识学习找点实习吧
|
11
jiangbingo OP @BlAO 我提大佬回答下,既然工作 5 年多,你没感知到除了核心深度学习算法部分,其他都是应用吗?既然是应用层,逻辑思维,业务理解,行业选择更重要。
|
12
BlAO 5 天前 via Android
@jiangbingo 深有感触,感谢前辈的回答
|
13
ranley123 5 天前 via iPhone
@BlAO 其他方向说实话今年开始要求也非常高了,除了要求对应的基础架构非常专业,也需要对 LLM 有了解。但是还是比核心算法的要求没有那么逆天,不过至少都要 985 本了,top2 本博也很常见
|
14
BlAO 4 天前 via Android
@ranley123 大佬,这么说普通学历想转你说的大模型相关的存储网络,GPU ,k8s 团队也很难吃到涨幅溢价咯,是不是只能做下 agent ,rag 类的应用开发了,看来和普通后端区别不大😂😂
|
15
jiangbingo OP @ranley123 不是 ms 这么牛的外企。多谢你的建议。
|
16
ranley123 1 天前 via iPhone
@BlAO 其实做 agent 也可以努力往推理靠靠,如何做到推理更快,需要的内存更少也是技术活,因为这个就需要你主动学习类似 kvcache 之类的技术,一点一点往大模型推理浸透,这样也属于加强了个人技术壁垒和业务深度,跟普通做做 agent 有本质区别。
|
17
ranley123 1 天前 via iPhone
@jiangbingo 可以看下我最新的一条,如果是普通学历做 agent ,可以往推理技术靠靠
|
18
ranley123 1 天前 via iPhone
总结一下:
学历好:从基础技术出发,直接走训练或推理框架。 学历普通:从 agent 出发,向推理优化学习。如后训练微调技术,推理时长背景的语义压缩,kv cache 技术,etc 。之后一定是大模型的应用时代,如何推理得更便宜,更快, 一定是 agent 和应用工程师应该学习的东西 |
19
ranley123 1 天前 via iPhone
还有高并发下的推理调度策略等等,所涉及的工程技术非常多,我只是举个例子。也许现在你们做的 agent 或者还在小公司,觉得杀鸡焉用牛刀。但是多提前储备,跳槽到大公司会非常有用。
|
20
jiangbingo OP 感谢大佬
@ranley123 专业和富有耐心的建议。 |