V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 请不要在回答技术问题时复制粘贴 AI 生成的内容
jiangbingo
0.01D
V2EX  ›  程序员

作为后端开发工程师,你们有中途转向机器学习/深度学习的吗?

  •  
  •   jiangbingo · 7 天前 · 792 次点击

    2025 年,ai ide/model 协作编程能力大幅度提升,作为后端开发,跟前端相比毫不了太多。做 ai 应用一年了,做了 rag 系统,机器学习图像识别项目,但面对核心的 ai/ml 算法设计部分不得要领。你们是如何与机器学习/ai 模型算法工程师协作以至于能承担部分工作增加核心竞争力的?

    ranley123
        1
    ranley123  
       7 天前 via iPhone
    转大模型 infra ,不过现在这个光景很难了。两年前我后端直接转大模型训练 infra 。现在已经杀得一片红海,同组算是国内最顶尖的大模型 infra 团队,进来的全是清北上交的博士,cmu 的也比比皆是。
    但是现在如果实在想转,可以看看大模型相关的存储网络等等基础架构相关的,甚至 GPU 和大模型相关的 k8s 团队也行。应该能吃到一些涨幅溢价,只不过都是大厂了。
    jiangbingo
        2
    jiangbingo  
    OP
       7 天前
    @ranley123 前外企大厂被优化,现创业小公司待着,无论是后端开发还是测试开发,经过一年多深度 vibe coding 深深的感受到传统程序员的生命周期比预期的要短。
    Elietio
        3
    Elietio  
       7 天前 via Android
    手头有个 NLP 的项目要做,完全零基础暂时先用 AI 干着。。。
    ranley123
        4
    ranley123  
       7 天前 via iPhone
    @jiangbingo 是的,我赞同你的观点。所以新时代多往 AI 和大模型靠靠,是能够延长的,甚至还有机会远程。个人经验也是如此。自从我入了 LLM infra ,至少前景和钱景上都得到了爆炸式提升
    ranley123
        5
    ranley123  
       7 天前 via iPhone
    @jiangbingo 外企大厂该不会是 ms 吧哈哈,如果是的话那就是前同事了。我觉得你可以学习一下大模型的原理,比如 transformer 和 attention 之类的,甚至包括一些推理的框架基本知识 kv cache 之类的,如果对训练感兴趣的话可以看看并行训练的基本框架,不过会比较困难。
    ranley123
        6
    ranley123  
       7 天前 via iPhone
    或者自己写写 ai agent 以后找 agent 工作
    richarddingcn
        7
    richarddingcn  
       7 天前
    @ranley123 ai infra 是写算子么?请教下大佬有啥学习渠道感谢🙏
    ranley123
        8
    ranley123  
       6 天前 via iPhone
    @richarddingcn 不止算子了,infra 包括高端的并行训练框架,算子优化,还有一系列分布式稳定性框架,LLM 故障检测和处理,LLM 存储 hdfs 优化和网络 NCCL 啥的,一大堆
    ranley123
        9
    ranley123  
       6 天前 via iPhone
    @richarddingcn 框架基本不用想了,现在只有清北博士级别和妖孽硕士的才能进。其他的就按照正常的基础架构+LLM 知识学习找点实习吧
    BlAO
        10
    BlAO  
       6 天前 via Android
    @ranley123 请问大佬,这些方向都很吃学历吗?我后端 5 年多,普本+非全硕
    jiangbingo
        11
    jiangbingo  
    OP
       6 天前   ❤️ 1
    @BlAO 我提大佬回答下,既然工作 5 年多,你没感知到除了核心深度学习算法部分,其他都是应用吗?既然是应用层,逻辑思维,业务理解,行业选择更重要。
    BlAO
        12
    BlAO  
       5 天前 via Android
    @jiangbingo 深有感触,感谢前辈的回答
    ranley123
        13
    ranley123  
       5 天前 via iPhone
    @BlAO 其他方向说实话今年开始要求也非常高了,除了要求对应的基础架构非常专业,也需要对 LLM 有了解。但是还是比核心算法的要求没有那么逆天,不过至少都要 985 本了,top2 本博也很常见
    BlAO
        14
    BlAO  
       4 天前 via Android
    @ranley123 大佬,这么说普通学历想转你说的大模型相关的存储网络,GPU ,k8s 团队也很难吃到涨幅溢价咯,是不是只能做下 agent ,rag 类的应用开发了,看来和普通后端区别不大😂😂
    jiangbingo
        15
    jiangbingo  
    OP
       4 天前
    @ranley123 不是 ms 这么牛的外企。多谢你的建议。
    ranley123
        16
    ranley123  
       1 天前 via iPhone
    @BlAO 其实做 agent 也可以努力往推理靠靠,如何做到推理更快,需要的内存更少也是技术活,因为这个就需要你主动学习类似 kvcache 之类的技术,一点一点往大模型推理浸透,这样也属于加强了个人技术壁垒和业务深度,跟普通做做 agent 有本质区别。
    ranley123
        17
    ranley123  
       1 天前 via iPhone
    @jiangbingo 可以看下我最新的一条,如果是普通学历做 agent ,可以往推理技术靠靠
    ranley123
        18
    ranley123  
       1 天前 via iPhone
    总结一下:
    学历好:从基础技术出发,直接走训练或推理框架。
    学历普通:从 agent 出发,向推理优化学习。如后训练微调技术,推理时长背景的语义压缩,kv cache 技术,etc 。之后一定是大模型的应用时代,如何推理得更便宜,更快, 一定是 agent 和应用工程师应该学习的东西
    ranley123
        19
    ranley123  
       1 天前 via iPhone
    还有高并发下的推理调度策略等等,所涉及的工程技术非常多,我只是举个例子。也许现在你们做的 agent 或者还在小公司,觉得杀鸡焉用牛刀。但是多提前储备,跳槽到大公司会非常有用。
    jiangbingo
        20
    jiangbingo  
    OP
       11 小时 1 分钟前
    感谢大佬
    @ranley123 专业和富有耐心的建议。
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2862 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 14:14 · PVG 22:14 · LAX 06:14 · JFK 09:14
    ♥ Do have faith in what you're doing.