工作亮点
- 业界最热门的大模型及 AGI 赛道初创团队
- Google 等世界顶级大模型 AI 算力平台技术专家带队;
- 解决中国算力卡脖子难题,为中国大模型团队提供低成本、高性价比算力;
- 与全球业界顶尖工程团队、高校教授、研究机构定时交流前沿技术;
- 混合办公(北京、或远程)、平等沟通、极致扁平化团队;
- 内部信息完全公开,为工程师打开产品、商业的大门;
- 丰厚期权;
关键词
DevOps 、Kubernetes 、Docker 、Python 、运维开发经验
能力要求
- 有强烈意愿让大模型普惠大众
- 计算机及计算机相关专业本科或以上学历,熟悉计算机科学基本知识:分布式系统原理、计算机网络、数据结构和算法
- 独立解决生产环境中的技术问题,阅读英文技术文档
- 精通 Linux 环境下 GPU ( NVIDIA 、国产 GPU 、国产 AI 芯片)、IB 网络的运维管理
- 精通主流云原生工具、Docker 、Kubernetes 等运维开发、Kubernetes 扩展机制:CRD 、Operator 、Scheduler plugin 等
- 熟悉 Kubeflow 、Ansible 、Ceph 、Harbor 等云原生工具
- 熟悉 Golang 、Python 、Shell 等编程语言
- 熟悉服务端基础技术(存储系统、数据库、消息队列、微服务、安全等)、熟悉分布式系统可扩展性机制和功能、熟悉 IaC ( Infrastructure as Code )最佳实践、熟悉公有云产品服务和系统架构
- 坚持高质量 DevOps 工程实践(测试、集成、架构)、抱有 AI 信仰:坚信 AI 改变世界
- 乐于并且善于与团队进行远程合作,在各种场合下卓越的沟通能力(代码、文档、即时通信工具、音视频会议、线下会议等等)
岗位职责
- 对 NVIDIA GPU 智算集群服务器及 IB 网络进行配置、优化,适配 Kubernetes ;
- 编写私有化部署的交付部署方案,编写部署和运维软件工具和脚本;
- 指导私有化部署客户现场交付,根据用户需求、IT 资产具体情况,制定可靠、高效的交付部署方案;
- 参与设计、开发 K8s 上的大模型训推平台;
- 参与制定公司整体软件工程规范,持续迭代优化公司软件工程质量、提升工程团队研发效能、提升产品服务质量;
薪资待遇
- 20k-40k 12 月
工作地点
- 北京、上海、苏州、或远程
联系方式
- 巩女士,Email:
[email protected] ,手机:15910555162 (微信同手机号)