算想未来是大模型算力云服务技术服务商;正在研发一款云原生、基于 K8s 的大模型训练平台软件产品;目前已有稳定营收、收支平衡、正在进行天使轮或 A 轮融资;算想未来的目标产品是开放的大模型算力云,一个匹配中小企业大模型算力需求与多样化的 GPU 算力源的开放式的、分布式的算力市场;该产品一方面解决算力供需匹配问题、另一方面基于算想未来大模型算力平台软件,提高算力使用效率、降低大模式算力用户使用成本。
算想未来团队来自 Google 等世界领先的大模型计算平台基础设施研发团队;创始团队合计超过 30 年的人工智能基础设施软件的研发经验。团队有丰富的创业经验,创始人是连续创业者,曾于 2019 年 4 月加入 Pixie ( https://px.dev ),作为创始团队成员和技术负责人,带领团队完成产品研发、并于 2020 年 12 月被纽约证券交易所上市公司 New Relic 收购,前后历时不到 2 年。
算想未来获得奇绩创坛天使轮融资;从全球超过 5000 家申请者中脱颖而出入选奇绩创坛 2022 年秋季创业营(录取率不到 1%)。团队帮助中国大模型团队迅速突破模型训练的算力墙,让大模型训练规模赶超 OpenAI 、Google ,打开大模型算法和 AI 应用迭代飞轮,让大模型发生在中国,让中国成为 AI 经济世代的领导者!
工作亮点
- 业界最热门的大模型及 AGI 赛道初创团队
- Google 等世界顶级大模型 AI 算力平台技术专家带队;
- 解决中国算力卡脖子难题,为中国大模型团队提供低成本、高性价比算力;
- 与全球业界顶尖工程团队、高校教授、研究机构定时交流前沿技术;
- 混合办公(北京、或远程)、平等沟通、极致扁平化团队;
- 内部信息完全公开,为工程师打开产品、商业的大门;
关键词
Python 、PyTorch 、自然语言处理 NLP 、良好英文读写能力、LLM 、Generative AI 、AIGC 、Mac 、Linux
能力要求
- 计算机及计算机相关专业本科或以上学历
- 敢于挑战,追求卓越,有创新精神和研发热情。
- 熟悉 NLP 理论和算法
- 熟悉 Transformer 系列模型架构和原理;
- 熟练使用 Python 、PyTorch ;
- 熟练使用 Megatron-LM 、DeepSpeed 等至少一种模型训练框架,掌握模型并行、流水线并行、数据并行和 ZeRO 等并行训练技术;
- 熟悉大模型推理优化技术,包括但不限于 layer fusion 、kernel fusion 、quantization 等技术;
岗位职责
- 为云原生大模型算力云平台提供需求指引;编写流行大模型预训练、精调、推理代码,在大模型算力平台上进行测试;并向算力平台研发团队提出功能、性能要求;
- 优化大模型训练、微调、推理框架;引入前沿优化算法,提升大模型算力平台软件适配最新优化算法的能力;
- 向大模型社区宣传算想未来的云原生大模型算力平台软件能力、功能、使用体验;扩大算想未来在大模型社区中的技术影响力;
薪酬待遇
- 20-40K x 12 薪
- 丰厚期权
工作地点
- 北京、或远程
联系人
- 巩女士,Email: [email protected] ,手机:15910555162 (微信同手机号)