邀请应聘

我的投递

我的收藏

猎聘APP

投诉建议

我的沟通
MOE 训练 Infra 开发 50-80k·16薪
北京 经验不限 本科
收藏
avator avator
李女士 1天前在线
猎头顾问 · 陕西嘉乐尼服人力资源管理有限公司
简历处理快 回复速度快
聊一聊
职位介绍
• 设计并实现高效的 MOE 训练框架,支持大规模分布式训练,优化训练性能,缩短训练时间。 • 解决 MOE 训练过程中的技术难题,如专家网络的选择、负载均衡、通信优化等。 • 与算法团队密切合作,根据算法需求调整和优化训练基础设施,确保算法的顺利实现。 2 MOE 推理 Infra 开发 • 开发高性能的 MOE 推理引擎,支持多种硬件平台(如 CPU、GPU、TPU 等),实现模型的快速部署和推理。 • 优化推理流程,提高推理效率和准确性,降低推理成本。 • 对推理结果进行监控和分析,及时发现并解决推理过程中出现的问题。 3 系统优化与维护 • 对 MOE 训练和推理基础设施进行性能调优,不断提升系统的稳定性和可靠性。 • 定期对系统进行维护和升级,确保系统的安全性和兼容性。 • 编写技术文档,为团队成员提供技术支持和培训。 4 团队协作与沟通 • 与算法团队、数据团队、产品团队等跨部门协作,共同推进项目的进展。 • 参与技术交流和分享活动,不断提升自己的技术水平和团队的整体实力。 以下是 MOE 训练/推理 Infra 工程师所需的关键技能: 1 分布式训练技术:掌握分布式训练框架(如 Horovod、PyTorch Distributed)的使用和优化。 2 硬件加速优化:熟悉 GPU、TPU 等硬件架构,能够进行硬件级性能调优。 3 模型优化技术:了解量化、剪枝、压缩等模型优化方法,以提升推理效率。 4 负载均衡与通信优化:能够设计高效的负载均衡策略和通信机制,以应对 MOE 模型的稀疏性挑战。 5 系统设计能力:具备分布式系统设计经验,能够解决大规模模型训练和推理中的工程问题。
其他信息
语言要求:不限
行业要求:互联网

猎聘温馨提示:

1. 如您发现平台内招聘方存在以下违规行为的,请立即举报
  • a. 扣押您的身份证件或者其他证件;
  • b. 要求您提供担保人、担保金或者以其他名义向您收取财物( 如培训费、体检费、资料费、置装费、押金等);
  • c. 强迫您入股或者向您集资;
  • d. 以招聘名义牟取不正当利益;
  • e. 发布虚假招聘广告信息;
  • f. 工作时长违反劳动法规定;
  • g. 存在其他损害您的合法权益的行为。
2. 如您应聘的岗位属于涉外劳务合作/海外岗位的,请务必核实招聘方对外劳务合作资质取得情况,同时注意自身资金安全,防范招聘欺诈。
查看全部

猜你喜欢

智算网络架构及关键技术研究岗
北京
60-90k
某知名公司
政府/公共事业 融资未公开 1000-2000人
曾先生
猎头
专家工程师-架构治理
北京-海淀区
45-60k·15薪
某北京生活服务O2O上市公司
生活服务O2O 已上市 10000人以上
陈女士
行业顾问
架构师(大型信息系统/物联网)
北京-海淀区
60-90k
某北京大型电子/半导体/集成电路公司
电子/半导体/集成电路 融资未公开 10000人以上
任女士
招聘顾问
编译器架构/编解码器架构
北京
60-90k·15薪
某杭州互联网上市公司
互联网 已上市 10000人以上
卢先生
项目经理
海外技术架构师 100-300w
北京
240-270k·18薪
某知名公司
金属制品 融资未公开 500-999人
钱先生
猎头顾问
1 2 3 4