腾讯游戏-资深机器学习工程师/专家-大规模模型训练与推理优化Apply |
|
Job Source |
腾讯集团 |
Location |
China, Shenzhen |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.负责3D/动画等美术资产生成大模型分布式训练和推理系统的性能优化;
2.通过数据并行、模型并行、流水线并行、专家并行等策略的工程实现和性能优化; 3.解决大模型训练中的显存瓶颈、通信延迟和负载均衡等核心计算资源问题; 4.负责多模态RLHF训练与推理平台的实现。 |
|
Job Requirements |
|
1.熟悉 GPU 架构 & CUDA 编程、算子融合优化等;
2.熟悉 PyTorch FSDP、DeepSpeed、Megatron-LM 等分布式训练框架,具备大模型多种并行训练策略实战经验; 3.熟悉 vLLM、SGLang 等大模型推理框架,有实际性能调优经验(如 KV Cache 优化、动态批处理、Attention 算子定制等); 4.熟悉大模型强化学习的工程技术,比如 OpenRLHF 框架。。加分项:1.在知名学术期刊或会议上发表过大模型训练/推理优化的相关技术论文; 2.有大规模分布式系统开发和优化的成功案例; 3.具备良好的团队协作能力和沟通能力,能够带领团队攻克技术难题。 |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !