微信-后台开发高级工程师-大模型训练框架方向(上海)Apply |
|
Job Source |
腾讯集团 |
Location |
China, Beijing |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.研发微信内通用的大模型训练框架 gCore 的研发,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求。通过并行策略和算子优化,使得 gCore 在不同的模型上都能达到 SOTA 的训练吞吐。
|
|
Job Requirements |
|
1.计算机相关专业本科及以上学历,2年以上相关开发经验,具备良好的工程素养;
2.熟悉某一深度学习训练框架,如 PyTorch、TensorFlow、Megatron-LM、DeepSpeed、Transformers 等,有底层优化或开源经验; 3.具备良好的沟通能力和团队协作精神,积极主动,勇于接受挑战。。加分项:1.有昇腾、Gaudi等 ASIC 算力设备上的开发经验; 2.熟悉大模型算法,设计方案时能做算法和工程的协同设计; 3.实际进行百卡以上的训练任务,并对训练性能做过调优。 |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !