Connecting World's top Talents with Premier Jobs and Networking.
Register
Connecting World's top Talents with Premier Jobs and Networking.

微信-后台开发高级工程师-大模型训练框架方向(上海)

Apply instagram Share link

Job Source

腾讯集团

Location

China, Beijing

Salary

Negotiable

Job Type

Full Time

Language

Job Posted Date

20-06-2025

Job Description

1.研发微信内通用的大模型训练框架 gCore 的研发,支持文本、多模态、文生图/视频等不同业务场景,以及预训练、SFT、RLHF等不同阶段的训练需求。通过并行策略和算子优化,使得 gCore 在不同的模型上都能达到 SOTA 的训练吞吐。

Job Requirements

1.计算机相关专业本科及以上学历,2年以上相关开发经验,具备良好的工程素养;
2.熟悉某一深度学习训练框架,如 PyTorch、TensorFlow、Megatron-LM、DeepSpeed、Transformers 等,有底层优化或开源经验;
3.具备良好的沟通能力和团队协作精神,积极主动,勇于接受挑战。。加分项:1.有昇腾、Gaudi等 ASIC 算力设备上的开发经验;
2.熟悉大模型算法,设计方案时能做算法和工程的协同设计;
3.实际进行百卡以上的训练任务,并对训练性能做过调优。



腾讯集团




Just one more quick step more to complete your application!

 

Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!

 

Just one more quick step more to complete your application!

 

Please complete now your information at our partner site and click to apply. Good luck !