高性能网络通信库研发工程师Apply |
|
Job Source |
腾讯集团 |
Location |
China, Beijing |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.通信算子开发:设计和实现大模型训练/推理场景下的高效集合通信算子(AllReduce、AllGather、ReduceScatter、AllToAll等);
2.通信计算融合:设计通信与计算的overlap策略,实现计算通信并行,提升大模型整体训练/推理性能; 3.通信性能调优:针对不同硬件平台(GPU、NPU等)进行算子性能分析和优化,解决性能瓶颈问题; 4.参与AI通信库整体架构设计,制定技术方案和开发规范。 |
|
Job Requirements |
|
1.计算机/网络通信/软件工程或相关专业,硕士及以上学历,3年以上网络通信相关工作经验;
2.精通C++/CUDA编程,熟悉Python开发; 3.具备分布式训练/推理的实践经验,理解数据并行、模型并行等策略,了解大模型架构(Transformer、GPT、LLaMA等)和推理优化技术; 4.具备良好的问题分析和解决能力,对前沿技术有强烈的学习兴趣和探索精神;责任心强,能够承受一定工作压力,具备良好的团队沟通和协作能力; 5.深入理解GPU架构和CUDA编程模型、有kernel优化经验者优先; 6.熟悉MPI、NCCL等通信库的原理者优先,具备RDMA verbs编程经验者优先。。加分项: |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !