Connecting World's top Talents with Premier Jobs and Networking.
Register
Connecting World's top Talents with Premier Jobs and Networking.

大模型推理优化研发工程师-算子优化

Apply instagram Share link

Job Source

腾讯集团

Location

China, Shanghai

Salary

Negotiable

Job Type

Full Time

Language

Job Posted Date

20-06-2025

Job Description

1.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA,AMD等)的底层性能优化与调优;
2.针对大模型推理场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率;
3.深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法;
4.探索前沿技术方向(如混合专家模型MOE、动态计算图编译优化、JIT等),推动AI工程化落地的效率提升。

Job Requirements

1.经验要求:2年以上GPU高性能计算开发经验,有大规模AI模型优化经验者优先;
2.精通CUDA OpenCL等GPU编程语言,熟悉NVIDIA或AMD的底层优化技巧;
3.精通Triton,Cutlass,CK等高性能算子开发工具;
4.熟悉VLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等);
5.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术;
6.熟练使用C/C++、Python,具备良好的算法设计与代码实现能力;
7.熟悉Attention结构MHA/MQA/GQA/MLA,以及MOE结构。。加分项:1.熟悉DeepSeek系列模型的工程优化技术,包括但不限于PD分离、MLA、MOE负载均衡、MTP等有TensorRT、VLLM、SGLang、Triton Inference Server、MLIR/LLVM等编译优化工具链的实际项目经验;
2.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。



腾讯集团




Just one more quick step more to complete your application!

 

Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!

 

Just one more quick step more to complete your application!

 

Please complete now your information at our partner site and click to apply. Good luck !