大模型推理优化研发工程师-算子优化Apply |
|
Job Source |
腾讯集团 |
Location |
China, Shanghai |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.参与基于GPU的高性能计算(HPC)项目设计与开发,负责GPU芯片(NVIDIA,AMD等)的底层性能优化与调优;
2.针对大模型推理场景,优化和扩展vLLM、SGLang等框架的核心模块,提升计算效率与资源利用率; 3.深入分析GPU硬件架构特性(如Tensor Core、显存带宽、通信机制等),设计并实现高性能算子与算法; 4.探索前沿技术方向(如混合专家模型MOE、动态计算图编译优化、JIT等),推动AI工程化落地的效率提升。 |
|
Job Requirements |
|
1.经验要求:2年以上GPU高性能计算开发经验,有大规模AI模型优化经验者优先;
2.精通CUDA OpenCL等GPU编程语言,熟悉NVIDIA或AMD的底层优化技巧; 3.精通Triton,Cutlass,CK等高性能算子开发工具; 4.熟悉VLLM、SGLang等大模型推理框架,有实际性能调优经验(如KV Cache优化、动态批处理、Attention算子定制等); 5.扎实的高性能计算基础,熟悉并行计算、内存优化、通信优化等技术; 6.熟练使用C/C++、Python,具备良好的算法设计与代码实现能力; 7.熟悉Attention结构MHA/MQA/GQA/MLA,以及MOE结构。。加分项:1.熟悉DeepSeek系列模型的工程优化技术,包括但不限于PD分离、MLA、MOE负载均衡、MTP等有TensorRT、VLLM、SGLang、Triton Inference Server、MLIR/LLVM等编译优化工具链的实际项目经验; 2.在同等条件下,通过腾讯云认证或取得同等资格认证的候选人,我们会优先考虑。 |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !