搜索应用部-模型推理工程师Apply |
|
Job Source |
腾讯集团 |
Location |
China, Beijing |
Salary |
Negotiable |
Designation |
Internet/AI |
Job Type |
Full Time |
Language |
|
Job Posted Date |
02-09-2025 |
Job Description |
|
1.参与搜索核心业务的模型部署、模型推理优化等相关工作;
2.负责推理框架核心模块的设计与开发,包括算子调度、流量调度、模型管理、推理引擎集成等工作; 3.负责推理加速方法的工程实现和落地,包括但不限于模型剪枝、模型量化、动态batch等方法; 4.调研前沿技术,推动稀疏化推理、异构推理、分布式推理等技术在搜索业务中的集成应用。 |
|
Job Requirements |
|
1.计算机/电子工程等相关专业,2年以上推理优化经验;
2.精通C++/Go/Python,熟悉CUDA/OpenCL高性能编程; 3.至少熟练掌握一种推理框架(TensorRT/Triton/vLLM/sglang),有二次开发经验; 4.熟悉量化、剪枝、动态Shape、算子融合等优化方法的基本原理和适用场景; 5.具备较强的团队合作和沟通能力,能够与团队成员、业务部门紧密协作,完成项目交付和技术创新。。加分项:1.大语言模型(LLM)推理优化经验; 2.熟悉TRT算子开发及应用经验。 |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !