微信-并行计算高级工程师Apply |
|
Job Source |
腾讯集团 |
Location |
China, Beijing |
Salary |
Negotiable |
Designation |
Internet/AI |
Job Type |
Full Time |
Language |
|
Job Posted Date |
04-07-2025 |
Job Description |
|
1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠;
2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎; 3.引导算法团队设计性能/功耗兼顾的算法。 |
|
Job Requirements |
|
1.本科以上学历,计算机相关专业;
2.优秀的 C++ 编程经验,熟练掌握常用数据结构与算法,有一定的软件工程能力、良好的编程能力、逻辑思维和快速学习能力; 3.良好的团队合作意识,优秀的沟通和学习能力; 4.熟悉常见深度学习算法和视觉、LLM、图像视频生成 等模型,熟悉主流-ML平台框架(如 TensorFlow/PyTorch); 5.热爱技术,致力用技术为大量用户带来价值,为知名开源项目作出贡献或长期维护个人开源项目。。加分项:1.有以下一种或多种高性能计算、编译框架深入的研究和实践经验,或者基础扎实,有热心和毅力去学习钻研以下内容的,优先:; 2.A.精通现代 ARM/x64 体系结构与ISA/微架构以及 SIMD 指令集。能够从指令流水线/存储器层次结构 等级别量化分析性能瓶颈,并做出极致的优化; 3.B.精通 Nvidia/AMD/Adreno/Mali/PowerVR 等现代 GPU 体系结构与微架构;精通 CUDA/OpenCL/ROCm/Metal;熟悉现代 GPU 驱动的行为;能够从指令流水线/存储器层次结构/驱动调度 等级别量化分析性能瓶颈,并做出极致的优化。熟悉现代 GPU 渲染管线; 4.C.精通 Hexagon/Movidius 等 DSP 或 NPU 的体系结构与指令集,有 VLIW 指令集的优化经验,熟悉常用模拟器,能做到 cycle 级别的性能分析,熟悉 DMA/RPC 操作; 5.D.对常用计算/带宽密集型算子(如:GEMM/Conv/MultiheadAttention)实现做过面向 延迟/吞吐/功耗 的极致优化,性能超过开源或商业高性能计算库(如:TensorRT(LLM)/CoreML/MKL/OpenVINO 等); 6.E.有 AI 相关编译器(如:TVM/XLA/MLIR)开发经验;熟悉现代编译器框架(如:LLVM/gcc)。 |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !