Connecting World's top Talents with Premier Jobs and Networking.
Register
Connecting World's top Talents with Premier Jobs and Networking.

微信-并行计算高级工程师

Apply instagram Share link

Job Source

腾讯集团

Location

China, Shenzhen

Salary

Negotiable

Designation

Internet/AI

Job Type

Full Time

Language

Job Posted Date

04-07-2025

Job Description

1.负责 AI 异构计算平台研发,打造 NLP/视觉/语音 等算法模型跨平台部署全流程优化,实现 AI 算力在微信生态(视频号、小程序、企业微信、微信读书、微信输入法等)的通用化和普惠;
2.分析 CNN、Transformer 等常用结构在微信实际业务场景中的性能瓶颈,在 CPU/GPU/NPU 上完成高性能实现与软硬件协同调优,实现性能极致的跨平台推理引擎;
3.引导算法团队设计性能/功耗兼顾的算法。

Job Requirements

1.本科以上学历,计算机相关专业;
2.优秀的 C++ 编程经验,熟练掌握常用数据结构与算法,有一定的软件工程能力、良好的编程能力、逻辑思维和快速学习能力;
3.良好的团队合作意识,优秀的沟通和学习能力;
4.熟悉常见深度学习算法和视觉、LLM、图像视频生成 等模型,熟悉主流-ML平台框架(如 TensorFlow/PyTorch);
5.热爱技术,致力用技术为大量用户带来价值,为知名开源项目作出贡献或长期维护个人开源项目。。加分项:1.有以下一种或多种高性能计算、编译框架深入的研究和实践经验,或者基础扎实,有热心和毅力去学习钻研以下内容的,优先:;
2.A.精通现代 ARM/x64 体系结构与ISA/微架构以及 SIMD 指令集。能够从指令流水线/存储器层次结构 等级别量化分析性能瓶颈,并做出极致的优化;
3.B.精通 Nvidia/AMD/Adreno/Mali/PowerVR 等现代 GPU 体系结构与微架构;精通 CUDA/OpenCL/ROCm/Metal;熟悉现代 GPU 驱动的行为;能够从指令流水线/存储器层次结构/驱动调度 等级别量化分析性能瓶颈,并做出极致的优化。熟悉现代 GPU 渲染管线;
4.C.精通 Hexagon/Movidius 等 DSP 或 NPU 的体系结构与指令集,有 VLIW 指令集的优化经验,熟悉常用模拟器,能做到 cycle 级别的性能分析,熟悉 DMA/RPC 操作;
5.D.对常用计算/带宽密集型算子(如:GEMM/Conv/MultiheadAttention)实现做过面向 延迟/吞吐/功耗 的极致优化,性能超过开源或商业高性能计算库(如:TensorRT(LLM)/CoreML/MKL/OpenVINO 等);
6.E.有 AI 相关编译器(如:TVM/XLA/MLIR)开发经验;熟悉现代编译器框架(如:LLVM/gcc)。



腾讯集团




Just one more quick step more to complete your application!

 

Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!

 

Just one more quick step more to complete your application!

 

Please complete now your information at our partner site and click to apply. Good luck !