混元机器学习平台GPU调度研发工程师(深圳/北京)Apply |
|
Job Source |
腾讯集团 |
Location |
China, Shenzhen |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.参与腾讯太极统一GPU调度平台开发,负责万卡GPU集群配额管理、任务排队、弹性任务、跨集群等功能和性能优化;
2.优化异构AI芯片在多种任务作业之间的全局最优匹配,实现全局最佳利用率; 3.支持腾讯混元大模型、广告、视频号等众多业务场景的离线、在线GPU作业,保障平台高性能高稳定运行。 |
|
Job Requirements |
|
1.有大规模GPU集群资源/任务调度研发经验,了解不同规格GPU资源,熟悉GPU任务运行、容错、调度特性;
2.熟悉常见的task-scheduling调度模型和框架,了解排队论、动态规划等运筹学等基础原理; 3.熟悉Kubernetes、Docker等云原生技术工具,了解CRD的工作原理和实现; 4.良好的自驱力、责任心,以及沟通能力和优秀的团队协作能力; 5.熟悉掌握JAVA/GO/Python中一种或多种编程语言,熟悉常用算法和数据结构,具有扎实的编程功底。。加分项: |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !