云原生算力平台运维工程师Apply |
|
Job Source |
腾讯集团 |
Location |
China, Shenzhen |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.负责GPU、CPU、异构计算设备的日常运维、软硬件排障、调优,以及算力服务能力提升、资源利用效率提升,保障算力输出的持续、稳定、高效;
2.负责k8s集群管理和治理,容灾设计、监控告警、版本变更、安全演练等,保障系统高可用和可维护; 3.负责运维运营工作自动化,包括资源管理、变更管理、故障恢复、用户工具接口等。 |
|
Job Requirements |
|
1.本科及以上学历,2年以上相关工作经验;
2.熟悉GPU、机器学习技术原理,有GPU硬件、驱动、Cuda、NCCL、Mellanox网络等运维和调优经验,有异构硬件经验者优先; 3.熟悉云原生容器技术,有Docker、K8s的实际使用和运维经验; 4.熟悉Linux环境和Shell,掌握Golang/Python/Java等1种以上语言; 5.熟悉云原生容灾设计优化,并善于使用自动化、智能化方法让服务稳定高效; 6.具有强烈的工作责任心和自驱力,有良好的学习沟通能力、逻辑分析能力和抽象能力,良好的团队合作精神。。加分项: |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !