大模型SRE运维工程师(搜广推方向)Apply |
|
Job Source |
腾讯集团 |
Location |
China, Shenzhen |
Salary |
Negotiable |
Job Type |
Full Time |
Language |
|
Job Posted Date |
20-06-2025 |
Job Description |
|
1.负责广告模型平台的系统稳定性和高可用性,确保平台在高并发和大流量下的稳定运行,设计和实施监控、报警和自动化运维平台建设等,及时发现和解决系统问题;
2.负责系统故障的快速定位和修复,制定并执行应急预案,确保业务连续性,参与故障复盘,分析根本原因,提出改进措施,防止类似问题再次发生; 3.开发和维护自动化运维平台与工具,提高运维效率,减少人为操作失误。进行资源使用优化,提高资源利用率,提升系统性能; 4.负责广告模型平台资源规划和管理,确保资源的合理分配和高效利用,进行资源成本分析,监控和评估资源使用情况,提出成本优化方案,同时能结合业界硬件演进roadmap与技术平台需求不断推动最优配置选型与迭代。 |
|
Job Requirements |
|
1.计算机科学、软件工程、信息技术或相关专业本科及以上学历;
2.5-8年互联网行业SRE、运维工程师或资源管理经验,有大型互联网公司工作经验者优先; 3.熟悉Linux操作系统,具备扎实的系统管理和网络知识;熟练掌握至少一种编程语言(如Python、Go、Shell等),有自动化运维工具开发经验;具备容器化和微服务架构经验,熟悉Kubernetes、Docker等技术; 4.具备资源规划和成本控制经验,熟悉常用的基础硬件评测技术,包括但不限于CPU、IO、内存等,能够进行硬件性能评估和选型,具备公司级成本优化管理经验,能够制定并执行资源成本控制计划,有大规模GPU集群管理经验者优先; 5.具备较强的故障排除和问题解决能力,能够在高压环境下快速响应和处理系统问题; 6.具备良好的沟通能力和团队协作精神,能够与跨部门团队有效合作; 7.具备快速学习和适应新技术的能力,乐于接受挑战和不断提升自我。。加分项: |
Welcome to Linkedtour! Please complete your profile first and then enjoy your trip in Linkedtour!
Please complete now your information at our partner site and click to apply. Good luck !