运维工程师-北京

工作地点:北京         所属部门:AI试验平台         发布时间:2020-07-09
岗位描述:

1. 负责智能平台基础服务运维(DNS/NTP/SVN等);

2. 负责实机和虚拟机的日常运维;

3. 负责基于GPU的kubernetes集群的日常运维;

4. 研究系统的性能瓶颈,优化系统性能;

5. 负责集群系统的配置和系统故障处理;

6. 负责系统运维平台的自动化的开发;

日常代码发布,业务系统问题处理、跟进;

系统监控,保障业务高可用性。

任职资格:

1. 有3年以上大型网站系统运维经验;

2. 熟练使用Linux操作系统,熟悉常见的基础服务搭建,配置与优化(apache/nginx/ftp/mysql/java/python/go等);

3. 掌握bash(sed awk 等)和(php/Python/perl/ruby)中的一种;

4. 熟悉(prometheus/grafana/zabbix)监控管理工具,有二次开发经验优先;

5. 熟悉 (tomcat/mq/redis) 等中间件相关配置及优化;

6. 熟悉 k8s 相关生态圈组件,有大规模生产应用经验;

7. 主动沟通,积极聆听,具有良好的团队合作精神和善于总结。