运维工程师工作内容

我不是一个人在这世界停靠
  • 回答数

    3

  • 浏览数

    9712

首页> 工程师报名> 运维工程师工作内容

3个回答默认排序
  • 默认排序
  • 按时间排序

深蓝海

已采纳

运维的职责覆盖了产品从设计到发布、运行维护、变更升级及至下线的生命周期,各个阶段的职责包括:

1、产品发布前

这个阶段运维工程师的职责是参与设计并把有关运维准入,主要包括:

(1) 产品的业务熟悉;

(2) 产品架构设计的合理性评估,包括是否存在单点,是否可容错,是否有强耦合等,同时需要提供产品设计的合理性建议以使产品能够满足上线发布并稳定运行的基本要求;

(3) 资源评估,包括所需的服务器资源、网络资源以及资源的分布等,同时把相关产品对资源预算申请的合理性,控制服务成本;

(4) 资源就位,将申请的服务器及基础环境域名准备就位。

2、产品发布

这个阶段运维工程师负责发布的具体工作,将具体的软件和系统硬件资源整合形成产品并对外提供服务。

对于已在线服务的更新也属于发布范畴,这个时候的产品发布一般要保障在线发布,在不中断对外服务的情况下完成产品的升级。对于大型复杂的变更也存在中止服务部署完成后再重新提供服务的情况,但这种情况需要运维工程师通过尽可能的技术手段来避免。

3、产品运行维护

这个阶段的主要工作包括:

(1) 监控:对服务运行的状态进行实时的监控,随时发现服务的运行异常和资源消耗情况;输出重要的日常服务运行报表以评估服务业务整体运行状况,发现服务隐患;

(2) 故障处理:对服务出现的任何异常进行及时处理,尽可能避免问题的扩大化甚至中止服务。这之前运维工程师需要针对各类服务异常,如机房网络故障、程序bug等问题制定处理的预案,问题出现时可以自动或手动执行预案达到止损的目的。

除了日常小故障外,运维工程师还需要考虑产品不同程度受损情况下的灾难恢复,包括诸如地震等不可抗力导致大规模机房故障、在线产品被删除等对产品造成致命伤害的情况。

容量管理:包括服务规模扩张后的资源评估、扩容、机房迁移、流量调度等规划和具体实施。

4、产品性能成本优化

产品对外提供服务最重要的一点是用户体验,用户体验中非常重要的是产品的可用性和响应速度。而如何用最合理的资源(如机器、带宽等)支持产品提供高可用和高速度的用户体验,这也是运维工程师的重要职责。

5、产品下线

发展良好的互联网产品将始终在线对外提供服务,但互联网产品快速迭代,也存在相当多孵化的产品最后被淘汰的情况,这些产品都需要做下线处理,这个过程运维工程师主要做好资源回收的工作,将机器网络等资源回收后纳入资源池中供其它服务使用。

167评论

你要牢牢记住你是我的

运维工程师主要做:保障系统正常运行、做好数据防范工作、技术故障、系统测试、数据备份。

1、保障系统正常运行:

负责机房IT系统核心设备的日常巡检与维护工作,能按要求对其进行配置,保障系统的正常、安全运行。

2、做好数据防范工作:

负责服务器系统的安全管理,做好数据安全和病毒的防范工作。

3、技术故障:

负责现场的技术支持,及时解决出现的各类技术故障。

4、系统测试:

负责数据库管理,及相关系统测试。

5、数据备份:

负责制定各服务器的数据备份计划,并且确保备份数据可用性。

运维工程师容易失业吗?

这个职业还是很有前途的,不容易失业。从行业的角度来看,随着中国互联网的飞速发展,网站规模的扩大以及架构的日益复杂,对专职网站运维工程师和网站架构师的要求将越来越迫切,尤其是对于优秀的运维人才来说,是庞大的,而且年龄越大,就越有价值。

从个人的角度来看,运维工程师的技术含量和要求会越来越高,最熟悉公司应用和体系结构的人们越来越受到关注。当前,国内外对运维人才的需求非常紧迫,运维工程师的薪水也在不断提高,与研发,测试等技术部门的水平相当甚至超过。

26评论

我不说并不代表我不知道

一: 运维工程师要保证线上系统地稳定,这是运维人员的核心价值 ,围绕这个展开,是一个非常大的话题,后面细化 二:基础建设:安全,质量,效率,成本 是运维人员可以展开运维工作的四大方面。围绕着这四个方面,我们需要制定规范,流程,建设对应的系统保证效率,标准化提升效率等等 质量: 立体化监控系统;测速,备份容灾等等 效率: 提升运维效率的系统建设,标准化机器初始化,软件安装标准化,监控标准化等等,提升效率,批量部署脚本等等 安全:互联网安全,系统支持,cgi扫描等等 成本:预算制定等等,合理优化部署,平衡成本与体验三:基础建设升华:一切以用户价值为依归1:异地部署 ,异地容灾2:柔性可用 ,柔性可损3:全网调度 ,实现成本与 用户体验的平衡4:优化用户体验:提升速度 四:从一个项目上看运维人员的工作分解1:项目初期介入,提对应运维需求,需要运维工程师预计运营时可能需要的数据,可以从两个方向考虑:A监控;B评估系统好坏的运维指标,如接口调用数据,用户访问速度等等,提出对应需求,开发在设计时实现,方便上线后运维采集这些数据做系统评估。 这个阶段要了解系统架构,评估运维上是否合理。是否方便部署,运维风险有哪些,从哪些层面可以避免,做好容灾,cache数据丢数,db down掉等的评估以及应对方案设计,全网调度方案等。 2:项目开发阶段,这个阶段运维也要参与其中,了解对应运维需求开发的完成情况 3:项目测试发布: 运维负责运营环境的搭建,发布上线,并监控线上系统稳定 4:项目发布后:保证对应监控,备份,容灾等对应工作完成 5:项目运营阶段:及时对告警进行处理,对系统发展趋势做好评估,扩容等,预估可能的运营风向,并做好对应的应对措施 6:相关演习 7:做好系统优化,提升用户体验五:从运维人员面对的周边角色做 运维人员的工作分解 1:上游战略依从:理解公司发展方向,调整运营战略 2;开发 3:测试 4:QA 5:老板等

42评论

相关问答