云计算时代给大家带了很多机遇,同时也带来了很多挑战,有人就认为随着云的普及,运维人员将会最终消失。当然,这个论点不免有些偏激,但云时代的确给运维带来了很多不同,也让运维从业人员开始思考很多问题。在近日举办的中国运维和安全大会上,我们就欣喜地看到了很多乐意迎接挑战的同学,也有很多大牛分享了自己的经验与心得。
中国的第一代黑客,现任UCloud CEO的季昕华为大家分析了云计算时代为运维与安全带来的挑战和机会。首先,运维人员要有一些基本的素质要求,其中包括懂风水,在机房选址时是否处于地震带,吹的什么风向,当地电价如何都是运维要考虑的;懂网络,在国内特殊的网络环境下,要理解南北差异;要有体力,必要时能去机房搬服务器;还要懂操作系统,懂网络攻击防御等等……
可是大多数运维人员在公司中的地位不高,而且在行业中的薪资相对偏低,究其原因还是因为运维的从业门槛低,大家对运维的认知度不高。因此,季昕华认为,除了上述基本知识,运维人员还因具备以下三方面的素质:
懂业务 ,例如要能理解产品的用户是一线城市还是二线城市,是PC端还是移动端,在对业务有足够的了解的情况下,才能让你的工作成为领导关心的事。
运营化 ,将运维中的意外管理变为过程管理,并能持续改进、持续优化;运维要能做到四个“第一”,即第一时间发现问题,第一时间定位问题,第一时间解决问题和第一时间反馈问题。
系统化 ,要能通过各种系统来辅助运维工作,甚至要能自己开发运维系统。
目前摆在大家面前有几个瓶颈,第一是成长空间有限,在公司的地位不高,行业内的知名度也不高;第二是云计算可能会革掉很多运维人员的名,很多小的初创企业甚至都不需要运维;第三是人员转型困难大。
当然,机会也有不少,比如,互联网正在快速地改变传统行业,之前兴起的O2O浪潮就是很好的例子,运维人员可以帮助那些传统行业快速地成长;大数据的到来也为大家打开了一扇窗户;另外就是云计算,当你能把一个行业做精做细,就能把它挖掘成一个产业,例如又拍云、DNSPod、监控宝和安全宝都是最好的例子。
季昕华建议大家在使用那些免费的运维服务时,如果可以,就更多地向他们付费,让公司知道运维也是有价值的。当台下有开发的同学问到该如何帮助运维同学时,几位嘉宾都讲到了如果能够做到DevOps那是最好的,不要再出现这样的情况:
产品不足,开发补,开发不足运维补,运维不足客服补
既然云是本次大会的一个重要主题,那自然少不了云存储的内容。来自七牛的韩拓为大家介绍了七牛在建设云存储方面的一些做法,他的分享分为两部分——底层存储和构建于前者之上的云存储,两者在设计上有着截然不同的地方。
底层存储有以下难点:
元数据管理
对冗余度的控制(副本的数量与成本的平衡点)
修复速度(直接影响存储系统的可靠性,在七牛恢复是集群任务,盘上数据的副本松散地保存在集群中,目前能做到在十几分钟到几十分钟内修复2到3T的数据)
应对容量的增长
可接受的访问速度
合理、有效的缓存
七牛在网络上采用了常规的千兆局域网,这是考虑到了它的成熟度和成本,在机柜之间无法保证任意两点间随时都是千兆,甚至无法保证全联通,而机房之间的速度,带宽成本很高,速度与连通性都无法保证。因此,数据存储的位置需要有一定的平衡,副本在同一机柜和不同机柜各有利弊,机房亦是如此。
在故障方面,除了要将故障视为常态,更要能明确地知道要面对哪些故障,它们的成因、概率和影响范围。
例如,常见的故障有:
机房内故障
网卡(断线、降速)
网线(断线、降速)
交换机(整体故障、单口故障、VLAN故障)
机柜级联故障
机房间故障
区域性网络故障(机房出口断网)
DNS解析故障(服务器之间DNS)
对于机房内的故障,不需要投入太多的资源成本做额外的高可用方案。
在网络安全上,除了必要的基础防御之外,更重要的是业务层面的防护,公有云的基本原则是开放,任何服务可以无条件暴露于公网,机房间的交互与客户无差别,不组VPN。
云存储构建于基础存储之上,它要能提供极高的上传、下载速度,有极高的可用性,有极高的可靠性,有丰富的附加功能(缩略图、水印等等),方便的网络访问。
它的难点在于:
云存储属于终端网络,它直接面对用户,情况复杂;它是最外层的接入点,前端没有机会做遮挡,对各种指标要求高。
广域网基础设施普遍质量不高,要基于99%可用的基础设施来提供99.999%的服务。