CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> 互联网络 >> 技术正文
 
云原生×混沌工程你究竟了解多少
[ 通信界 | 胡文 | www.cntxj.net | 2022/10/30 23:13:04 ]
 
导读

混沌工程(Chaos Engineering)不是一个新概念,从Netflix的工程师创建混沌猴子开始,已经默默发展了数年,随着近年云原生的兴起,混沌工程开始频繁地出现在我们面前。作为一种提高技术架构弹性能力的复杂技术手段,混沌工程在分布式系统上进行随机的故障注入实验,和云原生规模宏大、结构复杂、可靠性要求高的特点完美匹配,为云原生的发展提供较强助力。

云原生 × 混沌工程

“今年要搞云原生,混沌工程也要考虑了。”

“听说某某公司建了个混沌工程平台呢。”

“我最近也在研究混沌工程。”

最近是不是经常听到这样的对话?

混沌工程到底是什么?

为什么要实施混沌工程?

怎么实施?

如果你还不太了解❓

那就听我给你介绍一下吧👇

Part 01

●  什么是混沌工程 ●

有一只猴子,非常调皮,上蹿下跳地到处搞破坏,不知道什么时候就把系统内哪台服务给搞挂了,可是IT人们不仅不想办法消灭它,还非常欢迎它,甚至任由它的队伍发展壮大,成立了“猴子军团”!是不是特别匪夷所思?其实,这就是混沌工程的始祖,由Netflix公司开发的Chaos Monkey,让我们来了解一下吧。

根据这只猴子的特性,想必大家也能猜个几分了,在系统内随机搞破坏,制造一些正常手段难以设计的故障,验证系统的恢复能力,提高系统的可靠性,如果给个定义的话,混沌工程就是一种提高技术架构弹性能力的复杂技术手段。是不是感觉跟我们常说的“故障注入”有点像呢?没错,“故障注入”是混沌工程最重要的组成部分,“故障演练”和混沌工程确实有一部分重叠,只是混沌工程的内涵更丰富,有自己的通用准则,在实施层面上看,混沌工程更像是一种实验,并不预设实验结果。

Part 02

●  为什么要实施混沌工程 ●

按照目前云原生时代流行的持续测试的理念,测试人员在软件生命周期的需求分析阶段就介入了,更有自动化测试、测试左移/后移等手段的保驾护航,难道还会有发现不了的bug?还需要引入混沌工程?答案是肯定的。因为目前的测试手段都是基于制定好的测试用例来执行测试,测试结果是有预期的,对于复杂的系统,尤其是动辄成千上万台服务器的云环境,我们很难预计到系统内会发生什么故障,更无法预期发生一个小小的故障对整个系统会产生多大的影响。混沌工程就是为了解决这个问题而产生的,尽可能产生随机故障,监控系统的表现,为加固系统提供参考和建议,这样就能不断提高系统的健壮性。

Part 03

●  怎么实施混沌工程 ●

作为混沌工程的基础,肯定要先了解下故障注入,其实业界已经有了相对通用的按照等级划分的故障画像了。

有了故障画像,混沌工程的实施就有了基础,Netflix也给出了混沌工程的实施步骤以及设计原则,经过多年的发展,阿里巴巴、亚马逊等巨头公司都有了自己的混沌工程平台,同时开源了很多故障注入工具,站在巨人的肩膀上,我们再来实施混沌工程就容易了很多。

目前比较受欢迎的开源工具见下表,大部分的工具是在chaos monkey的基础上衍生出来的:

我们研究了部分开源工具,并在项目上进行了实践。不管是在虚拟机环境还是容器环境,这些工具的使用都非常简单,覆盖的故障场景也相对比较全面,从底层服务器级别,到代码的方法级别,常规的故障都可以模拟。当然了,目前支持的故障场景比较简单,很多常用的中间件也暂不支持,留给我们很大的二次开发空间。

这些开源工具存在的通用问题整理如下:

1、功能分散、单薄。每种工具在功能上都有局限性,只具备模拟部分故障的能力;

2、重点都在故障注入,在混沌工程的其他设计原则方面比较欠缺。不能自动化执行,没有可视化管理界面,对实验的爆炸半径控制不够等。

那什么样的才是完整的混沌工程平台呢?除了故障类型的支持,权限管理、资源管理、演练推荐、流程编排等   都是一个成熟的混沌工程平台的必要组成部分,甚至可以提供攻防演练等上层能力。所以说,搭建一个成熟的混沌工程平台不是一件容易的事情。

●  总结 ●

混沌工程发展了这么多年,前人已经在故障画像、故障注入工具、混沌工程平台搭建思路等方面打好了坚实的基础,进而推动混沌工程技术持续进步与完善,随着云原生技术的发展,混沌工程的价值也将更加显现。

 

1作者:胡文 来源:通信界 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 中信科智联亮相2023中国移动全球合作伙伴大会
普通新闻 全球首个基于Data Channel的新通话商用网络呼叫成功拨通
普通新闻 中国联通:以优质通信服务 助力“一带一路”共建繁华
普通新闻 杨杰:未来五年,智算规模复合增长率将超过50%
普通新闻 长沙电信大楼火灾调查报告发布:系未熄灭烟头引燃,20余人被问责
普通新闻 邬贺铨:生态短板掣肘5G潜能发挥,AI有望成“破局之剑”
普通新闻 工信部:加大对民营企业参与移动通信转售等业务和服务创新的支持力
普通新闻 摩尔线程亮相2023中国移动全球合作伙伴大会,全功能GPU加速云电脑体
普通新闻 看齐微软!谷歌表示将保护用户免受人工智能版权诉讼
普通新闻 联想王传东:AI能力已成为推动产业升级和生产力跃迁的利刃
普通新闻 APUS李涛:中国的AI应用 只能生长在中国的大模型之上
普通新闻 外媒:在电池竞赛中,中国如何将世界远远甩在后面
普通新闻 三星电子预计其盈利能力将再次下降
普通新闻 报告称华为5G专利全球第1 苹果排名第12
普通新闻 党中央、国务院批准,工信部职责、机构、编制调整
普通新闻 荣耀Magic Vs2系列正式发布,刷新横向大内折手机轻薄纪录
普通新闻 GSMA首席技术官:全球连接数超15亿,5G推动全行业数字化转型
普通新闻 北京联通完成全球首个F5G-A“单纤百T”现网验证,助力北京迈向万兆
普通新闻 中科曙光亮相2023中国移动全球合作伙伴大会
普通新闻 最高补贴500万元!哈尔滨市制定工业互联网专项资金使用细则
通信视界
邬贺铨:移动通信开启5G-A新周期,云网融合/算
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
普通对话 闻库:算网融合正值挑战与机遇并存的关键阶
普通对话 工信部副部长张云明:我国算力总规模已居世
普通对话 邬贺铨:我国互联网平台企业发展的新一轮机
普通对话 张志成:继续加强海外知识产权保护工作 为助
普通对话 吴春波:华为如何突破美国6次打压的逆境?
通信前瞻
亨通光电实践数字化工厂,“5G+光纤”助力新一
普通对话 亨通光电实践数字化工厂,“5G+光纤”助力新
普通对话 中科院钱德沛:计算与网络基础设施的全面部
普通对话 工信部赵志国:我国算力总规模居全球第二 保
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 我国北方海区运用北斗三号短报文通信服务开
普通对话 华为云Stack智能进化,三大举措赋能政企深度
普通对话 孟晚舟:“三大聚力”迎接数字化、智能化、
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像