(1. 电信科学技术研究院,北京 100191;2.中国信息通信研究院云计算与大数据研究所,北京 100191)
0 引言
随着全球数字化经济的蓬勃发展,越来越多的国家不断加快算力基础设施建设的步伐,众多产业需要算力进行赋能增效,算力正逐渐成为数字经济发展的核心生产力,并代表着一个国家的科技水平。与此同时,为了助力数字经济的高质量发展,传统云服务加速朝着算力服务升级,从应用场景、供给内容以及交付手段等多个方面进行全面升级。目前,算力服务已渗透数字政府、智能制造、航空航天、金融科技以及智慧医疗等众多行业,并在其中发挥着重要的作用。《“十四五”数字经济发展规划》明确指出,要加速建设数字经济安全体系,完善网络安全功能以及保障数据安全。算力服务作为数字经济发展的重要基石,掌握众多发展中的资源和数据,此时具有针对性的安全研究显得尤为重要。
1 背景与安全形势分析
近年来,国家接连发布众多法律法规,以保障互联网行业的安全。其中,《中华人民共和国网络安全法》作为我国核心网络安全法律法规,主旨在于完善我国网络安全战略,加强网络空间安全建设;《中华人民共和国数据安全法》指出要加强对数据的监管力度,并创建数据分类分级保护制度,并明确数据安全相关法律责任;《中华人民共和国个人信息保护法》规范了个人信息处理活动,明确了敏感个人信息的认定和保护规则;《关键信息基础设施安全保护条例》要求构建新型关键信息基础设施网络安全工作体系。由此可见,我国的网络安全政策体系正在不断健全,相关制度也在日益完善。
算力服务作为数字时代新型服务方式,发展过程应当积极响应国家安全建设的号召,遵循相关安全规定,加速构建一套完善的服务安全体系。
“东数西算”工程的正式启动,进一步推动了我国算力基础建设的发展,也预示着算力服务的发展即将迎来高潮。而算力服务旨在将安全普惠的算力带给各行各业,其发展离不开算与网的深度融合,因此算力网络的建设便成了关键一环。
当前,算力网络架构主要包括基础设施、编排管理以及运营服务三大模块,支持依据任务需求实现云、网、边、端算力资源的灵活分配和调度,但随着算网融合工作的持续推进,当中存在的一些安全风险也逐渐凸显,主要体现在以下几个方面。
图1 算力网络安全体系架构
(1)攻击暴露面增加:算力网络具有算力泛在、灵活接入等特点,频繁的资源链接将会导致资源的攻击暴露面增加。与此同时,网络攻击手段也在不断迭代升级,这些都使得资源受到攻击的概率大幅提升。
(2)数据隐私泄露:算力时代,数据作为商品传输,算力网络中流通着海量数据,其中涉及医疗、金融、政务以及个人信息等众多机密隐私数据,若在传输过程中遭受篡改或泄露将造成难以估量的严重后果。
(3)存证溯源困难:算力服务是端到端服务,用户群体庞大,分布式资源节点数量较多,数据信息管理起来较为繁杂,这导致存证溯源的复杂度提升,出现安全问题时难以快速定位安全威胁源。
(4)管控复杂度提升:相较于传统网络架构,算网新型架构新增网元如算网感知单元和算网控制单元等,这些网元的引入将导致算网全网安全的管理复杂度提升,安全风险也随之增加。
为解决上述所面临的安全挑战,需要不断增强算网安全能力,构建一套完善的算力网络内生安全体系。目前,市场中普遍认可的算力网络架构由基础设施、编排管理以及运营服务组成[1],本文将从这三个部分出发,依次阐述对应层级的内容和相应的安全建设策略,之后针对贯穿各个部分的数据安全建设进一步解释说明(见图1)。
2.1 基础设施
2.1.1 基本内容
算网基础设施为算网融合提供计算、网络以及存储等资源的物理承载,并实现了基本的网络传输、异构计算以及数据分析能力,是算网融合的关键底座。
计算基础设施和网络基础设施是算网基础设施的主要组成部分,前者是算力承载体,包含云计算数据中心、人工智能计算中心以及高性能计算中心等可用计算资源。后者负责联通网络,继而进行数据和计算任务的传输调度,主要包括全IP网和全光网[2]。
2.1.2 安全建设
基础设施安全分为计算资源安全和网络资源安全两部分。
(1)计算资源安全从硬件架构入手,强化硬件设备自身安全。虚拟化技术打破了物理硬件设备操作系统的壁垒,提高了硬件资源利用率,但同时也给系统安全带来众多挑战,因此需要加强对虚拟化和操作系统的安全防护,减少恶意程序的攻击。云原生是以容器、微服务以及DevOps等技术为基础构建的产品体系,是算力服务重要的基础组成。云原生安全则是充分利用平台原生安全资源,围绕云原生应用的生命周期进行构建的防护体系,具体可通过在云原生开发初期加强安全投资,保障供应链安全和镜像安全,在容器编排管理过程中从操作系统内核到运行时操作实施全方面防护,并对业务应用进行持续的监控、分析和响应。
(2)网络资源安全建设涉及内容较多,主要包括SRv6安全、访问控制以及入侵防范等。SRv6结合IPv6和源路由技术,可提供端到端的服务连接,并实现网络可编程[3],但同时也存在被窃听或报文在传输过程中被篡改等问题,常见的防护手段有配置访问控制列表(Access Control List,ACL)规则或使用哈希运算消息认证码(Hash-based Message Authentication Code,HMAC)校验安全方案。身份认证和访问控制是安全工作的首道防线,对于接入算力网络的终端设备和用户均需进行身份认证,零信任是解决该需求的最佳途径,其核心理念是不信任任何人或事物,每次访问都需进行身份认证授权,并遵循“最小权限原则”,其访问权限由访问主体身份和请求资源的可观测状态上下文的动态策略决定[4]。
2.2 编排管理
2.2.1 基本内容
编排管理是算力网络的核心中枢,下接复杂的算网环境,上承多样的算力需求,主要包含算网感知、协同编排以及灵活调度等关键功能,构建一体化编排的算网大脑。
目前,AI和大数据等新兴技术正与算网大脑深度融合,并加速探索算网自智、数字孪生以及意图网络等发展新方向,不断提升自动化和智能化能力,为灵活多变的业务需求寻求更多可能性。
2.2.2 安全建设
编排管理的安全建设可从安全感知、安全编排、安全调度以及安全管控四个方面考虑。
(1)安全感知:算网感知过程中需对算网身份进行统一标识,这样一旦出现异常,可在第一时间溯源并进行拦截制止。与此同时,算网大脑也应当实现对资源安全的持续监控,对异常行为如资源恶意消耗或网络拓扑泄露等要及时预警,并通过各种智能化、自动化手段进行修复。
(2)安全编排:相较于传统网络编排,算力网络中编排管理涉及的数据量大且结构复杂,包括用户信息、任务数据、算力资源分布信息等关键数据,需时刻对其进行监控和防护,保障数据的安全。另外,针对编排管理时的行为也要进行严格监控和授权,防止非法用户越权调度算力网络资源[5]。
(3)安全调度:算力网络的核心功能是算力调度,为实现安全调度,可通过制定相关标准规范,对用户信息、算力任务以及算力资源进行安全等级划分,根据任务需求将任务调度到具有相应安全等级的资源节点处。在具体调度过程中,需要根据实际情况对用户信息和任务数据进行加密传输,采用动态监测和节点验证等手段保障安全。
(4)安全管控:安全管控负责对业务行为的安全监测,满足算力服务的可管理安全需求,对算力网络全局中出现的算力滥用、异常冲突、安全攻击以及隐私泄露等安全问题及时处理解决。为加强算力网络的安全防御能力,安全管控需要从被动防御转变为自主检测和主动防御。
2.3 运营服务
2.3.1 基本内容
算力网络的运营服务直接面向用户和应用,旨在以服务的形式将资源供用户使用,其内容包含算力交易、算力封装、算力市场以及可视化平台等。
2.3.2 安全建设
运营服务的安全建设可分为安全交易、安全审计、安全应用以及安全监控四大模块。
(1)安全交易:算力交易平台可分为中心式交易平台和分布式交易平台,前者依托第三方中心交易平台,所有信息展示和交易流程都交于平台处理,此时安全策略由平台制定;后者以区块链技术为主,在链节点上进行信息展示和交易流程,且所有链节点同步节点信息,此时需要多方协作,实现分布式算力安全统一运营[6]。
(2)安全审计:安全审计主要是对算力交易流程进行识别、记录、归档整理以及分析,对于重要记录需进行备份,确保出现问题时有据可查。
(3)安全应用:算力网络服务的场景多样,其中包括自动驾驶、远程医疗以及数字化政府等安全需求较高的应用场景,为避免出现此类场景出现安全问题,可将安全能力进行原子化处理,针对不同场景配置相应安全措施,实现精细化安全防范,以满足不同应用的安全需求。
(4)安全监控:安全监控是对算力交易进行实时监控,覆盖从用户开通算力资源到资源释放整个流程,对安全故障及时预警,保障交易中数据和信息的安全。
2.4 数据安全
数据安全贯穿算力网络安全体系,是算力网络对外服务和运营的基础,相关安全防护措施可从数据全生命周期展开,其中涉及数据加密、数据脱敏、数据备份、隐私计算、安全存储以及数据溯源等众多技术环节。
在数据生成采集阶段,可利用数据标记技术实现对数据出网和数据流转等行为进行管控,出现安全威胁时可及时溯源定位;在数据传输阶段,需根据实际业务需求部署相应安全策略如加密传输和数据脱敏等;在数据存储阶段,应当实现分类分级并遵循相关规范的安全存储;在数据计算阶段,基于隐私计算技术,保障数据的可用不可见,实现数据价值的转化和释放;在数据销毁阶段,依据规范合理清除数据。
3 发展方向和建议
3.1 促进算力网络与SASE技术融合
2019年8月,Gartner首次提出了安全访问服务边缘(Secure Access Service Edge,SASE)的概念,并将其定义为一种基于实体的身份、实时上下文、企业安全/合规策略以及在整个会话中持续评估风险/信任的服务。
SASE是将网络与安全功能融于一体的服务模型[7],通过身份进行驱动,支持边缘侧接入,基于云原生架构提供全面、敏捷、弹性且能实现统一交付的网络安全服务。SASE框架中包含SD-WAN(Software Defined Wide Area Network)、ZTNA(Zero-Trust Network Access)、FWaaS(Firewall as a Service)以及云访问安全代理(Cloud Access Security Broker,CASB)等众多网络安全技术,具备身份驱动、统一管控、分布式连接以及边缘接入等特点,其核心理念零信任与算力网络的安全建设目标十分契合。目前,针对SASE与算力网络的融合,已开展了相关标准的制定工作,如《安全访问服务边缘(SASE)的功能编排管理系统框架》。此外,部分学者通过分析安全表达与路由、算力节点可信管理、安全资源自动编排调度等算力网络安全应用需求,提出了一种基于SASE的安全任务智能协同编排调度方案,实现了算力任务与安全资源的协同编排调度[8]。
由此可见,SASE技术为算力网络的安全建设带来了新的可能性。未来,算力网络可以继续深入与SASE框架的融合,为用户提供优质的安全服务。
3.2 提升安全自智能力
如今算力服务快速发展,具体应用的场景越来越多,但潜在的安全问题也随之增加,传统的静态式被动防御能力已然不能满足多样的安全需求。此时,算力网络可结合智能化和自动化相关技术发展,构建“自主监测、智能感知、主动防御”为一体的自适应和自学习内生安全体系。
智能化的安全管理可以协助算网大脑精准分析庞大且分散的信息数据,并对算网全网资源利用情况进行实时动态监控和态势感知,针对算力交易流程中出现的安全威胁可以快速感知并进行抵御,在持续学习安全故障形成模式后可实现提前预测威胁的能力,大大提高了系统架构的安全系数。
智能化和自动化技术给算网安全建设带来了便利,如何更好地在算力网络中引进相关技术是下一步研究的重点,争取尽早迎来算网自智的时代。
3.3 完善安全标准规范
成熟完备的标准规范是算网架构长治久安的基础,为了推动算网融合稳步发展,需尽快加速相关标准的制定,形成算力网络架构中自下而上的全流程安全规范体系。
算网安全规范的编写内容应包括安全策略、安全准则、管理规定、工作准则和执行指引等一系列内容,以实现由宏观策略到中观管控、再到微观执行的一致性[9]。目前,已有部分安全标准正在制定过程中,其中包括算力基础设施安全和算力交易安全等。但值得思考的是,市场上部分关键的算力标准还尚未统一,其中主要包括底层算力资源度量的标准化统一和上层应用对底层算力资源需求的标准化统一[10]。这对安全体系的建设或多或少也存在着一定的影响,应当加快推进相关标准的研究进度。
4 结束语
数字时代快速发展,算力服务即将迎来高潮,此时具有针对性的安全研究和建设工作刻不容缓。本文首先分析了算力网络的发展背景和当中凸显的安全问题如暴露面增加、数据隐私危机以及溯源复杂等,然后针对算力网络架构中的三大模块进行了介绍,并给出了相应的安全建设方案,再对贯穿始终的数据安全建设加以阐述,旨在协助构建完备的算力网络内生安全体系。最后,从技术融合、自智发展以及标准制定的三个角度提出对算力网络安全未来建设方向的建议。