CNTXJ.NET | 通信界-中国通信门户 | 通信圈 | 通信家 | 下载吧 | 说吧 | 人物 | 前瞻 | 智慧(区块链 | AI
 国际新闻 | 国内新闻 | 运营动态 | 市场动态 | 信息安全 | 通信电源 | 网络融合 | 通信测试 | 通信终端 | 通信政策
 专网通信 | 交换技术 | 视频通信 | 接入技术 | 无线通信 | 通信线缆 | 互联网络 | 数据通信 | 通信视界 | 通信前沿
 智能电网 | 虚拟现实 | 人工智能 | 自动化 | 光通信 | IT | 6G | 烽火 | FTTH | IPTV | NGN | 知本院 | 通信会展
您现在的位置: 通信界 >> 交换技术 >> 技术正文
 
面向6G网业融合的三维重建技术研究
[ 通信界 | 李可 李雅茹 王凯悦 滕瑞 崔春风 | www.cntxj.net | 2023/12/21 23:21:45 ]
 

李可 李雅茹 王凯悦 滕瑞 崔春风

(中国移动通信有限公司研究院,北京 100032)

0 引言
2023 年6 月,国际电信联盟完成了《IMT 面向2030及未来发展的框架和总体目标建议书》(简称《建议书》)[1],这将有助于形成6G 的全球统一标准。6G 的典型应用场景包括沉浸式通信、人工智能与通信融合、感知与通信融合等六大应用场景。这些应用场景展示了2030 年数字化时代到来后,数字世界与物理世界深度交互融合的美好愿景,而6G 网络将成为实现多样化业务应用场景的中流砥柱。然而,要实现上述美好愿景,不能将以边缘计算、毫米波为代表的通信技术和以渲染、三维重建(Three-Dimensional Reconstruction,3D Reconstruction)为代表的业务技术简单地拼接在一起。相反,必须以网业融合的思路(即打破不同技术领域的边界),通过端到端系统的重构和优化以促进具有不同技术特征和发展路径的多类信息技术相互渗透和协同,最终实现网络和业务的深度融合与创新。

目前,业内对于6G 业务的研究仍聚焦于业务和网络技术的分别迭代,未能深入探讨网业融合的发展逻辑。因此,本文以云端三维重建为6G 典型应用案例,从关键技术的研究进展出发,着重分析其对6G 网络的需求、影响和涉及的关键技术标准化现状,最后分析在云端三维重建系统原型搭建方面的探索并提出下一步研究方向。

1 三维重建赋能6G 愿景
面向元宇宙、Web3 等6G 多样化的业务场景和接入设备形态,中国移动通信有限公司研究院提出“数字孪生、智慧泛在”的需求愿景[2],在产业界形成广泛共识。为了实现6G 愿景,业界正在努力推进6G 各项研发工作。

为实现6G 愿景,目前学术界和产业界正围绕6G关键技术进行重点布局和攻关。与此同时,要想让6G网络赋能千行百业,助力各行业深化数字化转型,还需要深化与其它行业及技术领域的融合协作发展。以数字孪生愿景为例,要实现万事万物的数字化,需要三维重建技术的支撑。传统三维重建技术的采集、计算等全部功能处理流程均在本地进行,带来了成本高及移动性差等问题,造成业务始终无法大规模普及;而简单地将全部处理流程上云后,又会导致上行传输压力过大。只有将网络和业务技术统筹考虑、融合设计,才能更有效地发挥6G 网络在传输及算力方面的优势,让6G 真正成为沟通物理世界与数字世界的桥梁,最终实现网络无所不达、智能无所不及。

2 三维重建重点发展方向与面临的挑战
2.1 三维重建及应用场景
三维重建是指利用二维投影或影像恢复物体三维讯息(如形状等)的数学过程和计算机技术,即通过图像数据还原出三维物体。三维重建可以通过主动或被动的方法来完成[3]。常见的三维重建方法有运动恢复结构、多视图立体视觉(Multi-View Stereo,MVS)、同时定位与地图构建、深度学习技术等。运动恢复结构指从包含视觉运动信息的多幅二维图像序列中估计三维结构;MVS 指运用立体对应关系在多张照片上得到三维几何结构;同时定位与地图构建指通过相机实时跟踪自己的位姿并重建周围三维环境;深度学习技术[4-6]指使用深度学习网络对图像数据进行解析,提取特征点,然后进行三维重建。

三维重建是实现数字化世界的重要手段,在3D通话、扩展现实(Extended Reality,XR)交互、城市规划、自动驾驶、遗产保护等领域有着广泛应用。3D 通话是一种利用视觉、听觉和其它感测技术,在远程双方用户之间模拟出三维效果的实时视频通话。谷歌公司的Starline 系统[7]通过多个高分辨率传感器的数据采集、视频和深度流的压缩传输、数据融合、光场显示等技术,实时重建人物,使两个人在不需要佩戴特殊的眼镜、麦克风及耳机的情况下,体验面对面交流。在实时增强现实(Augmented Reality,AR)交互应用中,三维重建是非常重要的感知任务,国内外有大量企业和科研机构在三维重建领域进行研究。美国高通公司利用自监督神经网络进行单眼深度估计,在AR 眼镜上实时生成显示视角环境的3D 影像,实现了数字世界和物理世界的无缝对接。商汤科技公司和高校共同研发的Mobile3DRecon 系统,可以生动显示虚实物体间的遮挡和碰撞效果[8]。为了增强用户在虚拟世界中的真实感受,元宇宙场景中的人、物及环境都可以通过三维重建技术采集并生成。用户生成内容将打造元宇宙的核心生态,未来几乎每个人都能使用三维重建技术进行内容创造。

2.2 三维重建应用面临的挑战
沉浸式通信包含XR、全息等沉浸式多媒体、多感官交互以及数字孪生等场景,这些场景均离不开三维重建技术的运用。目前三维重建技术在专业化领域的应用,需要图形处理器等算力设备的支撑,效果好但成本高;而大多数移动端应用软件虽具有一定的易用性,但重建效果差强人意。上述现状导致三维重建技术始终无法大规模普及。

面对移动性和算力需求的双重挑战,将三维重建云化是一种高效的解决方案。通过集中云端算力调度和执行三维重建,不仅能够提高模型精度,而且还能维持终端轻便化,但在应用过程中,也会带来以下诸多挑战。在业务技术方面,终端需要针对不同应用场景搭建采集系统并采集高精度数据,同时云端需要使用具有高鲁棒性的重建算法。在业务功能设计方面,云化后的三维重建功能流程需要在端云两侧合理分配,同时引导数据传输以对网络友好的方式高效实现。在应用层传输方面,虽然目前已有多种应用层协议支持对音视频流进行实时传输,但尚未完全满足云端三维重建传输需求,尤其是对深度图、点云、网格等三维数据的有效支持不足。因此,需要对已有的应用层传输协议进行三维重建场景下的调整与适配。在无线网络传输方面,移动终端需要通过无线上行链路将采集的大量点云、视频等数据传输到云端进行建模和渲染。然而,上行资源匮乏以及不完善的调度机制会导致传输延迟和资源浪费。为此,需要进一步优化无线网络的容量增强和服务质量(Quality of Service,QoS)配置等功能。

3 云端三维重建潜在技术方案分析
3.1 业务模块化设计
针对云端三维重建系统在端云两侧可灵活调整的需求,需要对关键功能进行模块化设计与解耦。基于传统的三维重建框架流程,设计解耦合的、独立的模块来实现数据采集、数据传输、三维重建、数据显示等功能。其中最为重要的三维重建模块可进一步划分为系统标定、数据预处理、位姿估计、多视角数据融合、曲面重建、纹理映射等子模块。每个模块均进行模块化的接口设计,既通过明确输入输出接口来进行模块间的交互,又便于后期探索并进行重新设计时替换相应模块。

3.2 网络传输设计
考虑到云端三维重建类业务是典型的沉浸式通信业务,上行传输的音视频、相机参数、点云、深度信息等不同类型的多流数据,可以通过流媒体协议及6G 无线网络进行传输,以实现实时互动、远程协作及多种场景下的数据交互等。目前,在网络应用层和传输层,对于三维重建类业务可以考虑以下主流传输协议。

网页视频语音实时通讯技术(Web Real-Time Communications,WebRTC)通过不同终端建立点对点的连接,不借助中间媒介,实现数据实时传输[9]。WebRTC 包括音视频采集、网络传输等诸多功能,可以为实时三维重建多流数据提供全流程的多项功能与技术支持。用户在无需安装第三方软件或者任何插件的情况下,通过创建点对点的数据分享,实现3D 通话的三维重建场景。在时延方面,基于超文本传输协议的动态自适应流可能产生几秒至几十秒左右的传输时延,而基于用户数据报协议(User Datagram Protocol,UDP)的WebRTC 协议可将时延降低至秒级甚至毫秒级,使得实时AR 应用场景下的三维模型的低时延交互成为可能。

快速UDP 网络连接(Quick UDP Internet Connections,QUIC)是一种基于UDP 的新型传输层协议,可以避免传输控制协议(Transmission Control Protocol,TCP)的慢启动问题,通过零往返时延快速启动提高网络连接的速度。QUIC 通过内置加密技术传输用户交互数据和三维数据,具有更高的安全性和可靠性,支持在单个链接的多路复用技术,实现并行发送多个音视频、深度数据、点云模型等数据流,从而降低多流数据的并发时延并提高网络带宽利用率。QUIC 还具有拥塞控制和流量控制等机制,以应对传输高精度模型或者传感器采集的大量数据导致的网络拥塞,并保证网络传输的稳定性。

云端三维重建类业务需要对多流数据进行上行调度,涉及到无线网络中的容量增强以及QoS 分级传输等功能。在无线链路层,为了解决数据上行传输存在的时延和资源浪费问题,可以考虑以下四个方面的增强。

缓存状态报告(Buffer Status Report,BSR)增强可以优化无线链路上行资源的配置,在提升容量方面具有重要意义。现有协议标准定义了BSR 大小范围,针对云端三维重建类业务上行资源的调度传输,会产生较大的平均量化误差。根据采集数据的大小与时延要求在媒体接入控制协议中定义新的基于传输内容特征的缓存状态表,可以有效降低资源配置的平均量化误差,提高业务数据在传输时对无线资源的利用率。

分组数据汇聚协议(Packet Data Convergence Protocol,PDCP)层的丢弃控制增强可以保障重要数据的传输,对特定协议数据单元(Protocol Data Unit,PDU)进行丢弃操作。在云端三维重建类业务的数据传输过程中,当基站检测到网络出现拥塞时,终端可以启动基于PDU 集重要性(PDU Set Importance,PSI)的PDCP 丢弃操作,优先保障重要点云或者视频帧(如视频首帧、轮廓点云等)数据的传输,从而保障重建的实时性与重建效果,提升用户体验。

配置授权(Configured Grant,CG)功能主要用于上行传输,基站预先配置物理上行共享信道(Physical Uplink Shared Channel,PUSCH)资源,终端直接在CG资源上发送上行数据。云端三维重建类业务的上行流量涉及大视频帧的传输,可以引入上行CG 增强功能,在同一个CG 场合创建多个PUSCH。通过调整多PUSCH 配置授权的资源来适应业务流量的可变性,以最小的控制开销,提高云端三维重建类业务的容量并节省终端电力[10]。

在QoS 分级方面,除了用于移动宽带的默认QoS流之外,网络还可以针对云端三维重建类业务特定的数据流提供优化处理。在点云数据传输方面,连续的点云数据可以分为图集数据、几何数据、属性数据以及占用数据,其中最重要的图集数据用于实现2D 到3D的逆投影,次重要的几何数据表示投影点与虚拟相机的距离。针对其重要性的不同进行QoS 分类保障,在网络资源受限情况下优先保障重要性级别高的数据传输。在不同类型数据的传输方面,为了解决云端数据接收的乱序问题,定义每个模块处理的不同数据的需求时延,通过QoS 分流及差异化保障,有序调度传输数据,降低三维重建的端到端时延。

3.3 原型系统验证
基于现有的三维重建软硬件方案,本文选择了主流的MVS 方案与RGB-D 相机作为采集设备,实现了静态物体云端三维重建原型系统(见图2)。图2 左侧为实验环境下的图像采集环境,采集数据通过本地主机可以在无线网络(Wi-Fi)或有线网络下上传到云端服务器进行重建。为了实现高效数据传输,基于云管端架构和业务模块化设计,本文测试了两种系统架构:将全部三维重建功能放在云端;将三维重建部分数据预处理功能放在终端,而其余功能放在云端(见图3)。预处理可以通过时域和空域的平滑减少上行数据量。例如,将连续5 张深度图平滑成1 张更精确的深度图,或者对深度图像进行去畸变、边缘检测、阈值截取、去噪声等操作。针对三维重建原始数据量较大的关键问题,对于三维重建中涉及的RGB 图像、深度图像、点云三种主要数据类型设计了有损和无损的压缩方法。通过本文测试,可以发现原型系统实现了8 台深度相机设备在不同重建场景下,基于6 种不同RGB 图像分辨率及4 种深度相机分辨率进行数据采集,总体原始数据总量最大可达300 MB;有损压缩方面最高均可实现20:1 左右的压缩比,无损压缩方面最高可以分别实现4:1、10:1、6.7:1 左右的压缩比。在不显著影响三维重建效果的前提下,总体数据传输总量需求可从300 MB降低至20 MB 左右,为不同网络带宽情况下的数据传输提供了解决方案。

未来,用户使用移动终端多视角拍摄任意物体后,通过6G 网络将三维数据上传到云端即可重建并得到该物体的三维模型,从而有利于该业务大范围普及。

4 结束语
未来,6G 网络将会涵盖更多领域,开拓数字孪生、智能交互等全新的应用场景,推动整个社会向智慧化发展,并带来深刻的社会形态变革。为了实现这一目标,不仅需要在业务和通信原有技术路径上加大基础理论和关键技术研究,还需要注重跨界融合技术的创新,推动以云端三维重建为代表的业务和网络向融合方向发展。

从推动云端三维重建业务在6G 时代落地来看,建议后续重点布局以下几个方向:一是需考虑对音视频、三维数据等多流数据进行扩展,并支持实时互动要求下的数据高效传输与可靠性保障;二是需要全系列协议栈的联合支撑,如应用层协议和无线通信链路层协议之间的协同传输与性能优化,以共同保障6G 新业务在网络中的传输需求;三是需要针对云端三维重建类业务在无线侧的多流传输、实时上行调度等方面进行深入研究,推动6G 无线网络的标准化进展。

网业融合是一个长期的演进过程,需要在早期就集合产、学、研、用各方力量,共同探索,并加快关键技术的合作与研发。面向商业实际需求与产业化问题,做好系统性理论研究和技术方案设计,并在技术验证及业务示范中不断迭代,可望形成产业化的实施方案,尽早培育6G 产业和应用生态。为此,需要不断加强跨领域的沟通与合作,推动经验和资源共享,提高技术互动和包容精神,以便更好地促进6G 网络与业务的融合发展。

 

1作者:李可 李雅茹 王凯悦 滕瑞 崔春风 来源:信息通信技术与政策 编辑:顾北

 

声明:①凡本网注明“来源:通信界”的内容,版权均属于通信界,未经允许禁止转载、摘编,违者必究。经授权可转载,须保持转载文章、图像、音视频的完整性,并完整标注作者信息并注明“来源:通信界”。②凡本网注明“来源:XXX(非通信界)”的内容,均转载自其它媒体,转载目的在于传递更多行业信息,仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。③如因内容涉及版权和其它问题,请自发布之日起30日内与本网联系,我们将在第一时间删除内容。 
热点动态
普通新闻 发展新质生产力 运营商突破口何在?
普通新闻 浙江移动在杭州率先完成“水陆空”全场景5G-A通感一体验证,助力发
普通新闻 TD产业联盟发布《全球5G/6G产业发展报告(2023-2024)》
普通新闻 诺基亚与中国电信携手展示5G TSN技术助力智慧制造应用
普通新闻 网端业协同,中国移动将于2026年底实现5G-A全量商用
普通新闻 工信部:今年将开展“人工智能+”行动
普通新闻 工信部等四部门发文,低空经济“万亿赛道”再迎政策利好
普通新闻 首发百城势恢宏,中国移动5G-A商用部署划重点
普通新闻 美光捐助西安 "助爱小餐 "公益项目,为残疾人创造就业机会
普通新闻 何飚出任中国移动总经理、党组副书记
普通新闻 共创智慧家庭新篇章|宇视受邀参加中国联通重点产品培训
普通新闻 中国电信计划2024年资本开支960亿元 云和算力约占180亿元
普通新闻 中国电信完成全球首个全频段、全制式、全场景5G RedCap商用验证 启
普通新闻 我国家电行业发展开始进入新阶段 亟需加快数智化转型
普通新闻 通信界观察:何小鹏收复失地,小鹏汽车走出沼泽
普通新闻 美国企业对特定光纤连接器、适配器、跨接电缆、跳线以及下游产品及
普通新闻 50G PON已日趋成熟 预计2024年将走向商用
普通新闻 360AI浏览器APP即将上线,支持500万字长文本处理
普通新闻 美媒:美司法部起诉苹果避重就轻,为何不直指应用商店问题
普通新闻 人工智能如何为新质生产力注入新动力
通信视界
高通CEO安蒙:生成式AI走向终端,将带来最大智
普通对话 高通CEO安蒙:生成式AI走向终端,将带来最大
普通对话 李彦宏:不断地重复开发基础大模型是对社会
普通对话 中兴通讯徐子阳:强基慧智,共建数智热带雨
普通对话 邬贺铨:移动通信开启5G-A新周期,云网融合
普通对话 华为轮值董事长胡厚崑:我们正努力将5G-A带
普通对话 高通中国区董事长孟樸:5G与AI结合,助力提
普通对话 雷军发布小米年度演讲:坚持做高端,拥抱大
普通对话 闻库:算网融合正值挑战与机遇并存的关键阶
普通对话 工信部副部长张云明:我国算力总规模已居世
普通对话 邬贺铨:我国互联网平台企业发展的新一轮机
通信前瞻
亨通光电实践数字化工厂,“5G+光纤”助力新一
普通对话 亨通光电实践数字化工厂,“5G+光纤”助力新
普通对话 中科院钱德沛:计算与网络基础设施的全面部
普通对话 工信部赵志国:我国算力总规模居全球第二 保
普通对话 邬贺铨院士解读ChatGPT等数字技术热点
普通对话 我国北方海区运用北斗三号短报文通信服务开
普通对话 华为云Stack智能进化,三大举措赋能政企深度
普通对话 孟晚舟:“三大聚力”迎接数字化、智能化、
普通对话 物联网设备在智能工作场所技术中的作用
普通对话 软银研发出以无人机探测灾害被埋者手机信号
普通对话 AI材料可自我学习并形成“肌肉记忆”
普通对话 北斗三号卫星低能离子能谱仪载荷研制成功
普通对话 为什么Wi-Fi6将成为未来物联网的关键?
普通对话 马斯克出现在推特总部 收购应该没有悬念了
普通对话 台积电澄清:未强迫员工休假或有任何无薪假
普通对话 新一代载人运载火箭发动机研制获重大突破
推荐阅读
Copyright @ Cntxj.Net All Right Reserved 通信界 版权所有
未经书面许可,禁止转载、摘编、复制、镜像