通信界讯 相较于此前的视频生成模型,Sora在底层模型和算法上进行了创新,被业界称为视频生成领域的里程碑。因此,Sora的问世令世人惊呼:现实不存在了!在视频生成领域,公开信息显示,已有海康威视、佳都科技、昆仑万维、大华股份、萤石网络、万兴科技、因赛集团、拓尔思、当虹科技等多家A股上市公司积极布局。
继ChatGPT这一现象级的应用推出一年之后,近日,美国开放人工智能研究中心OpenAI正式发布了旗下首款视频生成模型Sora,再次在全球掀起了人工智能关注浪潮。相较于此前的视频生成模型,Sora在底层模型和算法上进行了创新,被业界称为视频生成领域的里程碑。因此,Sora的问世令世人惊呼:现实不存在了!
从自动生成文字到自动生成图片,再到现如今自动生成视频,人工智能大模型技术在加速迭代。中央财经大学数字经济融合创新发展中心主任陈端在接受《证券日报》记者采访时表示:“人工智能技术的国际竞争,本质上是国家创新力、创新生态以及创新资源体系的全方位竞争。国内人工智能相关企业拥有庞大的市场需求和丰富的数据资源等优势,正紧抓时间窗口,加强国际交流与合作,加快技术创新和商业化步伐,创造更多应用与成果。全球人工智能产业正进入加速发展阶段。”
为什么Sora引发关注潮?
Sora作为文字转视频模型,能够严格根据用户输入的提示词、文本指令或静态图像,生成长达1分钟的视频,保持较高的视觉质量。据OpenAI官网介绍,该公司正在努力教人工智能“理解和模拟处在运动当中的物理世界”。
国海证券2月18日发布研报认为,Sora体现出大模型进化速度的超预期。截至2023年12月份,ChatGPT用户数1.8亿,网站月均访问量17亿次,OpenAI估值超1000亿美元,Sora的发布将打开OpenAI用户量价和估值空间。
据悉,Sora相较于过去几款主流文生视频工具有了极大幅度的提升。华金证券分析师方闻千表示,Sora生成的视频具有超长时长、世界模型、多镜头切换三大特点。具体来看,之前几款主流模型生成的视频时长仅在20秒以内,Sora不仅能够深入理解用户提示,还学会了物理世界的部分规律,比如:一个人吃汉堡后会留下咬痕、火车车窗上会产生逼真的倒影,Sora还可在单个视频中设计出多个镜头。
继文字生成和图像生成技术之后,Sora是视频生成技术方面的突破性进展。短期来看,Sora将直接改变很多内容产业的成本结构以及资源支撑体系。萨摩耶云科技集团首席经济学家郑磊向《证券日报》记者表示:“Sora的诞生将对影视、广告、教育、游戏等多个行业产生直接影响。例如,视频创作者可以专注于更具创意性和战略性的工作,而将繁琐的重复性工作交给人工智能。”
陈端表示:“长期来看,Sora将远远不止是内容生产工具,其构建的基于三维物理世界来创造数字原生世界的强大引擎,将给一些产业从底层工具层面带来变化,形成深远影响。”360集团创始人、董事长周鸿祎2月16日在其微博上表示,Sora意味着AGI(人工通用智能)实现将从10年缩短到1年。
不过,目前的Sora仍存在一定局限性。例如,它可能难以精确模拟复杂场景的物理状况,也可能无法理解一些特定的因果和时间联系等。此外,模型还可能混淆一些文本指令中的空间细节,例如左右方向等。据了解,相关领域专家将对模型展开测试,目前,该模型只向有限数量的创作者提供访问权限。
中国信息协会常务理事、国研新经济研究院创始院长朱克力向《证券日报》记者表示:“要用好Sora,企业首先需深入了解其技术特性和应用场景,其次要积极探索Sora与其他技术的结合,如与虚拟现实、增强现实等技术的融合应用。同时,还应注意数据安全和隐私保护等问题。”
多家上市公司涉足相关领域
2023年,科技大厂、创业企业、科研院所等纷纷入局AI大模型,目前,我国大数据、云计算、人工智能企业创新发展,数字产业化体系逐渐完备,并向全球产业链中高端跃进。政策端,《生成式人工智能服务管理暂行办法》《关于加快推进视听电子产业高质量发展的指导意见》等陆续出台,既促进了人工智能大模型技术的创新发展和生成式人工智能产业健康发展,也进一步规范制度引领技术落地。
今年春节期间,支付宝等平台陆续推出了人工智能全家福照片制作功能,上传家人照片可以生成不同风格背景的全家福照片,生成式人工智能工具在图生图领域的落地应用已经被公众广泛接纳。
在视频生成领域,公开信息显示,已有海康威视、佳都科技、昆仑万维、大华股份、萤石网络、万兴科技、因赛集团、拓尔思、当虹科技等多家A股上市公司积极布局。
例如,佳都科技公布了其自主研发的国产化的大模型技术,聚焦在交通、城市治理、政务服务等垂直领域的应用,公司的TransCore-M多模态大模型能够理解文本、图像、视频等多种模态的信息,并且按照用户需求将其描述、提示或转化为指令代码,是个“聪明”的交通信息小助手。
当虹科技拥有自研的生成式人工智能工具集,于2023年上半年发布了以静态照片生成三维体积视频的方案,支持六自由度视角自由移动,并且通过点云模型转换及压缩算法实现高达800倍的视觉无损压缩,实现不同模态之间相互切换。
我国在人工智能技术和大模型领域已经取得了显著的进展,但与国际领先水平相比,仍存在一些短板。中国电子商务专家服务中心副主任、资深人工智能专家郭涛在接受《证券日报》记者采访时表示:“这些短板包括原创算法的研发、高质量数据集的构建、芯片和硬件的自主研发能力、国际化人才的吸引和培养等方面。”
中国移动通信联合会区块链与数据要素专业委员会主任委员、首席数字经济学家陈晓华表示,近年来,我国相关政策对人工智能技术应用和大模型的技术研发和产业创新提供了良好环境,但由于前期投入不足,在基础研究和核心算法的原始创新上还有差距。
陈晓华说:“人工智能革命将会推动算力基础设施的需求猛增,此外文生视频大模型将带动视频数据的调用规模持续放大,这对宽带质量也提出了更高的要求。”
商务部研究院电子商务研究所副研究员洪勇向《证券日报》记者表示:“国际上,部分大型科技公司凭借雄厚的技术积累和资源在人工智能赛道占据领先地位。中国企业在某些细分领域已具备国际竞争力,但仍有短板。当下需要清醒意识到差距,加强基础科研、培养高层次人才、建立合规体系,并积极参与国际合作与竞争,进一步提升在全球人工智能领域的地位。”