这是OpenAI首次进军人工智能视频生成领域。据公司介绍,Sora使用Transformer架构,可根据文本指令创建近似现实且富有想象力的场景,生成多种风格、不同画幅、最长为一分钟的高清视频。该模型还能够根据静态图像生成视频,或对现有视频进行扩展或填充缺失的帧。
一些分析人士认为,Sora再次凸显人工智能技术进步对现实生活和传统行业的深远影响。人工智能在视频生成领域的巨大发展前景在为塑造影视产业新业态打开大门的同时,恐将颠覆现存影视电影(电影行业分析报告)产业。好莱坞去年遭遇了63年来首次编剧和演员全行业罢工,因为该行业的部分工作机会可能被人工智能取代。Sora横空出世让这一威胁变得更迫近和真切。其面世第二天,主营图像处理、视频制作软件的奥多比公司(Adobe)股价应声下跌超过7%。
虽不是第一家涉足文本转视频领域的公司,但Sora的推出使OpenAI在这一赛道取得领先,巩固了其在生成式人工智能领域的领军地位。在这个领域没有一家公司比OpenAI更雄心勃勃,且这种雄心似乎有增无减。
OpenAI称,Sora对语言有着深刻的理解,不仅了解用户文本提示,还了解所述事物在物理世界中的存在方式。我们正在教授人工智能理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要与现实世界交互的问题。