OpenAI推出了一个新工具Sora,可以生成人工智能视频基于用户文本。
目前,安全专家和有限的创作者正在进行测试。
但是第一个——无可否认是精挑细选的——结果看起来非常逼真。
人工智能创造的图像将变得更加真实。
周四,OpenAI展示了一款名为Sora的新工具,它可以根据用户的提示生成非常逼真的视频。
该公司宣布,由苍井空制作的视频最长可达一分钟,可以由“具有多个角色、特定类型的动作和准确细节的复杂场景”组成。
根据OpenAI的说法,除了文本,Sora还可以从静止图像中生成视频,并“扩展”现有视频,包括“填补缺失帧”的能力。
该公司表示,该产品最初面向红队(与OpenAI合作提高产品安全性的错误信息、仇恨和偏见等领域的专家),以及“一些视觉艺术家、设计师和电影制作人,以获得反馈”。
(youtube明星比斯特先生似乎开玩笑说,他对这项技术感到担忧,并问他是否会丢掉工作。)
OpenAI分享了几个令人印象深刻的苍井空能力的例子,包括一个女人在东京街灯的霓虹灯下行走的视频,毛茸茸的猛犸象在雪地里奔跑的视频,阿马尔菲海岸一座教堂的鸟瞰图,以及一个卡通怪物好奇地跪在融化的蜡烛前的视频。
尽管如此,该公司也承认这个新生工具的弱点,包括在“模拟复杂场景的物理”时的缺陷,以及不理解“因果关系”——比如,一块饼干在有人咬了一口后看起来是完整的。
OpenAI表示,该模型还将左右混合在一起,并努力描述随着时间的推移发生的事件。
在广泛推广之前,OpenAI还表示,它正在通过构建工具来检测Sora生成的视频,并拒绝要求暴力、性、仇恨图像、名人肖像和第三方拥有的IP的提示,从而深入研究安全性。
该公司表示:“我们将与世界各地的政策制定者、教育工作者和艺术家接触,了解他们的担忧,并确定这项新技术的积极用例。”