OpenAI首席技术官:Sora宣布于年底向公众推出
OpenAI高层表示,其旗下的文生视频模型Sora计划在今年晚些时候正式向公众发布。虽然该模型在今年2月发布的展示片段引起了轰动,但目前只向安全团队、视觉艺术家、设计师和电影制作人开放了使用权限。据悉,Sora生成的视频仍存在不少缺陷,例如无法表现人类手部的精细动作。公司表示使用了公开可用的数据和获得许可的数据来训练模型,但是否包括来自YouTube、Instagram和Facebook的视频并未公布。修复这些问题后,Sora生成的视频会在底部出现水印,并在元数据中标识来源以帮助观众分辨真伪。OpenAI宣布将推出一款名为Sora的工具,可以帮助用户通过文字描述生成自然场景的图像。为了解决人工智能工具可能带来的较大风险,OpenAI决定在推出之前进行广泛测试。据了解,Sora系统采用了与OpenAIChatGPT模型相同的技术,但还会结合视觉信息,使其能够根据用户的描述生成场景的图像。OpenAI表示,Sora将在广告、媒体和设计领域中发挥重要作用,帮助用户更快地生成所需的图像。OpenAI会对Sora进行“红队测试”,即让安全测试人员尝试向其提供提示,以发现漏洞、偏见和其他潜在的有害结果:“实际上,这就是为什么我们现在还没有开放这些系统。我们需要在展开广泛部署之前解决这些问题。”穆拉蒂还表示,Sora的提示词使用规则会与文生图模型Dall-E的规则相近。例如,Sora不能为用户生成包含公众人物的图像,会直接拒绝这类请求。针对裸露问题,公司正在与艺术家展开合作,试图找出“在不妨碍创造力的前提下设置保护栏与限制”的方法。对于Sora与Dall-E的联系,穆拉蒂还谈到,为Sora提供能源的成本“要高得多”。OpenAI试图在向公众发布这个工具时,让其成本能够做到“与DALL-E相近”。而当记者问到Sora对视频制作工作的影响时,穆拉蒂再次强调,Sora的推出过程“缓慢而谨慎”,并表示OpenAI已经让影视行业内的工作人员加入测试:“我们希望电影行业的从事者和全球各地的创作者都能参与其中,并告知我们如何进一步地发展它。”值得注意的是,就在几天前,Sora团队的三位负责人刚公开表示Sora不会在“可预见的未来”发布。他们在3月8日发布的一档Youtube播客节目中表示,Sora仍是一个研究项目,无法在ChatGPT或其他地方提供给用户:“对于应该什么时候把它变成产品,我们目前都没有一个时间表,我们正处于获取反馈的阶段。”