突破视频时长、机位限制，openAI发布首个文字生成视频工具sora引业内讨论

来源：紫牛新闻

2024-02-18 11:54

2月17日，人工智能公司openAI发布的首款文生视频大模型sora以黑马之姿迅速引发行业关注，同时引发了视频、影视、营销从业者的积极讨论。

据介绍，该模型具有深度模拟真实物理世界的功能，用户在输入一段自然语言文本后即可生成一段视频内容，相较于目前已存在的一些具有文本生成视频功能的应用，sora不仅是模拟真实世界物理特性和互动特性上有了显著突破，而且突破了大部分文生视频AI工具仅能够生成几秒钟视频的限制，sora已可以生成保持有较高质量的一分钟视频。sora可以创建包含多人、特定运动类型和详细背景的复杂场景。它能生成准确反映用户提示的视频。sora给出了几个范例视频和对应的生成文本，包括了咖啡杯中乘风破浪的海盗船、行走街头的时尚女性、雪地中前行的长毛象，甚至还有太空人冒险的电影预告片，这些视频既有基于现实世界的，也有脑洞大开的奇想作品。

sora还具有类似于多机位拍摄功能，可以对同一事物并排生成具有多个观察视点的视频，开发者给出了一个生成的视频样本，视频样本展示了人们在雪天散步、玩雪的多个视角，均通过sora一次性完成。传统的视频制作流程基本上是人撰写好脚本，用摄像机进行多机位拍摄后再进行后期的剪辑处理，最终呈现一段表述完整内容的视频，而sora的多机位同时生成的功能意味着该模型将具有一次性生成多机位视频的能力，或许将会对短视频行业甚至长视频行业造成不小的冲击，视频创作者仅需要输入脚本信息即可生成多机位视频。

不过sora目前还存在诸多问题，已有网友制作出了sora失败视频集锦，和文生图一样，人物的手部细节经常失真，模型对于真实物理呈现仍然不够，比如在一段文本为考古人员从沙滩里挖出来一把椅子的视频中，椅子就出现了严重的扭曲变形，和同色系的沙子混淆，三只狗并排玩耍的视频中，狗与狗之间互相穿模甚至融为一体。

从积极的一方面来看，sora的出现进一步降低了视频拍摄的门槛，给任何想要制作视频的人带来了无限的可能，同时也给更多的“脑洞”提供了转化成为现实场景的机会，任何优秀的创意都可能成为AI视频的来源，但虚假泛滥的可能性及对人类知识库的污染仍然是sora及公众即将面对的重大问题，目前，OpenAI 尚未向公众开放 Sora。OpenAI 称，该模型正在接受测试，只分享给了一批精选的研究人员和学者。

扬子晚报/紫牛新闻记者沈昭

视频图片均由AI生成

校对盛媛媛

| 最新

总书记上海行丨记者手记：赢得未来，始于现在

| 美图

【紫牛头条】帕劳9名中国潜水者失联27小时讲述获救过程：鲨鱼绕着我们转，感谢当地华人倾力搜救

【读苏声】一票解锁“包邮区”，带来新活力

【时习之·一席话】扩大内需，不断释放经济活力潜力

2024年中央八项规定精神贯彻执行情况调查网络调查问卷

强强联合！比亚迪方程豹与华为乾崑智驾合作

| 微矩阵