OpenAI 文本转视频大模型 Sora 引爆科技圈！人类离 AGI 真的不远了吗？

本文主要是介绍OpenAI 文本转视频大模型 Sora 引爆科技圈！人类离 AGI 真的不远了吗？，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一年前 AI 智能涌现的场景又重现。

2 月 16 日，OpenAI 发布了最新的视频生成模型 Sora。它能够根据用户输入的提示词、文本指令或静态图像，生成长达一分钟的视频。

这一举动无疑轰动了整个科技圈，从目前 Open AI 展示的信息来看，Sora 实现了 AIGC 领域的里程碑式进展。从仅通过输入一句话，生成文本，再到图片，到现在可生成与好莱坞画面相媲美的视频，且长度最多可达 1 分钟，这让不少科技大佬折服。

Sora 到底有多强？

在官网更新的 48 个视频中，Sora 不仅能准确呈现细节，还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。其中既能实现多角度镜头的自然切换，还包含复杂的场景和生动的角色表情，且故事的逻辑性和连贯性极佳。

来看看官网更新的其中一个文本生成的视频：

AI 文本提示：一位时尚的女人走在东京的街道上，街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克，红色长裙，黑色靴子，背着一个黑色钱包。她戴着墨镜，涂着红色口红。她自信而随意地走路。街道潮湿而反光，营造出五颜六色的灯光的镜面效果。许多行人四处走动。

在这段仅持续一分钟的视频里，一位穿着鲜艳红裙的女士漫步在繁华都市、五光十色的霓虹灯下。视频的呈现风格极为逼真，画面切换自然流畅，但最令人震惊的，无疑是女主角那细致入微的面部特写。从毛孔的细微张开，到斑点与痘印的真实展现，每一个皮肤细节都栩栩如生，仿佛我们能直接触摸到她的肌肤质感。而那种粉底微脱、妆容稍许不整的效果，显得更加真实！