OpenAI 文本转视频大模型 Sora 引爆科技圈!人类离 AGI 真的不远了吗?

2024-02-23 19:12

本文主要是介绍OpenAI 文本转视频大模型 Sora 引爆科技圈!人类离 AGI 真的不远了吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一年前 AI 智能涌现的场景又重现。

2 月 16 日,OpenAI 发布了最新的视频生成模型 Sora。它能够根据用户输入的提示词、文本指令或静态图像,生成长达一分钟的视频。

这一举动无疑轰动了整个科技圈,从目前 Open AI 展示的信息来看,Sora 实现了 AIGC 领域的里程碑式进展。从仅通过输入一句话,生成文本,再到图片,到现在可生成与好莱坞画面相媲美的视频,且长度最多可达 1 分钟,这让不少科技大佬折服。

Sora 到底有多强?

在官网更新的 48 个视频中,Sora 不仅能准确呈现细节,还可以根据提示、静止图像填补现有视频中的缺失帧来生成视频。其中既能实现多角度镜头的自然切换,还包含复杂的场景和生动的角色表情,且故事的逻辑性和连贯性极佳。

来看看官网更新的其中一个文本生成的视频:

AI 文本提示:一位时尚的女人走在东京的街道上,街道上到处都是温暖的发光霓虹灯和动画城市标志。她身穿黑色皮夹克,红色长裙,黑色靴子,背着一个黑色钱包。她戴着墨镜,涂着红色口红。她自信而随意地走路。街道潮湿而反光,营造出五颜六色的灯光的镜面效果。许多行人四处走动。

在这段仅持续一分钟的视频里,一位穿着鲜艳红裙的女士漫步在繁华都市、五光十色的霓虹灯下。视频的呈现风格极为逼真,画面切换自然流畅,但最令人震惊的,无疑是女主角那细致入微的面部特写。从毛孔的细微张开,到斑点与痘印的真实展现,每一个皮肤细节都栩栩如生,仿佛我们能直接触摸到她的肌肤质感。而那种粉底微脱、妆容稍许不整的效果,显得更加真实!

除了对人物写实,Sora 还能够模拟现实中的动物与环境以及非写实的创意动画等等,其生成效果让网友开始担心起了各行业人士的饭碗。

Sora 的技术原理其实跟 ChatGPT 类似,都是拼接大量的数据和训练,建立起大模型,然后利用强大的算力快速生成内容。

目前主流大模型都是建立在巨大的参数量和运算量之上的,对算力提出了极高的要求,Sora 的横空出世,推动算力需求的持续高涨。训练一个模型需要大量 GPU 服务器。

为了提高企业 AI 应用产品的健康快速落地,支撑企业低成本快速使用 AI 算力资源。Finovy Cloud 提供全球先进算力产品和服务引擎,高性能云主机,致力于为企业提供先进的 AI 算力,助企业在 AI 行业中获得发展红利,协力迎接一个更加高效、智能的 AI 新时代到来。

这篇关于OpenAI 文本转视频大模型 Sora 引爆科技圈!人类离 AGI 真的不远了吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/739650

相关文章

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

使用Python实现文本转语音(TTS)并播放音频

《使用Python实现文本转语音(TTS)并播放音频》在开发涉及语音交互或需要语音提示的应用时,文本转语音(TTS)技术是一个非常实用的工具,下面我们来看看如何使用gTTS和playsound库将文本... 目录什么是 gTTS 和 playsound安装依赖库实现步骤 1. 导入库2. 定义文本和语言 3

Python实现常用文本内容提取

《Python实现常用文本内容提取》在日常工作和学习中,我们经常需要从PDF、Word文档中提取文本,本文将介绍如何使用Python编写一个文本内容提取工具,有需要的小伙伴可以参考下... 目录一、引言二、文本内容提取的原理三、文本内容提取的设计四、文本内容提取的实现五、完整代码示例一、引言在日常工作和学

Java实现将Markdown转换为纯文本

《Java实现将Markdown转换为纯文本》这篇文章主要为大家详细介绍了两种在Java中实现Markdown转纯文本的主流方法,文中的示例代码讲解详细,大家可以根据需求选择适合的方案... 目录方法一:使用正则表达式(轻量级方案)方法二:使用 Flexmark-Java 库(专业方案)1. 添加依赖(Ma

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

Linux使用cut进行文本提取的操作方法

《Linux使用cut进行文本提取的操作方法》Linux中的cut命令是一个命令行实用程序,用于从文件或标准输入中提取文本行的部分,本文给大家介绍了Linux使用cut进行文本提取的操作方法,文中有详... 目录简介基础语法常用选项范围选择示例用法-f:字段选择-d:分隔符-c:字符选择-b:字节选择--c