北大、腾讯强推!DynamiCrafter WebUI 在线教程,无需逐帧记录即可图片变视频

本文主要是介绍北大、腾讯强推!DynamiCrafter WebUI 在线教程,无需逐帧记录即可图片变视频,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

从史前时期开始,人类的祖先就曾以石为笔,在洞穴的石壁描绘出一系列野牛奔跑的分析图,壁画上的动物被叠加了多条腿,用来表现连贯的动作,这或许便是动态视频的最早雏形。

动图封面

被焚之城的山羊陶碗

时光流转,最初,人们在画纸上描绘多张场景、动作连续的图画,通过快速翻动纸张形成动态变化;随后,计算机、摄像机的出现为视频的呈现带来巨大变革,通过 1 秒内拍摄 24 帧以上画面,可以达成一种快速连贯的动态视觉效果,在模拟自然场景的随机动态(如云和流体)或特定领域的运动(如人体动作)方面取得了很大进展。

动图封面

花的盛开过程

然而,当前的技术在展示其他领域内物体的动作协调性、场景细节连贯性等方面,仍面临挑战。比如准确捕捉和展示自然界中一朵花盛开的完整周期,人们就需要真的等待花开,并逐帧记录。

动图封面

静态图+girl's hair blowing in the wind=过程动态视频

近日,由北大、腾讯 AI Lab 强强联手推出的 DynamiCrafter 模型,无需再繁琐地一帧一帧记录图像,也不仅仅局限于自然场景的随机动态或特定领域运动,DynamiCrafter 几乎能够结合任何领域的静态图像和文本提示,瞬间就能变幻出超逼真的动态视频!而且,高清晰、超流畅、无缝衔接,每一个细节都能拿捏得恰到好处!

动图封面

静态图片+boy walking on the street=过程动态视频

无论你是想看优美风景图的变化过程,还是不同人物的精彩瞬间,亦或是萌宠、豪车、艺术雕塑的动态场景,DynamiCrafter 能够轻松驾驭各种风格,定制你的专属动态视频记录!

动图封面

起始帧图片+结束帧图片+a smiling girl=过程动态视频

此外,DynamiCrafter 在应用场景上更是大显神通:打造情节跌宕的故事视频、循环播放的魔性小视频,甚至是让每一帧都丝滑过渡的帧插值技术,创意动画视频的制作从此 So easy!

为了帮助大家更好地体验 DynamiCrafter,OpenBayes平台上线了「DynamiCrafter AI 视频生成工具」教程!该教程为大家搭建好了环境,无需再等待模型下载训练,点击克隆即可一键启动,丝滑视频瞬间制作!

公共教程地址:https://go.openbayes.com/yHXZR

以上教程基于 WebUI,简单易用,但局部精准化控制有限。相反,ComfyUI 基于节点式的界面和工作流,可以通过改变节点来实现不同的效果,进而实现精细化控制,赋予用户更高的自由度和创作空间。

因此,OpenBayes 平台同时上线了「ComfyUI DynamiCrafter 图生视频工作流」。该教程帮助大家提前下载模型,为用户搭建好了工作流,一键即可使用,具体教程详情看 OpenBayes 今日发布的次条内容。

操作步骤

PART 1
Demo 运行阶段

1. 登录 http://OpenBayes.com,在「公共教程」页面,选择「DynamiCrafter AI 视频生成工具」。

2. 页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

3. 点击右下角「下一步:选择算力」。

4. 跳转后,选择「NVIDIA GeForce RTX 4090」,点击「下一步:审核」。新用户使用下方邀请链接注册,可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费时长!

小贝总专属邀请链接(直接复制到浏览器打开):

https://openbayes.com/console/signup?r=GraceXiii_W8qO

5. 点击「继续执行」,等待分配资源,首次克隆需等待 3-5 分钟左右的时间。当状态变为「运行中」后,点击「打开工作空间」。

若超过 10 分钟仍处于「正在分配资源」状态,可尝试停止并重启容器;若重启仍无法解决,请在官网联系平台客服。

6. 该教程可以实现以下 2 种效果,下面将逐一为大家演示:

通过图片和文本提示生成视频;
通过起始帧、结束帧和提示词生成视频。

PART 2
通过图片和文本提示生成视频

1. 新建一个终端,运行「cd DynamiCrafter」切换至 DynamiCrafter 目录下。

2. 执行「python gradio_app.py」命令,稍等片刻,当命令行出现「https://0.0.0.0:8080」后,拷贝右侧 API 地址到浏览器地址栏中打开 Gradio 界面。请注意,用户需在实名认证后才能使用 API 地址访问功能。

3. 打开 Gradio 页面后,上传一张照片和并增加一段文本描述(例如:fireworks display),点击「Generate」后,稍等片刻,即可生成视频。

动图封面

PART 3
通过起始帧、结束帧和提示词生成视频

1. 返回终端界面,通过「Ctrl + C」终止当前进程后,随后运行「python gradio_app_interp_and_loop.py」命令,待命令行出现「https://0.0.0.0:8080」后,打开右侧 API 地址。

2. 在 Gradio 页面,上传一个起始帧图片、结束帧图片以及一段文本描述(例如:a smiling girl),点击「Generate」即可生成视频。

动图封面

新用户福利

注册福利:点击下方邀请链接注册,即可获得 4 小时 RTX 4090 + 5 小时 CPU 的免费算力时长,永久有效!

小贝总专属邀请链接(直接复制到浏览器打开):

https://openbayes.com/console/s

这篇关于北大、腾讯强推!DynamiCrafter WebUI 在线教程,无需逐帧记录即可图片变视频的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030244

相关文章

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

Node.js学习记录(二)

目录 一、express 1、初识express 2、安装express 3、创建并启动web服务器 4、监听 GET&POST 请求、响应内容给客户端 5、获取URL中携带的查询参数 6、获取URL中动态参数 7、静态资源托管 二、工具nodemon 三、express路由 1、express中路由 2、路由的匹配 3、路由模块化 4、路由模块添加前缀 四、中间件

Android 10.0 mtk平板camera2横屏预览旋转90度横屏拍照图片旋转90度功能实现

1.前言 在10.0的系统rom定制化开发中,在进行一些平板等默认横屏的设备开发的过程中,需要在进入camera2的 时候,默认预览图像也是需要横屏显示的,在上一篇已经实现了横屏预览功能,然后发现横屏预览后,拍照保存的图片 依然是竖屏的,所以说同样需要将图片也保存为横屏图标了,所以就需要看下mtk的camera2的相关横屏保存图片功能, 如何实现实现横屏保存图片功能 如图所示: 2.mtk

Spring MVC 图片上传

引入需要的包 <dependency><groupId>commons-logging</groupId><artifactId>commons-logging</artifactId><version>1.1</version></dependency><dependency><groupId>commons-io</groupId><artifactId>commons-

记录每次更新到仓库 —— Git 学习笔记 10

记录每次更新到仓库 文章目录 文件的状态三个区域检查当前文件状态跟踪新文件取消跟踪(un-tracking)文件重新跟踪(re-tracking)文件暂存已修改文件忽略某些文件查看已暂存和未暂存的修改提交更新跳过暂存区删除文件移动文件参考资料 咱们接着很多天以前的 取得Git仓库 这篇文章继续说。 文件的状态 不管是通过哪种方法,现在我们已经有了一个仓库,并从这个仓

《x86汇编语言:从实模式到保护模式》视频来了

《x86汇编语言:从实模式到保护模式》视频来了 很多朋友留言,说我的专栏《x86汇编语言:从实模式到保护模式》写得很详细,还有的朋友希望我能写得更细,最好是覆盖全书的所有章节。 毕竟我不是作者,只有作者的解读才是最权威的。 当初我学习这本书的时候,只能靠自己摸索,网上搜不到什么好资源。 如果你正在学这本书或者汇编语言,那你有福气了。 本书作者李忠老师,以此书为蓝本,录制了全套视频。 试

Prompt - 将图片的表格转换成Markdown

Prompt - 将图片的表格转换成Markdown 0. 引言1. 提示词2. 原始版本 0. 引言 最近尝试将图片中的表格转换成Markdown格式,需要不断条件和优化提示词。记录一下调整好的提示词,以后在继续优化迭代。 1. 提示词 英文版本: You are an AI assistant tasked with extracting the content of