Stable Diffusion 长视频真人动画风格互转

2024-01-26 09:20

本文主要是介绍Stable Diffusion 长视频真人动画风格互转,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Stable Diffusion Temporal-Kit和EbSynth 从娱乐到商用

    • 1. Temporal Kit 和 EbSynth
      • 1.1 提取关键帧
      • 1.2 关键帧风格迁移
      • 1.3 生成序列帧
    • 2. 真人转卡通
    • 3. 卡通转真人
    • 4. 编辑技巧
    • 5. ControlNet + TemporalNet + 达芬奇Fusion
    • 6. Rerender A Video
    • 7. DiffSynth-Studio

基于SD的风格化编辑主流方式:

  • ControlNet-M2M
  • ControlNet img2img
  • Mov2mov extension
  • SD-CN Animation extension
  • Temporal Kit
  • Temporal Kit + EbSynth
  • EbSynth插件

问题:重绘幅度调整太小,基本上和换脸视频差不多,服装通过lora调整加入,关键词权重调很高,基本上不能把视频中的衣服换掉。尝试各种参数设置,效果可能都不是很好。

减少虚影:减少动画插帧数量。

1. Temporal Kit 和 EbSynth

Temporal Kit 和 EbSynth 都是视频风格转换的工具,用于提取关键帧、补全非关键帧。配合各种SD模型的使用方法:

  1. TemporalKit / Ebsynth提取关键帧
  2. Stable Diffusion 风格迁移
  3. TemporalKit / Ebsynth补全重绘后的关键帧图片之间的序列帧,并拼合出了视频。

区别:用Ebsynth进行补帧和合成,相比于Temporal-kit插件Ebsynth utility生成步骤清晰,后期还能指定更换背景。但Ebsynth utility插件生成的重绘效果有些图片会有阴影,需要单独挑出来再次

这篇关于Stable Diffusion 长视频真人动画风格互转的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/646340

相关文章

百度OCR识别结构结构化处理视频

https://edu.csdn.net/course/detail/10506

RISC-V教学内容及短视频吸引因素

RISC-V 教学内容 在我的认知中,大多数人对RV仍然了解甚少,我想本实习岗位主要面向对 RV 不了解或了解很少的同学,帮助大家更好入门。 因此教学内容为: RISC-V 简要介绍;RISC-V 指令集知识简要讲解,指令集介绍,各个指令集的指令规则及指令运行演示,可以结合模拟器运行结果讲解更为直观;常见 RV 模拟器介绍,分别适用的场景。对于一些简单的 RV 模拟器可以展开讲解安装部署使用

ArkTS开发系列之导航 (2.7动画)

上篇回顾: ArkTS开发系列之导航 (2.6 图形) 本篇内容:动画的学习使用 一、 知识储备 1. 布局更新动画 包含显式动画(animateTo)和属性动画(animation) 动画类型名称特点显式动画闭包内的变化都会触发动画执行, 可以做较复杂的动画属性动画属性变化时触发动画执行, 设置简单 说白了,显示动画就是靠闭包事件触发,属性动画是挂在组件身上的属性变化触发 显式动画

YOLOv9摄像头或视频实时检测

1、下载yolov9的项目 地址:YOLOv9 2、使用下面代码进行检测 import torchimport cv2from models.experimental import attempt_loadfrom utils.general import non_max_suppression, scale_boxesfrom utils.plots import plot_o

Android 扇形网络控件 - 无网络视图(动画)

前言 一般在APP没有网络的情况下,我们都会用一个无网络的提示图标,在提示方面为了统一app的情况,我们一般使用简单的提示图标,偶尔只需要改变一下图标的颜色就一举两得,而不需要让PS来换一次颜色。当然app有图标特殊要求的就另当别论了。 效果图 当你第一眼看到这样的图,二话不说直接让UI给你切一张图标来的快对吧,我其实开始也是这么想的,但是到了做的app越来越多的时候,你就会发现就算是用

google gemini1.5 flash视频图文理解能力初探(一)

市面能够对视频直接进行分析的大模型着实不多,而且很多支持多模态的大模型那效果着实也不好。 从这篇公众号不只是100万上下文,谷歌Gemini 1.5超强功能展示得知,Gemini 1.5可以一次性处理1小时的视频、11小时的音频或100,000行代码,并衍生出更多的数据分析玩法。能力覆盖: 跨模式理解和推理,当给出一部 44 分钟的巴斯特-基顿(Buster Keaton)无声电影时,该模型能准

警惕!推广文章与视频的兼职骗局大揭秘

在互联网时代,我们常常会看到各种各样的推广兼职信息,承诺可以轻松赚钱,特别是在推广文章和视频方面。然而,在这些看似诱人的机会背后,往往隐藏着一些骗局。本文将为大家揭示这些骗局,帮助大家避免上当受骗。 一、骗局特征 1. **高额回报承诺**:骗子常常以高额的回报作为诱饵,声称只要转发文章、分享视频,就能获得丰厚的佣金或收益。然而,这种不切实际的高额回报往往是骗局的开始。 2. **简单操作

视频监控平台:支持交通部行业标准JT/T905协议(即:出租汽车服务管理信息系统)的源代码的函数和功能介绍及分享

目录 一、视频监控平台介绍 (一)概述 (二)视频接入能力介绍 (三)功能介绍 二、JT/T905协议介绍 (一)概述 (二)主要内容 1、设备要求 2、业务功能要求 3、技术功能要求 4、性能要求 5、接口要求 6、设备通信协议与数据格式 三、代码和解释 (一)代码和注释 (二)函数功能说明 1. 头文件保护 2. 包含必要的头文件 3. 引入命名空间std

AIGC-Animate Anyone阿里的图像到视频 角色合成的框架-论文解读

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation 论文:https://arxiv.org/pdf/2311.17117 网页:https://humanaigc.github.io/animate-anyone/ MOTIVATION 角色动画的