【人工智能】AI虚拟主播制作初体验:生成数字人到视频创作全流程

本文主要是介绍【人工智能】AI虚拟主播制作初体验:生成数字人到视频创作全流程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


文章目录

  • 💯AI虚拟主播
  • 💯使用AI绘画工具生成数字人
    • 借助GPT生成数字人所需的提示词
    • 方案一:使用Midjourney生成数字人
    • 方案二:使用TensAI生成数字人
    • 补充方案三:在D-ID内直接生成数字人
  • 💯使用D-ID生成数字人视频
    • D-ID注册与消耗积分说明
    • D-ID 让数字人“活”起来
  • 💯小结


在这里插入图片描述


AI虚拟主播


💯AI虚拟主播

随着人工智能技术的不断进步,AI虚拟主播正逐渐成为内容创作领域的一大热点。通过AI技术生成的虚拟形象不仅能够高度还原真人的外观,还能够与观众进行互动,提供更加个性化的内容体验。无论是在广告宣传、教育培训,还是在直播与社交平台上,AI虚拟主播都展现出了巨大的潜力。本文将带你进行一次初步探索,感受AI虚拟主播的魅力。通过使用AI绘画工具生成逼真的数字人形象,并借助D-ID等平台让这些静态的形象“活”起来。
在这里插入图片描述


💯使用AI绘画工具生成数字人

首先,我们要使用AI绘画工具为我们生成一个虚拟的数字人形象,这种数字人会非常接近真人的形象。这里使用的AI绘画工具比较推荐Midjourney,如果没有Midjourney也没关系,还会推荐一款在线网页版的文生图的国内AI网站也可生成数字人,供我们使用。
补充:D-ID内也可直接生成数字人形象。
在这里插入图片描述


借助GPT生成数字人所需的提示词

首先我们要去构思如何编写创建数字人形象的提示词,我们通常会设定一些条件,比如他所从事的行业、年龄范围以及五官的具体特征等。这些设定有助于生成一个更符合我们需求的虚拟形象。
以下是一些参数可以参考:

  • 基础:国家、身份(学生/上班族/明星/网红/女装模特)、年龄
  • 容貌:面部(眼睛/鼻子/嘴巴/脸型)、肤色、身材、追加附魔词
  • 服装:休闲/职业/时尚/运动/纯色基本款/民族服饰
  • 场景:地点、时间、天气、光线
  • 摄影:现实、人像摄影、构图 (占比)
  • 动作:默认也可以设定
  • 比例:9:16或3:4宽高比

这里提供一个现成模板用于测试

中国、网红
女明星,五官立体,身材好,
白色连衣裙
街拍,购物街道,
索尼,85mm
走路,
9:16

让AI为我们生成提示词

现在你是一名基于输入描述的提示词生成器,你会将我输入的自然语言想象为完整的画面生成提示词。请注意,你生成后的内容服务于一个绘画AI,它只能理解具象的提示词而非抽象的概念。我将提供简短的中文描述,生成器需要为我提供准确的提示词,必要时优化和重组以提供更准确的内容,也只输出翻译后的英文内容。
请模仿示例的结构生成完美的提示词。
示例输入:“一个坐在路边的办公室女职员”
示例输出:1 girl, office lady, solo, 16yo,beautiful detailed eyes, light blush, black hair, long hair, mole under eye, nose blush , looking at viewer, suits, white shirt, striped miniskirt, lace black pantyhose, black heels, LV bags, 
thighhighs,sitting, street, shop border, akihabara , tokyo, tree, rain, cloudy, beautifully detailed background, depth of field, loli, realistic, ambient light, cinematic composition, neon lights, HDR, Accent Lighting, pantyshot, fish eye lens.
请仔细阅读我的要求,并严格按照规则生成提示词,如果你明白了,请回复"我准备好了",当我输入中文内容后,请生成我需要的英文内容。注意,英文连着写,不要标序号。

使用KIMI、文心一言等AI工具也同样可以帮助我们生成提示词,这里以GPT为例:
在这里插入图片描述
在这里插入图片描述
以下是生成好的提示词,已加上分辨率9:16

Chinese celebrity, internet star, female, detailed facial features, attractive body, white dress, street photography, shopping street, Sony 85mm lens, walking, realistic, urban background, fashion, vibrant colors, natural lighting, candid moment. --ar 9:16

方案一:使用Midjourney生成数字人

  1. 向Midjourney输入上一步GPT给我们生成的提示词
    在这里插入图片描述
  2. 放大我们需要的那张图,保存到本地。
    在这里插入图片描述

方案二:使用TensAI生成数字人

如果没有Midjourney,可先使用这个国内的AI工具,使用在线文生图功能:
TensAI:https://tensai.tenclass.com/?invite_code=4fdhLK

  1. 选择文生图功能,工具勾选M-J-P生成人像效果更佳。
    在这里插入图片描述

  2. 接着跟Midjourney一样输入提示词
    在这里插入图片描述

  3. 生成后找一张适合的进行放大
    在这里插入图片描述

  4. 保存到本地。
    在这里插入图片描述


  • 注意:以上是列举了两个相对容易上手的AI绘画工具,分别是Midjourney和TensAI,用于生成数字人图像。当然,除了这两个工具外,其他AI绘画工具也同样适用,例如Stable Diffusion等。选择哪种工具取决于你的具体需求和使用习惯,每种工具都有其独特的功能和优势,灵活选择能够帮助你更好地实现创作目标。

补充方案三:在D-ID内直接生成数字人

  • 写到一半才发现D-ID原来也可以在线生成数字人。
    在这里插入图片描述
  • 效果不错,生成速度也挺快的,这样子方便很多。
    在这里插入图片描述

💯使用D-ID生成数字人视频

在生成了逼真的数字人图像后,下一步就是让这些静态的图片形象“活”起来。这时,我们可以借助D-ID来实现这一目标。D-ID 是一款先进的AI技术平台,它能够将静态的图像转化为生动的面部动画和视频。通过D-ID,你可以为你的数字人赋予逼真的表情和语音,让他们看起来更具生命力。
D-ID:https://www.d-id.com/
在这里插入图片描述


D-ID注册与消耗积分说明

  • 这里我们需要注册一下才能使用图片转视频功能
    在这里插入图片描述
  • 注册过程就不详细介绍了。
    在这里插入图片描述

  • 这个网站都是英文,所以开启了Google翻译。

  • 注意:D-ID每个账号注册后有20个免费积分,每个代理会话消耗1个积分,每分钟视频价值4个积分。理论上来说,如果你拥有多个邮箱,可以不断注册新账号,这样就能够持续获得免费积分,从而使点数几乎用不完。
    在这里插入图片描述


D-ID 让数字人“活”起来

  1. 点击创建视频
    在这里插入图片描述

  1. 点击上传我们的AI数字人图像
    在这里插入图片描述

  1. 可选择视频中数字人呈现的表情和所在位置
    在这里插入图片描述

  1. 可以为数字人选择不同地区的语言,甚至是方言,并根据需要调整音色。此外,平台还支持根据你提供的音频样本进行声音模仿。
    在这里插入图片描述

  1. 在脚本处可以输入数字人视频中说的话,还可以调整说话风格、语速
    在这里插入图片描述
    在这里插入图片描述
  • 可以提供本地音频供AI模仿
    在这里插入图片描述

  1. 还可以选择自定义视频中数字人所处的背景,但好像是类似PS的图层,应该是需要先将数字人抠图才能完美融合背景。
    在这里插入图片描述

  1. 可在视频中自定义位置加上文字说明
    在这里插入图片描述
  • 可自定义文字信息。
    在这里插入图片描述

  1. 可对生成视频自定义命名
    在这里插入图片描述

  1. 生成成功后可以保存在本地
    在这里插入图片描述

💯小结

  • 数字人这个概念其实早在前几年就已经引起了广泛关注。然而,当时生成数字人的技术还没有如今这样成熟和易于操作,更多的是一些高端玩家能够玩转,对于我们普通人来说几乎是遥不可及的。而现在,随着AI技术的发展,我们可以借助AI绘画工具生成数字人图像,并通过D-ID让其“活起来”,大致了解AI虚拟主播的生成,时代的发展让普通人也能感受到科技带来的便利。
  • 本文只是对虚拟主播的一个简单制作体验教程,并不全面,还有许多功能没有深入探索。作为一个对于AI虚拟主播的初步探索,这篇文章也是为了让读者在尝试中体验到AI发展带来的乐趣,感谢阅读~

public class Main {  public static void main(String[] args) {  System.out.println(“愿你所到之处皆为热土,愿你所遇之人皆为挚友;愿你余生不负忧,自在如风常欢笑。”);  }  
}

在这里插入图片描述


这篇关于【人工智能】AI虚拟主播制作初体验:生成数字人到视频创作全流程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1103372

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

Security OAuth2 单点登录流程

单点登录(英语:Single sign-on,缩写为 SSO),又译为单一签入,一种对于许多相互关连,但是又是各自独立的软件系统,提供访问控制的属性。当拥有这项属性时,当用户登录时,就可以获取所有系统的访问权限,不用对每个单一系统都逐一登录。这项功能通常是以轻型目录访问协议(LDAP)来实现,在服务器上会将用户信息存储到LDAP数据库中。相同的,单一注销(single sign-off)就是指

Spring Security基于数据库验证流程详解

Spring Security 校验流程图 相关解释说明(认真看哦) AbstractAuthenticationProcessingFilter 抽象类 /*** 调用 #requiresAuthentication(HttpServletRequest, HttpServletResponse) 决定是否需要进行验证操作。* 如果需要验证,则会调用 #attemptAuthentica

流媒体平台/视频监控/安防视频汇聚EasyCVR播放暂停后视频画面黑屏是什么原因?

视频智能分析/视频监控/安防监控综合管理系统EasyCVR视频汇聚融合平台,是TSINGSEE青犀视频垂直深耕音视频流媒体技术、AI智能技术领域的杰出成果。该平台以其强大的视频处理、汇聚与融合能力,在构建全栈视频监控系统中展现出了独特的优势。视频监控管理系统EasyCVR平台内置了强大的视频解码、转码、压缩等技术,能够处理多种视频流格式,并以多种格式(RTMP、RTSP、HTTP-FLV、WebS

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖