超逼真人像视频,百分百AI生成!创业团队出身Snapchat,7个月已收入百万美元...

本文主要是介绍超逼真人像视频,百分百AI生成!创业团队出身Snapchat,7个月已收入百万美元...,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

尚恩 发自 凹非寺
量子位 | 公众号 QbitAI

下面这俩视频,你能分辨出哪个是真人,哪个是AI生成的吗?


1eabebf1f3a585e41ce08074ef7f9abb.gif
:注意看左图人物背景

实际上,这俩都是100%由AI生成的人像视频42d3024002485bf244f39aafc72d8875.png

现在,只用上传一段2分钟的小视频,就能达到这种效果,不仅生成速度快,视频还带轻微动态背景

另外像手势、面容和口型这种“细微肢体语言”也能调整。

看到这些生成效果后,网友纷纷竖起大拇指惊呼:

太牛了,视频制作游戏规则要改了!

c4deb4ea53c3d5d00167fdf12232d816.png

也有网友口吐芬芳直言:“数字人替我上,面试再也不紧张了”

(OS:你还挺会玩)

891347480fb62ba1cd72caa409293bc6.png

当然除了惊讶之余,也有一些不同的画风,比如这个网友就觉得:

比起兴奋,自己会更担忧技术被滥用。

7e3249487b81f46283cd83f5266e0c58.png

主打一个逼真

上面所有这些视频都出自HeyGen的Joshua Avatar 2.0,一款AI人像视频的工具,主打的就是一个超逼真。

758675f394ab028481cd9d157f9ce427.png

目前,HeyGen提供超过100+数字人素材和模板,广告、电商、新闻等一应俱全,也可以自己编辑PPT生成。

还同时支持300+不同音色和40+语言,各种配音随意玩,比如咱们来一个说法语的马斯克

当然了视频画质也不差,都是1080P的那种,电脑手机、横屏竖屏都能hold住。此外,还设有包括“文本到视频转换、音频上传、多场景视频、视频共享和背景音乐选项”等功能。

搞一个视频,最多只用三步即可:

选形象、写文本、等输出。

424005034d6d0b323f99723acb3494e1.png

尽管效果很骚,网友内测后发现有一个bug,就是数字人眨眼频率有点儿过高

真人5秒眨一下,数字人每秒眨50下。

46c028878f77745b00a772a7dd90b556.png

不过也有网友调侃道:“说谎的人,才会一直眨眼”f1727b8bdecc9ba6c7e07b5dd765f8f2.png

1f8a5f8f1eeba33aec1fc55449994df8.png

目前,Joshua Avatar 2.0还没完全上线,官网目前提供的还是1.0版本,手痒的朋友还需多等等。

不过好消息是,最新版已经开放内测试了,感兴趣的朋友可以先排个队试试。

内测链接:https://am8evw00qys.typeform.com/to/wauwjUYP?typeform-source=t.co/

66fd4f19702abdd79e25a23d539a4406.png

7个月盈收100万美元

从目前放出视频细节和对比市场同类AIGC工具,Joshua Avatar 2.0在逼真性方面确实做的非常不错。

根据官网显示,HeyGen效果之所以这么好,主要原因产品是基于Surreal Engine去打造的,而Surreal Engine本身就是专门用于创建VR和AR体验的,专注于生成实时人物视频序列

而像d-id这类则是基于GANs,GANs本身就更侧重于修改和转换已有视频,比如面部替换、场景转换等合成处理。

1ecac938832d790ca7762d9b5971b46f.png

此外,HeyGen这个创业团队也值得说道说道。

公司成立于2020年,一开始就专注于做AI数字人生成,创始人CEO曾在Snapchat担任主要工程师,负责机器学习领域。

b0cfe5b64303c030b2265a7a76123f8b.png

今年4月底,创始人Joshua Xu发了篇博客,表示产品从2022年9月上线至今,在仅7个月内实现了100万美元年度重复收入(ARR)。同时已经连续9个月保持稳定的月环比增长率为50%。

54a67fa37e2b909e9940884bfe2bfa0c.png

而且整个团队也只有约30人,分布在3个大陆、4个国家和6个城市,以远程办公进行。

目前,公司的盈利模式主要是围绕客户付费开展,未来也会开放API接口,提供更多团队协作和企业功能。

69cca4b438e0cb20290fb03fbb72e6c1.png

另外,CEO也表示已经积累了数百万个视频数据,也会考虑做视频垂直领域的大模型(LLM)。

你觉得这款工具怎么样?

参考链接:
[1]https://twitter.com/HeyGen_Official/
[2]https://twitter.com/joshua_xu_/status/1687129787267973123/
[3]https://www.heygen.com/article/0-1m-arr-in-7-months/

「AIGC+垂直领域社群」

招募中!

欢迎关注AIGC的伙伴们加入AIGC+垂直领域社群,一起学习、探索、创新AIGC!

请备注您想加入的垂直领域「教育」或「广告营销」,加入AIGC人才社群请备注「人才」&「姓名-公司-职位」。

c380d9383ac1860df1b5701a4da7761a.png

点这里👇关注我,记得标星哦~

这篇关于超逼真人像视频,百分百AI生成!创业团队出身Snapchat,7个月已收入百万美元...的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/303620

相关文章

Java实战之利用POI生成Excel图表

《Java实战之利用POI生成Excel图表》ApachePOI是Java生态中处理Office文档的核心工具,这篇文章主要为大家详细介绍了如何在Excel中创建折线图,柱状图,饼图等常见图表,需要的... 目录一、环境配置与依赖管理二、数据源准备与工作表构建三、图表生成核心步骤1. 折线图(Line Ch

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

浅析如何使用Swagger生成带权限控制的API文档

《浅析如何使用Swagger生成带权限控制的API文档》当涉及到权限控制时,如何生成既安全又详细的API文档就成了一个关键问题,所以这篇文章小编就来和大家好好聊聊如何用Swagger来生成带有... 目录准备工作配置 Swagger权限控制给 API 加上权限注解查看文档注意事项在咱们的开发工作里,API

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Java如何获取视频文件的视频时长

《Java如何获取视频文件的视频时长》文章介绍了如何使用Java获取视频文件的视频时长,包括导入maven依赖和代码案例,同时,也讨论了在运行过程中遇到的SLF4J加载问题,并给出了解决方案... 目录Java获取视频文件的视频时长1、导入maven依赖2、代码案例3、SLF4J: Failed to lo

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

Python实现多路视频多窗口播放功能

《Python实现多路视频多窗口播放功能》这篇文章主要为大家详细介绍了Python实现多路视频多窗口播放功能的相关知识,文中的示例代码讲解详细,有需要的小伙伴可以跟随小编一起学习一下... 目录一、python实现多路视频播放功能二、代码实现三、打包代码实现总结一、python实现多路视频播放功能服务端开

Java使用POI-TL和JFreeChart动态生成Word报告

《Java使用POI-TL和JFreeChart动态生成Word报告》本文介绍了使用POI-TL和JFreeChart生成包含动态数据和图表的Word报告的方法,并分享了实际开发中的踩坑经验,通过代码... 目录前言一、需求背景二、方案分析三、 POI-TL + JFreeChart 实现3.1 Maven

Python实现视频转换为音频的方法详解

《Python实现视频转换为音频的方法详解》这篇文章主要为大家详细Python如何将视频转换为音频并将音频文件保存到特定文件夹下,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果5. 注意事项