MIT利用AI系统通过2D视频创建3D运动雕塑

2024-01-10 10:10

本文主要是介绍MIT利用AI系统通过2D视频创建3D运动雕塑,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

MIT利用AI系统通过2D视频创建3D运动雕塑

文章来源:ATYUN AI平台 

你可能听说过雕塑,你可能看过3D电影,但你可能不知道3D运动雕塑(3D motion sculpture)。
这种艺术混合体是由麻省理工学院计算机科学与人工智能实验室、谷歌研究和加州大学伯克利分校的研究人员共同创造的,他们共同使用了AI系统,产生了一种混合超现实主义的运动和姿势。

该系统被称为MoSculp,在一篇论文“MoSculp: Interactive Visualization of Shape and Time”中有所描述,该论文将于下个月在德国柏林的用户界面软件和技术(UIST)会议上发布。Xiuming Zhang是一名博士生,也是论文的第一作者,他认为这可以用来为想要提高技能的运动员进行详细的运动研究。

Zhang表示,“想象一下,你有一个关于Roger Federer在网球比赛中投球的视频,以及一个自己学习网球的视频,你可以用MoSculp建立两种情景的动作雕塑来比较它们,并更全面地研究你需要改进的地方。”

精彩视频,点击链接:MIT利用AI系统通过2D视频创建3D运动雕塑

这是一个多步骤的过程。首先,MoSculp检测人体及其2D姿势,利用Carnegie Melon大学感知计算实验室维护的多人关键点检测实时库OpenPose,估算每个帧中的关键点(踝关节,肘关节,髋关节等)。接下来,它恢复成一个3D身体模型,代表了人的整体形状和他们在框架上的姿势。

它通过3D空间扫描这个模型,以创建初始运动雕塑,但正如研究人员指出的,这个模型缺乏纹理和结构细节,如精细的面部结构,头发和衣服。解决方案是将雕塑插入原始视频,而不是将3D内容从视频映射到场景。

为了防止伪影和遮挡,MoSculp估计每个框架中人物和雕塑的深度图,比较两者以确定人是否比雕塑更接近或更远离相机。然后,它跨所有帧提取主题的前景蒙版,以细化初始深度图。

以下是它在实践中的工作原理:将视频加载到系统后,MoSculp将检测到的关键点覆盖在输入帧上,并通过几个随机选择的帧确认它们(内置的校正工具可以让用户在必要时进行调整)。在校正“暂时不一致的检测”后,它会生成运动雕塑并将其加载到自定义界面中。

在MoSculp中,用户可以在雕塑周围导航或使用3D打印机进行打印。工具允许他们自定义材料,身体部位,场景背景,光照条件和其他美学特征。

目前,MoSculp仅适用于单主题视频,但团队希望将其扩展到多个人。在未来,他们相信它可以用于研究社会障碍,团队动力和人际交往等事情。

“舞蹈和高技能运动通常看起来像’移动雕塑’,但它们只会形成稍纵即逝的短暂形状,”Adobe传播负责人Courtney Brigham说,“这项工作展示了如何采取动作并将其转化为具有客观运动可视化的真实雕塑,为运动员提供了一种分析他们的训练动作的方式,只需要一个便携式摄像机和一些计算时间而无需更多设备。”

本文转自ATYUN人工智能媒体平台,原文链接:MIT利用AI系统通过2D视频创建3D运动雕塑

更多推荐

数据和机器学习如何改变欧洲足球,甚至是世界足球?!

谷歌将人工智能带入数据透视表,表单功能立刻升级!

入圈人工智能 你需要了解无监督机器学习的真正能力

你真的知道什么是随机森林吗?本文是关于随机森林的直观解读

欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com
欢迎关注ATYUN官方公众号,商务合作及内容投稿请联系邮箱:bd@atyun.com

 

这篇关于MIT利用AI系统通过2D视频创建3D运动雕塑的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/590434

相关文章

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

在不同系统间迁移Python程序的方法与教程

《在不同系统间迁移Python程序的方法与教程》本文介绍了几种将Windows上编写的Python程序迁移到Linux服务器上的方法,包括使用虚拟环境和依赖冻结、容器化技术(如Docker)、使用An... 目录使用虚拟环境和依赖冻结1. 创建虚拟环境2. 冻结依赖使用容器化技术(如 docker)1. 创

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首

Python创建Excel的4种方式小结

《Python创建Excel的4种方式小结》这篇文章主要为大家详细介绍了Python中创建Excel的4种常见方式,文中的示例代码简洁易懂,具有一定的参考价值,感兴趣的小伙伴可以学习一下... 目录库的安装代码1——pandas代码2——openpyxl代码3——xlsxwriterwww.cppcns.c

Java如何获取视频文件的视频时长

《Java如何获取视频文件的视频时长》文章介绍了如何使用Java获取视频文件的视频时长,包括导入maven依赖和代码案例,同时,也讨论了在运行过程中遇到的SLF4J加载问题,并给出了解决方案... 目录Java获取视频文件的视频时长1、导入maven依赖2、代码案例3、SLF4J: Failed to lo

CentOS系统Maven安装教程分享

《CentOS系统Maven安装教程分享》本文介绍了如何在CentOS系统中安装Maven,并提供了一个简单的实际应用案例,安装Maven需要先安装Java和设置环境变量,Maven可以自动管理项目的... 目录准备工作下载并安装Maven常见问题及解决方法实际应用案例总结Maven是一个流行的项目管理工具

SpringBoot整合DeepSeek实现AI对话功能

《SpringBoot整合DeepSeek实现AI对话功能》本文介绍了如何在SpringBoot项目中整合DeepSeekAPI和本地私有化部署DeepSeekR1模型,通过SpringAI框架简化了... 目录Spring AI版本依赖整合DeepSeek API key整合本地化部署的DeepSeek

Python实现多路视频多窗口播放功能

《Python实现多路视频多窗口播放功能》这篇文章主要为大家详细介绍了Python实现多路视频多窗口播放功能的相关知识,文中的示例代码讲解详细,有需要的小伙伴可以跟随小编一起学习一下... 目录一、python实现多路视频播放功能二、代码实现三、打包代码实现总结一、python实现多路视频播放功能服务端开

使用Python在Excel中创建和取消数据分组

《使用Python在Excel中创建和取消数据分组》Excel中的分组是一种通过添加层级结构将相邻行或列组织在一起的功能,当分组完成后,用户可以通过折叠或展开数据组来简化数据视图,这篇博客将介绍如何使... 目录引言使用工具python在Excel中创建行和列分组Python在Excel中创建嵌套分组Pyt

Python实现视频转换为音频的方法详解

《Python实现视频转换为音频的方法详解》这篇文章主要为大家详细Python如何将视频转换为音频并将音频文件保存到特定文件夹下,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. python需求的任务2. Python代码的实现3. 代码修改的位置4. 运行结果5. 注意事项