AI 修复:抗美援朝影像

2024-02-05 22:20
文章标签 ai 影像 修复 抗美援朝

本文主要是介绍AI 修复:抗美援朝影像,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“机器学习与生成对抗网络”,关注星标

获取有趣、好玩的前沿干货!

‍‍   博雯 发自 凹非寺 量子位 报道 | 公众号 QbitAI

你对“历史”这个词的第一印象是什么?

很多人的脑海中最先冒出来的,或许是像下面这样粗糙颗粒、老旧模糊的黑白影片:

278eedb3ee6d864e9f9e3973ed41d3c1.gif

图源1951年纪录片《抗美援朝》

但现在,在AI修复技术的帮助下,那些模糊的影片也能被赋予色彩:

ce02573674f70045ffe15ab6d1406d60.gif

在听到最新一批在韩中国人民志愿军烈士遗骸将于9月2日被移送回国的消息之后,“AI修复师”大谷Spitzer便再一次用这种独特的方法,表达了自己的哀思。

而共青团中央官博也转发了这段AI上色后的特殊视频,并表示:

山河无恙,英雄不朽。

9fa4a8faa6c4de36b431d86420b3d8b8.png

历史并非黑白无声

就如同电影《你好,李焕英》中,那段仿佛“一脚踏入现实”的从黑白到彩色的镜头一样。

当这段70年前的纪录片染上色彩之时,我们这些观者也不禁有一种向历史踏近了一步的感觉。

有穿着绿色军装,扛着红旗前行的小战士们:

72ef160b0d0482c56b8bf8b35a6ce711.gif

有挤在绿皮火车上,与自己的亲朋好友告别的军人们:91aaef69275a2976b0ab91761a2c4d7d.gif

还有踩在黄色土地上,从鸭绿江上横跨而过的队伍:

679ee2fb907d4b9ac42ae9fd2939c9f6.gif

制作者大谷Spitzer表示,“每次修复这些历史影像,都能给我带来很大的震撼”。

b5177e6ecf41da87908c76ec27feb981.png

而在之前的“让革命先烈露出微笑”的项目中,他也解释了自己所认为的“AI修复的意义”:

我会把它定义成五分钟彼岸的一个概念。

就是说,在这种纷繁复杂的现代社会中,可能抽个五分钟去看一段古代的影像,或者以前的影响,看看当时的古人们是如何生活的,他们所思所想是怎样的。

f04f5a483ac9d1556e73100212c1e90a.png

AI如何修复

对于这次修复,大谷坦言,“技术难点在于多人物镜头的修复”。

因此,他使用了支持TensorFlow、Flink等多种计算框架的机器学习平台PAI

在平台中,他增加了更多参考帧,并与其他的AI上色分辨率提升模型进行拼合,最终达到了很好的修复效果。

0ba5a277d06e6e6fa39522f230e6d150.gif

而在之前的项目中,大谷Spitzer也对自己所使用的AI修复技术进行了详细解释。

比如,用于脸部高清增强的是GAN先验嵌入式网络,也就是GPEN(GAN prior embedded network)。

这一网络架构会将GAN先验网络嵌入到深度神经网络(DNN)中,并从中进行微调。

30c0d1bbcfb4ca8de58b2594c1cf275f.png

上色的则是基于NoGAN技术的DeOldify,这种新型的GAN训练模型能够解决视频中物体闪烁等问题:

ce6a891683a97e3d9ce85d37aa05c66e.gif

32d8ff9b82f78f082268d2547ef33f79.gif

此外,还有负责视频帧插值的RIFE,用于脸部生成的Artbreeder,以及增加分辨率的Topaz Labs。

那些相隔百年的对视

其实在AI修复技术愈发成熟的今天,已经有越来越多的项目开始用到这项技术。

比如大谷Spitzer在去年就做过“晚清时期的北京”影像修复,玩了一把百年前的“老北京Vlog”:

4a7853d2962f23eefd5d6b9938aa1b2d.gif

而今年五月四日,央视还在AI修复节目《彩绘中国·觉醒》中展示了一段彩色的五四运动现场:

41a1818f1415f8d805f660f350486520.gif

这一节目的执行编导说到他们为老影像进行修复上色的初衷,只是“想还原一段历史”。

因为当时的人们并非生活在黑白无声的世界里。

我们所有的努力就是想向老影像致敬并以电影的体验方式呈现出来,以此把观众带入到那段时空当中去,感受一百年前人们的精神风貌。

这也正像是这位网友所说的那样:

我们周围的高技术越多,就越需要人的感情。

c4b7150975dd024cd8a4f19de2d6deb9.png

最后附上完整视频:

参考链接:

[1]https://weibo.com/2395607675/KuLYKfPO7?filter=hot&root_comment_id=0&type=comment
[2]https://www.qbitai.com/2020/05/14211.html
[3]https://www.qbitai.com/2021/07/25886.html

版权声明

本文来源:量子位,版权属于原作者,仅用于学术分享

猜您喜欢:

等你着陆!【GAN生成对抗网络】知识星球!

CVPR 2021专题1:GAN的改进

CVPR 2021 | GAN的说话人驱动、3D人脸论文汇总

CVPR 2021 | 图像转换 今如何?几篇GAN论文

【CVPR 2021】通过GAN提升人脸识别的遗留难题

CVPR 2021生成对抗网络GAN部分论文汇总

经典GAN不得不读:StyleGAN

最新最全20篇!基于 StyleGAN 改进或应用相关论文

超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 | 《Python进阶》中文版

附下载 | 经典《Think Python》中文版

附下载 | 《Pytorch模型训练实用教程》

附下载 | 最新2020李沐《动手学深度学习》

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 | 超100篇!CVPR 2020最全GAN论文梳理汇总!

附下载 |《计算机视觉中的数学方法》分享

870954cc39383fae531ba596ceea7678.png

这篇关于AI 修复:抗美援朝影像的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/682339

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学

AI行业应用(不定期更新)

ChatPDF 可以让你上传一个 PDF 文件,然后针对这个 PDF 进行小结和提问。你可以把各种各样你要研究的分析报告交给它,快速获取到想要知道的信息。https://www.chatpdf.com/

【北交大信息所AI-Max2】使用方法

BJTU信息所集群AI_MAX2使用方法 使用的前提是预约到相应的算力卡,拥有登录权限的账号密码,一般为导师组共用一个。 有浏览器、ssh工具就可以。 1.新建集群Terminal 浏览器登陆10.126.62.75 (如果是1集群把75改成66) 交互式开发 执行器选Terminal 密码随便设一个(需记住) 工作空间:私有数据、全部文件 加速器选GeForce_RTX_2080_Ti

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

AI基础 L9 Local Search II 局部搜索

Local Beam search 对于当前的所有k个状态,生成它们的所有可能后继状态。 检查生成的后继状态中是否有任何状态是解决方案。 如果所有后继状态都不是解决方案,则从所有后继状态中选择k个最佳状态。 当达到预设的迭代次数或满足某个终止条件时,算法停止。 — Choose k successors randomly, biased towards good ones — Close