汉字艺术生成！Stable Diffusion 的跨学科应用！

本文主要是介绍汉字艺术生成！Stable Diffusion 的跨学科应用！，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

本文来源新智元编辑：昕朋

【新智元导读】被中文折磨的歪果仁，开始用Stable Diffusion学习汉字！更绝的是，SD不仅精通汉字，还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏！

学习外语，不是件容易事。

当然，这份苦，不只有中国人吃。

在Reddit上，有一个「r/ChineseLanguage」的话题，里头专门发一些外国人学中文遇到的问题的吐槽。

对大部分学习中文的外国人来说，汉字永远是个跨不过去的坎。

没有正确的学习方法，学习者很难记住成百上千个结构各异的汉字。

不过没关系，Stable Diffusion会出手。

字不认识？看「图」！

在Reddit的Stable Diffusion频道，网友分享了文字生成模型Depth2Image。

代码链接：https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt

该模型使用Stable Diffusion的技术，可以将汉字图像转变为它所代表的含义。

例如，用火腿组成的「肉」字，

以及用绳子组成的「绳」字。

博主分享了图像的生成方式，在模型中输入需要呈现的材质照片，Depth2Image就会生成该材质对应的中文汉字。

此贴一出便引来广泛讨论。网友在热情分享自己创作的文字同时，也激动地表示：这在教育领域的应用未来可期！

其实在两年前，已经有人从事文字图像化的研究。推特网友@azlenelza就利用助神经网络，通过生成视觉助记符的方式将汉字图形化，表示各自的含义。

Azlen表示，这种方式会让各个汉字的意义和形状之间建立更多的联系，从而使每个汉字更容易记住。

可以发现，当时AI生成的图像更属于艺术字的范畴。例如右下角的图像，小编看了好久才认出是「制」字。

经过两年的发展，文字图像化的技术更加成熟。有了这项技术，或许真的能帮助汉语学习者更好地掌握每个汉字，在汉语教学领域大放异彩。

字不够用？得「造」！

更绝的是，Stable Diffusion还能造字。

在学习了1万个日文汉字后，Stable Diffusion模型开始为新事物创造「假汉字」，如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。

在这些字中，我们也发现了华点。

Stable Diffusion创造的「马里奥」和本尊相比，不能说毫不相干，只能说是一模一样（好家伙，纯象形字是吧）。

另外，AI模型造的「马斯克」一字也够霸气。称王还不够，直接超级加倍，变「王中王」。

相比之下，卷福和尼古拉斯·凯奇哭晕在厕所。

如果扩大输出图像的尺寸，模型还会整花活，生成一个比二维码还要复杂的「文字」。

密恐人士：6。

评论区有人说：「这不是西夏文吗？」

别说，还真有点像。这AI，知识学杂了。

在中日网友的眼中，这类技术可能只是为了整活。毕竟看惯了本国文字，就算看对方语言的汉字也会感到奇怪。

但对于身处另一套语言系统的人来说，看到一个个结构各异的图像，竟有如此丰富的内涵，或许更能感受到语言和文字的魅力。

巴别塔后，人类文字不通，无法交流；现代科技在克服语言壁垒的同时，又在建造一座新的「巴别塔」。这次，人类会成功吗？

参考资料：

https://twitter.com/hardmaru/status/1614119727416369152?s=46&t=BdjSSthlkb8_b_AWoh4BGw

https://www.reddit.com/r/StableDiffusion/comments/10b3r24/using_depth2image_to_create_images_to_aid/

猜您喜欢：

深入浅出stable diffusion：AI作画技术背后的潜在扩散模型论文解读

戳我，查看GAN的系列专辑~！

一顿午饭外卖，成为CV视觉的前沿弄潮儿！

最新最全100篇汇总！生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

ICCV 2021 | 35个主题GAN论文汇总

超110篇！CVPR 2021最全GAN论文梳理

超100篇！CVPR 2020最全GAN论文梳理

拆解组新的GAN：解耦表征MixNMatch

StarGAN第2版：多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云：独学而无友，则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群！

扫描下面二维码，添加运营小妹好友，拉你进群。发送申请时，请备注，格式为：研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

请备注格式：研究方向+地区+学校/公司+姓名

点击 一顿午饭外卖，成为CV视觉的前沿弄潮儿！，领取优惠券，加入 AI生成创作与计算机视觉 知识星球！

这篇关于汉字艺术生成！Stable Diffusion 的跨学科应用！的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

汉字艺术生成！Stable Diffusion 的跨学科应用！

【新智元导读】被中文折磨的歪果仁，开始用Stable Diffusion学习汉字！更绝的是，SD不仅精通汉字，还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏！

相关文章

Python如何自动生成环境依赖包requirements

SpringShell命令行之交互式Shell应用开发方式

SpringBoot应用中出现的Full GC问题的场景与解决

MySQL 分区与分库分表策略应用小结

Spring Shell 命令行实现交互式Shell应用开发

MySQL中动态生成SQL语句去掉所有字段的空格的操作方法

C语言函数递归实际应用举例详解

Java利用docx4j+Freemarker生成word文档

Java编译生成多个.class文件的原理和作用

使用Jackson进行JSON生成与解析的新手指南