本文主要是介绍汉字艺术生成!Stable Diffusion 的跨学科应用!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
本文来源 新智元 编辑:昕朋
【新智元导读】被中文折磨的歪果仁,开始用Stable Diffusion学习汉字!更绝的是,SD不仅精通汉字,还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏!
学习外语,不是件容易事。
当然,这份苦,不只有中国人吃。
在Reddit上,有一个「r/ChineseLanguage」的话题,里头专门发一些外国人学中文遇到的问题的吐槽。
对大部分学习中文的外国人来说,汉字永远是个跨不过去的坎。
没有正确的学习方法,学习者很难记住成百上千个结构各异的汉字。
不过没关系,Stable Diffusion会出手。
字不认识?看「图」!
在Reddit的Stable Diffusion频道,网友分享了文字生成模型Depth2Image。
代码链接:https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt
该模型使用Stable Diffusion的技术,可以将汉字图像转变为它所代表的含义。
例如,用火腿组成的「肉」字,
以及用绳子组成的「绳」字。
博主分享了图像的生成方式,在模型中输入需要呈现的材质照片,Depth2Image就会生成该材质对应的中文汉字。
此贴一出便引来广泛讨论。网友在热情分享自己创作的文字同时,也激动地表示:这在教育领域的应用未来可期!
其实在两年前,已经有人从事文字图像化的研究。推特网友@azlenelza就利用助神经网络,通过生成视觉助记符的方式将汉字图形化,表示各自的含义。
Azlen表示,这种方式会让各个汉字的意义和形状之间建立更多的联系,从而使每个汉字更容易记住。
可以发现,当时AI生成的图像更属于艺术字的范畴。例如右下角的图像,小编看了好久才认出是「制」字。
经过两年的发展,文字图像化的技术更加成熟。有了这项技术,或许真的能帮助汉语学习者更好地掌握每个汉字,在汉语教学领域大放异彩。
字不够用?得「造」!
更绝的是,Stable Diffusion还能造字。
在学习了1万个日文汉字后,Stable Diffusion模型开始为新事物创造「假汉字」,如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。
在这些字中,我们也发现了华点。
Stable Diffusion创造的「马里奥」和本尊相比,不能说毫不相干,只能说是一模一样(好家伙,纯象形字是吧)。
另外,AI模型造的「马斯克」一字也够霸气。称王还不够,直接超级加倍,变「王中王」。
相比之下,卷福和尼古拉斯·凯奇哭晕在厕所。
如果扩大输出图像的尺寸,模型还会整花活,生成一个比二维码还要复杂的「文字」。
密恐人士:6。
评论区有人说:「这不是西夏文吗?」
别说,还真有点像。这AI,知识学杂了。
在中日网友的眼中,这类技术可能只是为了整活。毕竟看惯了本国文字,就算看对方语言的汉字也会感到奇怪。
但对于身处另一套语言系统的人来说,看到一个个结构各异的图像,竟有如此丰富的内涵,或许更能感受到语言和文字的魅力。
巴别塔后,人类文字不通,无法交流;现代科技在克服语言壁垒的同时,又在建造一座新的「巴别塔」。这次,人类会成功吗?
参考资料:
https://twitter.com/hardmaru/status/1614119727416369152?s=46&t=BdjSSthlkb8_b_AWoh4BGw
https://www.reddit.com/r/StableDiffusion/comments/10b3r24/using_depth2image_to_create_images_to_aid/
猜您喜欢:
深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读
戳我,查看GAN的系列专辑~!
一顿午饭外卖,成为CV视觉的前沿弄潮儿!
最新最全100篇汇总!生成扩散模型Diffusion Models
ECCV2022 | 生成对抗网络GAN部分论文汇总
CVPR 2022 | 25+方向、最新50篇GAN论文
ICCV 2021 | 35个主题GAN论文汇总
超110篇!CVPR 2021最全GAN论文梳理
超100篇!CVPR 2020最全GAN论文梳理
拆解组新的GAN:解耦表征MixNMatch
StarGAN第2版:多域多样性图像生成
附下载 | 《可解释的机器学习》中文版
附下载 |《TensorFlow 2.0 深度学习算法实战》
附下载 |《计算机视觉中的数学方法》分享
《基于深度学习的表面缺陷检测方法综述》
《零样本图像分类综述: 十年进展》
《基于深度神经网络的少样本学习综述》
《礼记·学记》有云:独学而无友,则孤陋而寡闻
欢迎加入 GAN/扩散模型 —交流微信群 !
扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖
请备注格式:研究方向+地区+学校/公司+姓名
点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!
这篇关于汉字艺术生成!Stable Diffusion 的跨学科应用!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!