汉字艺术生成!Stable Diffusion 的跨学科应用!

2024-01-31 08:20

本文主要是介绍汉字艺术生成!Stable Diffusion 的跨学科应用!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本文来源  新智元  编辑:昕朋

【新智元导读】被中文折磨的歪果仁,开始用Stable Diffusion学习汉字!更绝的是,SD不仅精通汉字,还能当场造字。皮卡丘、iPhone、深度学习统统被拿捏!

学习外语,不是件容易事。

当然,这份苦,不只有中国人吃。

在Reddit上,有一个「r/ChineseLanguage」的话题,里头专门发一些外国人学中文遇到的问题的吐槽。

f253a383513bf8c961ceedd032bca0cd.jpeg

对大部分学习中文的外国人来说,汉字永远是个跨不过去的坎。

没有正确的学习方法,学习者很难记住成百上千个结构各异的汉字。

不过没关系,Stable Diffusion会出手。

字不认识?看「图」!

在Reddit的Stable Diffusion频道,网友分享了文字生成模型Depth2Image。

6d252139930272b245d2e4c51c699881.png

代码链接:https://huggingface.co/stabilityai/stable-diffusion-2-depth/blob/main/512-depth-ema.ckpt

该模型使用Stable Diffusion的技术,可以将汉字图像转变为它所代表的含义。

例如,用火腿组成的「肉」字,

436352b348c911c94cafbae018ecb1fc.jpeg

以及用绳子组成的「绳」字。

5c39fabb095436f08a313227bcdf7b06.png

博主分享了图像的生成方式,在模型中输入需要呈现的材质照片,Depth2Image就会生成该材质对应的中文汉字。

4b1077c5ee549e5435278dd891803f1a.png

此贴一出便引来广泛讨论。网友在热情分享自己创作的文字同时,也激动地表示:这在教育领域的应用未来可期!

其实在两年前,已经有人从事文字图像化的研究。推特网友@azlenelza就利用助神经网络,通过生成视觉助记符的方式将汉字图形化,表示各自的含义。

Azlen表示,这种方式会让各个汉字的意义和形状之间建立更多的联系,从而使每个汉字更容易记住。

4cd6d6caaa17a7e5e12ddacd6a16cd00.jpeg

可以发现,当时AI生成的图像更属于艺术字的范畴。例如右下角的图像,小编看了好久才认出是「制」字。

经过两年的发展,文字图像化的技术更加成熟。有了这项技术,或许真的能帮助汉语学习者更好地掌握每个汉字,在汉语教学领域大放异彩。

字不够用?得「造」!

更绝的是,Stable Diffusion还能造字。

在学习了1万个日文汉字后,Stable Diffusion模型开始为新事物创造「假汉字」,如马里奥、皮卡丘、马斯克、深度学习、YouTube、高达、奇点等。

ea94f731303e8e2c33f72dc4c30edf2c.jpeg

在这些字中,我们也发现了华点。

99a68f70eefc0b0abaf1de99bae61737.jpeg

Stable Diffusion创造的「马里奥」和本尊相比,不能说毫不相干,只能说是一模一样(好家伙,纯象形字是吧)。

另外,AI模型造的「马斯克」一字也够霸气。称王还不够,直接超级加倍,变「王中王」。

28bd47e41df91e2884156d24c825bea6.jpeg

相比之下,卷福和尼古拉斯·凯奇哭晕在厕所。

61e81754d3671399c8960ac040dced11.png

如果扩大输出图像的尺寸,模型还会整花活,生成一个比二维码还要复杂的「文字」。

8186ff438d623498899c10185d313a12.jpeg

密恐人士:6。

评论区有人说:「这不是西夏文吗?」

34b9d019704e2be4c84cd370f0c4c58a.jpeg

别说,还真有点像。这AI,知识学杂了。

86ca3663658ca15224a6e1613fe2fc15.jpeg

在中日网友的眼中,这类技术可能只是为了整活。毕竟看惯了本国文字,就算看对方语言的汉字也会感到奇怪。

但对于身处另一套语言系统的人来说,看到一个个结构各异的图像,竟有如此丰富的内涵,或许更能感受到语言和文字的魅力。

巴别塔后,人类文字不通,无法交流;现代科技在克服语言壁垒的同时,又在建造一座新的「巴别塔」。这次,人类会成功吗?

参考资料:

https://twitter.com/hardmaru/status/1614119727416369152?s=46&t=BdjSSthlkb8_b_AWoh4BGw

https://www.reddit.com/r/StableDiffusion/comments/10b3r24/using_depth2image_to_create_images_to_aid/

猜您喜欢:

深入浅出stable diffusion:AI作画技术背后的潜在扩散模型论文解读

26d09d55cf29d703c2e1f9d5a644bbd3.png 戳我,查看GAN的系列专辑~!

一顿午饭外卖,成为CV视觉的前沿弄潮儿!

最新最全100篇汇总!生成扩散模型Diffusion Models

ECCV2022 | 生成对抗网络GAN部分论文汇总

CVPR 2022 | 25+方向、最新50篇GAN论文

 ICCV 2021 | 35个主题GAN论文汇总

超110篇!CVPR 2021最全GAN论文梳理

超100篇!CVPR 2020最全GAN论文梳理

拆解组新的GAN:解耦表征MixNMatch

StarGAN第2版:多域多样性图像生成

附下载 | 《可解释的机器学习》中文版

附下载 |《TensorFlow 2.0 深度学习算法实战》

附下载 |《计算机视觉中的数学方法》分享

《基于深度学习的表面缺陷检测方法综述》

《零样本图像分类综述: 十年进展》

《基于深度神经网络的少样本学习综述》

《礼记·学记》有云:独学而无友,则孤陋而寡闻

欢迎加入 GAN/扩散模型 —交流微信群 !

扫描下面二维码,添加运营小妹好友,拉你进群。发送申请时,请备注,格式为:研究方向+地区+学校/公司+姓名。如 扩散模型+北京+北航+吴彦祖

85c9639c21f12872b6fb5cef1c7d92f4.jpeg

请备注格式:研究方向+地区+学校/公司+姓名

点击 一顿午饭外卖,成为CV视觉的前沿弄潮儿!,领取优惠券,加入 AI生成创作与计算机视觉 知识星球!

这篇关于汉字艺术生成!Stable Diffusion 的跨学科应用!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/663123

相关文章

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#

pdfmake生成pdf的使用

实际项目中有时会有根据填写的表单数据或者其他格式的数据,将数据自动填充到pdf文件中根据固定模板生成pdf文件的需求 文章目录 利用pdfmake生成pdf文件1.下载安装pdfmake第三方包2.封装生成pdf文件的共用配置3.生成pdf文件的文件模板内容4.调用方法生成pdf 利用pdfmake生成pdf文件 1.下载安装pdfmake第三方包 npm i pdfma

poj 1258 Agri-Net(最小生成树模板代码)

感觉用这题来当模板更适合。 题意就是给你邻接矩阵求最小生成树啦。~ prim代码:效率很高。172k...0ms。 #include<stdio.h>#include<algorithm>using namespace std;const int MaxN = 101;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int n

poj 1287 Networking(prim or kruscal最小生成树)

题意给你点与点间距离,求最小生成树。 注意点是,两点之间可能有不同的路,输入的时候选择最小的,和之前有道最短路WA的题目类似。 prim代码: #include<stdio.h>const int MaxN = 51;const int INF = 0x3f3f3f3f;int g[MaxN][MaxN];int P;int prim(){bool vis[MaxN];

poj 2349 Arctic Network uva 10369(prim or kruscal最小生成树)

题目很麻烦,因为不熟悉最小生成树的算法调试了好久。 感觉网上的题目解释都没说得很清楚,不适合新手。自己写一个。 题意:给你点的坐标,然后两点间可以有两种方式来通信:第一种是卫星通信,第二种是无线电通信。 卫星通信:任何两个有卫星频道的点间都可以直接建立连接,与点间的距离无关; 无线电通信:两个点之间的距离不能超过D,无线电收发器的功率越大,D越大,越昂贵。 计算无线电收发器D