出门问问把AIGC看得很透彻

2024-03-22 19:30
文章标签 aigc 透彻 问问 出门 看得

本文主要是介绍出门问问把AIGC看得很透彻,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

640?wx_fmt=jpeg&wxfrom=13&tp=wxpic

 (图片来源:Pixabay)

640?wx_fmt=jpeg&wxfrom=13&wx_lazy=1&wx_co=1&tp=wxpic

李志飞将AIGC看得很透,他可能是行业里“最不着急”的人。

640?wx_fmt=jpeg&wxfrom=13&wx_lazy=1&wx_co=1&tp=wxpic

 

@数科星球原创

作者丨苑晶

编辑丨大兔

 

“几乎每一个行业,从业者都是国外的2倍,利润又是同行的1/5,让中国的创业难度提升了10倍”。李志飞的这句话适用于广大行业,也可看成AIGC行业所面临的现状。

在2023年,AIGC行业开局即炸裂。“被离职”、泛互联网从业者及创业者扎根其中,保守估计已逾百万之众。热闹中裹挟着焦虑,熙熙攘攘的人群中到处可听见“chat、chat”。

第二季度,国内企业动作频出,百度、360、阿里、商汤相继发布自研大模型,创业圈也热情不减,王慧文、李开复、贾扬清、王小川相继下场宣布入局大模型,当大家的关注点都聚焦在5000万美元能买多少张卡,可以支持几次训练的时候,李志飞和出门问问却走出了另外一条路。自研大模型+AIGC产品矩阵,底层技术和应用落地并行是这家公司的特色,他可能是这个行业“最不着急”的人。

01

什么是大模型

在李志飞看来,大模型本质上是序列模型。

以GPT为代表的大模型起源于文本,⽂本是简单线性序列,从这个角度看,大模型本质上是一个序列模型。

他认为,序列本身是很通用的,语言是一种序列,天气温度、股票价格也是序列。任何一个序列都有所谓的Prefix(前缀)、中缀(Infix)和 Suffix(后缀),这些元素构成短语后就能形成具有递归能力的层次式表示,就像语言的语法树一样。大模型现在已经学会快速表达序列,这一能力是以前的AI在机器翻译、语音识别等序列任务里都不具备的。而且语言序列只是一种非常简单的序列,因为它是线性的。

这似乎并不难理解,在数科星球(ID:digital-planet)多方印证下,找到了序列模型的一些解释:(GPT、BERT等)之所以被称为序列模型,是因为它们是在序列数据上进行预训练的。在自然语言处理领域,大模型的输入通常是一句话或一篇文章,这些输入可以被看作是一个序列。因此,在训练这些模型时,它们通常会以序列方式处理输入,并使用一系列技术来建立记忆和理解上下文之间的关系,以提供更好的预测能力。

在数科星球(ID:digital-planet)的研究中发现,如今,序列模型在业界已被广泛采用。例如,Google的BERT模型可以通过在大量文本数据上进行预训练,理解单词和短语之间的关系,从而实现对复杂自然语言处理任务的卓越表现。同样,OpenAI的GPT-3模型是基于序列到序列的转换模型,以多种方式训练,使用Transformer架构来学习计算机生成的文本与真实的人类生成的文本之间的关系。

值得注意的是,大模型较之以往AI产品的好处是显而易见的。以往,问题在通过AI生成结果之前,需要定义语义模板,而这通常是指一种用于描述和表示语言语义信息的结构化模板。这些模板描述了一些常见的语言结构和句式,在生成文本时可以根据这些模板来指引生成过程。但缺点是,当问题发生变化,AI的程序也需变化,这让模型本身变得“不那么通用”。

“而大模型训练过程中并不会预设问题,只在最后Fine Tuning阶段给模型一些范例数据(而非按照格式去标注数据),然后就可以直接提问模型并得出答案。”这意味着,大模型产品不需要特意标注数据和重新训练系统,在通用性角度上,是一种极大的进步。

02

参数不是越多越好

随着ChatGPT在全球越来越火爆,大模型的基本原理已逐渐被世人熟知。在一个个大模型推向市场的同时,数科星球(ID:digital-planet)看到,大模型的参数量变成了人们关注的焦点。对此,人工智能科班出身的李志飞认为,大模型不只是”大“。

他提到,参数量超千亿的语言模型并非近年才发展起来,早在2007年,Google Translate的语言模型就已在2万亿文本token里进行学习,并达到3000亿参数。但那时的大模型都是基于文本里的n-grams构建,只是对互联网文本的表层建模,至多只能往前看六个词,主要用于在翻译过程中判断哪些句子更加符合目标语言习惯,并不具备泛化任务的能力。

所以大模型不只是「大」,更多是需要对互联网文本深度地建模。

在数科星球(ID:digital-planet)对话相关业内人士后,也得出了相似结论:即大模型并不是参数越多越好——大模型确实需要参数到达一定的量级才会出现“涌现“能力,增加参数量也的确可以提升模型表现,但也会带来以下一些潜在问题:

训练时间和计算资源:参数越多,训练模型所需的时间和计算资源就越多。这可能导致开发周期变长,并需要更强大的硬件设备才能支持。

过拟合:较多参数的大模型可能面临过拟合问题。当一个模型具有太多参数时,它可能过于复杂,以至于对训练数据捕捉过多细节,而无法很好地泛化到新的、未见过的数据。

优化挑战:参数较多的模型在寻找最优解时具有更大的搜索空间,从而使优化过程更为复杂和困难。

易用性和部署:大模型可能导致较大的存储和内存需求,这可能影响模型的易用性和部署。在资源受限的设备上(如移动设备),部署大模型可能存在挑战。

因此,在设计和选择模型时,应该根据任务需求和资源限制来平衡模型的大小和复杂度。在实际应用中,往往需要找到模型大小和性能之间的最佳平衡点。有时候,使用更小的模型加上合适的正则化方法、数据增强等技术,也能达到不错的效果。

03

关键在于把如何大模型用起来

4月20日,出门问问在2023AIGC战略发布会上内测自研大模型“序列猴子”,展示了其在知识储备、多步推理等方面的能力,李志飞本人甚至做了一场“人机交互”的live demo。

此外,出门问问还推出了四款AIGC产品形成产品矩阵,分别为AI写作平台“奇妙文”、AI绘画平台“言之画”、AI配音平台“魔音工坊”、数字人视频与直播平台“奇妙元”,涵盖了剧本生成、解说讲稿、文本工具、创意想法、视频制作和制图配图等多个使用场景。

自2012年成立,出门问问这家公司在语音识别、TTS和NLP等领域均有尝试。2020年6月,GPT-3出现之后其强大的通用能力让人李志飞非常震撼,一个单一的模型便可以完成多种特定任务,甚至能够完成从来没有接触过的任务。惊艳于GPT-3的表现,出门问问开始探索中国GPT-3之路,并于2021年发布大模型「UCLAI」,但由于其商业化落地过于艰难,出门问问便停止了对大模型的投入。

随后的一年多时间里,出门问问开始布局生成式AI,做出了一系列AIGC产品,如「魔音工坊」和「奇妙元」。同时在美国,以Jasper为代表的AIGC产品迎来爆发式发展,成为GPT落地应用的最佳场景之一。

2022年10月,出门问问重启大模型业务。历经6个月,出门问问在发布会中连发4款AIGC产品,涵盖剧本生成、解说讲稿、文本工具、创意想法、视频制作和制图配图等多个使用场景形成覆盖创作者全流程的生成式产品矩阵。

厚积薄发之下,大模型技术以及AIGC落地场景和产品应用的积累彻底打通了出门问问的“任督二脉”,让产品-数据和用户之间形成了飞轮效应。

客观地说,出门问问的模式可以成为大模型和AIGC企业的成长样板,在可预期的未来,AIGC产品之间也将在进一步提升语义语境理解、垂直模型和个性化之间展开。在数科星球(ID:digital-planet)看来这场技术革命才刚刚开始,远没到终局之时。

不过面对OpenAI引发的这场技术浪潮,相比于年初的满腔热血,李志飞理性了很多。

“跟ChatGPT差距是16个月 ”是李志飞对国内大模型技术水平的判断,他认为,目前国内各家大模型的平均水平大概处于谷歌FLAN阶段(FLAN开启了大模型的指令学习Instruction Tuning范式),

做大模型不能太着急,它是个长期主义的事情。

如今,在琳琅满目的AIGC类产品推向市场的同时,数科星球(ID:digital-planet)认为,创业企业在构建技术底座的同时,还应该明确落地场景和商业模式。毕竟目前,国内外差距展现出来的只是技术问题,而中国拥有全球难以企及的应用优势。技术和商业并行,两条腿走路或许是最适合国内大模型企业的发展路线,就像李志飞所说,发展大模型的关键在于把如何大模型用起来。

结尾:在对话多家AIGC企业后,数科星球(ID:digital-planet)觉得,李志飞和出门问问可能是行业中“最不着急”的人。他本人对AIGC的态度是长期看好,但并不焦虑。

现在,AIGC的子弹飞翔两个多月,并搅得行业“天下大乱”。在未来,数科星球(ID:digital-planet)希望看到更多更扎实、更能沉得住气的企业加入AIGC大潮。有理由相信,倘若再给行业多些时间,那么将会有更多的企业给大众带来更多惊喜。

这篇关于出门问问把AIGC看得很透彻的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/836051

相关文章

[AIGC] Guava Library 中常用的一些工具类详解

Google Guava 是一个功能强大的 Java 库,它提供了大量用于优化代码和提高代码质量的工具。该库提供了许多常用的实用类,下面我们来详细介绍一些在编程应用开发中经常需要的。 文章目录 1. 集合类2. I/O 类1. ByteStreams(字节流)2. CharStreams(字符流)3. Files(文件)4. MoreFiles(文件)5. Resources(资

AIGC-Animate Anyone阿里的图像到视频 角色合成的框架-论文解读

Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation 论文:https://arxiv.org/pdf/2311.17117 网页:https://humanaigc.github.io/animate-anyone/ MOTIVATION 角色动画的

AIGC时代算法工程师的面试秘籍(2024.5.13-5.26第十四式) |【三年面试五年模拟】

写在前面 【三年面试五年模拟】旨在整理&挖掘AI算法工程师在实习/校招/社招时所需的干货知识点与面试方法,力求让读者在获得心仪offer的同时,增强技术基本面。也欢迎大家提出宝贵的优化建议,一起交流学习💪 欢迎大家关注Rocky的公众号:WeThinkIn 欢迎大家关注Rocky的知乎:Rocky Ding AIGC算法工程师面试面经秘籍分享:WeThinkIn/Interview-

【AIGC半月报】AIGC大模型启元:2024.06(下)

AIGC大模型启元:2024.06(下) (1) Gen-3(2) Open-Sora(Open-Sora再升级)(3) Claude 3.5 Sonnet(Claude升级)(4) ChatTTS v3(ChatTTS升级)(5) 盘古大模型5.0 (1) Gen-3 2024.06.18 自从OpenAI公布了Sora,视频生成领域正式按下了行业加速键,许多国内外企业纷纷发

aigc基础概念(一)

目录 一、AI 1.1、基本术语 1、Artificial Intelligence (AI) —— 人工智能 2、Generative AI —— 生成性人工智能 3、Machine Learning (ML) —— 机器学习 4、Deep Learning (DL) —— 深度学习 5、Large Language Model (LLM) —— 大型语言模型 6、Trans

游戏工厂:AI(AIGC/ChatGPT)与流程式游戏开发

游戏工厂:AI(AIGC/ChatGPT)与流程式游戏开发 码客 卢益贵 ygluu 关键词:AI(AIGC、ChatGPT、文心一言)、流程式管理、好莱坞电影流程、电影工厂、游戏工厂、游戏开发流程、游戏架构、模块化开发 一、前言 开发周期长、人工成本高、成功率低等使得游戏公司融资比较困难。有的公司凭一个爆款游戏一骑绝尘之后再无亮点新作,有的公司经过漫长开发没等到游戏上线公司就挂了,有的公

AIGC时代的英语教育:人工智能会取代英语老师吗?

在当前AIGC(Artificial Intelligence Generated Content)时代,人工智能技术正在迅速发展并渗透到各个领域,其中包括英语教育。面对这一趋势,许多人担心人工智能会取代传统的英语教师。然而,本文将探讨人工智能在英语教育中的作用,以及如何利用这一技术提升英语教师的职业发展。 人工智能是否会取代英语教师? 首先,我们需要明确人工智能的优势和局限性。当前的AI工具

[AIGC] 宽度优先搜索(BFS) 讲解以及在 LeetCode 题中的应用

宽度优先搜索(Breadth-First Search,简称 BFS)是一种用于图或树结构的遍历算法。它以广度方向进行搜索,首先访问根节点,然后访问所有相邻的节点,然后再通过它们的邻居一直进行下去,直到所有的节点都被访问过。 文章目录 BFS 的工作过程BFS 在 LeetCode 中的应用 BFS 的工作过程 BFS 从图的某一节点(称为“源”节点)开始,访问可能

AIGC-CVPR2024best paper-Rich Human Feedback for Text-to-Image Generation-论文精读

Rich Human Feedback for Text-to-Image Generation斩获CVPR2024最佳论文!受大模型中的RLHF技术启发,团队用人类反馈来改进Stable Diffusion等文生图模型。这项研究来自UCSD、谷歌等。 在本文中,作者通过标记不可信或与文本不对齐的图像区域,以及注释文本提示中的哪些单词在图像上被歪曲或丢失来丰富反馈信号。 在 18K 生成图像 (R

[AIGC] 使用Google的Guava库中的Lists工具类:常见用法详解

在Java程序设计中,集合是我们最常用的数据结构之一。为了方便我们操作集合,Google的Guava库提供了一个名为Lists的工具类,它封装了许多用于操作List对象的实用方法。在本文中,我们将详细介绍其常见的用法,以帮助您更好地理解和运用此工具类。 文章目录 1. `Lists.newArrayList()`2. `Lists.partition(List list, i