关于大模型和AIGC的36条笔记和真话

2024-09-08 02:36
文章标签 36 笔记 模型 aigc 真话

本文主要是介绍关于大模型和AIGC的36条笔记和真话,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

img

行业到底有多卷?

最新统计,中国已有130多个大模型问世,在网信办备案的算法模型也超过70多家。BAT等互联网巨头悉数下场发布AI大模型,仅2023年就有超60家创业公司拿到融资,产品更是布满了基础层、模型层和应用层。新一代生成式AI,可能要回头看看上一代AI趟过的坑,不要行业自嗨,避免上一个冬天的轮回。在这个领域的从业者,更要清晰地看到行业的内卷和客户的痛点,别被大佬的鸡汤迷了眼。

1、现在有客户找到我们,说有20个场景,一个场景X万块?然后挨家询价,华为做不做?阿里做不做?百度做不做?要这么卷下去,最后都没有钱赚。

2、大家融到的钱,80%-90%给到了算力,这是现状。要知道,现在还只是训练,训练的成本是可控的,推理的成本是不可控的。

3、我们GPU有30000块,算力6000p,年底争取算力超12000p。数据方面,每个月有2万亿token清洗和标注完,年底会有10万亿的token。

4、目前看,行业还是缺少一些颠覆式的杀手级的应用,从而难以实现商业化的变现。

5、怎么能够在成本和效果之间,找到一个平衡点,这是比较难的地方。都用大模型,成本太高了。

6、再过一段时间,大家要比拼的是基础设施的优化能力。比如,网络优化能力,别人断时你不断,就能比别人多训练几次。

7、在算力紧张的情况下,我们在做一些前瞻性的技术尝试。大家可能都想不到,在我们大模型公司,做基础架构的同学,比做模型的同学要多。他们普遍的价格都还挺贵,也很难招。

8、大模型现在很尴尬,自身卖不上价格,最后都是卖云卖卡卖算力的赚钱了。

9、刚开始觉得模型还挺值钱的,现在又陷入到内卷了。前段时间碰到一个客户,BAT等都报价了。刚开始报价,还挺贵,1000多万。大家知道最后的成单价是多少?太卷了。

10、百亿参数的大模型,在某些特殊客户的认知里面,就是免费的。

来自一线的声音

人工智能领域的企业,耳根子应该时刻记得毛主席说的话,“从实践中来到实践中去”。脱下长袍马褂,走到田间地头,在客户身边才能得到最真实地反馈。现在AI领域的伪专家太多了,不如多听听来自一线的声音。

11、我们大概聊了150个客户。对于大模型本身的需求主要分为两类。一类是大模型本身文字上的需求,客户对大语言模型的要求是100%准确。另一种,是AI agent,函数调用、代码显示器、调用第三方工具。

12、我们在合作过程中,出现了一个冲突矛盾。客户会觉得,在内部决定部署之前,是不能把数据拿出来给你的。但如果没有这个数据,我们又怎么能训练出适合客户需求的模型呢?

13、我们在做项目的时候发现,用户是不愿意为大模型去买单的,他还是为你的应用去买单。有的客户会直接问,有了大模型,以前的一些智能中台、知识图谱就不需要了吗?最后发现,场景才是最核心的。

14、我们要找到一些性感的场景。有几个标准。第一,小切口。第二,跟大模型的优势相匹配。第三,让买单的决策用户有强感知。比如以前获取一些数据、结论或者服务,需要不同的流程,现在通过大模型,决策者在移动设备就能快速获取和完成。

15、大模型想做成功需要三件事:1)能不能拿到足够多的钱去买算力。2)能不能拿到足够多的数据。3)人才密度是不是够厚,不在数量多,而是有没有足够多的高质量的科学家。

16、现在我们遇到三类客户。一类是焦虑的客户,比如金融的客户因为竞对都在搞,于是也想搞,但他并不清楚自己的需求是什么?一类是希望降本的客户,客户的管理层认为,这主要是降本节流的问题,但模型到底节流了多少,不好评判具体的价值。最后一类是希望部署模型开源赚钱的客户,他是靠这个模型来创收的,这类客户付费是最爽快的。

ToC 还是 ToB?

据了解,GPT-4训练一次的成本约为6300万美元,需要1.8万亿巨量参数。中国目前发布的一些大模型,ToC方向还是互联网的免费模式。但从业者都清楚,大模型的开发和运行都需要消耗大量的成本,从而ToB的商业模式更容易良性运转。在商业化探索上,ToB还是ToC,一直是行业关注的问题。在闭门会中,我们反复听到了两个关键词:1)基因 2)越界。“你无法成为你所不是的”。

17、我们认为机会还是在tob垂直模型,核心点在数据和场景本身,这是最核心的。

18、我们自己也在思考,人工智能如何跟互联网、数字化等结合起来,怎么更好地将原来的场景做得更智能。

19、ToC还是ToB,坦率讲这跟大家的基因有关。我们做不到,不代表别人做不到。比如一些ToC的应用,都是一些00后10后的小朋友在玩,超出了我们年龄的认知。

20、Toc和Tob还是很不一样的。ToC对容错率相对较高。TOB则相反。举个例子,智能问答。准确率如何保证?像政府,都是有红线的。如何避免模型的幻觉,目前大家都在做相应的探索。

21、我们反而认为ToC赚钱比较容易。ToB有个问题,一个项目的历程时间比较长。客户批预算,再到立项,再到实施,钱的周期是很长的。

22、我觉得现在是机会太多,不要把资源分到你所不是的地方,做战略选择,这个很重要。

ToB 和 ToG 也很苦

23、B端最大的bug在于,最后做成了高级的人力外包。

24、所有的项目都是有周期的,所有的付款也是根据周期的节点来走的。不可能我无限制地帮你训练和优化一个模型。

25、AIGC创作这种,包容性比较强,可以有些错误。但到一些企业生产制造,对准确性的要求就很高了。往往我们从模型中挑一两个比较好case是比较容易的,但要它维持在较高的水平里面,没有比较差的case,这个还是蛮难的。

26、我们在一个经济发达的省份去做智能数字化政府项目的时候,我们推了超过5个场景,最后客户就认可了3个场景。接着,就对安全、对数据、对底层刨根问底。接着还会问,你们跟其他大模型的差异和优势是什么?最后,多方要坐下来,出一个评测体系。评测体系过了还要评性能。

用项目孵化产品和方案

27、用项目孵化产品,做完几个项目后,抽离出相应的技术方案。这套方案,大概率不是一个模型,而是大模型+小模型,最后是多个模型形成的综合解决方案。

28、最近一两年,可能是做创新、做产品的过程,现金的回收周期会相对长一些。

Agent

想象一下人工智能模仿人类的日常任务来处理大量人类的复杂社会行为。斯坦福大学的一篇名为《Generative Agents: Interactive Simulacra of Human Behavior,titled》的论文深入研究了记忆、反应和计划的AI Agent。AI Agent 被认为是OpenAI 发力的下一个方向。OpenAI 联合创始人在近期的活动上也说:“相比模型训练方法,OpenAI内部目前更关注Agent领域的变化,每当有新的AI Agents 论文出来的时候,内部都会很兴奋并且认真地讨论 ”。

29、我们总会把大模型想象成万能的,它能解决各种各样的问题?事实是这样的么?大模型只是大模型。

30、我们内部管AI,叫隐形的AI。在用户面前,我们不会强调是什么模型,参数有多少。我们对AI的定义,就是人的辅助。

31、绕开模型,绕开算力,可能接下来的机会就是Agent。

32、目前影响客户使用的最大的问题:投入产出比。一旦跟客户聊到最后,谈到项目预算的时候,如果只是纯文字相关,投入大几百万小几百万,客户就不太满意。另外,如果大模型使用AI agent 嵌入到实际的生产环境中,解决实际的问题,客户会非常愿意买单。

33、在大模型基础上,AI Agent具备记忆、规划和执行等能力,能力加强。我们这期投了60多个初创项目,其中20多个都是Agent。

34、中国和国外,ToC的产品,付费形态和产品形态,差别也特别大。近期,我们投了一些Agent的公司。

35、但是,现阶段AI Agent只是处于新的尝试阶段,距离通用智能还有一定差距。未来还需要解决单个AI Agent综合能力之外,多个AI Agent之间协作及情感(Emotion)等方面能力表现的突破。

36、大模型玩家,要保证自己能留在牌桌上,才有机会看到下半场新的东西出来。

人工智能\大模型入门学习大礼包》,可以关注工棕耗:AI技术星球
回🎀复:11即🉑️精准或取❕!

这篇关于关于大模型和AIGC的36条笔记和真话的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1146869

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU