AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫

2024-03-07 23:12

本文主要是介绍AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

过去一年,我对 AI 应用的看法经历了这样一个过程:质疑汤姆猫,理解汤姆猫,成为汤姆猫,超越汤姆猫。

什么是汤姆猫?汤姆猫是 2010 年移动互联网早期的一款应用,迅速走红,又淡出视野。这是一个比喻,指代那些很好玩,一度成为现象级,但没有长期留存的产品。拍出海马体的妙鸭相机,让郭德纲说英文相声的 Heygen,都有点 AI 时代汤姆猫的意思。

坦率讲,最开始我是质疑汤姆猫的,这类产品一度热闹,但玩法单一,没有长期留存率,很难持续。在写的《今天的AI创业,与移动互联网时代的区别在哪里?》中,有一段对汤姆猫的讨论:

一个平台从 1 岁走到黄金年龄,会经历很多真伪机会。回头看移动互联网的早期,有四类机会都曾霸榜。

……

第二类机会叫「汤姆猫」,是小机会。汤姆猫很巧妙的用到了手机的麦克风,你说什么话,它就会用猫的语气来复述。当时日下载量到了百万级别,但没有长期留存率,因为玩法单一,和猫对话几天后就没有新鲜感了。后来汤姆猫被中国的一家上市公司收购了,作价 70 亿人民币。

今天在 AI 的早期阶段,摆在我们眼前的依然是这四类机会,我们需要想清楚,谁是 AI 时代的手电筒,谁是 AI 时代的抖音快手。基于大模型的套壳应用是新时代的手电筒,很短的时间就会被大模型的能力击穿;基于 AI 做出的一些原生小爆款应用,如果玩法过于单一,无法形成自己的资产,很可能成为新时代的汤姆猫;

后来为什么理解汤姆猫了?因为更理解大模型的能力边界,和当下所处的阶段了。

01

理解汤姆猫,

是因为理解了当下大模型的能力边界

图片

大模型的发展规律和互联网有很大差异,更应该参照芯片行业的发展规律。

50 年代,仙童发明了半导体后,随着芯片能力的提升,先后出现了计算器、PC、游戏机、移动手机、MP3、智能手机这些国民级的电子产品,这背后是摩尔定律的推动,「处理器的性能每两年翻一倍,价格下降为之前的一半」。

这些电子产品横跨几十年,依次解锁,半导体刚出来的时候,它的能力只能用来做计算器,随着计算能力的提升,才能造出 PC。

OpenAI 推出 ChatGPT 只有一年多时间,基于大模型的应用的出现也是有先后顺序的,在要出计算器、随身听的时候,不要硬造 PC;在要出汤姆猫的时候,不要硬造抖音,造不出来。历史无法跳跃,只能经历。

Scaling Law 会成为 AI 时代的摩尔定律,堆算力,堆参数。随着模型能力的提升,基于大模型不是造应用,而是造虚拟人,起初是本科生,之后是白领,之后是某些领域的专家比如医生、律师,后面会造出科学家,最终极的形态是 AGI,随着模型智能程度的提升,这些虚拟人会依次解锁。

以造人的标准来看待当下大模型的能力,就知道需要多少智能,和中间的差距了。

而现在我们常说的「AIGC 应用」,可能只是 AI 发展史上的过渡阶段,是因为当下的模型还造不出虚拟人,所以先造辅助软件。

02

成为前千分之一的汤姆猫,

完成能力蜕变

理解汤姆猫后,我认为应该尽快「成为汤姆猫」,且做前千分之一的汤姆猫。

这缘于我的一个观察。

和很多投过的早期项目相处后,我发现创始人的能力不是线性增长,而是跳变的,忽然之间上了很大一个台阶,可能就一个月时间,隔壁老王已经不是我认识的老王,我得管他叫王哥了。

发生跳变的时间点往往和 PMF 跑通有关系,跑通后,整个人的思考水平、决策的犀利程度、心态的平稳度都有一个质变,再之后,就和业务量爬到几层楼相关了,月收入 1000 万、月收入 1 亿、月收入 10 亿是完全不同的思考水平,爬楼的中间,会有很多正负反馈,往往深刻又惨痛,反馈越大,能力跳变越明显。这才有了士别三日当刮目相看的感觉。

这让我明白了一个朴素的道理,产品是创始人的实验室,首先要跑通 PMF,让自己有个实验室,哪怕这个实验室小了点

然后要寻找更大的实验室,基于 10 万日活和 1 亿日活能做的实验是不一样的,一个人天天基于几亿日活做商业实验,他的水平能不高吗?为什么一些平台级产品的大佬思考水平极高,像开了天眼一样,因为他有几个亿的用户啊。

人人都想做有终局的产品,做下一个微信和抖音,但别忘了,张小龙是做 Foxmail 被腾讯收购的,Foxmail 是个邮件客户端,是那个年代最知名的套壳应用了。

基于这一观察,和 AI 现在所处的极早期阶段,在寻找 PMF 的时候,先不要嫌弃它是汤姆猫,找个具体且收敛的切入点,跑通它,让自己有个实验室,先完成能力跳变。

AI 和移动互联网的差异,远大于移动互联网和互联网的差异,先跳下来,刷一遍自己的 ROM 很重要。在 AI 这个全新的世界中,大多数人是从头学,今年完成能力跳变,还是明年完成能力跳变,会遇到截然不同的机遇。

但即便以汤姆猫的标准看 AI 应用,只求爆款,不苛求留存率,也只有前千分之一的产品能成汤姆猫。

03

超越汤姆猫,

才有机会成为 Super App

前千分之一的选手成为汤姆猫后,会面临两个选择:

一是基于汤姆猫继续绣花,迭代产品,希望做出长期留存,这很难,因为这个产品的地基很薄,就是绣花绣上天,也是个绣花版汤姆猫,基于汤姆猫建成一个迪斯尼娱乐王国是不现实的

二是通过做汤姆猫实现了团队能力升级,走出汤姆猫,去做新的事情。人站在一层楼和一百层楼看到的机会是不一样的,做过十亿的业务,自然会发现百亿业务的机会,这或许会找到更厚的地基,做出 super App。这是所谓的「超越汤姆猫」。

选一还是选二,是一道分水岭。很多耳熟能详的平台级产品,初创时都有过类似汤姆猫的阶段,又推出新产品超越了汤姆猫

2012 年 3 月,字节跳动成立,先推出的是内涵段子,同年 8 月推出了今日头条,2016 年 9 月,抖音上线。

2015 年 4 月,拼好货上线,做的是拼团买水果,同年 9 月,拼多多上线,切到了电商的主战场,2022 年 9 月,Temu 上线,开始海外的征程。

2010 年 3 月,美团团购上线,2013 年 11 月,美团外卖上线,2015 年 10 月,美团合并大众点评,从交易平台延伸到了信息平台。

好了,即便我们懂了「超越汤姆猫」这个道理,依然难过好这一生。

绝大多数情况下,人们很难大大方方承认自己是个汤姆猫,面对低留存率、低商业价值的时候,会做很多设想,是不是自己功能不够完善?是不是用户数量不够多?是不是应该把汤姆猫升级成社交产品,就有网络效应了?这种事情在移动互联网发生过很多了,做日历的、做滤镜的、做小游戏的,都有过平台梦。

「成为汤姆猫」是块石头,用好了可以踩着石头过河,实现「超越汤姆猫」;用不好是阻拦前行的巨石,做一辈子的汤姆猫。

04

Scaling Law 会成为 AI 时代的摩尔定律

上面是从质疑到成为的心路历程,也是感受当下,认清当下,抓住当下的过程。

那么更具体的聊聊当下,现在处于什么 timing,会推演出哪些信号?

最关键的信号,Scaling Law 会成为AI时代的摩尔定律,模型的智能程度每年增长百分之 X,价格降为之前的 1/N,现在还只有一个定性的描述,当 X 和 N 都成为一个定量数字的时候,这个规律就开始正式运转了。

Scaling Law 会把模型送上一个个新高度,从而会依次解锁上层应用,也就是造人。这些虚拟人需要替代真人,端到端的完成任务,做到「L4 级别」。在真实工作环境中,我们 90% 的时间是在解决那 10% 的难题,大模型能否解决好那 10% 的难题是一道及格线,过不了这个及格线,大模型只能做副驾 copilot,充其量是一个好用的软件;过了这个及格线,大模型就是主驾,我们开始为主驾付工资。

基于造人的标准,需要有一套图灵测试 2.0。在 ChatGPT 出来后,模型已经通过图灵测试 1.0,接近人的回答水平,以假乱真了。图灵测试 2.0 是一套基于工种的测试,比如文案策划、剧本杀小姐姐、程序员、医生,如果这个虚拟程序员能听懂你的需求、写出完整代码、修正 bug,那他就通过程序员图灵测试了。当下的大模型基本通过剧本杀小姐姐的图灵测试了,大家在 Character.ai、星野这些应用上和 AI 聊的很欢。

如果以图灵测试 2.0 来衡量当下的 AI Agent,真正的 Agent 尚未出现,真正意义上的 Agent 是可以自己规划任务,端到端的完成任务的。

如果第一个 Agent 出现,大概率是出在 OpenAI,因为他有最领先的模型,Agent 的出现主要和模型的智能程度相关,OpenAI 什么时候出 Agent 的 demo 产品,会是应用层百花齐放的关键信号

基于上面的这些推演,AI 还在很早期的阶段,如果硬要类比互联网的话,此时此刻对应 Yahoo 出现的门户时代。

做 AI 应用的创业者经常半夜问自己,我这应用有网络效应吗?放心,没有。

即便是 ChatGPT 也没有网络效应,只有品牌效应。互联网早期,门户网站也没有网络效应,只有品牌效应,Google 出来后才有了规模效应,Facebook 出来后才有了网络效应。

AI 行业什么时候会有网络效应这种城河?可能是 AI Agent 横行天下的时候,比如我们有个秘书 Agent,帮我们和生意上的伙伴约时间排会,双方的 Agent 一通交流,一握手,约好了!对方的 Agent 也必须是同一厂牌的 Agent,才能最大限度的交流,这就是 AI 时代的网络效应。

多久会发展到这个阶段?很难量化,但不要小看 AI 的进化速度。Sora 出来后,带给我最大的触动是,他比想象中来的快,行业里的人认为 2024 年年底或 2025 年才会出高质量的视频模型,OpenAI 直接在今年 2 月就拿出来了。

对 Sora 的热议,又一次体现了我们总是「高估当下,低估未来」,Sora 还没有公测,大家看到的是精选出来的 demo,在公测后,我估计大概率达不到大家的预期,这时又会出现「不过尔尔」的声音。又过一段时间,Sora 又进化的让人惊讶。

这种冷热交替,去年年初的时候已经在 ChatGPT 上上演过了,先是热议,认为要革命了,然后大家用了一段时间后,觉得还是有局限性,智慧程度不够,上层的杀手级应用也没出现,热议之后是冷静。然后 Sora 横空出世,又带来一波热议,如此往复。

别忘了,不管冷热,Scaling Law 永远在那里,在推动着模型成长。

万物自有其规律,没人能越过 1 到 17 岁,一步到位长到 18 岁。我们都知道 AI 带来的机会大,这是共识了。对当下 timing 的研判、对模型能力边界的理解,还处于非共识,这是真正考验创业者的地方

人人都想做有终局的产品,望着终局,恨不能省略中间的过程,跳跃中间的历史,直接做最有价值的事情,这是一种我执,忽略了真实世界运转的规律。

而理解汤姆猫、成为汤姆猫、超越汤姆猫,才是真实世界运转的规律,这是一种去执。

去执后,更容易看清当下,抓住当下。浪潮来的时候,关键是要站在海里,且早早学会游泳,早早习惯海水的味道。

这篇关于AI 应用之路:质疑汤姆猫,成为汤姆猫,超越汤姆猫的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/785149

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

zoj3820(树的直径的应用)

题意:在一颗树上找两个点,使得所有点到选择与其更近的一个点的距离的最大值最小。 思路:如果是选择一个点的话,那么点就是直径的中点。现在考虑两个点的情况,先求树的直径,再把直径最中间的边去掉,再求剩下的两个子树中直径的中点。 代码如下: #include <stdio.h>#include <string.h>#include <algorithm>#include <map>#