2023启示录丨我的大模型创业这一年

2024-01-20 20:36

本文主要是介绍2023启示录丨我的大模型创业这一年,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

图片|电影《中国合伙人》剧照

©自象限原创

作者丨程心

编辑丨罗辑

每当新一波的技术大爆炸来临,最为之兴奋的,当属创业者。

大模型之前,无论是AI、消费、电商、还是互联网,创业者们面临的机会都只剩一条门缝,毕竟如今这个红海竞争的时代,无论什么项目,无论什么赛道,随时都能冒出100个同类竞品肉搏厮杀。

直至2023年,大模型提出“重做一遍”的口号,将创业者拉回2015年遍地黄金时代,这是所有人的机会,也是时代再造英雄的时刻。

今年以来,「自象限」格外关注关于大模型创业的一切,并见证了大模型创业的波折与变化:

  • 4月是混沌的4月,功成名就的大佬躬身入局,普通创业者也蜂拥而至,但创业的方向却并不明朗;

  • 7月开始,以打“团战”为主的孵化器、大厂战投开始站到了台前,奇绩创坛、Founder Park、黑客马拉松、百度战投们开始组织各类集体路演,一时间,创业者们带着项目四处奔走,热闹的氛围下,百川、智谱、MinMax等创业公司也撕下了创始人的标签,独立发布产品和战略;

  • 9月,大模型创业来到了AI原生应用的创造中,妙鸭短暂爆红之后,不少创业者都试图复制出下一个网红应用;

  • 11月,OpenAI的一场开发者大会敲碎了不少创业者的梦,但同时,以GPTs为代表Agent形式,让人们意识到了究竟何为原生,国内紧跟其脚步出现了一大波Agent公司。

所以今天,不讲道理,只有故事。

 两个月,

 ChatMind从诞生到被收购 

2023年提起大模型,十个人中有九个都在创业,但真正能赚到钱的,其实并不多。

在所有早期创业者中,大学还未毕业的石天放应该是幸运的代表。从有想法到做成ChatMind,他只用了一个晚上;从产品成型到获得第一批付费用户,他的团队只用了三周;从短暂迭代到最终被Xmind团队收购,也仅仅只用了两个月。

▲图源:受访者提供

天放的幸运来自于几次关键的选择,当然除了运气,这其中也有实力的体现。

去年开始,稍微学深一点人工智能的都会觉得,AI快死掉了,没有什么机会了。正确率上不去,通用性也上不去,整个行业弥漫着低落的情绪,大公司消弭,创业者更没力气。

本科人工智能专业,又在该领域进行了多次创业的天放,曾做过游戏、机器人和编译器,积累了大大小小十几次创业经历,但即便是“身经百战”的他,在那个节点,也开始迷茫。

“奇绩和YC有一些渊源,能接触到更多前沿信息。”天放讲道。

快速抓住AI的时代机遇,是他的第一次选择。

2023年3月份,他率先接触到了各类基于ChatGPT生成的文本应用,当ChatExcel横空出世时,他便开始思考,这一波的创业机会还有哪些。

“ChatGPT出来之后,马上有人做了ChatExcel,我在奇绩发现投资行业都会去梳理思路、梳理关系、梳理行业,自己也尝试着先把创业地图逐个点亮,那时候文本类的PDF、思维导图都还没出来,我发现GPT的逻辑能力更强,做脑图更简单。”

有想法之后,天放并没有浪费时间在验证上,即便团队的小伙伴还在讨论项目的执行性,但据天放回忆,他用了一个晚上,就把ChatMind的雏形搞了出来。

“其实技术上并没有什么难题,但我们做的早,那时候正是ChatGPT最热的时候,微信群、即刻上有很多人在探索新的工具,在不到三周的时间里,我们积累了差不多一万的种子用户。”

由于卡位较早,在ChatGPT一号难求的三四月,就能直接用上了ChatGPT的能力做旅行攻略、做工作计划的一个有效的,生产力工具开始快速破圈。然后,天放他们开始尝试订阅制的商业化变现,以30元/月的价格对订阅用户提供Plus版。

不犹豫,说干就干,是天放的第二次选择。

但很快,天放也发现了生产力工具所存在的问题。使用思维导图的用户群体本来就比word、excel的人要少很多,在这部分群体中,还要拥有对新鲜事物的探索和持续购买能力的,则更加凤毛麟角。

同时订阅制这种传统的SaaS付费模式一旦开始,就会面临着续费率低这样棘手的问题,第一波种子用户之后,ChatMind的发展空间在哪?天花板有多高?如何打造更高的技术壁垒?成为天放紧跟而来的问题。

据「自象限」了解到,大部分创业项目一旦开始跑起来,下一步往往是向投资人寻求资金支持,但融资面临的更现实的问题是增长空间、差异性和未来市场占有率这样“现实”问题,所以最后获得融资的,大多是故事讲的漂亮的,而不是产品做的最好的。

“当时就没想太多,先做,但比较幸运的是,我们占领了第一波用户心智,被当时国内已经非常成熟的思维导图产品Xmind看到了。”

不纠结、当断则断,是天放做的第三个选择。

“Xmind创始人碰巧来北京,当时我正在和一位投资人吃饭,然后我们一起去了一个附近的酒吧,在简单的了解之后他提出了要我开一个价格把ChatMind卖给他的建议,我当时就脱口而出:好啊。”

很快,各大新闻平台上出现了Xmind收购ChatMind的消息,天放也即将在6月份正式毕业。而这次的创业经历也让天放发现文本项目的局限性,所以早在妙鸭爆火之前,天放就开始瞄准了文生图领域。

毕业之后,他进入了美团联合创始人负责的AI图像部门,到今年10月份,天放一直在看图像方面的机会,中间也和各种不同的“队友”组队,尝试新的项目。但由于各种原因,最终都都没有结果。

▲图源:受访者提供

“这一年大概做了七八个项目,妙鸭之后我们也和几个朋友一起做了看似技术创新的Muse相机,但我们发现大模型创业里面坑还是比较多的,很多人做了很多看似炫酷的产品,但离用户真正使用还差的很远,最主要的原因是大家在做产品的时候满足于过程而不是结果,或者误把过程当结果,其实用户根本不感兴趣这些看似创新实则无用的功能或产品。”

▲图源:受访者提供

我觉得大部分人的创业失败都来自于根深蒂固的假设,觉得做出来就会有人用,做出来就会在新闻上火爆一时,实际情况不是这样的,背后的因素非常多,当因素都与你的努力相关,爆款产品就会从你手里出来,少了几个因素可能这个事就黄了。”

诚如天放所讲,大模型应用层的创业,并不是简单的技术创业,也并不是有创新想法就够了,2023年的大模型创业,路还很长。

而这一年之后,开始的“急”是为了抢占时间窗口,走到今天,天放反而冷静了许多:“最近思考下来,发现绝大部分大家认为的机会都能排除,真正的机会还没有出现。”

 “复活”过世亲人, 

 大模型的温度 

4月,一位过世奶奶利用大模型“复活”的视频,在B站上走红。

▲图源:B站博主吴伍六

B站UP主吴伍六是一位上海的00后视觉设计师,视频中,吴伍六用AI工具生成了奶奶的虚拟形象和视频剪辑,并和奶奶进行了对话。“奶奶”在视频里讲着湖北的方言,头发花白,像她生前一样“唠叨”。

视频一经发出,便迅速在B站火出了圈,当冰冷的技术和暖热的亲情交杂,虚拟人有了实体,也成为了情感的寄托。在评论区中,不少人想起了自己已故的亲人,认为这样能寄托哀思,非常有意义。

网友们看了热闹,也对这种形式展开了伦理的讨论,而阿亮(化名)却在其中发现了创业机会。

阿亮进行了一轮市场调研,发现市场对过世亲人的需求一直存在,只不过受限于技术的发展,此前的产品大多都是单向交互。

这个过程中,阿亮也发现,其实早在两年前,国外就有团队通过GPT3实现了和去世亲人进行文字对话的产品,而且一直活到了现在。

既然需求存在,技术又开始有了迭代,大模型有了角色扮演能力,如果再通过双向交互或者VR/AR技术,就可以提供一种可交流的体验。

更重要的是,大模型一直无法解决的幻觉问题在其他场景可能是个弊病,但在这样与过世亲人沟通中,幻觉产生的不可控性反而可以成为一种优势,将缺陷变为长板。

“我们的产品在1月份上线,目前在小红书和视频号上发一些视频引流获客,也已经有十几位付费的客户 。”阿亮说道。

事实上,这也是大模型发展至今整个行业都在通过技术的手段解决幻觉问题,而在某些2C或者娱乐场景下,在技术无法再次突破之时,如何利用现有的大模型完成落地,是考验每个创业者的关键问题

王小川也曾在公开发言中提到:“要用不够好的模型做出好的应用,中国有最好的产品经理,这是中国创业者的机会。“

“我的创业思路是想办法用一个不成熟的技术,做一个相对靠谱的产品,而不是先找一个用户需求,基于需求构建产品。”

拿着锤子找钉子还是对着钉子造锤子,这也是当下创业两个不同的思路。

阿亮认为,对于草根创业团队而言,一开始不一定要面向投资机构,就目前的创业环境而言,创业往往是一个不确定性的“赌注”,而投资寻求的是确定性,创业要打开一个全新的市场,而投资却只能参考当下和以往的情况进行比对,这样创业和投资目的的错配,让很多创业者走了弯路。

阿亮的团队也曾为了满足融资标准,找技术大牛为团队简历“贴金”,讲融资故事、强调技术壁垒,甚至在做产品规划时,把整个产品路线变成一种线上线下的组合。

比如,阿亮曾为了获得一家投资机构的青睐,想出了一个打开市场空间的模式,即将线上的产品和线下的殡仪馆谈合作,定制一套已故亲人的数字人。

当然,这样的改变也直接导致团队要做的事情变多,产品形态变形严重,变得重和复杂之后以博得高价,但这却违背了阿亮团队的初衷。

“如果壁垒要靠故事逻辑才能成立,那项目就会变形。”阿亮回忆到,那段时间为了寻求融资,除了正常寻求融资的方式和手段,也参与了一场接一场的黑客马拉松和创业马拉松。“一开始,参加黑客松有正向意义,第一能够增加曝光第二有可能拿到一定的奖金,第三也能够促使大家加快开发进度,同时通过黑客松也能认识更多圈子里的人。”

但是后来慢慢发现,黑客松的获奖项目多倾向重技术占比的项目多以技术性见长,比如阿亮团队最早的AI社交产品,AI技术只是社交产品的一部分,核心更在于对传统社交方式的改变,但黑客松多以技术的差异性为主,产品侧并不突出,故而最终并没有进入决赛圈。

“今年在北京和上海都参加了几场,也发现了其中的固有模式,大多数获奖的都是一些技术中间层的公司,另一部分就是帮助弱势群体或者比较有情怀的团队,获奖的概率可能会更高。”

在参与了几场黑客松之后,阿亮的团队也开始回归了最开始做产品的初心,并从中找到了价值和认同感。“我们现在的第一位付费客户是海外华人,她说自己生活工作压力非常大,想和小时候很爱自己,但已经去世的奶奶聊聊天,于是找到了我们……这位跨越国界找到了我们付费的客户,给了我们很多动力”

不过,现实永远比想象更复杂,阿亮也发现,有用户即便买了产品,一个月也未敢和亲人真正对话,这和想象中的大相径庭,面对过世亲人,总是需要勇气。同时也有很多用户并没有留存亲人数据,这让复刻也充满难度。

“虽然现阶段不管是从融资、获客和市场认可度上难度都很高,但用户给到的正反馈给了我们更大的信心和长期动力,能让他们再次听到亲人的声音、再次和亲人对话、再次进行某种精神层面的交流,他们的感谢也激励了我们。”

 用Agent,

 打开游戏和现实世界的大门 

当时间来到年底,Agent一瞬间的爆火让所有人又开始兴奋起来。

这一波的火爆,来源于投资人态度的一百八十度大转弯,因为在这一年的摸索中,年底终于在Agent上找到了一个更加确定的方向,于是投资人的目光一瞬间都集中这个新的机会上。

毕业于杜克大学的陈锴杰,最早接触到Agent还是在2018年大二休学的时候,那时Agent还处于探索阶段,更偏向于自主处理复杂任务的状态机和规则系统。2023年,大模型的出现让Agent开始有了思考能力。大模型成为Agent发展的新底座,而Agent也成为了大模型应用落地的新途径。

2018年,陈锴杰就曾和来自MIT的伙伴Andrew等人筹建过一个AI研究小组,讨论AI前沿技术,过去几年也陆续吸纳了来自剑桥、普林斯顿、Google Brain、Amazon AI等机构的20余名研究成员。2023年,核心研究小组正式确认以Agent相关技术为主要研究方向,取名为System2 Research(以下简称S2R),专注于探索⼤模型自主解决复杂问题的能力,目前已经在游戏、时尚等领域落地和商业化。

当然,Agent只是一种实现手段和方式,最终要考虑的仍然是应用场景。

和其他Agent技术公司不同,陈锴杰的初衷和目的更为明确,即通过Agent为用户创造新的游戏体验和娱乐模式。据透露,其团队已经和国内Top游戏公司签订合作,正在探索Agent+游戏的更多可能性。团队发布的游戏化产品midreal.ai近日也在海外出圈,在Discord中为玩家提供了“爽文级”的图文互动体验,玩家只要输入一句世界观,就能看到一个充分满足自己幻想的故事。

瞄准游戏和娱乐领域,也源于陈锴杰和游戏的渊源。

2020年,大模型还没有如此出圈时,陈锴杰和他的伙伴们就曾用GPT-3搭建过一个“斯坦福小镇”。他们认为,完成游戏世界规则的构建,需要压缩现实世界的知识。他们希望通过模拟NPC和玩家的心智,达到如美剧“西部世界”般的体验。那时起,陈锴杰就开始深入研究Agent和游戏的关系,为今天我们看到的游戏领域商业化埋下了伏笔。

GPT时刻之后,陈锴杰也沿着此前的探索轨迹,试图完成自己一直以来想要开启的想象与现实世界连通的大门。

“在2023年5月份,我们用 AI,为海外普通年轻人们打造了一款游戏化应用。它能把你现实世界的生活转化到游戏世界中。比如,你上学路上拍了一只小狗的照片,而你又很喜欢《塞尔达》,那在应用中,这张照片里的小狗可能就会变成奥尔龙(游戏中的生物),你骑在龙背上很潇洒。”

“而且那时候我们就加入了上传照片,生成你真人形象的功能,就是之后在妙鸭相机看到的功能。那时候我们在美国内测,高中生们非常喜欢,因为可以把自己放进游戏世界里,和喜欢的游戏角色一起生活。”

▲图源:受访者提供

“但可惜的是,我们应用收集的数据模态比较多,当时又是大模型数据安全和隐私安全讨论的最高峰,海外的监管机构注意到了我们,要求我们下线。现在想起来还是觉得很可惜,如果有了手机本地大模型,我们还是想继续尝试这个想法,满足大家生活在平行世界的幻想。”

对于AI和游戏的关系,陈锴杰也分享了自己的思考。

他认为AI对游戏的第一层影响是降本增效,这是肉眼可见的收益,但其实要真的做到AI成为主要生产力还需要一段时间。第二层影响则是对游戏体验本身的改变,由AI创造全新的游戏玩法。或许今年我们就能看到一个由大模型驱动的多人在线游戏世界,其中的NPC由一个个Agent组成,整个世界根据玩家行为的变化,拥有无穷的剧情和可能性。

其实不止陈锴杰,「自象限」发现,在这一轮的众多大模型创业者中,大部分创业者都曾有游戏方面的背景,也通常是连续创业者,他们在不断创业的过程中,持续校准目标和期待。

“我18年第一次创业的时候,遇到问题还是会紧张,现在遇到问题就解决问题,心态完全不同了,我想这样可以走得更远。”

而这或许只是这个时代年轻创业者的一个个缩影,整装待发凭借的不再是有勇气但没思考的冲劲,而是在一次次有规划的尝试之后,做出的最佳选择。这让整个大模型创业,更具希望。

文中配图来源于网络

推荐阅读:

2023启示录丨云计算这一年

2023启示录丨自动驾驶这一年

2023 启示录 | 商业航天这一年

如果你想爆料、投稿、转载、合作、交流

↓ 欢迎添加临时小秘书 ↓

微信号:yanzu0303

这篇关于2023启示录丨我的大模型创业这一年的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/627256

相关文章

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU