Llama2大模型开源,和开源的原教旨主义者们的又一次分道扬镳!

2024-02-20 19:40

本文主要是介绍Llama2大模型开源,和开源的原教旨主义者们的又一次分道扬镳!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

0601d65e64cf8a7a037d95382d50ed2d.jpeg

64209997e20b9494bac5f5ea58c489d3.jpeg

开源推动创新,因为它使更多的开发者能够利用新技术进行构建。同时,这也提高了安全性和保障,因为当软件是开放的时候,更多人可以审查并修复潜在问题。

                                                                      ——扎克伯格

上周技术圈最爆款的新闻估计就是扎克伯格的Meta公司宣布免费、开源、商用Llama 2的大语言模型了。

在一日千里的AIGC赛道上,Meta和OpenAI、谷歌、苹果还有马斯克们展开的真是一场刺刀见红的白热化竞争。这个新闻的前几天,马斯克官宣成立xAI公司,而近期苹果宣称建立了自己的框架“Ajax”来创建大型语言模型,准备提供基于“Apple GPT”聊天机器人服务。

毫无疑问,Meta借助于开源、免费、可商用这几个关键词,着实高调吸引了一波眼球。可以说,Meta算是正在巧妙地利用开源,来试图对AIGC市场竞争格局进行一次战略重置。但这一招能否见效,尚需时间来验证。不过,可以确定的是,在这波这浪下,面对OpenAI 的先发优势,这将不失是一个明智的策略。值得让所有从事开源的人们对企业的开源策略产生更深刻的认识。 

4128eb182dde748facfd4ce9cf0453b7.png

bdcfb25441e91edfe15c40864dbe59fc.jpeg

我们知道Meta的大语言模型由之前的LLaMA(Large Language Model Meta AI)变成了Llama 2。本次开源的产品其实有两个:

  • 一个是经过预训练的基座模型:Llama 2;

  • 一个是针对会话任务微调过的Fine-Tuned模型:Llama 2-Chat。

a7f49afe4449e2cbaf7dfdad2e2e56cb.png

按照Meta提供的报告数据显示,基座模型Llama 2似乎强大到已经超越GPT3,而经过微调的聊天模型也可以与 ChatGPT3.5媲美了。这可以算是开源模型中的一次巨大飞跃,也对那些闭源模型服务商的一次沉重打击。

开源的Llama 2模型就完全可以为大多数计划搭开源便车的公司用更低的成本,更高的效率来提供更多的可定制性应用。这绝对是很多中小型技术服务公司的开源福利。

既然Meta公司打着开源的口号,自然能会引起开源界的好奇,他们的Llama 2又到底用了一个什么样的开源许可协议呢?

于是有人去探究了一下他们的许可证,没想到Llama2和最初开源的Llama 1竟然完全不同。如果说Llama1用的GPLv3开源许可协议算是严格意义上的开源,那么这次Llama2的开源许可证就被悄悄替换成了一个自定义的商业开源许可证。

Llama 2虽然在宣传上是开源,但Meta在提供代码开源的同时,另外附加了好多限制条件。比较关键的是以下两条:

1) Llama2开源模型不得用于月活MAU大于7亿的产品或服务平台,除非获得Meta公司的批准和授权;

2) Llama2开源模型不得以任何违反适用法律或法规(包括贸易合规法)的方式使用。同时不适用于除英语以外的语言中使用。

这第一条限制就是有目标的限制了像Twitter这样的竞争对手,不过自信如马斯克应该也不屑于去使用。第二条限制就是要求新模型只在英语环境下用。这项限制的目的其实就不言自明了。

9722127e62f3f7a11017d489b9a5018b.png

所以,Meta高调官宣的开源其实并非是一次严格意义上的开源。也和开源软件促进联盟(OSI)的开源十条标准是违背的。用多年开源经验的开源老兵林旅强(Richard)在他上周一个朋友圈的话来说,“一个开源,各自表述。

19cce9a96ee3e303b0f3f175867c1a97.jpeg

无论从哪个角度,Meta用自己的方式来完全定制的自己的许可证条款完全无可厚非,毕竟这是他们自己的代码,他们有自己的自由和选择。但对于那些原本坚持开源协议就应当遵循OSI开源标准开源卫道者们来说,就不啻于是一次打击。因为这无异于是商业公司的开源策略和OSI开源标准的又一次分道扬镳。

如今Meta一方面希望借助开源赶超对手,另一方面为了保护自己的商业利益,和当年MongoDB、ElasticSearch为了应付来自公有云厂商的市场竞争而将原先各自的开源协议改成了自定义的SSPL许可协议所采取的策略如出一辙,Llama 2就自定义了一个自己的许可协议。

黑格尔说,凡是存在的都必有其合理性,凡是合理的就必将存在。与其说,这是和OSI所倡导的开源精神背道而驰,不如说是这是在现实市场环境下的开源进化。而且,在未来开源大模型推陈出新的世界中,「开源」的事实定义也大概率会被慢慢改写。

b3bc28cf597a758580bfd693ee1962a5.jpeg

对于开源可以给Meta带来的价值,扎克伯格在Facebook上发表了一篇文章写道:“开源推动创新,因为它可以使更多开发者能够利用新技术进行构建。同时,这也提高了安全性和保障,因为当软件是开放的时候,更多人可以审查并修复潜在问题。”

简单概括一下扎克伯格上面的讲述,就是两点:

1)开源有利于企业创新;

2)开源有利于提高代码质量。

早在二十多年前,埃里克·雷蒙德在《魔法锅》一中就具有远见性地指出了:开放源码实际可以作为企业竞争战略的武器。实际上,开源可以企业带来的优势绝对也不止于扎克伯格提到的这两点。还可以有如下更多方面:

1. 降本:通过开源社区吸引更多开发者协同开发,降低企业研发成本;

2. 获客:通过社区的宣传和免费使用,吸引或获得更多用户;

3. 招募:在开源社区内人才的聚集后更容易招募到企业所需的研发人才;

4. 竞争:重置市场竞争,打破领先者优势;

5. 标准:通过核心代码贡献,获取社区话语权,成为某一技术标准的主导者;

6. 品宣:同说过社区,扩大技术影响力,进行企业品牌形象宣传;

7.价值战略:通过开源,把组织战略建成真正以开放为核心价值观的企业战略;

虽然扎克伯格说自己对Llama的开源是为了提高创新和改善代码质量,但从开源对企业的价值分析来看,Meta在Llama上的开源显然隐藏了另一个更重要的目标:就是利用开源来和其他更强大对手进行竞争。在AIGC赛道上,OpenAI无可争议地获得了先发优势而且获得了领先地位,其他各科技大厂无一不想在这个巨大的潜力市场上赶超。与其他公司发布严格保密的专有模型不同,Meta公司大胆地公开了LlamA 2背后的代码和数据,使全球的研究人员能够构建和改进这项技术,其实就是希望借助开源的力量和文化来创造奇迹。

那么,开源又何德何能,能让Meta这样的公司也愿意用开源策略来和竞争对手们在AIGC赛道上放手一搏?我们实在是很有必要来看看开源在企业价值体系中的底层逻辑的真相。

ea393d924e9f97da8da4ca1dae3daa47.jpeg

虽然每个开源项目的创建有着不同的背景情况,传统上,无论是开源项目的创始团队、风险投资者,行业观察者,资本市场等各方,大多会习惯于沿用一般技术型企业的价值衡量指标和估值方式去看待这个项目或其所在商业企业的潜力和估值。即使他们考虑了开源的所带来的积极影响,但最多也就是将这些因素再映射到对于商业产品或服务业务的指标上。最后各方看到的是这个项目所在企业的商业估值作为项目和企业的市场价值。

e8296315e1659dae2b9be49e76fc37eb.png

但以笔者对开源的观察和研究来看,实际上这样的方式是片面和局部的,也是不科学的。一个传统的创业项目往往只对应一项商业产品。但对于开源,如果仔细想一下,我们实际上可以看到:在一个开源项目的生命周期中,一个开源项目对应的将不只是一项在开源上衍生的商业产品或服务,而是在三个不同维度下且不同性质和类别的产物

如下所示:

1)一项或几项基于开源项目衍生的企业产品或者服务;

2)一个开源代码库,我们也如今可以称数字公共品;

3)一个基于开源项目和开源社区的社会网络关系。

这三个产物,虽然皆因开源代码而产生和相互关联,也存在一定的依赖关系,但三者是相互独立的。一个开源项目,一旦创建,开源项目中的代码,社区和企业实际有着自己的形态和生命周期,各自承载着完全不同的使命和目标。

如果我们将一个开源项目的整个生态价值最后仅是简单粗暴的统一在企业产品或服务价值上,这是有失偏颇的。一个优秀的开源代码库未必能孵化出成功的企业产品。一个优秀的企业也未必能产生一个成功的开源社区。所以,当我们在评估一个开源项目或者开源企业的价值时,我们不能忽略开源社区作为社会网络关系的独立价值;我们更不能忽略开源代码作为数字公共品的独立价值。

c14dcaf711434e176d9293295cc0d8cc.png

事实上,开源社区为企业所构建的社会网络关系可以成为企业的一项新型社会资本,进而提升企业的商业价值。而开源作为数字公共品帮助企业产生的社会责任和可持续发展价值(在这里我们简称“ESG价值”)更是成为了当今资本市场对企业商业价值判定的一个热点。

基于此,对于一个开源企业的商业价值判定,我们不应当再囿于以往资本市场估值模式-简单的依靠产品的技术和市场潜力,而应当加入开源项目可以给企业所扩展出来的社会资本价值以及ESG价值。即一个开源企业的新价值可以用如下公式来表达:

开源企业价值 = 传统商业估值 + 社会资本价值 + 数字公共品ESG价值

一个企业的价值原来普遍意义上讨论的是人才,技术,资金,市场。而开源实际上为企业价值的创造开拓了新的领域和维度:开源代码所进入的数字公共品领域,开源社区创造的社会网络所产生的社会资本价值。

2a14c01853533b42f46560717c3cde34.png

39d944686e9b2b4996f74a0b6ef44f0c.jpeg

关于开源给企业所带来的企业社会资本,需要注意的第一个点是,我们这里所指出的社会资本并不是指马克思所认为的那些和私人资本相对应的集团资本,包括股份资本和国家资本。而是指个体或团体之间的关联——社会网络、互惠性规范和由此产生的信任,是人们在社会结构中所处的位置给他们带来的资源,它是一种社会网络关系。

社会资本的知名研究者Coleman认为社会资本存在于网络中的节点之间的连线间。如果人力资本的连接在节点,那么社会资本则属于节点之间的线段一个企业传统意义上的社会资本是来自于家族网络,政府网络,商圈网络,科研网络,和校友网络等,企业可以通过这样些外部的关系网络可以用较低的成本获取一些自身缺乏的重要资源能力。如今开源,则给开源的企业创造了一种新型的社会网络关系-开源社区网络。这是属于开源的企业所独有的一个崭新和独特的网络,相比其他闭源的企业,提供开源项目的企业则就因此具备了更多的社会资本价值,进而构建出更大的竞争优势。

一般来说。有价值的社会资本可以提供政策支持,金融支持,管理支持,人才支持,技术支持和其他特殊的资源。所以,我们在前面提到的开源对企业的价值中很大一部分时来自于开源社区为企业创造出的社会资本所带来的。如降本,增效,人才招募,技术创新等都实际上开源社区网络关系的所带来的社会资本在企业促进成长的路径和手段。这些本质上都是社会资本的产物,而非其他。

097b4d1d559c155276a79c1dc5f25fd8.jpeg

ESG是对公司的可持续性和社会影响的量化衡量,是在联合国倡导的可持续发展和社会责任的理念下发展出来的一项指标。2004年,联合国环境规划署首次提出这个概念,ESG分别代表Environmental (环境)、Social (社会)和 Governance(治理),其核心就是关注环境、社会、治理问题。随着ESG被社会各界的重视,近年来ESG更成为了金融市场的重要投资理念和企业行动指南,已经被用作评判一个企业投资潜力的重要量化指标。联合国作为人类可持续发展的推动者,也在不断把开源代码和开源软件逐步纳入到可持续发展目标中。

恰好,今天是阿里集团的年度财报日,阿里同时随之公布了2023年的ESG报告。在关于2023财年的ESG核心议题和亮点上,他们把“让技术更可得”作为了阿里集团的一项目标和成果。在报告中,阿里是这样阐述的:

”我们是开源技术和技术开放生态坚定的信仰者和推动者,并且是中国最大开源技术社区的建设者和支持者。“

可以看到,阿里集团把开源贡献被纳入到集团的发展ESG战略中,实际上是除了满足企业自身的技术研发需要之外,也是把开源看作为帮助企业满足ESG指标的需要并以此来强化企业的社会责任和对可持续发展目标的追求。

所以,通过开源的数字公共品输出能力。开源也成为了企业资本市场价值的提升手段。

综上,经过我们对开源的一番底层逻辑分析过后,就可以看到Meta对于Llama大语言模型的开源,无论其是在Llama 1上用GPLv3进行严格意义的开源,还是在Llama 2上用自定义的商业开源许可证的泛开源,实际上都是在使用开源带来的ESG价值和社会资本价值来构建自己和其他对手的竞争战略。

在一个开源项目下,如果缺失了对于数字公共品和社会网络关系的价值衡量,私以为,对开源企业价值及企业的市场影响力评估是不恰当的。而在未来,无论是对开源的创业者,还是开源的投资者来说,把开源置于社会资本价值和ESG价值体系框架下的价值再认识和估值重构,则无疑是一个值得思考和研究的方向。

作者丨狄安

编辑丨罗蕊艳

相关阅读 | Related Reading

bfacc43abd4134e325406baf139c0e07.jpeg

来了!7月30日KCC杭州站成立仪式暨首场线下读书会活动诚邀您的参加!

a25a974cd6e2f21925b6729a0acc4bc4.jpeg

KCC@Singapore 助力 AI & GPT 应用创新 Hackathon,最后4天,赢$26000奖金!

开源社简介

开源社成立于 2014 年,是由志愿贡献于开源事业的个人成员,依 “贡献、共识、共治” 原则所组成,始终维持厂商中立、公益、非营利的特点,是最早以 “开源治理、国际接轨、社区发展、项目孵化” 为使命的开源社区联合体。开源社积极与支持开源的社区、企业以及政府相关单位紧密合作,以 “立足中国、贡献全球” 为愿景,旨在共创健康可持续发展的开源生态,推动中国开源社区成为全球开源体系的积极参与及贡献者。

2017 年,开源社转型为完全由个人成员组成,参照 ASF 等国际顶级开源基金会的治理模式运作。近九年来,链接了数万名开源人,集聚了上千名社区成员及志愿者、海内外数百位讲师,合作了数百家赞助、媒体、社区伙伴。

fd8557db4ccc0dc94acbb2306fbf2db4.gif

这篇关于Llama2大模型开源,和开源的原教旨主义者们的又一次分道扬镳!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/729335

相关文章

电脑多久清理一次灰尘合? 合理清理电脑上灰尘的科普文

《电脑多久清理一次灰尘合?合理清理电脑上灰尘的科普文》聊起电脑清理灰尘这个话题,我可有不少话要说,你知道吗,电脑就像个勤劳的工人,每天不停地为我们服务,但时间一长,它也会“出汗”——也就是积累灰尘,... 灰尘的堆积几乎是所有电脑用户面临的问题。无论你的房间有多干净,或者你的电脑是否安装了灰尘过滤器,灰尘都

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}

秋招最新大模型算法面试,熬夜都要肝完它

💥大家在面试大模型LLM这个板块的时候,不知道面试完会不会复盘、总结,做笔记的习惯,这份大模型算法岗面试八股笔记也帮助不少人拿到过offer ✨对于面试大模型算法工程师会有一定的帮助,都附有完整答案,熬夜也要看完,祝大家一臂之力 这份《大模型算法工程师面试题》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

【生成模型系列(初级)】嵌入(Embedding)方程——自然语言处理的数学灵魂【通俗理解】

【通俗理解】嵌入(Embedding)方程——自然语言处理的数学灵魂 关键词提炼 #嵌入方程 #自然语言处理 #词向量 #机器学习 #神经网络 #向量空间模型 #Siri #Google翻译 #AlexNet 第一节:嵌入方程的类比与核心概念【尽可能通俗】 嵌入方程可以被看作是自然语言处理中的“翻译机”,它将文本中的单词或短语转换成计算机能够理解的数学形式,即向量。 正如翻译机将一种语言