马斯克开源Grok-1:3140亿参数是GPT3.5的2倍【附保存通道】

2024-03-26 12:59

本文主要是介绍马斯克开源Grok-1:3140亿参数是GPT3.5的2倍【附保存通道】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

普通人:财富机会来了。马斯克将3410亿参数AI语言模型开源,这是目前世界上最大的开源模型,权重架构全开放,截至目前可用于商用。

6个月内成功研发出了拥有3410亿参数的大型自研模型,马斯克实现了他的承诺!据智东西3月18日的报道,马斯克旗下的AI创企xAI正式发布了备受期待的大型模型Grok-1,其参数量高达3140亿,远超过OpenAI GPT-3.5的1750亿。

这是目前参数规模最大的开源自然语言模型,遵循Apache 2.0协议,开放模型权重和架构供人使用。这一举措将对自然语言处理领域产生深远影响。
 

Grok-1是一个采用混合专家(Mixture-of-Experts,MOE)架构的大型模型。MOE架构的关键在于提高大型模型的训练和推理效率。可以形象地理解,MOE就像将各个领域的“专家”汇集在一起,根据任务将其分配给不同领域的专家,最后综合他们的结论以提升效率。这种架构决定每个专家的任务分配,使用了被称为“门控网络”机制。xAI已经在GitHub上开源了Grok-1的权重和架构,这将有助于推动自然语言处理领域的研究和发展。

目前Grok-1的源权重数据大小大约为300GB。截至北京时间3月22日上午7时许,Grok-1项目收获了39.9千颗星。

Grok-1是马斯克旗下xAI自2023年7月12日成立以来发布的首个自研大型模型。xAI强调这是他们从头开始训练的大模型,并没有针对特定应用进行微调。xAI作为马斯克去年成立的明星AI创企之一,旨在与OpenAI、谷歌、微软等竞争对手在大型模型领域展开竞争。xAI的团队来自各大知名企业和研究机构,如OpenAI、谷歌DeepMind、谷歌研究院、微软研究院等。在公布更多关于Grok-1的细节时,xAI指出基础模型是基于大量文本数据训练的,未针对特定任务进行微调。Grok-1是一个拥有3140亿参数的Mixture-of-Experts模型,其中每个token的活跃权重比例为25%。xAI从2023年10月开始使用自定义训练堆栈在JAX和Rust之上从头训练Grok-1。尽管xAI并没有公布Grok-1的具体测试成绩,但与OpenAI即将发布的GPT-5的大型模型的竞争将成为业内关注焦点。同时,马斯克和ChatGPT官方账号之间的互动也引起了关注,展示了在AI领域的竞争与幽默之间的趣味交流。

马斯克当然不会示弱,立即反问请告诉我OpenAI在哪些方面表现得“开放”?而马斯克高仿号也随即跳出来加入讨论,指出大家都知道是Sam在运营ChatGPT的账号。此次xAI发布Grok-1消息时所使用的封面图片是由Midjourney生成的。Grok-1给出了一个提示文本:一个神经网络的3D插图,展示具有透明节点和发光连接的神经网络,显示不同粗细和颜色的连接线代表不同权重。

获取保存通道👇👇👇

公众号:「吉吉说安全」,对我发消息【20240322】获取Grok-1保存通道

免费红队知识库:

会持续给大家更新更好东西,期待得到你随手免费的

【点赞】【在看】【转发】

今年肯定能“一帆风顺,二龙腾飞,三羊开泰,四季平安,五福临门,六六大顺,七星高照,八方来财,九九同心,十全十美,百事亨通,千事吉祥,万事如意“。

免责声明

由于传播、利用本公众号所提供的信息而造成的任何直接或者间接的后果及损失,均由使用者本人负责,本公众号及作者不为此承担任何责任,一旦造成后果请自行承担!如有侵权烦请告知,我们会立即删除并致歉。谢谢!

这篇关于马斯克开源Grok-1:3140亿参数是GPT3.5的2倍【附保存通道】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/848590

相关文章

ABAP怎么把传入的参数刷新到内表里面呢?

1.在执行相关的功能操作之前,优先执行这一段代码,把输入的数据更新入内表里面 DATA: lo_guid TYPE REF TO cl_gui_alv_grid.CALL FUNCTION 'GET_GLOBALS_FROM_SLVC_FULLSCR'IMPORTINGe_grid = lo_guid.CALL METHOD lo_guid->check_changed_data.CALL M

探索Elastic Search:强大的开源搜索引擎,详解及使用

🎬 鸽芷咕:个人主页  🔥 个人专栏: 《C++干货基地》《粉丝福利》 ⛺️生活的理想,就是为了理想的生活! 引入 全文搜索属于最常见的需求,开源的 Elasticsearch (以下简称 Elastic)是目前全文搜索引擎的首选,相信大家多多少少的都听说过它。它可以快速地储存、搜索和分析海量数据。就连维基百科、Stack Overflow、

Java面试八股之JVM参数-XX:+UseCompressedOops的作用

JVM参数-XX:+UseCompressedOops的作用 JVM参数-XX:+UseCompressedOops的作用是启用对象指针压缩(Ordinary Object Pointers compression)。这一特性主要应用于64位的Java虚拟机中,目的是为了减少内存使用。在传统的64位系统中,对象引用(即指针)通常占用8字节(64位),而大部分应用程序实际上并不需要如此大的地址空间

设置android返回键,保存和取得最高分

1.在.h中声明一些方法 virtual void keyBackClicked();           //Android返回键 bool isHaveSaveFile(); void getHighestHistoryScore(); 在.cpp中实现这个几个方法 void WelcomeLayer::keyBackClicked(

关于命令行参数argv(《学习OpenCV》)

在《学习OpenCV》这本书中,很多示例代码都用到了命令行参数。作为新手,之前总是很困扰,不知道怎么用。偶然的机会终于略知一二了。 在Visual Studio中,我们可以自行设置命令行参数。 如在这个示例程序中,我们想把图像存入argv[1]。 方法如下: 依次点击,项目、属性、配置属性、调试、命令参数。出现下面的界面: 然后进行编辑,即输入图像路径。如:E:\Lena.jpg

示例:推荐一个基于第三方开源控件库DataGridFilter封装的FilterColumnDataGrid,可以像Excel拥有列头筛选器

一、目的:基于第三方开源控件库DataGridFilter封装的FilterColumnDataGrid,可以像Excel拥有列头筛选器,感兴趣的可以去下方链接地址查看开源控件库地址。本控件封装的目的在于将第三方库的皮肤和样式封装到皮肤库中可统一设置样式,同时生成nuget方便调用 二、效果如下 三、环境 VS2022 Net7 四、使用方式 1、安装nuget包:H.Con

将知乎专栏文章转换为 Markdown 文件保存到本地

一、参考内容 参考知乎文章`代码 | 将知乎专栏文章转换为 Markdown 文件保存到本地,利用代码为GitHub:https://github.com/chenluda/zhihu-download。 二、步骤 1.首先安装包flask、flask-cors、markdownify 2. 运行app.py 3.在浏览器中打开链接,并填写URL和Cookies 获取Cookies的步

Linux IPC 参数设定,echo 80 /proc/...

文章转自 http://blog.chinaunix.net/uid-22287947-id-1775633.html Linux IPC 参数设定- 命令方式: echo 80 > /proc/sys/vm/overcommit_ratio, etc MSGMNB  每个消息队列的最大字节限制。 MSGMNI  整个系统的最大数量的消息队列。 MSGGSZ  消息片断的大

ULTRAINTERACT 数据集与 EURUS 模型:推动开源大型语言模型在推理领域的新进展

在人工智能的浪潮中,大型语言模型(LLMs)已经成为推动自然语言处理技术发展的关键力量。它们在理解、生成语言以及执行复杂任务方面展现出了巨大的潜力。然而,尽管在特定领域内取得了显著进展,现有的开源LLMs在处理多样化和高难度的推理任务时,仍然难以与最前沿的专有模型相媲美。这一差距不仅限制了开源模型的应用范围,也阻碍了整个领域的发展和创新。 推理任务,特别是那些需要综合运用数学知识、编程技能和逻辑

开源低代码平台,JeecgBoot v3.7.0 里程碑版本发布

项目介绍 JeecgBoot是一款企业级的低代码平台!前后端分离架构 SpringBoot2.x,SpringCloud,Ant Design&Vue3,Mybatis-plus,Shiro,JWT 支持微服务。强大的代码生成器让前后端代码一键生成! JeecgBoot引领低代码开发模式(OnlineCoding-> 代码生成-> 手工MERGE), 帮助解决Java项目70%的重复工作,让开