欧洲版OpenAI疑似将在24年发布并开源GPT-4级别模型!

2023-12-20 07:30

本文主要是介绍欧洲版OpenAI疑似将在24年发布并开源GPT-4级别模型!,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

大家好,我是二狗。
今天在推特上看到一条振奋人心的消息:

“ 欧洲版OpenAI、法国初创公司 Mistral 首席执行官 Arthur Mensch 在法国国家广播电台宣布,Mistral 将在 2024 年发布开源 GPT-4 级别模型。”

图片

这位老哥接着表示甚至可能是免费的!

图片

这一下子把二狗我给看激动了!

GPT-4级别模型将要免费开源,这可是天大的福利啊!

新一轮百模大战估计又要打响!国产“自主研发”大模型又要崛起了(手动狗头)。

然而当二狗我点进去这个网址后,发现自己可能高兴早了。这个网址是一个语音博客,而且还是法语的,二狗我表示听不懂。

图片

听不懂那我没法证实“Mistral 将在 2024 年发布开源 GPT-4 级别模型”这条消息是可靠的。”好在reddit上有网友在吃瓜讨论。

图片

很显然,大家都在关心 Mistral 的CEO到底有没有明确表示要开源 GPT-4 级别的模型。

很遗憾,有懂法语的网友表示Mistral 的CEO只表示明年要推出和GPT-4竞争的模型,但没有表明要开源。

图片

另一位法国网友也证实了没有提到开源的事情。

图片

好难过,一大期待可能要落空了。

但是,好在Mistral 的CEO也没有明确表示不会开源!

以Mistral 公司一直坚持开源的路线,还是有希望的!

为何大家对Mistral有所期待?

因为就在前几天,Mistral AI开源的一个Mixtral 8x7B MoE模型引爆了AI社区。

一是因为它的性能击败了LLama2和GPT-3.5。

图片

二是因为,Mixtral是一个专家混合模型(Mixture-of-Experts model,MoE),使用了传闻中 OpenAI 用于GPT-4的架构,但是参数相比GPT-4要小很多,堪称是缩小版“GPT-4”。

而且这个模型还开源了,Mistral AI甚至直接通过torrent链接将其甩在推特上发布。

图片

huggingface下载链接: 

https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1

Mixtral 8x7B MoE模型当前支持:

  • 在 Apache 2.0 许可下免费使用;

  • 推理速度提高6 倍,性能优于 Llama 2 70B模型。

  • 性能匹配或优于 GPT3.5;

  • 上下文长度为32K;

  • 精通英语、法语、意大利语、德语和西班牙语;

三是因为Mistral AI带来的格局变化。

Mistral AI 目前已是欧洲最强的大模型公司,团队由来自 Google、Meta 和 Hugging Face的新生代科学家们组成,目前只有20人左右。

图片

Mistral AI 最近完成了由 A16z 领投的 4.15 亿美元 A 轮融资,估值为 20 亿美元。

Mistral AI的崛起带来了两点格局变化。

一是欧洲和美、中竞争格局变化。

最新这十年,在投资和创新方面,欧洲的AI企业一直落后于美国和中国的同行。

图片

然而这次Mistral AI的成功,可能标志着一个决定性的转变——欧洲在AI创新方面走到了最前沿。

二是开源和私有模型竞争格局变化。

在生成式AI的竞争舞台上,OpenAI、Google DeepMind等老牌巨头 已经走向了闭源,而Mistral AI的打法是开源,这一点和Meta很相似。

虽然目前业界最强的大模型是GPT-4或者Gemini,但正如Yann LeCun所说, 开源AI模型正在超越私有模型。

未来,以Mistral AI为代表的开源模型会不会彻底赶上甚至超越私有模型,让我们拭目以待吧。

这篇关于欧洲版OpenAI疑似将在24年发布并开源GPT-4级别模型!的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/515210

相关文章

Golang的CSP模型简介(最新推荐)

《Golang的CSP模型简介(最新推荐)》Golang采用了CSP(CommunicatingSequentialProcesses,通信顺序进程)并发模型,通过goroutine和channe... 目录前言一、介绍1. 什么是 CSP 模型2. Goroutine3. Channel4. Channe

五大特性引领创新! 深度操作系统 deepin 25 Preview预览版发布

《五大特性引领创新!深度操作系统deepin25Preview预览版发布》今日,深度操作系统正式推出deepin25Preview版本,该版本集成了五大核心特性:磐石系统、全新DDE、Tr... 深度操作系统今日发布了 deepin 25 Preview,新版本囊括五大特性:磐石系统、全新 DDE、Tree

Linux Mint Xia 22.1重磅发布: 重要更新一览

《LinuxMintXia22.1重磅发布:重要更新一览》Beta版LinuxMint“Xia”22.1发布,新版本基于Ubuntu24.04,内核版本为Linux6.8,这... linux Mint 22.1「Xia」正式发布啦!这次更新带来了诸多优化和改进,进一步巩固了 Mint 在 Linux 桌面

多模块的springboot项目发布指定模块的脚本方式

《多模块的springboot项目发布指定模块的脚本方式》该文章主要介绍了如何在多模块的SpringBoot项目中发布指定模块的脚本,作者原先的脚本会清理并编译所有模块,导致发布时间过长,通过简化脚本... 目录多模块的springboot项目发布指定模块的脚本1、不计成本地全部发布2、指定模块发布总结多模

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

高效+灵活,万博智云全球发布AWS无代理跨云容灾方案!

摘要 近日,万博智云推出了基于AWS的无代理跨云容灾解决方案,并与拉丁美洲,中东,亚洲的合作伙伴面向全球开展了联合发布。这一方案以AWS应用环境为基础,将HyperBDR平台的高效、灵活和成本效益优势与无代理功能相结合,为全球企业带来实现了更便捷、经济的数据保护。 一、全球联合发布 9月2日,万博智云CEO Michael Wong在线上平台发布AWS无代理跨云容灾解决方案的阐述视频,介绍了

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

阿里开源语音识别SenseVoiceWindows环境部署

SenseVoice介绍 SenseVoice 专注于高精度多语言语音识别、情感辨识和音频事件检测多语言识别: 采用超过 40 万小时数据训练,支持超过 50 种语言,识别效果上优于 Whisper 模型。富文本识别:具备优秀的情感识别,能够在测试数据上达到和超过目前最佳情感识别模型的效果。支持声音事件检测能力,支持音乐、掌声、笑声、哭声、咳嗽、喷嚏等多种常见人机交互事件进行检测。高效推