突如其来:OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3

本文主要是介绍突如其来:OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

突如其来的消息,OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3

这货居然在默默无闻中一举超越了GPT-4的地位。没发布会,没吹牛逼,就发了一帖子。

字少,事大。

Claude3独挡一面的推理能力

Anthropic推出了三款模型:Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。这个命名真是有意思,Opus(超大杯)、Sonnet(大杯)、Haiku(中杯),一看就知道规模大小。

首先得提一句,Claude3的Opus模型似乎在全面碾压GPT-4上拔得头筹。

有人搞了个MGSM测试集,也就是多语言数学推理,Claude3 Opus用0-shot的方式达到了90.7%的准确率,而GPT-4居然要用8-shot,结果才74%。

0-shot就是大模型直接上阵,不给任何示例,8-shot是在上阵前给了8个示例。这区别一看就明显,GPT-4都给了8个示例了还输给了Claude3 Opus。

在复杂的推理任务上,Claude3简直就是GPT-4的克星。

再看其他测试集,比如MMLU、GSM8K这些语言知识的测试集,Claude3和GPT-4差不多水平,总体来说,提升主要在推理能力上。

Claude3 Opus,就是个厉害的货。不过有点小插曲,得付费才能玩这个。Anthropic的花样还真跟OpenAI一样,免费的只有Sonnet,Opus得交20刀的会员费才能撸。

PS:那么推荐个虚拟信用卡平台,专门解决这种海外业务付费订阅问题 WildCard平台虚拟卡开好之后,用支付宝充值就可以进行Opus升级。

Claude3最大的进化点,就是推理和逻辑。虽然单看参数你可能感觉不到,但有人专门给了初中的数学题,推理题,等等致命题。在已经明确了补集法的情况下,GPT-4的错误率竟然高达50%多。而Claude3 Opus,准确率高达90%。简直刷新认知。 总体看,Claude在逻辑和推理上的进化巨大,初中的理科题基本上是随便玩,不过高中题还是有点难度,全线阵亡状态。不过,一些看似弱智的问题或者语义逻辑,Claude3已经是无往而不利了。

Claude3和GPT4V打平的多模态

再说说多模态,GPT-4V也出来很久了,多模态功能可是个把人离不开的好东西。这次Claude3也不甘示弱,把视觉能力给强化了。你可以直接扔图进去,整体评价是,跟GPT-4V大致打平手。官方数据也有这样的倾向。

总体上,跟GPT-4V差不多,对中文的支持也不错,算是Anthropic弥补了一直以来Claude的短板。

基于超长文本的对话、总结、查询能力,在Claude3中也终于有了质的飞跃。当然,得说实话,Kimi都在这方面耕耘了差不多半年,Claude3现在也才刚刚赶上Kimi在长文本这块的水平。 但是综合来看,Claude3 Opus,绝对是目前最厉害的大模型。或者说,就是当前的No.1。

这次更新,Claude3还有一些其他特点。比如减少了不必要的拒绝,准确性更高等等,但是我觉得就不展开说了。Claude3这次更新后,不仅有独一档的推理能力,跟GPT-4V打平的多模态,还有200K长文本优化。

可以当之无愧地说,Claude3 Opus就是市面上目前最强的大模型。

当然,OpenAI和奥特曼的尿性你了解的,他们这肯定忍不了这口气。评论区里,网友说出了我的心声。Anthropic这么一出手,Claude3一露面,GPT-4的地位有点危险了。

期待一手ChatGPT 5

未来的竞争,肯定会更加激烈。看看评论区,网友们早就开始猜OpenAI会怎么回应了。Anthropic这一次搞得风生水起,GPT-4的霸主地位真的有点摇摇欲坠。ChatGPT 5是不是可以出手了,这一场巅峰对决,我可是期待了好久。

参考:https://aliyuntm.com/chatgptplus/claude3.html

这篇关于突如其来:OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/892208

相关文章

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

创业者该如何设计公司的股权架构

本文来自七八点联合IT橘子和车库咖啡的一系列关于设计公司股权结构的讲座。 主讲人何德文: 在公司发展的不同阶段,创业者都会面临公司股权架构设计问题: 1.合伙人合伙创业第一天,就会面临股权架构设计问题(合伙人股权设计); 2.公司早期要引入天使资金,会面临股权架构设计问题(天使融资); 3.公司有三五十号人,要激励中层管理与重要技术人员和公司长期走下去,会面临股权架构设计问题(员工股权激

某公司笔试编程题

参加了某公司编程题,这些题都来自牛客网,记录总结吧! 一、蛇形矩阵 题目描述 蛇形矩阵是有1开始的自然数依次排列成的一个上三角矩阵. 接口说明 void GetResult(int Num, int* pResult);输入参数:int Num :输入的正整数N输出参数:int *pResult: 指向放蛇形矩阵的字符串指针指针指向的内存区域保证有效 样例输入: 4

我的第一次份实习工作-iOS实习生-公司使用过的软件

bittorrentsync 素材,文件同步软件 cornerstone svn 软件开发合作 mark man 测量坐标的软件 SQLLite Manager 数据库操作软件

How can I load the openai api configuration through js in html?

题意:怎样在HTML中通过JavaScript加载OpenAI API配置 问题背景: I am trying to send a request through js in my html so that openai analyzes it and sends a response, but if in the js I put the following: 我正在尝试通过HTM

Anthropic 创始人 Dario Amodei 谈:关于护城河与风险,AI 大很难直接替代人

护城河的迷思   近期,Anthropic创始人Dario Amodei与投资人Erik Torenberg进行了一场引人关注的对话。他们探讨了AI的护城河与潜在风险。话说,护城河就像酒水的保质期,过了时间就得小心别翻车。Amodei提到,AI虽有强大的潜力,但短期内难以完全替代人类的智慧。这可让很多人松了一口气,毕竟机器发热总比人心复杂,听着都觉得不舒服。 聪明与控制的博弈   Dar

Creating OpenAI Gym Environment from Map Data

题意:从地图数据创建 OpenAI Gym 环境 问题背景: I am just starting out with reinforcement learning and trying to create a custom environment with OpenAI gym. However, I am stumped with trying to create an enviro

OpenAI澄清:“GPT Next”不是新模型。

不,”GPT Next” 并不是OpenAI的下一个重要项目。 本周早些时候,OpenAI 日本业务的负责人长崎忠男在日本 KDDI 峰会上分享了一场演讲,似乎在暗示一个名为 “GPT Next” 的新模型即将出现。 但OpenAI的一位发言人已向Mashable证实,幻灯片中用引号括起来的”GPT Next”一词只是一个假设性占位符,旨在表明OpenAI的模型如何随着时间呈指数级进化。发言人

每个游戏公司的领导都应该看看Supercell的“十年总结”

我知道,你一定会说,Supercell的案例太特殊了。手游出现以来,全世界就只有这么一个Supercell,它的经历、理念和公司架构这些文化,其他公司学不来,不管对中国公司还是海外公司,都没有什么实际借鉴意义。 但Supercell真的有这么“特殊”吗? 比如他们对于留存数据的看重,尤其是测试期留存的看重,和国内——和任何一家常规游戏公司看重留存的态度,都没有什么明显不同。 他们也会试着设立

How can I provide a RGBA png file to OpenAI PHP library

题意:将RGBA PNG文件提供给OpenAI的PHP库 问题背景: I import Orhanerday\OpenAi library to my DALL-E Examples project but when I provide images, I got Invalid input image - format must be in ['RGBA'], got RGB. er