突如其来：OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器—

突如其来：OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3

本文主要是介绍突如其来：OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

突如其来的消息，OpenAI分家的Anthropic公司悄悄地释放出他们的秘密武器——Claude3

这货居然在默默无闻中一举超越了GPT-4的地位。没发布会，没吹牛逼，就发了一帖子。

字少，事大。

Claude3独挡一面的推理能力

Anthropic推出了三款模型：Claude 3 Opus、Claude 3 Sonnet 和 Claude 3 Haiku。这个命名真是有意思，Opus（超大杯）、Sonnet（大杯）、Haiku（中杯），一看就知道规模大小。

首先得提一句，Claude3的Opus模型似乎在全面碾压GPT-4上拔得头筹。

有人搞了个MGSM测试集，也就是多语言数学推理，Claude3 Opus用0-shot的方式达到了90.7%的准确率，而GPT-4居然要用8-shot，结果才74%。

0-shot就是大模型直接上阵，不给任何示例，8-shot是在上阵前给了8个示例。这区别一看就明显，GPT-4都给了8个示例了还输给了Claude3 Opus。

在复杂的推理任务上，Claude3简直就是GPT-4的克星。

再看其他测试集，比如MMLU、GSM8K这些语言知识的测试集，Claude3和GPT-4差不多水平，总体来说，提升主要在推理能力上。

Claude3 Opus，就是个厉害的货。不过有点小插曲，得付费才能玩这个。Anthropic的花样还真跟OpenAI一样，免费的只有Sonnet，Opus得交20刀的会员费才能撸。

PS：那么推荐个虚拟信用卡平台，专门解决这种海外业务付费订阅问题 WildCard平台虚拟卡开好之后，用支付宝充值就可以进行Opus升级。

Claude3最大的进化点，就是推理和逻辑。虽然单看参数你可能感觉不到，但有人专门给了初中的数学题，推理题，等等致命题。在已经明确了补集法的情况下，GPT-4的错误率竟然高达50%多。而Claude3 Opus，准确率高达90%。简直刷新认知。总体看，Claude在逻辑和推理上的进化巨大，初中的理科题基本上是随便玩，不过高中题还是有点难度，全线阵亡状态。不过，一些看似弱智的问题或者语义逻辑，Claude3已经是无往而不利了。