如果用大模型考公，kimi、通义千问谁能考高分？

本文主要是介绍如果用大模型考公，kimi、通义千问谁能考高分？，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

都说大模型要超越人类了，今天就试试让kimi和通义千问做公务员考试题目，谁能考高分？

测评结果再次让人震惊！

问题提干：大小两种规格的盒装鸡蛋，大盒装23个，小盒装16个，采购员小王买了500个鸡蛋，大盒装一共比小盒装()，请问括号中填多少？

备注： 这里稍微改写了下原题描述，避免大模型搜索网上的答案。

Kimi考公

kimi上面的数学计算出现了错误。这是最简单的加减法错误。我告诉他错了。

通过上面的对话可以看出kimi开始给的方程式 23x + 16y=500对的，但是自己无法计算出结果。

后面经过几轮对话，我失去了耐心。。。。

放弃吧~

通义千问开始方程式和kimi一样：23x + 16y=500，但是他一开始认为无解，经过我二次提示，他给出了答案：x=16, y=7，且洋洋得意地计算464+112=500，这也是一个加法错误。

我尝试告诉他有其他答案，这个答案不对。

但是他却倔强地说这是唯一解。

算了算了。

你是唯一解，你没通过考验！

通过上述对话可以看出kimi和通义千问都不具备根据逻辑题目分析和解析方程的能力。

即使使用最笨的方法，从x=1~x=21遍历也能得到答案。

kimi有尝试使用遍历方法，但是不知道为啥直接从x=1跳到了x=14，就跳过了x=12, y=14的题目答案，与答案失之交臂。

通义千问给出了错误答案，坚持到底。

如果您对测评结果有疑问，欢迎交流，更多大模型案例在公众号首发。

#AIGC #kimi #通义千问 #大模型

这篇关于如果用大模型考公，kimi、通义千问谁能考高分？的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！