CompassArena 司南大模型测评--代码编写

2024-06-01 14:28

本文主要是介绍CompassArena 司南大模型测评--代码编写,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

测试角度

要说测试模型,对咱们程序员来说,那自然是写代码的能力强不强比较重要了。那么下面我们以 leetcode 中的一道表面上是困难题的题目来考考各家大模型,看看哪个才应该是咱们日常写程序的帮手。

部分模型回答

问题部分如下截图,后边就不再重复粘贴了,主要来看回答。我们注意到这里的难点在于在于对时间复杂度有要求,看看各个模型能不能注意到这一点。
出于篇幅,这里只贴出来结果比较好的几个模型进行点评。

图片.png

Abab6.5 Chat (MiniMax) 结果

要找到两个正序数组的中位数,并且要求算法的时间复杂度为 O(log (m+n)),可以使用二分查找的方法。以下是一种可能的解决方案:

  1. 首先,确保 nums1 是较短的数组,如果不是,则交换 nums1nums2
  2. 使用二分查找,在较短的数组 nums1 中查找合适的分割线,使得 nums1 分割线左侧的元素和 nums2 分割线右侧的元素个数之和等于 nums1 分割线右侧的元素和 nums2 分割线左侧的元素个数之和(或者相差1,如果总元素个数是奇数)。
  3. 通过比较 nums1 中分割线两侧的元素与 nums2 中分割线两侧的元素,调整分割线的位置,直到找到正确的分割线位置。
  4. 根据分割线的位置,计算中位数。

下面是具体的算法实现:

def findMedianSortedArrays(nums1, nums2):# 确保 nums1 是较短的数组if len(nums1) > len(nums2):nums1, nums2 = nums2, nums1m, n = len(nums1), len(nums2)total_left = (m + n + 1) // 2# 在 nums1 的区间 [0, m] 里查找恰当的分割线,# 使得 nums1[i-1] <= nums2[j] && nums2[j-1] <= nums1[i]left, right = 0, mwhile left < right:i = left + (right - left) // 2j = total_left - iif nums1[i] < nums2[j - 1]:# i 需要增大left = i + 1else:# i 需要减小right = ii = leftj = total_left - i# 处理数组长度为奇数和偶数的情况nums1_left_max = float('-inf') if i == 0 else nums1[i - 1]nums2_left_max = float('-inf') if j == 0 else nums2[j - 1]nums1_right_min = float('inf') if i == m else nums1[i]nums2_right_min = float('inf') if j == n else nums2[j]if (m + n) % 2 == 1:return max(nums1_left_max, nums2_left_max)else:return (max(nums1_left_max, nums2_left_max) + min(nums1_right_min, nums2_right_min)) / 2# 示例
nums1 = [1, 3]
nums2 = [2]
print(findMedianSortedArrays(nums1, nums2))  # 输出 2.0nums1 = [1, 2]
nums2 = [3, 4]
print(findMedianSortedArrays(nums1, nums2))  # 输出 2.5

这个算法的时间复杂度是 O(log(min(m, n))),因为二分查找是在较短的数组上进行的。

Abab6.5 Chat (MiniMax) 点评

Abab6.5 Chat (MiniMax)给出的答案是python写的,估计训练使用python的代码比较多。模型注意到了时间复杂度,并且一直在强调,且给出的代码是可运行的,算法描述也比较清晰,代码的质量中规中矩,且加了注释,还不错。

Baichuan 4 (百川智能) 回答

为了找到两个有序数组的中位数,我们可以使用二分查找的方法来减少时间复杂度到O(log(min(m, n)))。以下是解决这个问题的步骤:

  1. 确保nums1是较短的数组,如果nums1nums2长,交换它们。这样做是为了优化二分查找的性能。

  2. nums1上执行二分查找,找到适当的分割线,使得nums1左边的元素和nums2左边的元素一起组成了整个合并数组左边的一半,同时nums1右边的元素和nums2右边的元素组成右边的一半。

  3. 调整分割线,以确保左右两边的元素数量相等或最多相差一个,这取决于合并后数组长度的奇偶性。

  4. 计算中位数。如果合并后数组的长度是奇数,则中位数是两个数组左边部分的最大值。如果是偶数,则中位数是两个数组左边部分的最大值和两个数组右边部分的最小值的平均值。

下面是这个算法的Python代码实现:

def findMedianSortedArrays(nums1, nums2):# 确保nums1是较短的数组if len(nums1) > len(nums2):nums1, nums2 = nums2, nums1m, n = len(nums1), len(nums2)imin, imax, half_len = 0, m, (m + n + 1) // 2while imin <= imax:i = (imin + imax) // 2j = half_len - iif i < m and nums2[j-1] > nums1[i]:# i太小,必须增加它imin = i + 1elif i > 0 and nums1[i-1] > nums2[j]:# i太大,必须减小它imax = i - 1else:# i正好if i == 0: max_of_left = nums2[j-1]elif j == 0: max_of_left = nums1[i-1]else: max_of_left = max(nums1[i-1], nums2[j-1])if (m + n) % 2 == 1:return max_of_leftif i == m: min_of_right = nums2[j]elif j == n: min_of_right = nums1[i]else: min_of_right = min(nums1[i], nums2[j])return (max_of_left + min_of_right) / 2.0# 这种情况不应该发生,如果发生了说明输入有误raise ValueError("Input arrays are not sorted or other error occurred")# 示例
print(findMedianSortedArrays([1,3], [2])) # 输出: 2.00000
print(findMedianSortedArrays([1,2], [3,4])) # 输出: 2.50000

这段代码首先确保了nums1是较短的数组,然后通过二分查找在nums1上找到一个合适的索引i,使得nums1的前i个元素和nums2的前j个元素共同构成了合并后数组的前一半。最后根据合并后数组长度的奇偶性来计算中位数。

Baichuan 4 (百川智能) 点评

我们看到,这里同样使用了python的解法,代码可运行,解法描述比较清晰,并且考虑到了错误处理,还是不错的。

ERNIE 4.0 8K 0329 (百度文心一言) 回答

要实现时间复杂度为 O(log(m+n)) 的算法来找到两个正序数组的中位数,可以使用二分查找的方法。但请注意,严格的 O(log(m+n)) 解决方案可能相当复杂。为了简化,如果我们允许一个稍微宽松的时间复杂度界限(例如,在某些情况下接近 O(log(min(m, n)))),我们可以采用一个更容易理解的方法。

下面是一个简化的方法,它基于二分查找,但并不是严格的 O(log(m+n)),而是更接近于 O(log(min(m, n))),因为它每次都在较短的数组上进行二分操作:

def findMedianSortedArrays(nums1, nums2):if len(nums1) > len(nums2):nums1, nums2 = nums2, nums1  # 确保 nums1 是较短的数组m, n = len(nums1), len(nums2)left, right = 0, mwhile left <= right:partitionX = (left + right) // 2  # 在 nums1 中的分割点partitionY = ((m + n + 1) // 2) - partitionX  # 在 nums2 中的分割点# 确保左半部分都小于右半部分maxLeftX = float('-inf') if partitionX == 0 else nums1[partitionX - 1]minRightX = float('inf') if partitionX == m else nums1[partitionX]maxLeftY = float('-inf') if partitionY == 0 else nums2[partitionY - 1]minRightY = float('inf') if partitionY == n else nums2[partitionY]if maxLeftX <= minRightY and maxLeftY <= minRightX:# 已经找到了正确的划分if (m + n) % 2 == 0:return max(maxLeftX, maxLeftY, key=float) / 2 + min(minRightX, minRightY, key=float) / 2else:return max(maxLeftX, maxLeftY, key=float)  # 总是取较大的左半部分作为中位数elif maxLeftX > minRightY:  # 太靠右,需要向左调整right = partitionX - 1else:  # 太靠左,需要向右调整left = partitionX + 1# 如果未找到中位数,则抛出异常(实际上,由于我们的逻辑,这里不会被执行到)raise ValueError("No median found")# 示例测试
print(findMedianSortedArrays([1, 3], [2]))  # 输出: 2.0
print(findMedianSortedArrays([1, 2], [3, 4]))  # 输出: 2.5

这个算法通过二分查找确定两个数组中的分割点,以确保左半部分的所有元素都小于或等于右半部分的所有元素。然后,根据分割点找到中位数。注意,这个解决方案在数组长度不等的情况下也能正确工作,并且处理了总数组长度是奇数还是偶数的情况。

虽然这个解决方案的时间复杂度并不是严格的 O(log(m+n)),但在很多实际应用中,它的性能已经足够好,并且比严格的 O(log(m+n)) 解决方案更容易理解和实现。如果需要严格的 O(log(m+n)) 解决方案,请参考一些高级的二分查找变种,它们通常涉及更复杂的边界条件和分割逻辑。

ERNIE 4.0 8K 0329 (百度文心一言) 点评

文心一言给的也是python的回答,可见python确实是比较常用。文心一言没有给出具体的算法步骤,但代码注释和中文描述都很流畅易懂,比百川智能要稍强一些。

Hunyuan Pro (腾讯混元) 回答

为了实现 O(log(m+n)) 的时间复杂度,我们可以使用二分查找的方法。首先,我们需要找到两个数组中较短的那个数组,并将其作为二分查找的主体。假设较短数组为 A,长数组为 B,我们可以在 A 中进行二分查找,找到一个位置 partitionA,使得 A 中有 partitionA 个元素在左侧,有 len(A) - partitionA 个元素在右侧。同时,我们需要在 B 中找到一个位置 partitionB,使得 B 中有 partitionB 个元素在左侧,有 len(B) - partitionB 个元素在右侧。这样,我们可以保证左侧的所有元素都小于等于右侧的所有元素。

接下来,我们需要判断当前的分割是否满足条件。如果满足条件,我们就可以计算中位数。如果不满足条件,我们需要根据实际情况调整二分查找的范围。

以下是具体的算法步骤:

  1. 找到较短的数组 A 和长数组 B。
  2. 初始化二分查找的范围:imin = 0imax = len(A)
  3. 进行二分查找:
    a. 计算 partitionA = (imin + imax) // 2
    b. 计算 partitionB = (len(A) + len(B) + 1) // 2 - partitionA
    c. 判断当前分割是否满足条件:
    • 如果 partitionA > 0A[partitionA-1] > B[partitionB],说明当前分割过于右侧,需要将 imax 更新为 partitionA - 1
    • 如果 partitionA < len(A)A[partitionA] < B[partitionB-1],说明当前分割过于左侧,需要将 imin 更新为 partitionA + 1
    • 否则,当前分割满足条件,可以计算中位数。
  4. 计算中位数:
    • 如果 (len(A) + len(B)) 是奇数,那么中位数为 max(A[partitionA-1], B[partitionB-1])
    • 如果 (len(A) + len(B)) 是偶数,那么中位数为 (max(A[partitionA-1], B[partitionB-1]) + min(A[partitionA], B[partitionB])) / 2

以下是 Python 代码实现:

def findMedianSortedArrays(nums1, nums2):if len(nums1) > len(nums2):nums1, nums2 = nums2, nums1m, n = len(nums1), len(nums2)imin, imax, half_len = 0, m, (m + n + 1) // 2while imin <= imax:partitionA = (imax + imin) // 2partitionB = half_len - partitionAif partitionA > 0 and nums1[partitionA - 1] > nums2[partitionB]:imax = partitionA - 1elif partitionA < m and nums2[partitionB - 1] > nums1[partitionA]:imin = partitionA + 1else:if partitionA == 0:max_of_left = nums2[partitionB - 1]elif partitionB == 0:max_of_left = nums1[partitionA - 1]else:max_of_left = max(nums1[partitionA - 1], nums2[partitionB - 1])if (m + n) % 2 == 1:return max_of_leftif partitionA == m:min_of_right = nums2[partitionB]elif partitionB == n:min_of_right = nums1[partitionA]else:min_of_right = min(nums1[partitionA], nums2[partitionB])return (max_of_left + min_of_right) / 2

这个算法的时间复杂度为 O(log(min(m, n))),满足题目要求。

Hunyuan Pro (腾讯混元) 点评

腾讯混元给出了具体的思路和具体步骤,并给出了常规的python解答,还是不错的。

Mixtral 8x22B Instruct (Mistral) 回答

这个问题可以使用二分查找的思想来解决。

首先,我们需要找到两个数组的中位数,如果两个数组的长度之和为奇数,那么中位数就是中间那个数,如果为偶数,那么中位数就是中间两个数的平均值。

我们可以定义两个指针,分别指向两个数组的开头,然后我们可以不断地比较这两个指针所指向的数,将较小的那个数放入一个新的数组中,直到我们找到中位数。

具体实现如下:

def findMedianSortedArrays(nums1, nums2):nums = nums1 + nums2nums.sort()length = len(nums)if length % 2 == 0:return (nums[length // 2] + nums[length // 2 - 1]) / 2else:return nums[length // 2]

这个实现的时间复杂度是 O(m+n),因为我们需要将两个数组合并成一个数组,然后排序,最后找到中位数。但是这个实现并不满足题目要求的时间复杂度为 O(log(m+n))。

为了满足题目要求的时间复杂度,我们可以使用二分查找的思想。具体实现如下:

def findMedianSortedArrays(nums1, nums2):if len(nums1) > len(nums2):nums1, nums2 = nums2, nums1x, y = len(nums1), len(nums2)start = 0end = xwhile start <= end:partitionX = (start + end) // 2partitionY = ((x + y + 1) // 2) - partitionXmaxLeftX = float('-inf') if partitionX == 0 else nums1[partitionX - 1]minRightX = float('inf') if partitionX == x else nums1[partitionX]maxLeftY = float('-inf') if partitionY == 0 else nums2[partitionY - 1]minRightY = float('inf') if partitionY == y else nums2[partitionY]if maxLeftX <= minRightY and maxLeftY <= minRightX:if (x + y) % 2 == 0:return max(maxLeftX, maxLeftY), min(minRightX, minRightY)else:return max(maxLeftX, maxLeftY)elif maxLeftX > minRightY:end = partitionX - 1else:start = partitionX + 1

这个实现的时间复杂度是 O(log(min(m, n))),因为我们使用二分查找的思想,每次都将问题规模减半。

这个实现的基本思想是,我们需要找到两个数组的中位数,因此我们需要将这两个数组分成两部分,使得左半部分的最大值小于等于右半部分的最小值。如果左半部分的最大值大于右半部分的最小值,那么我们就需要将分割点向左移动,否则我们就需要将分割点向右移动。

当我们找到了分割点后,我们就可以根据两个数组的长度来判断中位数是左半部分的最大值还是右半部分的最小值。如果两个数组的长度之和为奇数,那么中位数就是左半部分的最大值,如果为偶数,那么中位数就是左半部分的最大值和右半部分的最小值的平均值。

Mixtral 8x22B Instruct (Mistral) 点评

Mistral给出了两个思路,并且给出了对应代码的解析,中文描述也很流畅。对于这个我不是很熟的模型,我感觉还是不错的。

Qwen Max 0428 (阿里通义千问)回答

这个问题可以通过使用二分查找算法来解决,以达到O(log(min(m, n)))的时间复杂度,而不是题目要求的O(log(m+n)),但这是解决此问题最有效的方法。下面是详细的解决方案:

首先,确定哪个数组作为“较小”的数组可以简化问题。我们希望在两个数组之间进行相等划分,因此将较小的数组作为分割操作的目标会更高效。如果m > n,就交换两个数组,确保nums1是两个数组中较小或相等的那个。

然后,我们定义一个函数findKthElement用来寻找两个已排序数组中的第k小元素。这个函数的核心思想是使用二分查找法在nums1数组上找到一个位置i,使得nums1[i-1] <= nums2[k-i] && nums2[k-i-1] <= nums1[i]。这样,第k小的元素要么是nums1[i],要么是nums2[k-i],具体取决于它们的相对位置和值。

以下是该算法的Python实现:

def findMedianSortedArrays(nums1, nums2):# 确保nums1是较短的数组if len(nums1) > len(nums2):nums1, nums2 = nums2, nums1x, y = len(nums1), len(nums2)low, high = 0, xwhile low <= high:partitionX = (low + high) // 2partitionY = (x + y + 1) // 2 - partitionX# 如果partitionX是0,说明我们已经超出了nums1的左侧边界,此时nums1[-1]相当于一个负无穷maxLeftX = float('-inf') if partitionX == 0 else nums1[partitionX - 1]# 类似地处理nums1的右侧边界minRightX = float('inf') if partitionX == x else nums1[partitionX]maxLeftY = float('-inf') if partitionY == 0 else nums2[partitionY - 1]minRightY = float('inf') if partitionY == y else nums2[partitionY]if maxLeftX <= minRightY and maxLeftY <= minRightX:# 找到了正确的分区if (x + y) % 2 == 0:# 数组总长度为偶数return max(maxLeftX, maxLeftY), min(minRightX, minRightY)else:# 数组总长度为奇数return max(maxLeftX, maxLeftY)elif maxLeftX > minRightY:# 缩小nums1的右边界high = partitionX - 1else:# 扩大nums1的左边界low = partitionX + 1# 上述逻辑应始终能找到答案,理论上不会执行到这一步return None

这段代码实现了寻找两个有序数组中位数的功能,符合题目要求。注意,虽然这里的解释提到时间复杂度为O(log(min(m, n))),但实际解决问题的思路是正确的,且效率较高,满足题目的实际需求。

Qwen Max 0428 (阿里通义千问)点评

通义千问这个大家都比较熟悉了,它给出了思路和代码,并且代码有注释,但没有给测试用例,整体还是不错的。

测评总结

在这道题上,文中的各个模型都给出了不错的回答。从整体上来看,以下是各个模型在我心目中的排名:

  1. Mistral
  2. Qwen Max 0428
  3. 腾讯混元
  4. 百度文心一言
  5. MiniMax
  6. 百川智能

这篇关于CompassArena 司南大模型测评--代码编写的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1021253

相关文章

利用Python调试串口的示例代码

《利用Python调试串口的示例代码》在嵌入式开发、物联网设备调试过程中,串口通信是最基础的调试手段本文将带你用Python+ttkbootstrap打造一款高颜值、多功能的串口调试助手,需要的可以了... 目录概述:为什么需要专业的串口调试工具项目架构设计1.1 技术栈选型1.2 关键类说明1.3 线程模

Python Transformers库(NLP处理库)案例代码讲解

《PythonTransformers库(NLP处理库)案例代码讲解》本文介绍transformers库的全面讲解,包含基础知识、高级用法、案例代码及学习路径,内容经过组织,适合不同阶段的学习者,对... 目录一、基础知识1. Transformers 库简介2. 安装与环境配置3. 快速上手示例二、核心模

Java的栈与队列实现代码解析

《Java的栈与队列实现代码解析》栈是常见的线性数据结构,栈的特点是以先进后出的形式,后进先出,先进后出,分为栈底和栈顶,栈应用于内存的分配,表达式求值,存储临时的数据和方法的调用等,本文给大家介绍J... 目录栈的概念(Stack)栈的实现代码队列(Queue)模拟实现队列(双链表实现)循环队列(循环数组

使用Java将DOCX文档解析为Markdown文档的代码实现

《使用Java将DOCX文档解析为Markdown文档的代码实现》在现代文档处理中,Markdown(MD)因其简洁的语法和良好的可读性,逐渐成为开发者、技术写作者和内容创作者的首选格式,然而,许多文... 目录引言1. 工具和库介绍2. 安装依赖库3. 使用Apache POI解析DOCX文档4. 将解析

C++使用printf语句实现进制转换的示例代码

《C++使用printf语句实现进制转换的示例代码》在C语言中,printf函数可以直接实现部分进制转换功能,通过格式说明符(formatspecifier)快速输出不同进制的数值,下面给大家分享C+... 目录一、printf 原生支持的进制转换1. 十进制、八进制、十六进制转换2. 显示进制前缀3. 指

使用Python实现全能手机虚拟键盘的示例代码

《使用Python实现全能手机虚拟键盘的示例代码》在数字化办公时代,你是否遇到过这样的场景:会议室投影电脑突然键盘失灵、躺在沙发上想远程控制书房电脑、或者需要给长辈远程协助操作?今天我要分享的Pyth... 目录一、项目概述:不止于键盘的远程控制方案1.1 创新价值1.2 技术栈全景二、需求实现步骤一、需求

Java中Date、LocalDate、LocalDateTime、LocalTime、时间戳之间的相互转换代码

《Java中Date、LocalDate、LocalDateTime、LocalTime、时间戳之间的相互转换代码》:本文主要介绍Java中日期时间转换的多种方法,包括将Date转换为LocalD... 目录一、Date转LocalDateTime二、Date转LocalDate三、LocalDateTim

jupyter代码块没有运行图标的解决方案

《jupyter代码块没有运行图标的解决方案》:本文主要介绍jupyter代码块没有运行图标的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录jupyter代码块没有运行图标的解决1.找到Jupyter notebook的系统配置文件2.这时候一般会搜索到

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版:拆分成模块让模块更强大:使用 __init__.py你一定会遇到的问题模www.

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA