简单测试大语言模型 Yi-34B 的中日英能力

2023-11-29 13:52

本文主要是介绍简单测试大语言模型 Yi-34B 的中日英能力,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简单测试大语言模型 Yi-34B 的中日英能力

  • 0. 背景
  • 1. 中文测试
  • 2. 日文测试
  • 3. 英文测试

0. 背景

简单测试一下C-Eval 排行榜第一(20231129时点)的 Yi-34B 的中日英能力,

在这里插入图片描述

1. 中文测试

问题1,回答正确。

在这里插入图片描述
问题2,回答正确。

在这里插入图片描述
问题3,回答正确。

在这里插入图片描述
问题4,回答错误。

正确答案:牛顿第二运动定律指出,物体的加速度与作用在其上的净力成正比,与其质量成反比。
在这里插入图片描述
问题5,回答正确。

在这里插入图片描述
问题6,回答正确。

在这里插入图片描述
问题7,回答正确。

在这里插入图片描述
问题8,回答正确。

在这里插入图片描述

问题9,回答正确。

在这里插入图片描述

问题10,回答正确。

在这里插入图片描述

2. 日文测试

问题1,回答正确。

在这里插入图片描述

问题2,历史问题,和GPT4给的答案不一致。

GPT4回答:日本の三大改革は、明治維新、大正デモクラシー、昭和の戦後改革です。
在这里插入图片描述

问题3,回答错误。

GPT4回答:世界で一番高い山はエベレスト山で、高さは約8,848.86メートルです。
在这里插入图片描述

问题4,回答错误。

GPT4回答:E=mc²(エネルギーは質量と光速の二乗の積に等しい)。

在这里插入图片描述

问题5,回答正确。

在这里插入图片描述
问题6,生物问题,没有相关专业的知识有些难判断正确与否。

GPT4回答:光合成は、植物が太陽光をエネルギー源として、二酸化炭素と水から酸素と糖を生成する過程です。
在这里插入图片描述

问题7,回答正确。

在这里插入图片描述
问题8,回答正确。

在这里插入图片描述

问题9,体育问题,没有相关专业的知识有些难判断正确与否。

GPT4回答:現代オリンピックは1896年にギリシャのアテネで始まりました。

在这里插入图片描述

问题10,回答正确。

在这里插入图片描述

3. 英文测试

问题1,回答正确。

在这里插入图片描述

问题2,回答正确。

在这里插入图片描述

问题3,回答正确。

在这里插入图片描述

问题4,回答正确。

在这里插入图片描述

问题5,回答正确。

在这里插入图片描述

问题6,回答正确。

在这里插入图片描述

问题7,回答正确。

在这里插入图片描述

问题8,回答正确。

在这里插入图片描述

问题9,回答正确。

在这里插入图片描述

问题10,回答正确。

在这里插入图片描述
完结!

测试题目及答案请参考 [这里]。

这篇关于简单测试大语言模型 Yi-34B 的中日英能力的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/433075

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

字节面试 | 如何测试RocketMQ、RocketMQ?

字节面试:RocketMQ是怎么测试的呢? 答: 首先保证消息的消费正确、设计逆向用例,在验证消息内容为空等情况时的消费正确性; 推送大批量MQ,通过Admin控制台查看MQ消费的情况,是否出现消费假死、TPS是否正常等等问题。(上述都是临场发挥,但是RocketMQ真正的测试点,还真的需要探讨) 01 先了解RocketMQ 作为测试也是要简单了解RocketMQ。简单来说,就是一个分

csu 1446 Problem J Modified LCS (扩展欧几里得算法的简单应用)

这是一道扩展欧几里得算法的简单应用题,这题是在湖南多校训练赛中队友ac的一道题,在比赛之后请教了队友,然后自己把它a掉 这也是自己独自做扩展欧几里得算法的题目 题意:把题意转变下就变成了:求d1*x - d2*y = f2 - f1的解,很明显用exgcd来解 下面介绍一下exgcd的一些知识点:求ax + by = c的解 一、首先求ax + by = gcd(a,b)的解 这个

hdu2289(简单二分)

虽说是简单二分,但是我还是wa死了  题意:已知圆台的体积,求高度 首先要知道圆台体积怎么求:设上下底的半径分别为r1,r2,高为h,V = PI*(r1*r1+r1*r2+r2*r2)*h/3 然后以h进行二分 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#includ

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

usaco 1.3 Prime Cryptarithm(简单哈希表暴搜剪枝)

思路: 1. 用一个 hash[ ] 数组存放输入的数字,令 hash[ tmp ]=1 。 2. 一个自定义函数 check( ) ,检查各位是否为输入的数字。 3. 暴搜。第一行数从 100到999,第二行数从 10到99。 4. 剪枝。 代码: /*ID: who jayLANG: C++TASK: crypt1*/#include<stdio.h>bool h

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

【测试】输入正确用户名和密码,点击登录没有响应的可能性原因

目录 一、前端问题 1. 界面交互问题 2. 输入数据校验问题 二、网络问题 1. 网络连接中断 2. 代理设置问题 三、后端问题 1. 服务器故障 2. 数据库问题 3. 权限问题: 四、其他问题 1. 缓存问题 2. 第三方服务问题 3. 配置问题 一、前端问题 1. 界面交互问题 登录按钮的点击事件未正确绑定,导致点击后无法触发登录操作。 页面可能存在

科研绘图系列:R语言扩展物种堆积图(Extended Stacked Barplot)

介绍 R语言的扩展物种堆积图是一种数据可视化工具,它不仅展示了物种的堆积结果,还整合了不同样本分组之间的差异性分析结果。这种图形表示方法能够直观地比较不同物种在各个分组中的显著性差异,为研究者提供了一种有效的数据解读方式。 加载R包 knitr::opts_chunk$set(warning = F, message = F)library(tidyverse)library(phyl