本文主要是介绍论文笔记:Evaluating the Performance of Large Language Models on GAOKAO Benchmark,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
1 论文思路
采用zero-shot prompting的方式,将试题转化为ChatGPT的输入
对于数学题,将公式转化为latex输入
主观题由专业教师打分
2 数据
2010~2022年,一共13年间的全国A卷和全国B卷
3 结论
3.1 不同模型的zeroshot 高考总分
3.2 各科主观题&客观题得分
3.3 不同年份的得分
这篇关于论文笔记:Evaluating the Performance of Large Language Models on GAOKAO Benchmark的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!