本文主要是介绍【书生浦语第二期实战营学习笔记作业(七)】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
课程文档:https://github.com/InternLM/Tutorial/blob/camp2/opencompass/readme.md
课程作业:https://github.com/InternLM/Tutorial/blob/camp2/opencompass/homework.md
OpenCompass 大模型评测实战
- 1. 大模型的评测
- 1.1 大模型评测如何促进发展
- 1.2 大模型评测中的难点
- 2. OpenCompass介绍
- 2.1 OpenCompass发展历程
- 2.2 OpenCompass广泛应用助力
- 2.3 OpenCompass评测大模型方式和优点特性
- 2.4 OpenCompass模型排行
- 作业
1. 大模型的评测
1.1 大模型评测如何促进发展
1.2 大模型评测中的难点
2. OpenCompass介绍
2.1 OpenCompass发展历程
2.2 OpenCompass广泛应用助力
2.3 OpenCompass评测大模型方式和优点特性
2.4 OpenCompass模型排行
作业
基础作业
- 使用 OpenCompass 评测 internlm2-chat-1_8b 模型在 C-Eval 数据集上的性能
查看支持的数据集和模型
评测结果:
进阶作业
- 将自定义数据集提交至OpenCompass官网
这篇关于【书生浦语第二期实战营学习笔记作业(七)】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!