新增模型检验,指标自动评估模型效果|ModelWhale 版本更新

本文主要是介绍新增模型检验,指标自动评估模型效果|ModelWhale 版本更新,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

二月将至,ModelWhale 迎来开年首次版本更新,期待为大家带来更优质的使用体验。

本次更新中,ModelWhale 主要进行了以下功能迭代:

  • 新增 模型检验(团队版✓)
  • 优化 模型评审测试(团队版✓)
  • 新增 自动评审‘数据源文件’(团队版✓)
  • 新增 组织私有数据公开到和鲸社区(团队版✓)
  • 新增 Canvas 支持 ipywidgets 渲染(专业版✓ 团队版✓)

1、新增 模型检验(团队版✓)

模型效果检验贯穿整个模型生命周期:训练时通过“历史数据”检验,业务应用后通过“真实使用数据”检验。算法竞赛中,主办方还会通过一些“评审算法”检验选手提交的模型作品。ModelWhale 基于多年在竞赛场景下的模型检验经验,新增【模型评估】功能模块(从已有竞赛系统抽离):支持通过多种业务指标(评审算法)自动化检验模型效果。以气象预测模型为例,可以通过「客观评审」比对“模型输出结果”和“实况观测数据”,评估预报准确性;如果模型输出结果较大(或已封装为服务 API 应用于实际业务场景),可以通过「模型评审」进行效果验证。

算法工程师提交“模型输出文件”或“模型服务应用”后,可即时获得模型评分、反馈;而,每个检验任务的配置(i.e 使用哪个检验指标、任务运行算力、提交格式规范)均可以由任务管理员(小组主管)按业务需求设计

注:“模型服务应用”是 ModelWhale 产品功能,将模型部署为服务 API(或网站应用),以便应用于实际业务场景。模型服务配有运维监控系统:支持追踪服务的实际运行情况、输入及输出数据,可供进行模型调优。

更多详见:模型服务的监控和调用

任务配置、管理(管理员)

2、优化 模型评审测试(团队版✓)

仅评估“模型输出文件(传统的客观评审)”未必可以识别过拟合现象。ModelWhale 支持【模型评审】:通过运行算法工程师(或比赛选手)提交的“模型服务应用”,直接检验原始模型,更准确评估模型效果。为保证评审顺利进行(i.e 按规则出分反馈),现已优化评审测试:任务管理员可以在配置任务时获得测试反馈,如遇报错可依据调整,直至按预期出分后,再将任务发布、公开。

3、新增 自动评审‘数据源文件’(团队版✓)

ModelWhale 客观评审任务,支持按照“检验指标”自动评估提交的结果文件(本地/在线文件)。当需要评估的文件较大时(i.e 一些算法模型的输出较复杂):算法工程师(或比赛选手)现在可以选择将它们保存成“数据集”、保存至“对象存储”、“NAS 空间”,然后将对应位置的数据文件提交到评审任务,进行结果检验。

注:结果文件的提交来源(在线文件/数据源/本地文件)、提交方式(是否支持 Token 提交),均由任务管理员依据实际需求配置。

4、新增 组织私有数据公开到和鲸社区(团队版✓)

和鲸社区,汇聚由专业研究机构、行业垂类专家、优秀研究个人提供的丰富案例、数据集;它也与 ModelWhale 公有云平台关联:ModelWhale 组织内用户均可参考使用这些宝贵资源。与此同时,组织内的研究成果(分析报告、数据集)也支持一键【发布到社区】:供更多用户查看使用、讨论交流,以发挥更大影响力、创造更大社会价值。

Tips:ModelWhale 重视“数据资产的安全问题”,公有云组织配有严格的权限管理系统 + 相对封闭的研究环境(私有化环境完全封闭),组织成员需获得“对应权限”方可公开自己的研究成果。

权限控制(管理员)

5、新增 Canvas 支持 ipywidgets 渲染(专业版✓ 团队版✓ )

ipywidgets 交互控件,可用于 Notebook 内进行界面设计,实现简单的交互操作。现 ModelWhale Canvas 也已支持渲染 ipywidgets:你可以将在 Notebook 内跑通的分析流程(比如 含 ipywidgets 交互的分析流程),封装固化到 Canvas 中,以便其他同事后续更简洁的复用。下述图片展示一个视频标注的案例。

Tips:ModelWhale Canvas 的输入输出交互简单,可零代码实现算法调用、完成业务分析;

更多详见:ModelWhale Canvas 使用说明。

以上,就是本期 ModelWhale 版本更新的全部内容。

进入 Modelwhale 官网,免费试用 Modelwhale 专业版(个人研究)或团队版(组织协同),获赠 CPU、GPU 算力!(建议使用 pc 端体验试用)

若对 ModelWhale 有任何建议、疑问,或有试用续期需求,欢迎点击【联系产品顾问】,MoMo 很高兴为你服务、与你交流(咨询备注“产品咨询”)。

这篇关于新增模型检验,指标自动评估模型效果|ModelWhale 版本更新的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/672742

相关文章

大模型研发全揭秘:客服工单数据标注的完整攻略

在人工智能(AI)领域,数据标注是模型训练过程中至关重要的一步。无论你是新手还是有经验的从业者,掌握数据标注的技术细节和常见问题的解决方案都能为你的AI项目增添不少价值。在电信运营商的客服系统中,工单数据是客户问题和解决方案的重要记录。通过对这些工单数据进行有效标注,不仅能够帮助提升客服自动化系统的智能化水平,还能优化客户服务流程,提高客户满意度。本文将详细介绍如何在电信运营商客服工单的背景下进行

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

poj3468(线段树成段更新模板题)

题意:包括两个操作:1、将[a.b]上的数字加上v;2、查询区间[a,b]上的和 下面的介绍是下解题思路: 首先介绍  lazy-tag思想:用一个变量记录每一个线段树节点的变化值,当这部分线段的一致性被破坏我们就将这个变化值传递给子区间,大大增加了线段树的效率。 比如现在需要对[a,b]区间值进行加c操作,那么就从根节点[1,n]开始调用update函数进行操作,如果刚好执行到一个子节点,

hdu1394(线段树点更新的应用)

题意:求一个序列经过一定的操作得到的序列的最小逆序数 这题会用到逆序数的一个性质,在0到n-1这些数字组成的乱序排列,将第一个数字A移到最后一位,得到的逆序数为res-a+(n-a-1) 知道上面的知识点后,可以用暴力来解 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#in

hdu1689(线段树成段更新)

两种操作:1、set区间[a,b]上数字为v;2、查询[ 1 , n ]上的sum 代码如下: #include<iostream>#include<algorithm>#include<cstring>#include<stack>#include<queue>#include<set>#include<map>#include<stdio.h>#include<stdl

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

hdu 1754 I Hate It(线段树,单点更新,区间最值)

题意是求一个线段中的最大数。 线段树的模板题,试用了一下交大的模板。效率有点略低。 代码: #include <stdio.h>#include <string.h>#define TREE_SIZE (1 << (20))//const int TREE_SIZE = 200000 + 10;int max(int a, int b){return a > b ? a :

透彻!驯服大型语言模型(LLMs)的五种方法,及具体方法选择思路

引言 随着时间的发展,大型语言模型不再停留在演示阶段而是逐步面向生产系统的应用,随着人们期望的不断增加,目标也发生了巨大的变化。在短短的几个月的时间里,人们对大模型的认识已经从对其zero-shot能力感到惊讶,转变为考虑改进模型质量、提高模型可用性。 「大语言模型(LLMs)其实就是利用高容量的模型架构(例如Transformer)对海量的、多种多样的数据分布进行建模得到,它包含了大量的先验

图神经网络模型介绍(1)

我们将图神经网络分为基于谱域的模型和基于空域的模型,并按照发展顺序详解每个类别中的重要模型。 1.1基于谱域的图神经网络         谱域上的图卷积在图学习迈向深度学习的发展历程中起到了关键的作用。本节主要介绍三个具有代表性的谱域图神经网络:谱图卷积网络、切比雪夫网络和图卷积网络。 (1)谱图卷积网络 卷积定理:函数卷积的傅里叶变换是函数傅里叶变换的乘积,即F{f*g}