Nature Chemistry | 化学机器学习的最佳实践:推荐的一套标准化指南

本文主要是介绍Nature Chemistry | 化学机器学习的最佳实践:推荐的一套标准化指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

5e48947318db9d3f42a6982fe6e27894.png

来源:专知本文约1000字,建议阅读5分钟 
本文讨论了训练可靠、可重复和可再生模型的所需要素,并为机器学习报告推荐了一套指南。

d2679900615c7c567727af92c42f28c7.png

摘要

基于机器学习的统计工具正在融入化学研究的工作流程。本文讨论了训练可靠、可重复和可再生模型的所需要素,并为机器学习报告推荐了一套指南。

https://www.nature.com/articles/s41557-021-00716-z

前言

长期以来,从化学动力学中的艾林方程、描述化学稳定性和反应性的电负性尺度到连接分子结构和光谱的配体场方法,化学一直受益于使用模型来解释数据模式。此类模型通常采用可重现的封闭式方程形式,并且在数十年间仍然具有相关性。然而,化学规则通常仅限于特定类别的系统(如多面体硼烷的电子计数)和条件(如热力学平衡或稳态)。

在应用简单的分析表达式或计算复杂的数值模型这些限制之外,统计建模和分析提供了发现更普适性新关系的契机,正在成为化学领域的有效研究工具。然而,这些技术的从业者必须谨慎地遵循协议,以达到与既定方法类似的有效性和可重复性。

本评论的目的是提出一个“最佳实践”标准,以确保统计学习开发模型的鲁棒性,以及观察效果的可重复性。希望相关的清单(图1)对作者、审稿人和读者有用,以指导机器学习模型的训练和报告的批判性评估,并提供一定程度的标准化。建议出版商可以在此清单的帮助下为机器学习手稿的提交制定指南和可重复性的规范。也希望众多科学家将带头开展这项运动,并主动提供机器学习清单来支撑论文。

6a575636ceed4831a8da1ef077e7c871.png图1 用于建议作者和审稿人报告和评估机器学习模型的清单

编辑:文婧

358c689b3a2936fc8f39b4d52b6f6e27.png

这篇关于Nature Chemistry | 化学机器学习的最佳实践:推荐的一套标准化指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/901062

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

基于MySQL Binlog的Elasticsearch数据同步实践

一、为什么要做 随着马蜂窝的逐渐发展,我们的业务数据越来越多,单纯使用 MySQL 已经不能满足我们的数据查询需求,例如对于商品、订单等数据的多维度检索。 使用 Elasticsearch 存储业务数据可以很好的解决我们业务中的搜索需求。而数据进行异构存储后,随之而来的就是数据同步的问题。 二、现有方法及问题 对于数据同步,我们目前的解决方案是建立数据中间表。把需要检索的业务数据,统一放到一张M

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

零基础学习Redis(10) -- zset类型命令使用

zset是有序集合,内部除了存储元素外,还会存储一个score,存储在zset中的元素会按照score的大小升序排列,不同元素的score可以重复,score相同的元素会按照元素的字典序排列。 1. zset常用命令 1.1 zadd  zadd key [NX | XX] [GT | LT]   [CH] [INCR] score member [score member ...]

Retrieval-based-Voice-Conversion-WebUI模型构建指南

一、模型介绍 Retrieval-based-Voice-Conversion-WebUI(简称 RVC)模型是一个基于 VITS(Variational Inference with adversarial learning for end-to-end Text-to-Speech)的简单易用的语音转换框架。 具有以下特点 简单易用:RVC 模型通过简单易用的网页界面,使得用户无需深入了

【机器学习】高斯过程的基本概念和应用领域以及在python中的实例

引言 高斯过程(Gaussian Process,简称GP)是一种概率模型,用于描述一组随机变量的联合概率分布,其中任何一个有限维度的子集都具有高斯分布 文章目录 引言一、高斯过程1.1 基本定义1.1.1 随机过程1.1.2 高斯分布 1.2 高斯过程的特性1.2.1 联合高斯性1.2.2 均值函数1.2.3 协方差函数(或核函数) 1.3 核函数1.4 高斯过程回归(Gauss