基于ADME的分子过滤和 lead-likeness标准

2023-12-01 11:30

本文主要是介绍基于ADME的分子过滤和 lead-likeness标准,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

T002 · 基于ADME的分子过滤和 lead-likeness标准

项目来源于TeachOpenCADD

本文目标

在药物设计的背景下,重要的是通过例如它们的物理化学性质来过滤候选分子。

在这个教程中,从 ChEMBL ( Talktorial T001 )获得的化合物将按照 Lipinsik 的五法则进行过滤,以仅保留口服生物可利用的化合物。

理论内容

  • ADME - 吸收、分布、代谢和排泄
  • Lead-likeness 和 Lipinski 的五法则 (Ro5)
  • Lead-likeness背景下的雷达图

实践内容

  • 定义和可视化示例分子
  • 计算并绘制 Ro5 的分子特性
  • 调查是否符合 Ro5
  • 将 Ro5 应用于 EGFR 数据集
  • 可视化 Ro5 属性(雷达图)

理论

在虚拟筛选中,我们的目标是预测化合物是否可能与特定目标结合并相互作用。然而,如果我们想要鉴定一种新药,同样重要的是该化合物能够到达目标并最终以有利的方式从体内清除。因此,我们还应该考虑一种化合物是否真的被吸收到体内,以及它是否能够跨越某些障碍以达到其目标。它的代谢是否稳定?一旦不再作用于目标,它将如何排泄?这些过程在药代动力学领域进行了研究。与药效学( “药物对我们的身体有什么作用?” )相反,药代动力学处理的问题是“药物在我们体内发生了什么?” .

ADME - 吸收、分布、代谢和排泄

药代动力学主要分为四个步骤:吸收、分布、代谢和排泄。这些总结为 ADME。通常,ADME 还包括毒理学,因此被称为 ADMET 或 ADMETox。下面更详细地讨论了 ADME 步骤。

  • 吸收:药物吸收到体内的量和时间取决于多种因素,这些因素可能因人而异,他们的条件以及物质的特性。化合物溶解度(差)、胃排空时间、肠道转运时间、胃内的化学(不)稳定性和(不)渗透肠壁的能力等因素都会影响药物在给药后的吸收程度例如口服、吸入或接触皮肤。
  • 分布:吸收物质的分布,即在体内、血液和不同组织之间,以及穿过血脑屏障,受区域血流速率、化合物的分子大小和极性以及与血清蛋白和转运体结合的影响酵素。毒理学中的关键影响可能是脂肪组织中高度非极性物质的积累,或穿过血脑屏障。
  • 代谢:化合物进入体内后会被代谢。这意味着该化合物中只有一部分会真正达到其目标。主要是肝脏和肾脏酶负责分解异生素(身体外在的物质)。
  • 排泄:化合物及其代谢物需要通过排泄从体内清除,通常是通过肾脏(尿液)或粪便。不完全排泄会导致外来物质的积累或对正常代谢的不利干扰。

ADME processes in the human body

Figure 1: ADME processes in the human body (figure taken from Openclipart and adapted).

Lead-likeness 和 Lipinski 的五法则 (Ro5)

先导化合物是具有前景的开发候选药物。它们被用作起始结构并进行修饰以开发有效的药物。除了生物活性(化合物与感兴趣的靶标结合)之外,有利的 ADME 特性也是设计高效药物的重要标准。

化合物的生物利用度是一个重要的 ADME 特性。Lipinski 的五规则 (Ro5, Adv. Drug Deliv. Rev. (1997), 23, 3-25 ) 被引入以仅基于化合物的化学结构来估计化合物的生物利用度。Ro5 指出,如果化学结构违反以下规则中的一项以上,则化合物吸收或渗透不良的可能性更大:

  • 分子量 (MWT) <= 500 Da
  • 氢键受体 (HBA) 的数量 <= 10
  • 氢键供体 (HBD) 的数量 <= 5
  • 计算的 LogP(辛醇-水系数)<= 5

注:Ro5中所有数字均为五的倍数;这就是规则名称的由来。

补充说明:

  • LogP也称为分配系数或辛醇-水系数。它测量化合物的分布,通常在疏水相(例如 1-辛醇)和亲水相(例如水)之间。

  • 疏水性分子在水中的溶解度可能会降低,而亲水性更强的分子(例如大量的氢键受体和供体)或大分子(高分子量)可能更难通过磷脂膜。

lead-likeness背景下的雷达图

分子特性,例如 Ro5 特性,可以通过多种方式可视化(例如克雷格图、花图或金三角)以支持药物化学家的解释(Drug. Discov. Today (2011), 16(1-2 ) , 65-72).

由于它们的外观,雷达图有时也被称为“蜘蛛”或“蜘蛛网”图。它们以 360 度环状排列,每个条件都有一个轴,从中心开始。每个参数的值绘制在轴上并用一条线连接。阴影区域可以表示参数满足条件的区域。

Radar plot for physicochemical properties

Figure 2: Radar plot displaying physico-chemical properties of a compound dataset

实践

from pathlib import Path
import mathimport numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.lines import Line2D
import matplotlib.patches as mpatches
from rdkit import Chem
from rdkit.Chem import Descriptors, Draw, PandasTools
# Set path to this notebook
HERE = Path(_dh[-1])
DATA = HERE / "data"

定义和可视化示例分子

在处理从 ChEMBL 检索到的整个数据集之前,我们选择了四种示例化合物来研究它们的化学性质。

我们从他们的 SMILES 中抽取了四个示例分子。

smiles = ["CCC1C(=O)N(CC(=O)N(C(C(=O)NC(C(=O)N(C(C(=O)NC(C(=O)NC(C(=O)N(C(C(=O)N(C(C(=O)N(C(C(=O)N(C(C(=O)N1)C(C(C)CC=CC)O)C)C(C)C)C)CC(C)C)C)CC(C)C)C)C)C)CC(C)C)C)C(C)C)CC(C)C)C)C","CN1CCN(CC1)C2=C3C=CC=CC3=NC4=C(N2)C=C(C=C4)C","CC1=C(C(CCC1)(C)C)C=CC(=CC=CC(=CC=CC=C(C)C=CC=C(C)C=CC2=C(CCCC2(C)C)C)C)C","CCCCCC1=CC(=C(C(=C1)O)C2C=C(CCC2C(=C)C)C)O",
]
names = ["cyclosporine", "clozapine", "beta-carotene", "cannabidiol"]

首先,我们将分子的名称和 SMILES 及其结构组合在一个 DataFrame 中。

molecules = pd.DataFrame({"name": names, "smiles": smiles})
PandasTools.AddMoleculeColumnToFrame(molecules, "smiles")
molecules
namesmilesROMol
0cyclosporineCCC1C(=O)N(CC(=O)N(C(C(=O)NC(C(=O)N(C(C(=O)NC(...
Mol
1clozapineCN1CCN(CC1)C2=C3C=CC=CC3=NC4=C(N2)C=C(C=C4)C
Mol
2beta-caroteneCC1=C(C(CCC1)(C)C)C=CC(=CC=CC(=CC=CC=C(C)C=CC=...
Mol
3cannabidiolCCCCCC1=CC(=C(C(=C1)O)C2C=C(CCC2C(=C)C)C)O
Mol

计算并绘制 Ro5 的分子特性¶

  1. 使用rdkit描述符descriptors计算分子量、氢键受体和供体的数量以及 logP 。
molecules["molecular_weight"] = molecules["ROMol"].apply(Descriptors.ExactMolWt)
molecules["n_hba"] = molecules["ROMol"].apply(Descriptors.NumHAcceptors)
molecules["n_hbd"] = molecules["ROMol"].apply(Descriptors.NumHDonors)
molecules["logp"] = molecules["ROMol"].apply(Descriptors.MolLogP)# Colors are used for plotting the molecules later
molecules["color"] = ["red", "green", "blue", "cyan"]
# NBVAL_CHECK_OUTPUT
molecules[["molecular_weight", "n_hba", "n_hbd", "logp"]]
molecular_weightn_hban_hbdlogp
01201.8413681253.26900
1306.184447411.68492
2536.4382020012.60580
3314.224580225.84650
# Full preview
molecules
namesmilesROMolmolecular_weightn_hban_hbdlogpcolor
0cyclosporineCCC1C(=O)N(CC(=O)N(C(C(=O)NC(C(=O)N(C(C(=O)NC(...
Mol
1201.8413681253.26900red
1clozapineCN1CCN(CC1)C2=C3C=CC=CC3=NC4=C(N2)C=C(C=C4)C
Mol
306.184447411.68492green
2beta-caroteneCC1=C(C(CCC1)(C)C)C=CC(=CC=CC(=CC=CC=C(C)C=CC=...
Mol
536.4382020012.60580blue
3cannabidiolCCCCCC1=CC(=C(C(=C1)O)C2C=C(CCC2C(=C)C)C)O
Mol
314.224580225.84650cyan
  1. 将分子特性绘制为条形图。
ro5_properties = {"molecular_weight": (500, "molecular weight (Da)"),"n_hba": (10, "# HBA"),"n_hbd": (5, "# HBD"),"logp": (5, "logP"),
}
# Start 1x4 plot frame
fig, axes = plt.subplots(figsize=(10, 2.5), nrows=1, ncols=4)
x = np.arange(1, len(molecules) + 1)
colors = ["red", "green", "blue", "cyan"]# Create subplots
for index, (key, (threshold, title)) in enumerate(ro5_properties.items()):axes[index].bar([1, 2, 3, 4], molecules[key], color=colors)axes[index].axhline(y=threshold, color="black", linestyle="dashed")axes[index].set_title(title)axes[index].set_xticks([])# Add legend
legend_elements = [mpatches.Patch(color=row["color"], label=row["name"]) for index, row in molecules.iterrows()
]
legend_elements.append(Line2D([0], [0], color="black", ls="dashed", label="Threshold"))
fig.legend(handles=legend_elements, bbox_to_anchor=(1.2, 0.8))# Fit subplots and legend into figure
plt.tight_layout()
plt.show()

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-EJnxiOra-1686104448503)(null)]

在条形图中,我们比较了四个具有不同属性的示例分子的 Ro5 属性。在接下来的步骤中,我们将调查每种化合物是否违反 Ro5。

调查是否符合Ro5

def calculate_ro5_properties(smiles):"""Test if input molecule (SMILES) fulfills Lipinski's rule of five.Parameters----------smiles : strSMILES for a molecule.Returns-------pandas.SeriesMolecular weight, number of hydrogen bond acceptors/donor and logP valueand Lipinski's rule of five compliance for input molecule."""# RDKit molecule from SMILESmolecule = Chem.MolFromSmiles(smiles)# Calculate Ro5-relevant chemical propertiesmolecular_weight = Descriptors.ExactMolWt(molecule)n_hba = Descriptors.NumHAcceptors(molecule)n_hbd = Descriptors.NumHDonors(molecule)logp = Descriptors.MolLogP(molecule)# Check if Ro5 conditions fulfilledconditions = [molecular_weight <= 500, n_hba <= 10, n_hbd <= 5, logp <= 5]ro5_fulfilled = sum(conditions) >= 3# Return True if no more than one out of four conditions is violatedreturn pd.Series([molecular_weight, n_hba, n_hbd, logp, ro5_fulfilled],index=["molecular_weight", "n_hba", "n_hbd", "logp", "ro5_fulfilled"],)
# NBVAL_CHECK_OUTPUT
for name, smiles in zip(molecules["name"], molecules["smiles"]):print(f"Ro5 fulfilled for {name}: {calculate_ro5_properties(smiles)['ro5_fulfilled']}")
Ro5 fulfilled for cyclosporine: False
Ro5 fulfilled for clozapine: True
Ro5 fulfilled for beta-carotene: False
Ro5 fulfilled for cannabidiol: True

根据 Ro5,估计环孢菌素cyclosporin和β-胡萝卜素beta-carotene的生物利用度较差。
然而,由于它们都是批准的药物,它们是 Ro5 如何用作警报但不一定用作过滤器的好例子。

将 Ro5 应用于 EGFR 数据集

该calculate_ro5_properties函数可应用于符合 Ro5 标准的化合物的 EGFR 数据集。

molecules = pd.read_csv(HERE / "../T001_query_chembl/data/EGFR_compounds.csv", index_col=0)
print(molecules.shape)
molecules.head()
(5568, 5)
molecule_chembl_idIC50unitssmilespIC50
0CHEMBL637860.003nMBrc1cccc(Nc2ncnc3cc4ccccc4cc23)c111.522879
1CHEMBL358200.006nMCCOc1cc2ncnc(Nc3cccc(Br)c3)c2cc1OCC11.221849
2CHEMBL537110.006nMCN(C)c1cc2c(Nc3cccc(Br)c3)ncnc2cn111.221849
3CHEMBL660310.008nMBrc1cccc(Nc2ncnc3cc4[nH]cnc4cc23)c111.096910
4CHEMBL537530.008nMCNc1cc2c(Nc3cccc(Br)c3)ncnc2cn111.096910

Apply the Ro5 to all molecules.

# This takes a couple of seconds
ro5_properties = molecules["smiles"].apply(calculate_ro5_properties)
ro5_properties.head()
molecular_weightn_hban_hbdlogpro5_fulfilled
0349.021459315.2891True
1387.058239514.9333True
2343.043258513.5969True
3339.011957424.0122True
4329.027607523.5726True

Concatenate molecules with Ro5 data.

molecules = pd.concat([molecules, ro5_properties], axis=1)
molecules.head()
molecule_chembl_idIC50unitssmilespIC50molecular_weightn_hban_hbdlogpro5_fulfilled
0CHEMBL637860.003nMBrc1cccc(Nc2ncnc3cc4ccccc4cc23)c111.522879349.021459315.2891True
1CHEMBL358200.006nMCCOc1cc2ncnc(Nc3cccc(Br)c3)c2cc1OCC11.221849387.058239514.9333True
2CHEMBL537110.006nMCN(C)c1cc2c(Nc3cccc(Br)c3)ncnc2cn111.221849343.043258513.5969True
3CHEMBL660310.008nMBrc1cccc(Nc2ncnc3cc4[nH]cnc4cc23)c111.096910339.011957424.0122True
4CHEMBL537530.008nMCNc1cc2c(Nc3cccc(Br)c3)ncnc2cn111.096910329.027607523.5726True
# Note that the column "ro5_fulfilled" contains boolean values.
# Thus, we can use the column values directly to subset data.
# Note that ~ negates boolean values.
molecules_ro5_fulfilled = molecules[molecules["ro5_fulfilled"]]
molecules_ro5_violated = molecules[~molecules["ro5_fulfilled"]]print(f"# compounds in unfiltered data set: {molecules.shape[0]}")
print(f"# compounds in filtered data set: {molecules_ro5_fulfilled.shape[0]}")
print(f"# compounds not compliant with the Ro5: {molecules_ro5_violated.shape[0]}")
# NBVAL_CHECK_OUTPUT
# compounds in unfiltered data set: 5568
# compounds in filtered data set: 4635
# compounds not compliant with the Ro5: 933
# Save filtered data
molecules_ro5_fulfilled.to_csv(DATA / "EGFR_compounds_lipinski.csv")
molecules_ro5_fulfilled.head()
molecule_chembl_idIC50unitssmilespIC50molecular_weightn_hban_hbdlogpro5_fulfilled
0CHEMBL637860.003nMBrc1cccc(Nc2ncnc3cc4ccccc4cc23)c111.522879349.021459315.2891True
1CHEMBL358200.006nMCCOc1cc2ncnc(Nc3cccc(Br)c3)c2cc1OCC11.221849387.058239514.9333True
2CHEMBL537110.006nMCN(C)c1cc2c(Nc3cccc(Br)c3)ncnc2cn111.221849343.043258513.5969True
3CHEMBL660310.008nMBrc1cccc(Nc2ncnc3cc4[nH]cnc4cc23)c111.096910339.011957424.0122True
4CHEMBL537530.008nMCNc1cc2c(Nc3cccc(Br)c3)ncnc2cn111.096910329.027607523.5726True

可视化 Ro5 属性(雷达图)

计算 Ro5 属性的统计数据

定义一个辅助函数来计算输入 DataFrame 的均值和标准差。

def calculate_mean_std(dataframe):"""Calculate the mean and standard deviation of a dataset.Parameters----------dataframe : pd.DataFrameProperties (columns) for a set of items (rows).Returns-------pd.DataFrameMean and standard deviation (columns) for different properties (rows)."""# Generate descriptive statistics for property columnsstats = dataframe.describe()# Transpose DataFrame (statistical measures = columns)stats = stats.T# Select mean and standard deviationstats = stats[["mean", "std"]]return stats

计算满足 Ro5的化合物数据集的统计数据。

molecules_ro5_fulfilled_stats = calculate_mean_std(molecules_ro5_fulfilled[["molecular_weight", "n_hba", "n_hbd", "logp"]]
)
molecules_ro5_fulfilled_stats
# NBVAL_CHECK_OUTPUT
meanstd
molecular_weight414.43901187.985100
n_hba5.9965481.875491
n_hbd1.8899681.008368
logp4.0705681.193034

计算了 违反 Ro5 的化合物数据集的统计数据

molecules_ro5_violated_stats = calculate_mean_std(molecules_ro5_violated[["molecular_weight", "n_hba", "n_hbd", "logp"]]
)
molecules_ro5_violated_stats
meanstd
molecular_weight587.961963101.999229
n_hba7.9635582.373576
n_hbd2.3011791.719732
logp5.9734611.430636

定义辅助函数为雷达绘图准备数据

下面,我们将定义一些仅用于雷达绘图的辅助函数。

准备 y 值:用于 Ro5 标准的属性具有不同的大小。MWT 的阈值为 500,而 HBA 和 HBD 的数量以及 LogP 的阈值分别仅为 10、5 和 5。为了最简单地可视化这些不同的尺度,我们将把所有属性值缩放到5 的缩放阈值:

scaled property value = property value / property threshold * scaled property threshold

  • scaled MWT = MWT / 500 * 5 = MWT / 100
  • scaled HBA = HBA / 10 * 5 = HBA / 2
  • scaled HBD = HBD / 5 * 5 = HBD
  • scaled LogP = LogP / 5 * 5 = LogP

这导致 MWT 缩小 100,HBA 缩小 2,而 HBD 和 LogP 保持不变。

以下辅助函数执行此类缩放,稍后将在雷达绘图期间使用。

def _scale_by_thresholds(stats, thresholds, scaled_threshold):"""Scale values for different properties that have each an individually defined threshold.Parameters----------stats : pd.DataFrameDataframe with "mean" and "std" (columns) for each physicochemical property (rows).thresholds : dict of str: intThresholds defined for each property.scaled_threshold : int or floatScaled thresholds across all properties.Returns-------pd.DataFrameDataFrame with scaled means and standard deviations for each physiochemical property."""# Raise error if scaling keys and data_stats indicies are not matchingfor property_name in stats.index:if property_name not in thresholds.keys():raise KeyError(f"Add property '{property_name}' to scaling variable.")# Scale property datastats_scaled = stats.apply(lambda x: x / thresholds[x.name] * scaled_threshold, axis=1)return stats_scaled

Prepare x values:

以下辅助函数返回 雷达图的物理化学属性轴的角度。例如,如果我们想为 4 个属性生成雷达图,我们想将轴设置为 0°、90°、180° 和 270°。辅助函数返回弧度等角度。

def _define_radial_axes_angles(n_axes):"""Define angles (radians) for radial (x-)axes depending on the number of axes."""x_angles = [i / float(n_axes) * 2 * math.pi for i in range(n_axes)]x_angles += x_angles[:1]return x_angles

Both functions will be used as helper functions in the radar plotting function, which is defined next.

生成雷达图!

现在,我们定义了一个函数,以雷达图的形式可视化化合物的化学性质。我们遵循了stackoverflow 上的这些说明。

def plot_radar(y,thresholds,scaled_threshold,properties_labels,y_max=None,output_path=None,
):"""Plot a radar chart based on the mean and standard deviation of a data set's properties.Parameters----------y : pd.DataFrameDataframe with "mean" and "std" (columns) for each physicochemical property (rows).thresholds : dict of str: intThresholds defined for each property.scaled_threshold : int or floatScaled thresholds across all properties.properties_labels : list of strList of property names to be used as labels in the plot.y_max : None or int or floatSet maximum y value. If None, let matplotlib decide.output_path : None or pathlib.PathIf not None, save plot to file."""# Define radial x-axes angles -- uses our helper function!x = _define_radial_axes_angles(len(y))# Scale y-axis values with respect to a defined threshold -- uses our helper function!y = _scale_by_thresholds(y, thresholds, scaled_threshold)# Since our chart will be circular we append the first value of each property to the endy = y.append(y.iloc[0])# Set figure and subplot axisplt.figure(figsize=(6, 6))ax = plt.subplot(111, polar=True)# Plot dataax.fill(x, [scaled_threshold] * 5, "cornflowerblue", alpha=0.2)ax.plot(x, y["mean"], "b", lw=3, ls="-")ax.plot(x, y["mean"] + y["std"], "orange", lw=2, ls="--")ax.plot(x, y["mean"] - y["std"], "orange", lw=2, ls="-.")# From here on, we only do plot cosmetics# Set 0° to 12 o'clockax.set_theta_offset(math.pi / 2)# Set clockwise rotationax.set_theta_direction(-1)# Set y-labels next to 180° radius axisax.set_rlabel_position(180)# Set number of radial axes' ticks and remove labelsplt.xticks(x, [])# Get maximal y-ticks valueif not y_max:y_max = int(ax.get_yticks()[-1])# Set axes limitsplt.ylim(0, y_max)# Set number and labels of y axis ticksplt.yticks(range(1, y_max),["5" if i == scaled_threshold else "" for i in range(1, y_max)],fontsize=16,)# Draw ytick labels to make sure they fit properly# Note that we use [:1] to exclude the last element which equals the first element (not needed here)for i, (angle, label) in enumerate(zip(x[:-1], properties_labels)):if angle == 0:ha = "center"elif 0 < angle < math.pi:ha = "left"elif angle == math.pi:ha = "center"else:ha = "right"ax.text(x=angle,y=y_max + 1,s=label,size=16,horizontalalignment=ha,verticalalignment="center",)# Add legend relative to top-left plotlabels = ("mean", "mean + std", "mean - std", "rule of five area")ax.legend(labels, loc=(1.1, 0.7), labelspacing=0.3, fontsize=16)# Save plot - use bbox_inches to include text boxesif output_path:plt.savefig(output_path, dpi=300, bbox_inches="tight", transparent=True)plt.show()

在下文中,我们要绘制两个数据集的雷达图:

  1. 满足 Ro5 的化合物
  2. 违反 Ro5 的化合物

定义两个雷达图应保持相同的输入参数

thresholds = {"molecular_weight": 500, "n_hba": 10, "n_hbd": 5, "logp": 5}
scaled_threshold = 5
properties_labels = ["Molecular weight (Da) / 100","# HBA / 2","# HBD","LogP",
]
y_max = 8
  1. 绘制了满足 Ro5 的化合物数据集的雷达图。
plot_radar(molecules_ro5_fulfilled_stats,thresholds,scaled_threshold,properties_labels,y_max,
)

在这里插入图片描述

蓝色方块表示分子理化性质符合 Ro5 的区域。

蓝线突出显示平均值,而橙色虚线显示标准偏差。

我们可以看到,平均值从不违反任何 Lipinski 规则。但是,根据标准偏差,某些属性的值大于 Ro5 阈值。这是可以接受的,因为根据 Ro5,可以违反四项规则中的一项。

  1. 绘制了违反 Ro5 的化合物数据集的雷达图。 violate the Ro5.
plot_radar(molecules_ro5_violated_stats,thresholds,scaled_threshold,properties_labels,y_max,
)

我们看到化合物大多违反 Ro5,因为它们的 logP 值和分子量。

这篇关于基于ADME的分子过滤和 lead-likeness标准的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/440981

相关文章

Python 标准库time时间的访问和转换问题小结

《Python标准库time时间的访问和转换问题小结》time模块为Python提供了处理时间和日期的多种功能,适用于多种与时间相关的场景,包括获取当前时间、格式化时间、暂停程序执行、计算程序运行时... 目录模块介绍使用场景主要类主要函数 - time()- sleep()- localtime()- g

Mybatis拦截器如何实现数据权限过滤

《Mybatis拦截器如何实现数据权限过滤》本文介绍了MyBatis拦截器的使用,通过实现Interceptor接口对SQL进行处理,实现数据权限过滤功能,通过在本地线程变量中存储数据权限相关信息,并... 目录背景基础知识MyBATis 拦截器介绍代码实战总结背景现在的项目负责人去年年底离职,导致前期规

深入探索协同过滤:从原理到推荐模块案例

文章目录 前言一、协同过滤1. 基于用户的协同过滤(UserCF)2. 基于物品的协同过滤(ItemCF)3. 相似度计算方法 二、相似度计算方法1. 欧氏距离2. 皮尔逊相关系数3. 杰卡德相似系数4. 余弦相似度 三、推荐模块案例1.基于文章的协同过滤推荐功能2.基于用户的协同过滤推荐功能 前言     在信息过载的时代,推荐系统成为连接用户与内容的桥梁。本文聚焦于

pandas数据过滤

Pandas 数据过滤方法 Pandas 提供了多种方法来过滤数据,可以根据不同的条件进行筛选。以下是一些常见的 Pandas 数据过滤方法,结合实例进行讲解,希望能帮你快速理解。 1. 基于条件筛选行 可以使用布尔索引来根据条件过滤行。 import pandas as pd# 创建示例数据data = {'Name': ['Alice', 'Bob', 'Charlie', 'Dav

MOLE 2.5 分析分子通道和孔隙

软件介绍 生物大分子通道和孔隙在生物学中发挥着重要作用,例如在分子识别和酶底物特异性方面。 我们介绍了一种名为 MOLE 2.5 的高级软件工具,该工具旨在分析分子通道和孔隙。 与其他可用软件工具的基准测试表明,MOLE 2.5 相比更快、更强大、功能更丰富。作为一项新功能,MOLE 2.5 可以估算已识别通道的物理化学性质。 软件下载 https://pan.quark.cn/s/57

数据治理框架-ISO数据治理标准

引言 "数据治理"并不是一个新的概念,国内外有很多组织专注于数据治理理论和实践的研究。目前国际上,主要的数据治理框架有ISO数据治理标准、GDI数据治理框架、DAMA数据治理管理框架等。 ISO数据治理标准 改标准阐述了数据治理的标准、基本原则和数据治理模型,是一套完整的数据治理方法论。 ISO/IEC 38505标准的数据治理方法论的核心内容如下: 数据治理的目标:促进组织高效、合理地

C 标准库 - `<float.h>`

C 标准库 - <float.h> 概述 <float.h> 是 C 标准库中的一个头文件,它定义了与浮点数类型相关的宏。这些宏提供了关于浮点数的属性信息,如精度、最小和最大值、以及舍入误差等。这个头文件对于需要精确控制浮点数行为的程序非常有用,尤其是在数值计算和科学计算领域。 主要宏 <float.h> 中定义了许多宏,下面列举了一些主要的宏: FLT_RADIX:定义了浮点数的基数。

《C++标准库》读书笔记/第一天(C++新特性(1))

C++11新特性(1) 以auto完成类型自动推导 auto i=42; //以auto声明的变量,其类型会根据其初值被自动推倒出来,因此一定需要一个初始化操作; static auto a=0.19;//可以用额外限定符修饰 vector<string> v;  auto pos=v.begin();//如果类型很长或类型表达式复杂 auto很有用; auto l=[] (int

Java8特性:分组、提取字段、去重、过滤、差集、交集

总结下自己使用过的特性 将对象集合根据某个字段分组 //根据id分组Map<String, List<Bean>> newMap = successCf.stream().collect(Collectors.groupingBy(b -> b.getId().trim())); 获取对象集合里面的某个字段的集合 List<Bean> list = new ArrayList<>