本文主要是介绍from sklearn.datasets import make_classification生成随机类别的数据,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
先看help结果,及返回的结果,就是训练用的数据
make_classification(n_samples=100, n_features=20, n_informative=2,
n_redundant=2, n_repeated=0, n_classes=2, n_clusters_per_class=2, weights=None,
flip_y=0.01, class_sep=1.0, hypercube=True, shift=0.0, scale=1.0, shuffle=True, random_state=None)X : array of shape [n_samples, n_features]The generated samples.y : array of shape [n_samples]The integer labels for class membership of each sample.
y是0~n_classes-1单个数字的集合,分别对应X的sample
X几个特征就有几列,知道三个参数就可以干活了。
>>> X, y = make_classification(n_samples=100, n_features=5, n_classes=2, random_state=42)
>>> X[:12]
array([[-0.43066755, 0.67287309, -0.72427983, -0.53963044, -0.65160035],[ 0.21164583, -0.84389686, 0.53479393, 0.82584805, 0.68195297],
这篇关于from sklearn.datasets import make_classification生成随机类别的数据的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!