stratified专题

Stratified Transformer复现和调试运行记录,训练S3DIS数据集(点云语义分割)

环境: ubuntu20.04,gcc和g++都是7.5,cuda是11.3,显卡3090 创建虚拟环境: python=3.7,离线安装torch=1.8.0,torchision=0.9.0 (torch 不要超过1.12.1我的编译时报错)  安装torch=1.8.0(兼容性稍微好点)是因为torch.points3d这些库的要求,也可以使用作者用的torch1.7.1,cuda10

抽样偏差(Sampling Bias)与 分层抽样(Stratified Sampling)

个人觉得, 把分层抽样称为“分类采样”会更贴切一些。通常最基本的采样手段是:随机抽样,但是在很多场景下,随机抽样是有问题的。最简单也最有说服力的例子就是身高和体重在性别上的差异,在对它们进行抽样时必须考虑性别因素。我们可以粗略地说:女性的身高符合165为中心的正态分布,体重符合50公斤为中心的正态分布,而男性身高则可能是175为中心的正态分布,体重是60公斤中心的正态分布。还有一些示例未必那么明细