distancenet专题

Multi-Source Domain Adaptation for Text Classification via DistanceNet-Bandits论文学习

摘要目标域上的学习算法的域适应性能是其源域的误差和两个域的数据分布的散度度量。我们在NLP任务的上下文任务中研究了各种基于距离的方法，根据样本估计来描述域之间的差异。我们首先进行了分析实验来展示哪种距离度量方法可以最好地区分样本来自相同领域还是不同领域，和实际结果相关。接下来，我们研究了一种叫做DistanceNet的模型，这个模型使用这些距离度量的方法，或者将这些度量方法混合，作为一种额外的损