论文解读(DWL)《Dynamic Weighted Learning for Unsupervised Domain Adaptation》

[ Wechat:Y466551 | 付费咨询,非诚勿扰 ]

论文信息

论文标题:Dynamic Weighted Learning for Unsupervised Domain Adaptation

论文作者:Jihong Ouyang、Zhengjie Zhang、Qingyi Meng
论文来源:2023 aRxiv
论文地址:download 
论文代码:download
视屏讲解:click

1 介绍 

   

2 方法

2.1 出发点

  

  反应的问题:随着域对齐的实现,判别性在下降;

2.2 模型框架

  

2.3 Sample Weighting

  为避免由于源域和目标域样本数量差距过大导致模型产生倾向性,本文对每个域的样本进行加权:

    x^is=a(1+ntns)xis,i=1,2,,nsx^jt=a(1+nsnt)xjt,j=1,2,,nt

  其中,a(0,1] 是一个控制样本加权程度的超参数。

2.4 Domain Alignment Learning and Class Discrimination Learning 

  域对齐(对抗性学习):

    minθgmaxθdLda(θg,θd)=ExisDslog[D(G(x^is))]+ExjtDtlog[1D(G(x^jt))]

  鉴别性特征学习:


    minθg,θcmaxθc1,θc2Lcd(θg,θc,θc1,θc1)=ExjtDtC1(G(x^jt))C2(G(x^jt))1+C(G(x^jt))C1(G(x^jt))1+C(G(x^jt))C2(G(x^jt))1

  NoteCC1C2 是使用源域数据预训练得到的分类器。首先,固定 GC 最大化 C1C2 的差异。然后,固定 C1 和 C2 训练 GC

2.5 Dynamic Weighted Learning 

  域对齐度量 [ MMD ]:

    MMD(Ds,Dt)=ExisDsG(x^is)ExjtDtG(x^jt)2

  鉴别性度量  [ LDA ]:

    maxWJ(W)=tr(WSbW)tr(WSwW)

  其中,Sb 为类间散射矩阵,Sw 为类内散射矩阵。

  注意J(W) 越大,具有更好的辨别性。

  由于上述两个评价标准不在一个数量级上,本文对其进行了归一化处理:

    MM~D(Ds,Dt)=MMD(Ds,Dt)MMD(Ds,Dt)minMMD(Ds,Dt)maxMMD(Ds,Dt)min

    J~(W)=J(W)J(W)minJ(W)maxJ(W)min

  构造一个动态平衡因子:

    τ=MM~(Ds,Dt)MM~(Ds,Dt)+(1J~(W))

  注意MM~D(Ds,Dt) 越小代表这域对齐效果越好,1J~(W) 越小代表这鉴别性特征越好。

  • 当域对齐的程度远优于类的可辨别性时,MM~D(Ds,Dt) 接近 01J~(W) 接近 1τ 接近 0
  • 当域对齐程度远低于类别识别程度时,MM~D(Ds,Dt) 接近 11J~(W) 接近 0τ 接近 1

  基于 τ 的良好特性,采用 τ 作为域对齐损失的权重,1τ 作为类鉴别损失的权重。因此,得到的域对齐和类鉴别的动态加权模型如下:

    minθg,θcmaxθθd,θc1,θc2τLda(θg,θd)+(1τ)Lcd(θg,θc,θc1,θc2)

  • 当领域对齐学习的有效性远远低于类辨别学习时,模型增加了域对齐学习的权重;
  • 当鉴别学习的学习效果远低于域对齐学习时,模型增加鉴别学习的权重;

  在这种动态加权学习机制下,可以保持域对齐学习与类辨别学习之间的一致性,从而避免过度的域对齐或类可辨别性。

2.6 Overall Training Objective

  总体训练目标整合了样本加权、领域对齐学习、类判别学习和动态加权学习。此外,还需要最小化标记源样本的期望源误差。最终的极大极小目标:

    minθg,θcmaxθd,θc1,θc2i=1tsLce(C(G(xis;θg);θc),yis)+τLda(θg,θd)+(1τ)Lcd(θg,θc,θc1,θc2)

3 实验

分类结果

  

收敛性分析

  

  对于每个子图,红色曲线的左轴表示分类误差,蓝色曲线的右轴表示平衡因子 τ 的值。可以发现,随着迭代,它们两者都逐渐收敛到一个平坦的值。这意味着随着 τ 的减少,使得类的可鉴别性被强调,使得分类误差也减小。

  在迭代过程中,当 τ 的变化相对明显时,识别精度的提高也相对明显。我们将 τ 的初始值设为 0.5,可以发现 τ  在第一个时期急剧下降到 0.5 以下,说明该模型的对齐性相对较好,但可辨别性相对较差。

混淆矩阵可视化

  

对齐度和可鉴别性度的分析

  

消融实验

  

  

 

__EOF__

  • 本文作者: Blair
  • 本文链接: https://www.cnblogs.com/BlairGrowing/p/17604174.html
  • 关于博主: I am a good person
  • 版权声明: 本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
  • 声援博主: 如果您觉得文章对您有帮助,可以点击文章右下角推荐一下。
  • © 版权声明
    THE END
    喜欢就支持一下吧
    点赞0

    Warning: mysqli_query(): (HY000/3): Error writing file '/tmp/MYZaOCN1' (Errcode: 28 - No space left on device) in /www/wwwroot/583.cn/wp-includes/class-wpdb.php on line 2345
    admin的头像-五八三
    评论 抢沙发
    头像
    欢迎您留下宝贵的见解!
    提交
    头像

    昵称

    图形验证码
    取消
    昵称代码图片