您现在的位置是：首页 > 其他

当前栏目

迁移学习《Cluster-Guided Semi-Supervised Domain Adaptation for Imbalanced Medical Image Classification》

迁移学习 for Image cluster domain Classification Supervised

2023-09-14 09:08:52 时间

论文信息

论文标题：Cluster-Guided Semi-Supervised Domain Adaptation for Imbalanced Medical Image Classification
论文作者：S. Harada, Ryoma Bise, Kengo Araki
论文来源：ArXiv 2 March 2023
论文地址：download
论文代码：download
视屏讲解：click

1 摘要

　　一种半监督域自适应方法，对医学图像分类任务中常见的类不平衡情况具有鲁棒性。为了稳健性，提出了一种弱监督聚类流水线来获得高纯度聚类，并在表示学习中利用这些聚类进行域适应。

2 方法

2.1 问题定义

　　Consider that we have a set of $m^{s}$ labeled source samples, $\mathcal{D}^{s}=\left\{\left(x_{i}^{s}, y_{i}^{s}\right)\right\}_{i=1}^{m^{s}}$ , where $x_{i}^{s}$ is the $i$-th image sample in the source domain and $y_{i}^{s} \in\{1, \ldots, C\}$ is its class label. In the target domain, we have a set of $m^{t}$ labeled samples, $\mathcal{D}^{t}=\left\{\left(x_{i}^{t}, y_{i}^{t}\right)\right\}_{i=1}^{m^{t}}$ , and a set of $m^{u}$ unlabeled target samples, $\mathcal{D}^{u}=\left\{x_{i}^{u}\right\}_{i=1}^{m^{m}}$ . Then we consider the problem of improving the classification performance using not only $\mathcal{D}^{s}$ but also $\left\{\mathcal{D}^{t}, \mathcal{D}^{u}\right\}$ , after adapting $\left\{\mathcal{D}^{t}, \mathcal{D}^{u}\right\}$ to $\mathcal{D}^{s}$ . Since we have the labeled samples $\mathcal{D}^{t}$ in the target domain, this problem is called semi-supervised domain adaptation.

2.2 模型概念图

2.3 方法简介

2.3.1 弱监督聚类

通过软约束聚类优化聚类

　　第一个聚类优化步骤旨在将每个冲突的聚类（即具有来自不同类别标签的样本的聚类）划分为几个不冲突的聚类。约束聚类引入了两种类型的约束，称为 必须链接 和 不能链接。必须链接给应该分组到同一个集群的样本，而不能链接给不应该在同一分组的样本。

　　本文使用 k-means 初始化聚类，如果同一簇存在不同带标签的样本则不能将链接附加到它们，反之可以。链接附加后，再次执行聚类，同时满足链接的约束。应用此步骤后，集群中标记的目标样本始终属于一个类。

通过基于比例的分裂进行聚类细化

　　第二个聚类细化步骤旨在根据类比例 $\left(p_{1}, \ldots, p_{C}\right)$ 将聚类拆分为更小的聚类，即通过带标签目标样本的比例计算整体的比例。

　　$\bar{c}_{i}$ 表示第 $i$ 个簇中标记样本的类别，$u_{i}$ 是第 $i$ 个簇中未标记样本的数量。如果 $m^{u} p_{\bar{c}_{i}} \leq u_{i}$ ，认为集群对于类 $\bar{c}_{i}$ 来说太大了，因此通过 k-means (k = 2) 将其分成两个较小的集群。因此，即使是小类，也可以期待高纯度的簇。

2.3.2 集群引导域适应

　　使用上述谨慎步骤给出的聚类结果，我们现在执行聚类引导的域自适应，如 Figs.(c) 和 Figs.(d) 所示。 CNN 模型 $f$ 针对两个目标进行训练。一种是通过交叉熵损失对所有标记样本 $\mathcal{D}^{s} \cup \mathcal{D}^{t}$ 进行分类，使源样本和标记目标样本靠得更近，如 $Fig. \mathrm{c}$ 所示。另一种是引导未标记样本 $x_{j}^{u}$ 重新训练后更接近属于同一簇的标记样本 $\boldsymbol{x}_{i}^{t}$（即 $\boldsymbol{x}_{i}^{t}$ 比属于 a 的 $x_{l}^{u}$ 更接近属于同一簇的 $\boldsymbol{x}_{j}^{u}$ 不同的集群）。更具体地说，我们通过以下目标训练模型：

　　　　$\begin{array}{l}\mathcal{L}_{\mathrm{clu}}\left(\boldsymbol{x}_{i}^{t}, \boldsymbol{x}_{j}^{u}, \boldsymbol{x}_{l}^{u}\right)= \max \left\{\left\|\boldsymbol{f}\left(\boldsymbol{x}_{i}^{t}\right)-\boldsymbol{f}\left(\boldsymbol{x}_{j}^{u}\right)\right\|_{2}^{2}-\left\|\boldsymbol{f}\left(\boldsymbol{x}_{i}^{t}\right)-\boldsymbol{f}\left(\boldsymbol{x}_{l}^{u}\right)\right\|_{2}^{2}+\varepsilon, 0\right\}\end{array}$

　　其中 $f(x)$ 表示样本 $x$ 的特征向量，$\varepsilon \in \Re^{+}$ 是边距。如 $Fig.1(d)$ 所示，通过使用这种损失训练 $f$ 以及标记样本 $x_{i}^{t}$ 的引导，将未标记样本逐渐映射到源域的相应类。请注意，在此框架中，我们没有为未标记样本提供任何伪标签——未标记样本被用作未标记样本，以帮助使用 $Eq. (1)$ 中标记样本进行表示学习。

3 实验

可视化

4 总结

　　略

猜你喜欢

tf-idf, CHI, TextRank详解程序员
MySQL数据库容灾策略: 优化容错能力！（mysql数据库容灾方案）
Oracle OSB组件实现智能系统集成（oracle osb组件）
javascript运行机制之this详细介绍
spring生命周期和bean生命周期_程序生命周期
2022下半年盘点：20+主流数据库重大更新及技术要点汇总
快速高效：Linux间文件传输（linux间传文件）
jQuery温习篇强大的JQuery选择器
Sticky Posts Switch插件教程WordPress中为分类添加置顶文章
操作Linux搭建图形化操作系统环境（linux添加图形界面）
以现在市场饱和度来说应该学习哪门编程语言是最好的呢？
VMware推出容器友好的Linux系统
掌握Oracle数据库，展现前沿复制技术（oracle数据库复制）
[android] android消息机制入门详解手机开发
Linux下批量重命名实现方法（批量重命名linux）
深入探索Linux网络设置方法（linux如何配置上网）

相关主题

mysql 迁移5
mysql 迁移12
数据迁移
虚拟机的迁移
迁移学习
学习学习
图像风格迁移
PyTorch-24h 06_迁移学习
[机器学习] 集成学习
机器学习和统计学习
机器学习之深度学习
Oracle数据库迁移
学习学习中
博客已迁移
redis：迁移键
7、迁移学习
Code First 迁移
PyTorch迁移学习
ORACLE 数据迁移

zl程序教程