您现在的位置是：首页 > 其他

当前栏目

概念：弱监督学习

概念学习监督

2023-09-14 09:01:23 时间

文章给的定义是：数据集的标签是不可靠的，如（x，y），y对于x的标记是不可靠的。这里的不可靠可以是标记不正确，多种标记，标记不充分，局部标记等。

在实际应用中的学习问题往往以混合形式出现,如多标记多示例、半监督多标记、弱标记多标记等。针对监督信息不完整或不明确对象的学习问题统称为弱监督学习。

弱监督学习可以看做是有多个标记的数据集合，次集合可以是空集，单个元素，或是多个元素，分别对应x没有标记，有一个标记，和有多个标记三种情况。在此统一声明为一个标记的集合。

在实际的使用中多标记的使用是很常见的，在图像文本语音中是很容易找到多个标记的。

举个图像中的例子：

一般机器学习算法，每一个训练样本都需要类别标号（对于二分类：1/-1）。实际上那样的数据其实已经经过了抽象，实际的数据要获得这样的标号还是很难，图像就是个典型。还有就是数据标记的工作量太大，我们想偷懒了，所以多只是给了正负样本集。负样本集里面的样本都是负的，但是正样本里面的样本不一定都是正的，但是至少有一个样本是正的。比如检测人的问题，一张天空的照片就可以是一个负样本集；一张某某自拍照就是一个正样本集（你可以在N个区域取N个样本，但是只有部分是有人的正样本）。这样正样本的类别就很不明确，传统的方法就没法训练。

那么问题来了：图像的不是有标注吗？有标注就应该有类别标号啊？这是因为图片是人标的，数据量特大，难免会有些标的不够好,这就是所谓的弱监督集（weakly supervised set）。所以如果算法能够自动找出最优的位置，那分类器不就更精确吗？标注位置不是很准确，比如自行车的车轮的位置，是完全没有位置标注的，只知道在bounding box区域附近有一个车轮。

弱监督学习多用在多标记的数据上，感兴趣的可以去看一下：

《Weakly supervised discriminative location and classification: a joint learning process》

猜你喜欢

Docker 构建 Centos 7 镜像
C++ 随机数字以及随机数字加字母生成
30分钟用 Restful ABAP Programming(RAP)模型开发一个支持增删改查的 Fiori 应用
SAP loyalty management点击了公式超链接后的处理逻辑
说说 PADS Layout 中的第 20 层和第 25层
[Java] Tomcat环境变量设置
【Android 插件化】Hook 插件化框架 ( 加载插件包资源 )
android设备之间屏幕共享
spring学习笔记(20)数据库事务并发与锁详解
Scala 位运算及代码块
PHP模拟登录并获取数据
Spring官网改版后下载
毕业设计 Spring Boot的考研信息收集与查询系统(含源码+论文)
如何写评价“星星”有半个情况的，如3.5，这样写好调数据
SSO之CAS基础及应用视频教程(2)

相关主题

3.k8s核心概念
数据库概念
云数据库概念
容器的概念
机器学习概念
学习学习
一些概念
云计算概念与技术
[机器学习] 集成学习
机器学习和统计学习
机器学习之深度学习
学习学习中
Linux进程概念
3-7 模块的概念
01_测试的概念
多线程概念
Linux相关概念

zl程序教程

当前栏目

概念：弱监督学习

相关文章