概念:弱监督学习
文章给的定义是: 数据集的标签是不可靠的,如(x,y),y对于x的标记是不可靠的。这里的不可靠可以是标记不正确,多种标记,标记不充分,局部标记等。
在实际应用中的学习问题往往以混合形式出现,如多标记多示例、半监督多标记、弱标记多标记等。针对监督信息不完整或不明确对象的学习问题统称为弱监督学习。
弱监督学习可以看做是有多个标记的数据集合,次集合可以是空集,单个元素,或是多个元素,分别对应x没有标记,有一个标记,和有多个标记三种情况。在此统一声明为一个标记的集合。
在实际的使用中多标记的使用是很常见的,在图像文本语音中是很容易找到多个标记的。
举个图像中的例子:
一般机器学习算法,每一个训练样本都需要类别标号(对于二分类:1/-1)。实际上那样的数据其实已经经过了抽象,实际的数据要获得这样的标号还是很难,图像就是个典型。还有就是数据标记的工作量太大,我们想偷懒了,所以多只是给了正负样本集。负样本集里面的样本都是负的,但是正样本里面的样本不一定都是正的,但是至少有一个样本是正的。比如检测人的问题,一张天空的照片就可以是一个负样本集;一张某某自拍照就是一个正样本集(你可以在N个区域取N个样本,但是只有部分是有人的正样本)。这样正样本的类别就很不明确,传统的方法就没法训练。
那么问题来了:图像的不是有标注吗?有标注就应该有类别标号啊?这是因为图片是人标的,数据量特大,难免会有些标的不够好,这就是所谓的弱监督集(weakly supervised set)。所以如果算法能够自动找出最优的位置,那分类器不就更精确吗? 标注位置不是很准确,比如自行车的车轮的位置,是完全没有位置标注的,只知道在bounding box区域附近有一个车轮。
弱监督学习多用在多标记的数据上,感兴趣的可以去看一下:
《Weakly supervised discriminative location and classification: a joint learning process》
相关文章
- 《跟唐老师学习云网络》 - 我的网络概念
- ML - 深度学习之美十四章-概念摘要(1~7)
- 重新整理操作系统概念系类——进程通信
- 【Machine Learning】机器学习及其基础概念简介
- 机器学习、数据挖掘、人工智能、统计模型这么多概念有何差异
- 【学习总结】计算机硬件常用概念
- ML - 深度学习之美十四章-概念摘要(8~14)
- ML - 深度学习之美十四章-概念摘要(1~7)
- identity4 系列————开篇概念[一]
- 机器学习笔记 - 探索性数据分析(EDA) 概念理解
- Atitit 前端重要概念和趋势总结 大前端 目录 1. 大前端1 2. 三个层面上的大前端1 2.1. 大前端与NodeJS与前后端分离1 2.2. 微信Web1 2.3. React
- Atitit.java线程池使用总结attilax 1.1. 动态更改线程数量1 1.2. code1 三、线程池的原理 其实线程池的原理很简单,类似于操作系统中的缓冲区的概念,它的流程如下
- 通过单步调试的方式学习 Angular 中 TView 和 LView 的概念
- Paper:《Explainable Artificial Intelligence (XAI): Concepts&可解释的人工智能:负责任人工智能的概念、分类法、机遇和挑战》翻译与解读02
- ML与math:机器学习与高等数学基础概念、代码实现、案例应用之详细攻略——基础篇
- CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧
- ML之UL:无监督学习Unsupervised Learning的概念、应用、经典案例之详细攻略
- CGI WSGI ASGI的概念和区别
- 【Kotlin 协程】协程简介 ( 协程概念 | 协程作用 | 创建 Android 工程并进行协程相关配置开发 | 异步任务与协程对比 )
- Linux五种IO模型(同步 阻塞概念)
- SpringCloud的入门学习之概念理解、Zuul路由网关
- 鸟书shell 学习笔记(一) shell专注于概念和命令
- go语言笔记——包的概念本质上和java是一样的,通过大小写来区分private,fmt的Printf不就是嘛!
- 学习 C++,关键是要理解概念,而不应过于深究语言的技术细节
- 【机器学习概念笔记】:空间概念
- 大数据Hadoop之——DorisDB核心概念介绍与简单使用(StarRocks)
- 【ML】第 1 章 :分布式机器学习:术语和概念
- ELkStack集群核心概念(一)
- k8s数据卷概念与常用操作