深度学习中正样本、负样本、简单样本、困难样本的区别 (简单易懂)
2023-04-18 16:28:37 时间
1. 前序
在读论文或者看一些博客的时候,经常会出现这种名词:正样本、负样本、简单样本以及困难样本,最近自己为了加深这方面的理解,参考网上的一些资料,整理了下这几者之间的区别,方便自己查看也方便初学者快速了解。
2. 名词解释
正样本: 与真值对应的目标类别来说该样本为正样本。
负样本: 与真值不对应的其他所有目标类别来说该样本为负样本。
简单样本: 预测时与真值标签误差较小的样本。
困难样本: 预测时与真值标签误差较大的样本。
补充下:真值其实就是我们选择的这个样本的,比如说当前样本是猫,其他的狗、马之类的就不是真值。
3. 举例说明
我们以猫狗分类来举例说明什么是正负样本:
label = dog 的所有图片都是 这个类的正样本,其他图片作为负样本
label = cat 的所有图片都是 这个类的正样本,其他图片作为负样本
同理,在目标检测任务中
box 中有目标对象就是正样本,没有目标对象,也就是前景,看做负样本
接下来我们在用图片分类来说明什么是简单困难样本:
假如我们需要识别马、羊、牛三个类别。
给一张马的图片。对于预测马来说这个样本为正样本,对于预测羊和牛来说该样本为负样本。
真值one-hot标签:[1, 0, 0],而在预测出概率分布为[0.3, 0.3, 0.4]时,
真值one-hot标签相差较大,则此时该样本是困难样本。
而预测出[0.98, 0.01, 0.01]时,与真值one-hot标签相差较小,则此时该样本为简单样本。
对于困难样本因为真值one-hot标签[1,0,0] 其中按照我们人为思路给定的这张为马的图片概率是1,但是预测出来的概率为0.3,这与实际相差太大了,所以称这样的样本为困难样本。
4. 参考文献
相关文章
- 5G第一阶段标准发布 中国厂商标准占三成
- 抖音、微视短兵相接的3个月,腾讯到底做错了什么?
- 美媒:如果中国抢先建成5G网络 对美国威胁有多大
- 微博发手机报告,用iPhone的人越来越少了
- AR中的人工智能
- 第一版5G标准将于下月公布 揭秘:5G标准如何确立?
- 基于人工智能场景的移动平台工程化
- 想要提升自己?试试这19个好用的学习网站
- 安卓手机流畅排名:小米第五,一加第一,华为在哪?
- 开发者怎样在枯燥的工作中寻求技术的提升
- 手机大PK,终端云服务也将走向“一站式”?
- 美团iOS面试败北感悟
- 苹果为Siri引入机器学习技术 不再认错主人
- 中国手机销量下滑28%,乐视和酷派已消失,下一个消失的是谁?
- 一个老程序员的忠告:千万不要一辈子靠技术生存
- iOS程序员这样面试,当场拿到offer的几率是80%?
- 5G第一版国际标准6月完成:中国领跑
- 因为这三大原因 苹果不会首批采用5G技术
- 5G即将商用!工信部:今年6月确定5G第一版本国际标准
- 5G试验路线公布:今年开始5大城市规划500个站试验