数据漂移
2023-02-18 16:32:13 时间
数据漂移的分类
第一种 叫做特征漂移或者是协变量漂移,它指的是在 $p(y|x)$ 不变的情况下,$p(x)$ 变化的情况。 比如我训练模型的时候用的主要是中年人的数据,但是在线上的主要用户却是青少年居多,那么很可能我没有那么好的数据
第二种叫做 label shift 也经常被叫做 prior shift, 顾名思义,就是 $y$ 的概率进行了漂移,但是 $p(x|y)$ 却没怎么变化。这里通常在做一些反因果的推断的时候比较又用比如 $x$ 是疾病的表现,$y$ 是疾病,那么疾病导致表现就可以认为是不变的,但是如果我们看到某一个疾病的出现更多了,那么可能是有什么突然的密集感染等等。
第三种就是 $p(y|x)$ 改变了,$p(x)$ 却没怎么变,这一类 shift 被称作 concept shift,概念漂移。比如说同样是搜索武汉这个城市,在疫情前爆发前和疫情爆发后,和在疫情被控制之后,大家想看到的内容是不一样的。
https://www.bilibili.com/video/BV1Ta411Z71A/?spm_id_from=333.999.0.0&vd_source=3ed772508ddeb48d236a6a9feb8a75a3
https://www.bilibili.com/read/cv18322985
==================
相关文章
- 一起来学redis-redis数据结构
- 一起来学redis-redisObject
- 一起来学redis-持久化
- 一起来学redis redission
- netfilter 五链四表 - 为什么服务器没有监听 80 端口却被k3s占用了
- RedisRoad - 01 Redis 的基本操作
- RedisRoad - 02 数据类型 String
- RedisRoad - 03 数据类型: List 列表
- RedisRoad - 04 数据类型 Set 集合
- RedisRoad - 05 数据类型 ZSet 有序集合
- RedisRoad - 06 数据类型 Hash 映射
- RedisRoad - redis 使用 unlink 删除大 key
- 【开个坑】 kustz 快速发布应用到 Kubernetes
- kustz 从零开始写一个 kubernetes 发布管理工具(汇总)
- 算法学习——递推之猴子爬山
- 算法学习——递推之超级素数
- 算法学习——枚举之完美综合式
- 算法学习——递归之排队购票问题
- 算法学习——枚举之超级方程
- 算法学习——枚举之最简真分数