【阶段二】Python数据分析Pandas工具使用06篇:探索性数据分析:异常数据的检测与处理
2023-09-14 09:06:13 时间
本篇的思维导图:
探索性数据分析:异常数据的检测与处理
异常值也称为离群点,就是那些远离绝大多数样本点的特殊群体,通常这样的数据点在数据集中都表现出不合理的特性。如果忽视这些异常值,在某些建模场景下就会导致结论的错误(如线性回归模型、K均值聚类等),所以在数据的探索过程中,有必要识别出这些异常值并处理好它们。通常,异常值的识别可以借助于图形法(如箱线图、正态分布图)。
基于箱线图识别异常
箱线图实际上就是利用数据的分位数识别其中的异常点,该图形属于典型的统计图形,在学术界和工业界都得到广泛的应用。箱线图的形状特征如图所示:
相关文章
- Python简介
- linxu 查看python解释器或者c/c++编译器的位置
- 小白学 Python 数据分析(14):Pandas (十三)数据导出
- 小白学 Python 数据分析(9):Pandas (八)数据预处理(2)
- 用Python的pandas框架操作Excel文件中的数据教程
- 重新梳理Linux系统中Python环境的问题
- 机器学习笔记 - python学习记录二 pandas常用命令
- [转]Python 命令行参数和getopt模块详解
- Python之pandas:将dict字典格式数据保存为dataframe格式数据的几种方法
- Python语言学习之pandas:利用pandas库统计某一列col中各个值出现的次数(降序输出)并绘图可视化
- Python之pandas:pandas中缺失值与空值处理的简介及常用函数(drop()、dropna()、isna()、isnull()、fillna())函数详解之详细攻略
- 100天精通Python(数据分析篇)——第70天:Pandas常用排序、排名方法(sort_index、sort_values、rank)
- 100天精通Python(数据分析篇)——第68天:Pandas数据清洗函数大全(判断缺失、删除空值、填补空值、替换元素、分割元素)
- 【阶段二】Python数据分析Pandas工具使用10篇:探索性数据分析:数据的检验:正态性检验
- 【阶段二】Python数据分析Pandas工具使用03篇:数据预处理:多表合并与连接
- 【阶段二】Python数据分析Pandas工具使用01篇:Pandas工具介绍、Pandas工具安装、数据结构:Series数据结构与DataFrame数据结构
- Python学习17:定义函数
- 【华为机试真题 Python实现】跳格子游戏【2022 Q2 | 200分】
- python pandas 基础理解
- python的range函数与切片操作符
- 〖Python自动化办公篇⑫〗- Excel 文件自动化 - 读取 excel 数据
- Python——numpy库查询
- Python基于OpenCV&ORB和特征匹配的双视频图像拼接(源码&部署教程)