您现在的位置是：首页 > 其它

当前栏目

相关性分析你了解多少？可视化展示一下吧~~

分析了解可视化多少展示一下相关性

2023-06-13 09:13:56 时间

今天小编介绍数据分析中最常用的方法之一相关性分析，该步骤多用于数据探索过程中，用于检测数据维度之间的相关密切程度。本文将通过以下内容介绍相关性分析：

相关性定义及种类
相关性分析图表展示

更多绘制细节可参考Python-matplotlib 学术散点图 EE 统计及绘制。

R绘制

R-ggplot2绘制小编这里也直接给出绘制代码。如下：

library(tidyverse)
scatter_data <- read.csv('scatter_ggplot2.csv')

#可视化绘制
ggplot(scatter_data,aes(x = true_data,y = model01_estimated)) +
  geom_point(shape=15) + 
  geom_smooth(method = 'lm',se = F,color='red',size=1) +
  #绘制对角线:最佳拟合线
  geom_abline(slope = 1,intercept = 0,color='black',size=1) +
  #绘制上误差线
  geom_abline(slope = 1.15,intercept = .05,linetype = "dashed",size=1) +
  #绘制下误差线
  geom_abline(slope = .85,intercept = -.05,linetype = "dashed",size=1) +
  #使用 ggpubr 包添加R2等元素
  stat_regline_equation(label.x = .1,label.y = 1.8,size=6,family='Times_New_Roman',fontface='bold')+
  stat_cor(aes(label = paste(..rr.label.., ..p.label.., sep = "~`,`~")),
      label.x = .1, label.y = 1.6,size=6,family='Times_New_Roman',fontface='bold') +
  geom_text(x=.1,y=1.4,label="N = 4348",size=6,family='Times_New_Roman',hjust = 0)+
  #修改坐标轴刻度
  scale_x_continuous(limits = c(0,2),breaks = seq(0,2,0.2),expand = c(0,0)) +
  scale_y_continuous(limits = c(0,2),breaks = seq(0,2,0.2),expand = c(0,0)) +
  labs(x ='True Values',y="Model Estimated",
       title = "The scatter chart of Train data and Tset data",
       subtitle = "scatter R-ggplot2 Exercise(no color)",
       caption = 'Visualization by DataCharm')+
  #添加图序号（a）
  geom_text(x=1.85,y=1.85,label='(a)',size=9,family='Times_New_Roman',fontface='bold')+
  #添加误差个数
  geom_text(x=1.4,y=.4,label='Within EE = 52%',size=5,family='Times_New_Roman',hjust = 0)+
  geom_text(x=1.4,y=.3,label='Above EE = 39%',size=5,family='Times_New_Roman',hjust = 0)+
  geom_text(x=1.4,y=.2,label='Below EE = 9%',size=5,family='Times_New_Roman',hjust = 0)+
  #theme_base() +
  theme(text = element_text(family = "Times_New_Roman",face='bold'),
           axis.text = element_text(family = 'Times_New_Roman',size = 12,face = 'bold'),
           #修改刻度线内
           axis.ticks.length=unit(0.22, "cm"), 
           #绘制虚线网格
           panel.grid.major.y = element_line(linetype = 'dotted',color = 'black'),
           #去除y刻度
           axis.ticks.y = element_blank(),
           axis.line.y = element_blank(),
           #去除panel 背景颜色
           panel.background = element_rect(fill = NA),
           panel.ontop = F,
           #加宽图边框
           #panel.border = element_rect(size=1),
           plot.background = element_rect(fill = NULL),
           axis.line = element_line(size = .8),
           axis.ticks = element_line(size = .8),
           #设置刻度label的边距
           axis.text.x = element_text(margin=unit(c(0.5,0.5,0.5,0.5), "cm")), 
           axis.text.y = element_text(margin=unit(c(0.3,0.3,0.3,0.3), "cm")))

Example Chart Of Correlation Analysis in R

更多绘制细节可参考R-ggplot2 学术散点图绘制。

总结

今天这篇推文，小编简单的介绍了相关性含义，并分别使用Python和R语言进行了一个标准相关性散点图的绘制，希望可以给需要的小伙伴一些帮助~~

猜你喜欢

京东方入股荣耀！官方回应来了
RocketMQ——RocketMQ与JMS的辨析（杂谈）详解编程语言
秒杀场景Redis令人惊叹的反应力（秒杀完全依赖redis）
安卓手机实现连接SQL Server数据库的简易方法（安卓连sqlserver）
精益生产流程优化的好处这么多，不允许你不知道！
mysql的多表删除
Oracle Job执行出错这是怎么回事（oracle job报错）
位版本下载和安装指南（mysql5.564）
jsp分页显示完整实例
ubbjs
Oracle使用游标循环实现数据处理（oracle使用游标循环）
php从右向左/从左向右截取字符串的实现方法
更新SqlServer：构建智能数据库新世界（更新sqlserver）
模块Linux查看核心模块：简明指南（linux查看核心）
linux curl怎么安装_python curl
如何求连续几个数之和的最大值
【Pytorch基础】加载数据集
Linux挂载ISO：从入门到精通（linux挂载iso）

zl程序教程

当前栏目

相关性分析你了解多少？可视化展示一下吧~~

相关性分析简介

基本介绍

相关系数、判定系数、回归系数

相关性图表绘制

Python绘制

R绘制

总结

相关文章