生信星球学习day6-毽子
2023-02-25 18:19:48 时间
R包学习
1.镜像设置
为了保证我们可以自定义CRAN和Bioconductor的下载镜像,其实是可以在Rstudio中进行设置的,只需要运行这两行代码即可:
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
2.安装
记得要联网,看看网行不行
R包安装命令是install.packages(“包”)或者BiocManager::install(“包”)。取决于你要安装的包存在于CRAN网站还是Biocductor,存在于哪里?可以谷歌搜到。
3.加载
library和require,两个函数均可
安装加载三部曲
options("repos" = c(CRAN="https://mirrors.tuna.tsinghua.edu.cn/CRAN/"))
options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/")
install.packages("dplyr")
library(dplyr)
dplyr五个基础函数
先导入示例数据再操作
示例数据直接使用内置数据集iris的简化版:
test <- iris[c(1:2,51:52,101:102),]
mutate(),新增列
mutate(test, new = Sepal.Length * Sepal.Width)
select 按列筛选
select(test,1)
select(test,c(1,5))
(2)按列名筛选
select(test, Petal.Length, Petal.Width)
vars <- c("Petal.Length", "Petal.Width")
select(test, one_of(vars))
3.filter()筛选行
4.arrange(),按某1列或某几列对整个表格进行排序
arrange(test, Sepal.Length)#默认从小到大排序
arrange(test, desc(Sepal.Length))#用desc从大到小
5.summiaze(): 汇总
summarise(test, mean(Sepal.Length), sd(Sepal.Length))# 计算Sepal.Length的平均值和标准差
> group_by(test, Species)
summarise(group_by(test, Species),mean(Sepal.Length), sd(Sepal.Length))
dplyr两个实用技能
1:管道操作 %>% (cmd/ctr + shift + M)
(加载任意一个tidyverse包即可用管道符号)
2:count统计某列的unique值
count(test,Species)
dplyr处理关系数据
1.內连inner_join,取交集
inner_join(test1, test2, by = "x")
2.左连left_join
ps:理解起来有点绕
3.全连接 full_join( test1, test2, by = 'x')
4.半连接:返回能够与y表匹配的x表所有记录semi_join
5.反连接:返回无法与y表匹配的x表的所记录anti_join
anti_join(x = test2, y = test1, by = 'x')
6.简单合并
在相当于base包里的cbind()函数和rbind()函数;注意,bind_rows()函数需要两个表格列数相同,而bind_cols()函数则需要两个数据框有相同的行数
相关文章
- 从源码层面理解 React 是如何做 diff 的
- 如何计算浏览器页面的帧数 FPS?
- web前端面试技巧-如何自我介绍?如何应对hr?
- 软件测试面试,如何自我介绍?
- 揭开 Python super() 的真面目
- 移动端适配viewport缩放方案
- 移动端适配动态rem方案
- 移动端适配vw方案
- appium 处理存webview页面与webview和native混合页面
- Python 面向对象进阶
- Python 面向对象编程基础
- 函数式编程(一) 认识“编程范式”和“函数”
- comet在asp.net中的实现
- 依赖倒置(DIP)与依赖注入(DI)
- 软件设计原则与模式
- .NET开发笔记(二十三) 谷歌地图下载
- .Net开发笔记(二十一) 反射在.net中的应用
- .Net开发笔记(二十)创建一个需要授权的第三方组件
- .Net开发笔记(十九) 创建一个可以可视化设计的对象
- .net开发笔记(十八) winform中的等待框