您现在的位置是：首页 > IT要闻

当前栏目

生信星球学习day6-毽子

学习变量命令数据

2023-02-25 18:19:01 时间

新手攻略：

（1）R的赋值符号不是等号，而是<- （2）在Console 控制台输入命令，相当于Linux的命令行（3）R的代码都是带括号的，括号必须是英文的。（4）显示工作路径 getwd() （5）向量是由元素组成的，元素可以是数字或者字符串。（6）表格在R语言中改名叫数据框^_^ （7）别只复制代码，要理解其中的命令、函数的意思。函数或者命令不会用时，除了百度/谷歌搜索以外，用这个命令查看帮助：?read.table，调出对应的帮助文档，翻到example部分研究一下。（8）数据类型（重点只有两个，剩下的不看）

--生信星球

part1：向量

元素包括：数字或者字符串（用chr表示）等

标量：一个元素组成的变量

向量：多个元素组成的变量

赋值
x<- c(1,2,3) #常用的向量写法，意为将x定义为由元素1，2，3组成的向量。
x
x<- 1:10 #从1-10之间所有的整数
x
x<- seq(1,10,by = 0.5) #1-10之间每隔0.5取一个数（注意是逗号不是分号）
x
x<- rep(1:3,times=2) #1-3 重复2次
x

提取元素

按照位置选取

#这里的x是你刚才赋值的变量名，根据自己的情况来修改

x[4] #x第4个元素

x[-4]#排除法，除了第4个元素之外剩余的元素

x[2:4]#第2到4个元素

x[-(2:4)]#除了第2-4个元素

x[c(1,5)] #第1个和第5个元素

（2）根据逻辑值

x[x==10]#等于10的元素

x[x<0]

x[x %in% c(1,2,5)]#存在于向量c（1，2，5）中的元素

Part2：数据框

1.创建doudou.txt

2建立示例数据：

X1,X2

A,1

D,3

3.将示例数据放在你的工作目录下（！！！重要）

记得一定要放在工作目录里，否则报错。

用以下命令即可获得示例数据框：

X<-read.csv('doudou.txt')

（1）读取本地数据

（2）设置行名和列名

X<-read.csv('doudou.txt') #在示例数据里有doudou.txt 注意这里的变量X是一个数据框

colnames(X) #查看列名

rownames(X) #查看行名,默认值的行名就是行号，1.2.3.4...

colnames(X)[1]<-"bioplanet"#有的公司返回数据，左上角第一格为空，R会自动补为x,用这个命令来修改

X<-read.csv(file = "huahua.txt",sep = " ",header =T,row.names=1)#最后row.names的意思是修改第一列为行名

ps：（其实我们这个数据框并不需要改，如果你已经改了，知道怎么撤销吗？用刚才的read.table命令重新赋值一遍就可以覆盖掉你刚才改瞎的了。这也就是变量为什么叫"变"量）
嗯。我故意写了个大写的X，就是告诉你一下大小写是严格区分的，耶。

3）数据框的导出

write.table(X,file = "yu.txt",sep = ",",quote=F)#分隔符改为逗号，字符串不加双引号（默认格式带由双引号）

（4）变量的保存与重新加载

#这次没有处理完的数据下次想接着用怎么办?--学会保存和重新加载。保存的格式是RData。

save.image(file="bioinfoplanet.RData")#保存当前所有变量

save(X,file="test.RData")#保存其中一个变量

load("test.RData")#再次使用RData时的加载命令

（5）提取元素

- X[x,y]#第x行第y列

- X[x,]#第x行

- X[,y]#第y列

- X[y] #也是第y列

- X[a:b]#第a列到第b列

- X[c(a,b)]#第a列和第b列

- X$列名#也可以提取列（优秀写法，而且这个命令还优秀到不用写括号的地步，并且支持Tab自动补全哦，不过只能提取一列）

（6）直接使用数据框中的变量

新建一个脚本

plot(iris$Sepal.Length,iris$Sepal.Width)

把此代码复制进去

保存.(后缀为.R）

save(X,file="test.RData")这句代码如果报错object X not found，是为什么，应该怎么解决？

重新给X赋值?

或者判断x的大小写

猜你喜欢

最长无重复子串
写技术博客的一些心得分享
Java 多线程（七）：线程池
Java 多线程（五）：锁（三）
Java 多线程（四）：锁（二）
Java 多线程（三）：锁（一）
Java 多线程（二）：并发编程的三大特性
线性时间非比较类排序
Java 多线程（一）：基础
合并k个已排序的链表
HDFS 高可用分布式环境搭建
合并两个有序数组
连续子数组的最大和
HDFS 分布式环境搭建
容器盛水问题
大数加法
HDFS 伪分布式环境搭建
设计LRU缓存结构
两数之和
使用单调栈来解决的一些问题

zl程序教程