R语言-分组统计
分组统计
1、假定有一组成绩数据,要求根据性别进行分组统计:
> score
ID score1 score2 Gender
1 101 11.35321 0.9 male
2 102 12.58654 0.6 male
3 103 19.79380 0.9 female
4 104 12.01352 0.4 female
5 105 11.97081 0.4 female
6 106 17.37480 0.7 female
7 107 14.24884 0.3 female
8 108 18.47972 0.8 male
9 109 18.74792 0.8 male
10 110 18.90146 0.7 male
2、方法:使用aggregate(x, by, FUN)
其中x是待折叠的数据对象,by是一个变量名组成的列表,这些变量将被去掉以形成新的观测,而FUN则是用来计算描述性统计量的标量函数,它将被用来计算新观测中的值。
> aggregate(score[,c(2,3)],list(score[,4]),mean)
Group.1 score1 score2
1 female 15.08035 0.54
2 male 16.01377 0.76
score[,c(2,3)] 表示对score1和score2列进行分组统计
list(score[,4])表示根据score第4列,也就是性别列进行分组统计。
mean表示统计平均值。
也可以写作下面的形式:
> aggregate(score[,c(2,3)],list(score$Gender),mean)
Group.1 score1 score2
1 female 15.08035 0.54
2 male 16.01377 0.76
可选参考:
library(dplyr)
group_by(data, sex) %>% summarize_each(funs(mean), var1, var2, var3...)
相关文章
- 回文子串的个数_统计回文子串的个数
- 2022-11-10:写一个 bash 脚本以统计一个文本文件 words.txt 中每个单词出现的频率。 为了简单起见,你可以假设: words.txt只包括
- R语言地理可视化:中国国内航线航班信息统计、绘制分布夜景图
- 生存分析中的统计检验方法你用对了吗?
- 学生成绩统计c语言
- 【C 语言】文件操作 ( 使用 fread 和 fwrite 实现二进制文件的拷贝 | stat 统计文件大小 | feof 判定文件结尾 )
- PostgreSQL实现按年、月、日、周、时、分、秒的分组统计
- shell脚本实现网站日志分析统计详解程序员
- 如何统计一段英文中的单词的个数详解编程语言
- MySQL统计周级别数据分析(mysql按周分组统计)
- 如何记录 Linux 的系统运行时间的统计信息
- 机器学习:统计与计算之恋
- 数据统计SQL Server 当月数据统计分析(sqlserver 当月)
- 使用Redis实现累计值统计功能(使用Redis统计累计值)
- Oracle 年度统计报告出炉,亮点引人关注(oracle ytd)
- Redis实时统计订阅数量(redis获取订阅数量)