您现在的位置是：首页 > 其他

当前栏目

使用R进行分组统计

统计进行分组使用

2023-09-14 08:57:09 时间

分组统计数据集是很常见的需求，R中也有相应的包支持数据集的分组统计。自己尝试了写了段R代码来完成分组统计数据集，支持公式，感觉用起来还算方便。代码分享在文章最后。

使用方式:

step 1: source('AggregateSummary.R')

step 2: pastecs_summary(mpg+hp+wt~am,data=mtcars)

执行结果如下：

AggregateSummary.R的源码：

library(plyr)
library(stringr)
library(pastecs)


parseformula <- function(formula = "...  ~ variable", varnames, value.var = "value") {
  remove.placeholder <- function(x) x[x != "."]
  replace.remainder <- function(x) {
    if (any(x == "...")) c(x[x != "..."], remainder) else x
  }
  
  if (is.formula(formula)) {
    formula <- str_c(deparse(formula, 500), collapse = "")
  }
  
  if (is.character(formula)) {
    dims <- str_split(formula, fixed("~"))[[1]]
    formula <- lapply(str_split(dims, "[+*]"), str_trim)
    
    formula <- lapply(formula, remove.placeholder)
    
    all_vars <- unlist(formula)
    if (any(all_vars == "...")) {
      remainder <- setdiff(varnames, c(all_vars, value.var))
      formula <- lapply(formula, replace.remainder)
    }
  }
  
  if (!is.list(formula)) {
    stop("Don't know how to parse", formula, call. = FALSE)
  }
  lapply(formula, as.quoted)
}

evalFormula <- function(formula,data){
  fo<-parseformula(formula)
  lapply(fo,eval.quoted,envir=data)
}

pastecs_Summary<- function(formula,data){
  tmplist<-evalFormula(formula,data)
  df1<-as.data.frame(tmplist[1])
  uni<-unique(tmplist[[2]][[1]])
  lst<-list()
  for(i in uni){
    lst[[paste(names(tmplist[[2]]),i)]]<-stat.desc(df1[which(tmplist[[2]][[1]]==i),])
  }
  
  return(lst)
}

猜你喜欢

如何实现网站的防盗链？
Javascript入门学习
grep, egrep, fgrep, rgrep - print lines matching a pattern
js 的 ArrayBuffer 和 dataView
Android 图形驱动初始化(二十三)
【三】3D匹配Matching之可变形曲面匹配Deformable Surface—Based——clear_deformable_surface_matching_result()算子
[Algorithm] 94. Binary Tree Inorder Traversal iteratively approach
ManagedObject this[oPropertyInfo._sMutator](oValue);
SPSS转换菜单：创建时间序列
Leetcode.2397 被列覆盖的最多行数
Java刷题面试系列习题(十九)
Cygwin安装教程
机器学习（三十三）：Apriori 算法进行关联规则挖掘(实战）
浅表副本

相关主题

shell 统计行数
hdu 1251 统计
机器学习和统计学习
【C】数值统计
Unity版本使用情况统计
shell统计
词频统计1

zl程序教程

当前栏目

使用R进行分组统计

相关文章