《数据科学:R语言实战》一1.4 问题
2023-09-11 14:17:43 时间
本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.4节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看
实际问题
如何决定是否使用K-means或K-medoids? 设计箱线图的意义是什么?为什么那样设计? 对于密度图,请描述生成于iris数据异常值中的底层数据。 对于市场数据集中的其他项目,有哪些抽取规则?什么时候做、怎样做以及为什么这样做?
未审查在特定领域检测的异常值存在哪些风险?难道不该一直进行计算吗? 为什么需要将iris分类栏排除在异常值检测算法以外?确定异常值时能在某些-方面使用iris分类栏吗? 您设想过生成的购物篮数据和规则并不适用于您工作的商店吗?
挑战 通过使用随机数据,在出现同一示例的两个维度中开发异常值的测试数据十分困难。您能开发出一个测试在至少两个维度中总是出现异常值并且这些维度出现在同一示例中吗? 网络上有一个关于“泰坦尼克号”游轮乘客个人信息数据的数据集,生成有关可能生还乘客的规则。
R语言实战——Cox 比例风险回归模型 COX比例风险模型(cox proportional-hazards model)是英国统计学家D.R.COX于1972年提出的一种半参数回归模型,它可同时研究多个风险因素和事件结局发生情况、发生时间的关系,从而克服了简单生存分析中单因素限制的不足。
这是之前使用R语言完成的一道简单的数据统计题目链接:https://zhuanlan.zhihu.com/p/27092971 完成之后心理还是有点小得意的。
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。
相关文章
- C#,入门教程(39)——C#语言的概念与知识点摘要
- 用R语言进行数据可视化的综合指南(二)
- 《R语言数据挖掘》----第1章 预备知识 1.1大数据
- 《R语言数据挖掘》----1.10 数据属性与描述
- 《R语言数据挖掘》----1.14 数据变换与离散化
- 《R语言数据挖掘:实用项目解析》——第2章,第2.10节小结
- DML语言练习,数据增删改查,复制清空表
- C# 语言中的其他成分
- 《数据科学:R语言实战》一1.5 总结
- 为什么我认为Java是当代开发语言的基础
- 语言类型的相关总结--类型的动静以类型的绑定时间来划分(类型行为),类型的强弱以类型的约束强度来划分
- Go语言学习(一)
- 使用c语言向本地文件写入数据的一个实现
- 《Python语言程序设计》——2.11 类型转换和四舍五入
- 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一1.2 原始数据
- 《数据科学R语言实践:面向计算推理与问题求解的案例研究法》一一2.2 将比赛结果表读入R中
- 《数据科学:R语言实现》——1.6 理解闭包
- 《数据科学:R语言实现》——1.8 创建中缀操作符
- 《数据科学:R语言实现》——2.3 读取和写入CSV文件
- 《数据科学:R语言实现》——3.6 过滤数据
- 《数据科学:R语言实现》——3.12 估计缺失数据
- sql之操纵语言(DML)
- 【Go语言入门教程】WaitGroup 实现并发等待
- 物联网语言是什么不重要,这个标志设计很萌倒是真的