zl程序教程

您现在的位置是:首页 >  其他

当前栏目

《数据科学:R语言实战》一1.4 问题

语言数据 实战 科学 1.4 问题
2023-09-11 14:17:43 时间

本节书摘来自异步社区《数据科学:R语言实战》一书中的第1章,第1.4节,作者 【美】Dan Toomey(丹·图米),更多章节内容可以访问云栖社区“异步社区”公众号查看

1.4 问题

实际问题

如何决定是否使用K-means或K-medoids? 设计箱线图的意义是什么?为什么那样设计? 对于密度图,请描述生成于iris数据异常值中的底层数据。 对于市场数据集中的其他项目,有哪些抽取规则?

什么时候做、怎样做以及为什么这样做?

未审查在特定领域检测的异常值存在哪些风险?难道不该一直进行计算吗? 为什么需要将iris分类栏排除在异常值检测算法以外?确定异常值时能在某些-
方面使用iris分类栏吗? 您设想过生成的购物篮数据和规则并不适用于您工作的商店吗?
挑战 通过使用随机数据,在出现同一示例的两个维度中开发异常值的测试数据十分困难。您能开发出一个测试在至少两个维度中总是出现异常值并且这些维度出现在同一示例中吗? 网络上有一个关于“泰坦尼克号”游轮乘客个人信息数据的数据集,生成有关可能生还乘客的规则。
R语言实战——Cox 比例风险回归模型 COX比例风险模型(cox proportional-hazards model)是英国统计学家D.R.COX于1972年提出的一种半参数回归模型,它可同时研究多个风险因素和事件结局发生情况、发生时间的关系,从而克服了简单生存分析中单因素限制的不足。
这是之前使用R语言完成的一道简单的数据统计题目链接:https://zhuanlan.zhihu.com/p/27092971 完成之后心理还是有点小得意的。
异步社区 异步社区(www.epubit.com)是人民邮电出版社旗下IT专业图书旗舰社区,也是国内领先的IT专业图书社区,致力于优质学习内容的出版和分享,实现了纸书电子书的同步上架,于2015年8月上线运营。公众号【异步图书】,每日赠送异步新书。