科普——随机森林和决策树
随机 森林 科普 决策树
2023-09-27 14:21:03 时间
参考链接
随机森林
决策树
一、决策树
(一)决策树是什么?
1.概念:采用树形节点,层层推理实现最终的分类
- 根节点,包含样本的全集
- 内部节点,对应特征的分类
- 叶节点,决策的结果
(二)决策树的使用方法?
特征学习的3个步骤 - 特征选择:选择与结果相关度更高的特征
- 决策树生成:对每个子节点采用相同的方式生成新的子节点
- 决策树剪枝:防止过拟合
(三)决策树的优缺点
优点: - 易于理解
- 适合处理有缺失属性的样本
- 能够处理不相关的特征
- 处理速度快
缺点 - 容易发生过拟合
- 能够忽略属性之间的相关性
二、随机森林
(一)随机森林是什么?
由多个不相关的决策树组成,进行分类任务时,新的样本进入,让森林中每一棵决策树分别进行判断和分类。决策树的分类结果哪一个最多就会把这个结果当成最终结果。
(二)随机森林的使用方法? - 随机抽样,训练决策树
- 随机选取属性,做节点分裂,建立大量决策树形成森林
(三)随机森林的优缺点
优点 - 可以处理高维的数据
- 能够判断特征的重要程度,特征之间的相互印象
- 对于不平衡的数据集,可以平衡误差
缺点 - 大量决策树,需要更多的资源
相关文章
- [matlab] 7.快速搜索随机树(RRT---Rapidly-exploring Random Trees) 路径规划
- 决策树模型组合之随机森林与GBDT(转)
- 随机切分csv训练集和测试集
- Google Earth Engine(GEE)——NDVI、NDWI和NDBI用来进行增加分类精度的验证结果(随机森林和cart分类)
- 【BZOJ4597】[Shoi2016]随机序列 线段树
- 机器学习面试题——集成学习、Adaboost、随机森林、GBDT、xgBoost、LightGBM
- 机器学习笔记之集成学习(二)Bagging与随机森林
- JavaScript - 一维数组 / 二维数组快速乱序,随机打乱数组每项的位置顺序排序,基本不重复(支持普通数组与复杂对象数组)
- 阿里2014校招笔试题(南大)——利用thread和sleep生成字符串的伪随机序列
- 面试复盘 常见面试题 正则表达式 验证邮箱 Java 1-100万整数全部随机生成不重复 遍历一个文件夹下所有的文件和子文件 数据库查询班级最高分 创建一个学生表,记录学生父母名字
- java获取随机不重复的数得值
- 机器学习九大算法---随机森林
- python 随机模块random
- (数据科学学习手札26)随机森林分类器原理详解&Python与R实现
- go如何生成随机小数?
- PyTorch深度学习实战 | 基于多层感知机模型和随机森林模型的某地房价预测
- 【UE5】AI随机漫游蓝图两种实现方法(角色蓝图、行为树)
- Kaggle竞赛入门(四):随机森林算法的Python实现
- [CareerCup] 18.3 Randomly Generate Integers 随机生成数字
- Oracle dbms_random随机函数包
- SQL分组获取随机记录
- jQuery随机抽取数字号代码