决策树模型的用途_决策树模型怎么建立
概念
定义在特征空间与类空间上的条件概率分布,即给定特征条件下类的条件概率分布;也可以认为是if-then规则的集合
优点
模型具有可读性,分类速度快。
模型
首先,介绍一下决策树模型:
由结点和有向边组成,结点又可分为内部结点和叶结点。内部结点表示一个特征或属性,叶结点表示一个类。
决策树与条件概率分布
决策树所表示的条件概率分布由各个单元给定条件下的类的条件概率分布组成。若X表示特征的随机变量,取值于给定划分下单元的集合,Y表示类的随机变量,取值于类的集合,则该条件概率分布可以表示为P(Y|X)。
各叶结点(单元)上的条件概率往往偏向于某一类,即属于某一类的概率较大。
决策树本质
从训练数据集中归纳出一组分类规则。
步骤
决策树的学习常包含三个步骤:
特征选择
决策树的生成
决策树的剪枝
特征选择
是决定用哪个特征来划分特征空间。三种方法:
信息增益
信息增益比
基尼指数
决策树的生成
基本方法,从根结点出发,对结点计算所有可能的特征的信息增益(或信息增益比或基尼指数),选择信息增益值(或信息增益比或基尼指数)较大的特征作为结点的特征。
几种选择标准的不同(ID3, C4.5, CART)可参考:决策树
决策树的剪枝
通过极小化决策树整体的损失函数或代价函数来实现。
两者的不同:
决策树的生成只考虑了通过提高信息增益或信息增益比对数据进行更好的拟合,而剪枝通过优化损失函数还减小了模型的复杂度。
决策树生成学习局部的模型,而决策树剪枝学习整体的模型。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/179599.html原文链接:https://javaforall.cn
相关文章
- 微信平台分账产品怎么选?
- pycharm的python环境配置_怎么安装pycharm及环境变量配置
- 证明frobenius范数是个范数_1范数怎么求
- 理论:第九章:JVM内存模型,算法,垃圾回收器,调优,四大引用,常见的JVM错误,类加载机制(双亲委派),创建一个对象,这个对象在内存中是怎么分配的?
- oracle数据库904_oracle00933怎么解决
- YOLOv8来啦!YOLO内卷期模型怎么选?9+款AI硬件如何快速部署?深度解析
- 项目迭代快,线上BUG频出,怎么降低线上BUG率?
- 485自收发电路中,怎么理解当发送高电平时,A和B为高阻态?
- ChatGPT国内登录方法 ChatGPT国内怎么使用
- Java 19 发布,Loom 怎么解决 Java 的并发模型缺陷?
- 微服务中的鉴权该怎么做?
- Endnote软件怎么下载?文献管理软件Endnote x9中文版下载安装
- 库如何使用MySQL快速复制数据库(mysql怎么复制数据)
- 统计Oracle字段统计的简单方法(oracle怎么字段)
- 1 亿银行用户信息失窃之谜:黑客是怎么找到漏洞的?
- MacOS 语音之旅:你知道怎么读吗?(macos怎么读)
- 网页上如何管理MSSQL(网页上怎么管理mssql)
- 重启MSSQL:打开三种拯救之门(怎么重启mssql)
- MySQL中如何使用TOP进行数据查询(mysql中top怎么用)
- Redis代码编写指南简单易行(怎么写redis代码)
- 深入理解Redis的多线程模型(怎么理解redis多线程)
- 理解Redis中的多线程模型(怎么理解redis多线程)
- 简易教程如何安装MySQL下载好的软件(mysql下载好怎么安装)
- Oracle中如何导出包(oracle中怎么导出包)
- Redis登录设置指南(redis设置怎么登陆)