SAS数据挖掘实战篇【七】
数据挖掘 实战篇 SAS
2023-09-14 08:58:54 时间
6.5 SAS
EM数据挖掘-----预测模型
1
问题定义
目标:建立模型预测贷款申请的信用状态,选择最优的模型来预测和减少损失。
数据集:SAMPSIO.DMAGECR
数据集大小:1000
变量数目:21(20个输入变量,1个目标变量)
变量描述
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
该损失矩阵将产生和第一个损失矩阵相似的决策,但是第二个矩阵产生的统计描述更加容易理解。
先验概率
在训练数据集中,
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
未预测数据:SAMPSIO.DMAGESCR
数据集大小:75(没有GOOD_BAD变量)
2
创建数据挖掘工程
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
4
选择变量选项卡,右击GOOD_BAD的模型角色,设置变量角色为target。
5
目标资料主要定义三种信息
(1) 分类变量的目标级别
(2) 决策矩阵
(3) 先验概率
在变量选项卡中右击GOOD_BAD目标变量,编辑目标信息
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
设置目标事件级别
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
为GOOD_BAD变量定义决策矩阵
选择评估信息选项卡,显示四个预定义的矩阵
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
6
查看区间变量和类别变量的统计信息
可以发现没有缺失值,但是AMOUT变量倾斜度过高
创建顺序分组变量
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
创建顺序分组变量
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
选择目标关联选项卡,设置变量选择方法为卡方。
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
12
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
运行评估节点,查看模型比较。从工具菜单中选择提升图。
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
13 定义评分数据集
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
打开score节点,选择如下
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
15
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
在program选项卡中输入下面的代码,显示信用好的贷款申请者
options nocenter
nodate;
data goodapps;
set &_SCORE;
if D_GOOD_BAD_ =
'accept';
run;
proc print data = goodapps
lable;
var custid D_GOOD_BAD_
EL_GOOD_BAD_;
title "Good Credit Risk
Applicants";
run;
![SAS数据挖掘实战篇【七】](http://simg.sinajs.cn/blog7style/images/common/sg_trans.gif)
查看创建的报表,在浏览器中查看。
18
关闭工程,完成项目。
相关文章
- 【数据挖掘】任务2:医学数据库MIMIC-III数据处理
- 数据挖掘的方法有哪些?
- 基于Django+LayUI+HBase的文献数据挖掘系统(附源码)
- 数据挖掘的流程[通俗易懂]
- PYTHON用户流失数据挖掘:建立逻辑回归、XGBOOST、随机森林、决策树、支持向量机、朴素贝叶斯和KMEANS聚类用户画像|附代码数据
- 从零开始的异世界生信学习 GEO数据库数据挖掘--GEO代码-芯片数据分析-1
- 数据挖掘[一]---汽车车交易价格预测(测评指标;EDA)
- GEO数据挖掘——快速将探针ID转化为Gene Symol
- 【数据挖掘】神经网络 后向传播算法 ( 线性回归与逻辑回归 | 单个神经元本质及逻辑 | 神经网络每一层分析 | 神经网络矩阵形式 | 线性变换与非线性变换 )
- 数据挖掘领域大师俞士纶团队新作:最新图自监督学习综述
- 【机器学习入门与实践】合集入门必看系列,含数据挖掘项目实战
- 华为数据挖掘方法论及案例介绍详解大数据
- 从MySQL挖掘有价值的数据(mysql数据挖掘工具)
- 数据挖掘规则实现商品推荐:SQL Server
- Oracle数据挖掘之路:提炼、获取、利用(获取oracle数据)
- 数据挖掘规则实现商品推荐:SQL Server