zl程序教程

您现在的位置是:首页 >  其他

当前栏目

ML之FE:在特征工程/数据预处理阶段对【类别型】特征变量进行处理的技术总结、经验技巧、案例应用之详细攻略

2023-09-14 09:04:44 时间

ML之FE:在特征工程/数据预处理阶段对【类别型】特征变量进行处理的技术总结、经验技巧、案例应用之详细攻略

目录

在特征工程/数据预处理阶段对【类别型】特征变量进行处理

技术总结

1、统计每个【类别型】特征的子分类

2、统计每个【类别型】特征的多样性

经验技巧


在特征工程/数据预处理阶段对【类别型】特征变量进行处理

技术总结

1、统计每个【类别型】特征的子分类

from NDataScience.DataAnalysis import ColCats_Unique
ColCats_Unique(df_train)



bodyType [1.0 2.0 0.0 5.0 3.0 nan 6.0 7.0 4.0]
fuelType [0.0 1.0 nan 2.0 3.0 4.0 5.0 6.0]
gearbox [0.0 1.0 nan]
notRepairedDamage ['0.0' '-' '1.0']

2、统计每个【类别型】特征的多样性

from NDataScience.DataAnalysis import CountColCats2Xls
CountColCats2Xls(df_train,data_name)
modelcountsbrandcountsbodyTypecountsfuelTypecountsgearboxcountsnotRepairedDamagecounts
01176203148004142009165601116230.0111361
199573416737135272146991132396-24324
48445141608923032422212null59811.014315
1603810142493134913262null0
295186113794496094118
48505261021757607545
4045029730666482636
2644965466571289null8680
84391133817null4506
313827112945
13376232461

经验技巧

更新中……