python特征生成是什么?
2023-03-20 15:28:32 时间
业内常说数据决定了模型效果的上限,机械学习算法通过数据特征进行预测,良好的特征可以显着提高模型效果。这意味着通过特征生成(即从数据设计中加工模型的可用特征)是特征工程的重要一步。
一、特征生成作用
1、增加特征的表达能力,提升模型效果;
(如体重除以身高就是表达健康情况的重要特征,而单纯看身高或体重对健康情况表达就有限。)
2、可以融入业务上的理解设计特征,增加模型的可解释性。
二、特征生成方法
1、聚合方式
对存在一对多的字段,将其对应多条记录分组聚合后统计平均值、计数、值等数据特征。
# 自定义分组聚合统计函数 def x2_sum(group): return sum(group**2) df.groupby('cust_no').C1.apply(x2_sum)
2、转换方式
对字段间做加减乘除等运算生成数据特征的过程,对不同字段类型有不同转换方式。
相关文章
- Python中的函数与方法 以及Bound Method和Unbound Method
- 一文贯通python文件读取
- Python 中的异步编程:Asyncio
- 7个你现在就该学习Python的理由
- 提高Python运行效率的六个窍门
- Python数据科学:神经网络
- 一篇文章看懂大数据分析就业前景及职能定位
- R和Python中的文本挖掘:8个入门小贴士
- 告诉你为什么Python有点慢,但我却无所谓?
- 专注学习DevOps编程语言Top 5推荐
- Python发送邮件脚本
- Python多进程并行编程实践: mpi4py 的使用
- Python语言在未来的发展前景
- Python vs Ruby: 谁是最好的 web 开发语言?
- Python对Ruby:谁在Web开发领域更胜一筹?
- Python一行代码完成并行任务
- Python开发者2017应该关注的七个类库
- python爬虫入门基本知识
- 在终端中优雅地编写Python
- Python机器学习实战:信用卡欺诈检测