数学建模学习笔记(九)数据预处理
2023-09-14 09:01:37 时间
一些数据预处理的基本思路与步骤:
1、删除无关变量
2、检查重复值
3、检查缺失值
4、特殊处理(例如删除不相关评论…)
附pandas和numpy的部分处理代码:
import pandas as pd
import numpy as np
df=pd.read_csv('pacifier.tsv', sep='\t', header=0)
df= df.drop('product_id',axis=1)
df= df.drop('review_id',axis=1)
df= df.drop('customer_id',axis=1)
df= df.drop('marketplace',axis=1)
df= df.drop('product_title',axis=1)
df= df.drop('product_category',axis=1)
df= df.drop('product_parent',axis=1)
#丢弃缺失数值
df=df.replace(to_replace='?',value=np.nan)
df = df.dropna(how='any')
print(df.shape)
writer = pd.ExcelWriter('naizui.xlsx')
#df = df.to_csv("weibolu.tsv",index=0)
df = df.to_excel(writer)
writer.save()
相关文章
- 维度建模——数据仓库初步[通俗易懂]
- 从Transformer到扩散模型,一文了解基于序列建模的强化学习方法
- HR一定要会的人力资源各模块数据建模
- UML 用例图_uml建模用例图和细化用例
- 别忘记我:通过局部-全局内容建模进行文本擦除方法
- 数学建模比赛超全整理【数学建模有哪些比赛?】【全网最全数模整理】
- SketchUp Pro for mac 2023 v23.0.396 草图大师 - 专业的3D建模软件
- 数据治理专业认证CDMP学习笔记(思维导图与知识点)- 第五章数据建模与设计篇
- 【数据挖掘】数据挖掘建模 ( 预测建模 | 描述建模 | 预测模型 | 描述模型 | 判别模型 | 概率模型 | 基于回归的预测模型 )
- Hinton团队CV新作:用语言建模做目标检测,性能媲美DETR
- DAMA数据管理知识体系指南之数据架构和建模
- C4D软件下载,三维建模动画设计Cinema 4D软件2023中文版下载安装
- 维度升华—Vray 6.0 for SketchUp带你走入真实建模世界+全版本安装包
- 深入探究Oracle数据建模技术(oracle数据建模)
- Ayam是一个免费的3D建模环境的RenderMan接口,基于BSD许可发布。