您现在的位置是：首页 > 后端

当前栏目

Python3 Pandas的DataFrame数据的增、删、改、查详解编程语言

Python3 pandas 数据编程语言详解 dataframe

2023-06-13 09:11:43 时间

增、删、改、查的方法有很多很多种，这里只展示出常用的几种。

参数inplace默认为False,只能在生成的新数据块中实现编辑效果。当inplace=True时执行内部编辑，不返回任何值，原数据发生改变。

import numpy as np 

import pandas as pd 

#测试数据。 

df = pd.DataFrame(data = [[lisa,f,22],[joy,f,22],[tom,m,21]],index = [1,2,3],columns = [name,sex,age])

数据：

 name sex age 

1 lisa f 22 

2 joy f 22 

3 tom m 21

二、增删改查操作（1）.按列增加

citys = [ny,zz,xy] 

df.insert(0,city,citys) #在第0列，加上column名称为city，值为citys的数值。 

jobs = [student,AI,teacher] 

df[job] = jobs #默认在df最后一列加上column名称为job，值为jobs的数据。 

df.loc[:,salary] = [1k,2k,2k,2k,3k] #在df最后一列加上column名称为salary，值为等号右边数据。

（2）按行增加

#若df中没有index为“4”的这一行的话，该行代码作用是往df中加一行index为“4”，值为等号右边值的数据。若df中已经有index为“4”的这一行，则该行代码作用是把df中index为“4”的这一行修改为等号右边数据。 

df.loc[4] = [zz,mason,m,24,engineer’] 

df_insert = pd.DataFrame({name:[mason,mario],sex:[m,f],age:[21,22]},index = [4,5]) 

#返回添加后的值，并不会修改df的值。ignore_index默认为False，意思是不忽略index值，即生成的新的ndf的index采用df_insert中的index值。若为True，则新的ndf的index值不使用df_insert中的index值，而是自己默认生成。 

ndf = df.append(df_insert,ignore_index = True)

（1）方法一：df[ column_name ] 和df[row_start_index, row_end_index]

df[name] 

df[gender] 

df[[name,gender]] #选取多列，多列名字要放在list里 

df[0:] #第0行及之后的行，相当于df的全部数据，注意冒号是必须的 

df[:2] #第2行之前的数据（不含第2行） 

df[0:1] #第0行 

df[1:3] #第1行到第2行（不含第3行） 

df[-1:] #最后一行 

df[-3:-1] #倒数第3行到倒数第1行（不包含最后1行即倒数第1行，这里有点烦躁，因为从前数时从第0行开始，从后数就是-1行开始，毕竟没有-0）

（2）方法一：df.loc[index,column]

# df.loc[index, column_name],选取指定行和列的数据 

df.loc[0,name] # Snow 

df.loc[0:2, [name,age]] #选取第0行到第2行，name列和age列的数据, 注意这里的行选取是包含下标的。 

df.loc[[2,3],[name,age]] #选取指定的第2行和第3行，name和age列的数据 

df.loc[df[gender]==M,name] #选取gender列是M，name列的数据 

df.loc[df[gender]==M,[name,age]] #选取gender列是M，name和age列的数据

（3）方法三：iloc[row_index, column_index]

df.iloc[0,0] #第0行第0列的数据，Snow 

df.iloc[1,2] #第1行第2列的数据，32 

df.iloc[[1,3],0:2] #第1行和第3行，从第0列到第2列（不包含第2列）的数据 

df.iloc[1:3,[1,2] #第1行到第3行（不包含第3行），第1列和第2列的数据

（1）改行列标题

df.columns = [name,gender,age] #尽管我们只想把’sex’改为’gender’，但是仍然要把所有的列全写上，否则报错。 

df.rename(columns = {name:Name,age:Age},inplace = True) #只修改name和age。inplace若为True，直接修改df，否则，不修改df，只是返回一个修改后的数据。 

df.index = list(abc)#把index改为a,b,c.直接修改了df。 

df.rename({1:a,2:b,3:c},axis = 0,inplace = True)#无返回值，直接修改df的index。

（2）改数值

1 使用loc

df.loc[1,name] = aa #修改index为‘1’，column为‘name’的那一个值为aa。 

df.loc[1] = [bb,ff,11] #修改index为‘1’的那一行的所有值。 

df.loc[1,[name,age]] = [bb,11] #修改index为‘1’，column为‘name’的那一个值为bb，age列的值为11。

2 使用iloc[row_index, column_index]

df.iloc[1,2] = 19 #修改某一无素 

df.iloc[:,2] = [11,22,33] #修改一整列 

df.iloc[0,:] = [lily,F,15] #修改一整行

（1）删除行

df.drop([1,3],axis = 0,inplace = False)#删除index值为1和3的两行，

（2）删除列

df.drop([name],axis = 1,inplace = False) #删除name列。 

del df[name] #删除name列。 

ndf = df.pop(age) #删除age列，操作后，df都丢掉了age列,age列返回给了ndf。

16674.html

cjavapython

猜你喜欢

到底什么是“数据中台”，我用大白话给你说清楚
PHP使用ob_start生成html页面的方法
MySQL正则表达式实现提取（mysql 正则提取）
Linux下修改用户名的简易指南（linux中修改用户名）
用CMD命令停止MySQL服务运行（cmd停止运行mysql）
SQLServer 错误 2537 表错误:对象 ID O_ID，索引 ID I_ID，分区 ID PN_ID，分配单元 ID A_ID（类型为 TYPE），页 P_ID，行 ROW_ID。记录检查(CHECK_TEXT)失败。值为 VALUE1 和 VALUE2。故障处理修复支持远程
深入浅出Redis默认失效机制（redis默认失效机制）
探索Oracle内部的查询功能（oracle自身查询）
MySQL 求并集：多表查询的新方式（mysql取并集）
如何使用Redis作为root用户启动（redisroot启动）
Redis五大数据类型之Zset(有序集合)命令操作
ORA-19604: conversation file naming phase is over ORACLE 报错故障修复远程处理
MySQL数据库排序升序降序（mysql一个升序降序）

zl程序教程

当前栏目

Python3 Pandas的DataFrame数据的增、删、改、查详解编程语言

相关文章