zl程序教程

您现在的位置是:首页 >  后端

当前栏目

如何在 Pandas DataFrame 中减去两列?

pandas 如何 dataframe 两列
2023-09-14 08:57:38 时间

正在使用的数据框:

方法一:直接法 

这是__getitem__方法语法[] ),它允许您使用列名直接访问数据框的列。

示例:减去 Pandas 数据框中的两列

  • Python3
 
import numpy as np
import pandas as pd
  
data = np.arange(0, 20).reshape(4, 5)
  
  
df1 = pd.DataFrame(data,
                   index=['Row 1', 'Row 2', 'Row 3', 'Row 4'],
                   columns=['Column 1', 'Column 2', 'Column 3',
                            'Column 4', 'Column 5'])
  
# using our previous example
# now let's subtract the values of two columns
df1['Column 1'] - df1['Column 2']

输出: 

方法 2:定义函数

我们可以创建一个专门用于减去列的函数,将列数据作为参数,然后使用 apply 方法将其应用于整个列的所有数据点。 

示例:减去 Pandas 数据框中的两列

  • Python3
 
import numpy as np
import pandas as pd
  
def diff(a, b):
    return b - a
  
data = np.arange(0, 20).reshape(4, 5)
  
  
df = pd.DataFrame(data,
                  index=['Row 1', 'Row 2', 'Row 3', 'Row 4'],
                  columns=['Column 1', 'Column 2', 'Column 3',
                           'Column 4', 'Column 5'])
  
  
df['Difference_2_1'] = df.apply(
    lambda x: diff(x['Column 2'], x['Column 2']), axis=1)

输出 : 

方法 3:使用apply()

由于我们要执行的操作很简单,我们可以直接使用apply()方法而无需显式定义函数。轴参数提供为1以访问列。 

句法:

s.apply(func, convert_dtype=True, args=())

参数:

  • func: .apply 接受一个函数并将其应用于 pandas 系列的所有值。
  • convert_dtype:根据函数的操作转换 dtype。
  • args=():传递给函数而不是系列的附加参数。

返回类型:应用功能/操作后的熊猫系列。

示例:在 Pandas Dataframe 中减去两列 

  • Python3
 
import pandas as pd
import numpy as np
  
data = np.arange(0, 20).reshape(4, 5)
  
  
df = pd.DataFrame(data,
                  index=['Row 1', 'Row 2', 'Row 3', 'Row 4'],
                  columns=['Column 1', 'Column 2', 'Column 3',
                           'Column 4', 'Column 5'])
  
  
df['diff_3_4'] = df.apply(lambda x: x['Column 3'] - x['Column 4'], axis=1)
df

输出:

方法 4:使用分配方法

assign()方法将新列分配给 DataFrame,返回一个新对象(副本),其中新列添加到原始列。 

示例:减去 Pandas 数据框中的两列

  • Python3
 
import numpy as np
import pandas as pd
  
data = np.arange(0, 20).reshape(4, 5)
  
  
df = pd.DataFrame(data,
                  index=['Row 1', 'Row 2', 'Row 3', 'Row 4'],
                  columns=['Column 1', 'Column 2', 'Column 3',
                           'Column 4', 'Column 5'])
  
  
df = df.assign(diff_1_5=df['Column 1'] - df['Column 5'])
  
df

输出 :