pandas.DataFrame删除/选取含有特定数值的行或列

  • Post author:
  • Post category:其他


1.删除/选取某列含有特殊数值的行

import pandas as pd
import numpy as np

a=np.array([[1,2,3],[4,5,6],[7,8,9]])
df1=pd.DataFrame(a,index=['row0','row1','row2'],columns=list('ABC'))
print(df1)
df2=df1.copy()

#删除/选取某列含有特定数值的行
#df1=df1[df1['A'].isin([1])]
#df1[df1['A'].isin([1])]  选取df1中A列包含数字1的行

df1=df1[~df1['A'].isin([1])]
#通过~取反,选取不包含数字1的行
print(df1)
运行结果:

在这里插入图片描述

2.删除/选取某行含有特殊数值的列 —–一下功能可由date.dropna()实现

用法:DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)

参数说明:

labels 就是要删除的行列的名字,用列表给定
axis 默认为0,指删除行,因此删除columns时要指定axis=1;
index 直接指定要删除的行
columns 直接指定要删除的列
inplace=False,默认该删除操作不改变原数据,而是返回一个执行删除操作后的新dataframe;
inplace=True,则会直接在原数据上进行删除操作,删除后无法返回。

因此,删除行列有两种方式:

    1)labels=None,axis=0 的组合
    2)index或columns直接指定要删除的行或列

>>>df = pd.DataFrame(np.arange(12).reshape(3,4), columns=['A', 'B', 'C', 'D'])

>>>df

  A   B   C   D

0  0   1   2   3

1  4   5   6   7

2  8   9  10  11

#Drop columns,两种方法等价

>>>df.drop(['B', 'C'], axis=1)

A   D

0  0   3

1  4   7

2  8  11

>>>df.drop(columns=['B', 'C'])

 A   D

0  0   3

1  4   7

2  8  11

# 第一种方法下删除column一定要指定axis=1,否则会报错
>>> df.drop(['B', 'C'])

ValueError: labels ['B' 'C'] not contained in axis

#Drop rows
>>>df.drop([0, 1])

A  B   C   D

2  8  9  10  11

>>> df.drop(index=[0, 1])

A  B   C   D

2  8  9  10  11

原文:

https://blog.csdn.net/songyunli1111/article/details/79306639

#删除/选取某行含有特定数值的列
cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]==3]
#利用enumerate对row0进行遍历,将含有数字3的列放入cols中
print(cols)

#df2=df2[cols]   选取含有特定数值的列
df2=df2.drop(cols,axis=1) #利用drop方法将含有特定数值的列删除
print(df2)

运行结果:

在这里插入图片描述

3.删除含有空值的行或列

实现思路:利用pandas.DateFrame.fillna对空值赋予特定值,再利用上文介绍的方法找到这些含有特定值的行或列去除即可。

import pandas as pd
import numpy as np

df1 = pd.DataFrame(
[
    [np.nan, 2, np.nan, 0],
    [3, 4, np.nan, 1],
    [np.nan, np.nan, np.nan, 5],
    [np.nan, 3, np.nan, 4]
],columns=list('ABCD'))
print(df1)
df2=df1.copy()

df1['A']=df1['A'].fillna('null') #将df中A列所有空值赋值为'null'
print(df1)
df1=df1[~df1['A'].isin(['null'])]
print(df1)

#删除某行空值所在列

df2[0:1]=df2[0:1].fillna('null')
print(df2)
cols=[x for i,x in enumerate(df2.columns) if df2.iat[0,i]=='null']
print(cols)
df2=df2.drop(cols,axis=1)
print(df2)

运行结果:

在这里插入图片描述

原文:

https://blog.csdn.net/luocheng7430/article/details/80330566



版权声明:本文为weixin_43668299原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。